某种提取关联的方案汇报

环境3090（24g）*2

模型qwen1.5-14b-chat

参数

python -m vllm.entrypoints.openai.api_server

–model /root/models/qwen1.5-14b-chat

–tensor-parallel-size 2 #双卡并行

–trust-remote-code

–host 0.0.0.0

–port 8000

–gpu-memory-utilization 0.9 #存留显存余量

–dtype bfloat16

–max-model-len 4096（Qwen1.5-14B #默认支持 32768 个 Token 的超长上下文（约 24000 字），把 max_model_len 降到 4096（约 3000 字），内存不足，模型分配完后只剩5.27g）

几种尝试：

输入内容改变，由简化轨迹变成完整的轨迹点序列；

明确输出格式要求，限定关系类型为 “跟随 / 避让 / 无明显关系”；

补充量化关系定义（如跟随关系：距离 1-2 海里 + 航向偏差≤10°+ 速度差≤2 节）；

优化轨迹点描述格式（去掉冗余分隔符，标准化字段顺序），分块输入设计；

降低温度参数（temperature=0.2），增加错误示例对比，强化约束语气；

修改提示词，尝试降低约束；

结果：目前在**小规模的模拟数据**中效果较好。

由于模型上下文长度有限，采取措施重新清洗数据

统一字段名、标准化时间格式

删除缺失关键信息（MMSI、经纬度、速度等）、物理异常（超常规速度 / 航向 / 经纬度）、重复记录的数据

精简格式（保留合理小数位），减少冗余数据占用的 Token 量

采样时采用**关键节点和均匀采样**拼接，避免过于密集，同时保留行为特征

此外，进行按照时空切分，确保同一窗口内的船舶集群时间同步、空间距离合适

最终生成最小分析单元–船对

将船队用批处理脚本输入大模型，判断两两之间的关系

大多数无明显关系

发送评论 编辑评论