环境3090(24g)*2
模型qwen1.5-14b-chat
参数
python -m vllm.entrypoints.openai.api_server
–model /root/models/qwen1.5-14b-chat
–tensor-parallel-size 2 #双卡并行
–trust-remote-code
–host 0.0.0.0
–port 8000
–gpu-memory-utilization 0.9 #存留显存余量
–dtype bfloat16
–max-model-len 4096(Qwen1.5-14B #默认支持 32768 个 Token 的超长上下文(约 24000 字),把 max_model_len 降到 4096(约 3000 字),内存不足,模型分配完后只剩5.27g)
几种尝试:
输入内容改变,由简化轨迹变成完整的轨迹点序列;
明确输出格式要求,限定关系类型为 “跟随 / 避让 / 无明显关系”;
补充量化关系定义(如跟随关系:距离 1-2 海里 + 航向偏差≤10°+ 速度差≤2 节);
优化轨迹点描述格式(去掉冗余分隔符,标准化字段顺序),分块输入设计;
降低温度参数(temperature=0.2),增加错误示例对比,强化约束语气;
修改提示词,尝试降低约束;
结果:目前在**小规模的模拟数据**中效果较好。
由于模型上下文长度有限,采取措施重新清洗数据
统一字段名、标准化时间格式
删除缺失关键信息(MMSI、经纬度、速度等)、物理异常(超常规速度 / 航向 / 经纬度)、重复记录的数据
精简格式(保留合理小数位),减少冗余数据占用的 Token 量
采样时采用**关键节点和均匀采样**拼接,避免过于密集,同时保留行为特征
此外,进行按照时空切分,确保同一窗口内的船舶集群时间同步、空间距离合适
最终生成最小分析单元–船对
将船队用批处理脚本输入大模型,判断两两之间的关系
大多数无明显关系