1. 任务与数据
- 任务:给定两智能体轨迹,预测关系 ∈ {
yields to,bypasses,overtakes}。 - 数据集:

2. 大模型路线
2.1 数据组织(SFT)
- 组织为 chat 数据:
- system:固定指令
- user:轨迹采样帧 + event summary
- assistant:
{"relation": "..."}
- JSON 规范化(把 assistant 强制规范为
{"relation":"xxx"})。
2.2 训练方法(QLoRA + Masked Loss)
- QLoRA:4-bit 量化加载 + LoRA 训练。
- 只对 assistant 计算 loss:prompt tokens labels = -100。
- vLLM 部署评测:加载 base + LoRA,通过 OpenAI API 形式测 val。
2.3 结果与问题

“f1_macro”: 0.1995,
“accuracy_valid_only_percent”: “36.62%”

“f1_macro”: 0.3878,
“accuracy_valid_only_percent”: “43.68%”
有提升,但是不显著
3. 传统机器学习路线
3.1 特征工程(从轨迹序列 → 结构化特征向量)
一共是40个维度,涉及各种两个轨迹间的关联信息。
3.2 模型(多项逻辑回归)
- Pipeline:
StandardScaler + LogisticRegression(multinomial, class_weight=balanced)
3.3 结果



未来计划
对场景中每对 agent (i,j) 计算同样的相对特征
用当前训练好的二体分类器输出 P(relation | i,j)
得到一个 关系图(graph):节点是 agent,边是关系概率/类别
或许也可以用特征值来测试大模型效果,并且微调