轨迹交互关系：从大模型微调到传统机器学习 – 伶衣の博客

轨迹交互关系：从大模型微调到传统机器学习

2026-2-03 20:12

|

321

|

0

|

331 字

|

2 分钟

1. 任务与数据

任务：给定两智能体轨迹，预测关系 ∈ {yields to, bypasses, overtakes}。
数据集：

2. 大模型路线

2.1 数据组织（SFT）

组织为 chat 数据：
- system：固定指令
- user：轨迹采样帧 + event summary
- assistant：{"relation": "..."}
JSON 规范化（把 assistant 强制规范为 {"relation":"xxx"}）。

2.2 训练方法（QLoRA + Masked Loss）

QLoRA：4-bit 量化加载 + LoRA 训练。
只对 assistant 计算 loss：prompt tokens labels = -100。
vLLM 部署评测：加载 base + LoRA，通过 OpenAI API 形式测 val。

2.3 结果与问题

alt text

“f1_macro”: 0.1995,
“accuracy_valid_only_percent”: “36.62%”

alt text

“f1_macro”: 0.3878,
“accuracy_valid_only_percent”: “43.68%”

有提升，但是不显著

3. 传统机器学习路线

3.1 特征工程（从轨迹序列 → 结构化特征向量）

一共是40个维度，涉及各种两个轨迹间的关联信息。

3.2 模型（多项逻辑回归）

Pipeline：StandardScaler + LogisticRegression(multinomial, class_weight=balanced)

3.3 结果

alt text

alt text

alt text

未来计划

对场景中每对 agent (i,j) 计算同样的相对特征

用当前训练好的二体分类器输出 P(relation | i,j)

得到一个关系图（graph）：节点是 agent，边是关系概率/类别

或许也可以用特征值来测试大模型效果，并且微调

暂无评论

发送评论编辑评论

Markdown

|´・ω・)ノ

ヾ(≧∇≦*)ゝ

(☆ω☆)

（╯‵□′）╯︵┴─┴

￣﹃￣

(/ω＼)

∠( ᐛ 」∠)＿

(๑•̀ㅁ•́ฅ)

→_→

୧(๑•̀⌄•́๑)૭

٩(ˊᗜˋ*)و

(ノ°ο°)ノ

(´இ皿இ｀)

⌇●﹏●⌇

(ฅ´ω`ฅ)

(╯°A°)╯︵○○○

φ(￣∇￣o)

ヾ(´･･｀｡)ノ"

( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃

(ó﹏ò｡)

Σ(っ °Д °;)っ

( ,,´･ω･)ﾉ"(´っω･｀｡)

╮(╯▽╰)╭

o(*////▽////*)q

＞﹏＜

( ๑´•ω•) "(ㆆᴗㆆ)

颜文字

Emoji

小恐龙

花!