轨迹交互关系:从大模型微调到传统机器学习

1. 任务与数据

  • 任务:给定两智能体轨迹,预测关系 ∈ {yields tobypassesovertakes}。
  • 数据集
    alt text

2. 大模型路线

2.1 数据组织(SFT)

  • 组织为 chat 数据:
    • system:固定指令
    • user:轨迹采样帧 + event summary
    • assistant:{"relation": "..."}
  • JSON 规范化(把 assistant 强制规范为 {"relation":"xxx"})。

2.2 训练方法(QLoRA + Masked Loss)

  • QLoRA:4-bit 量化加载 + LoRA 训练。
  • 只对 assistant 计算 loss:prompt tokens labels = -100。
  • vLLM 部署评测:加载 base + LoRA,通过 OpenAI API 形式测 val。

2.3 结果与问题

alt text

“f1_macro”: 0.1995,
“accuracy_valid_only_percent”: “36.62%”

alt text

“f1_macro”: 0.3878,
“accuracy_valid_only_percent”: “43.68%”

有提升,但是不显著

3. 传统机器学习路线

3.1 特征工程(从轨迹序列 → 结构化特征向量)

一共是40个维度,涉及各种两个轨迹间的关联信息。

3.2 模型(多项逻辑回归)

  • Pipeline:StandardScaler + LogisticRegression(multinomial, class_weight=balanced)

3.3 结果

alt text
alt text
alt text

未来计划

对场景中每对 agent (i,j) 计算同样的相对特征

用当前训练好的二体分类器输出 P(relation | i,j)

得到一个 关系图(graph):节点是 agent,边是关系概率/类别

或许也可以用特征值来测试大模型效果,并且微调

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇