python D:\research\research_training\17\extract_multiactor_pairs_dataset.py --data_root "D:\research\research_training\10\test\test"
–out_root “D:\research\research_training\17\trajrel_multi” --val_ratio 0.1
–min_overlap 30 --dist_recall_thr 25
–neg_per_pos 3 `
–seed 42
这周主要把多智能体场景的数据预处理流程跑通了:从原始场景 JSON 中解析每个 agent 的轨迹,并从 interaction 字段自动抽取三类关系标注;在场景内枚举所有候选 agent pair,用重叠帧数和最小距离做召回过滤,再为每个 pair 计算一套固定维度的相对运动特征,同时按可复现的规则划分 train/val 并输出成可直接训练的 CSV。下周计划是在这份数据集上先训练一个 related 的二分类器,再在相关 pair 上训练三分类关系模型(之前是无向,这次打算加上关系方向),最后把场景内所有 pair 的预测结果汇总成关系图(节点=agent,边=关系类别/概率),并用可视化和误差分析确认哪些场景/关系类型最容易出错。
pairs train: D:\research\research_training\17\trajrel_multi\pairs\pairs_train.csv rows= 232608
pairs val : D:\research\research_training\17\trajrel_multi\pairs\pairs_val.csv rows= 25492
agents train: D:\research\research_training\17\trajrel_multi\agents\agents_train.csv rows= 147167
agents val : D:\research\research_training\17\trajrel_multi\agents\agents_val.csv rows= 16431
meta: D:\research\research_training\17\trajrel_multi\meta.json
skips: {‘no_pairs_after_recall’: 89}