重新预处理数据 – 伶衣の博客

python D:\research\research_training\17\extract_multiactor_pairs_dataset.py  --data_root "D:\research\research_training\10\test\test"
–out_root “D:\research\research_training\17\trajrel_multi”  --val_ratio 0.1
–min_overlap 30  --dist_recall_thr 25
–neg_per_pos 3 `
–seed 42

这周主要把多智能体场景的数据预处理流程跑通了：从原始场景 JSON 中解析每个 agent 的轨迹，并从 interaction 字段自动抽取三类关系标注；在场景内枚举所有候选 agent pair，用重叠帧数和最小距离做召回过滤，再为每个 pair 计算一套固定维度的相对运动特征，同时按可复现的规则划分 train/val 并输出成可直接训练的 CSV。下周计划是在这份数据集上先训练一个 related 的二分类器，再在相关 pair 上训练三分类关系模型(之前是无向，这次打算加上关系方向)，最后把场景内所有 pair 的预测结果汇总成关系图（节点=agent，边=关系类别/概率），并用可视化和误差分析确认哪些场景/关系类型最容易出错。

pairs train: D:\research\research_training\17\trajrel_multi\pairs\pairs_train.csv rows= 232608
pairs val : D:\research\research_training\17\trajrel_multi\pairs\pairs_val.csv rows= 25492
agents train: D:\research\research_training\17\trajrel_multi\agents\agents_train.csv rows= 147167
agents val : D:\research\research_training\17\trajrel_multi\agents\agents_val.csv rows= 16431
meta: D:\research\research_training\17\trajrel_multi\meta.json
skips: {‘no_pairs_after_recall’: 89}

发送评论 编辑评论

发送评论编辑评论