1. 本周工作总览
本周的重点不是跑新实验,而是把后续研究推进前最关键的两件基础工作做扎实:
- 系统精读
MECD / MECD+,明确方法边界、可复现路径和可创新空间。 - 完成面向科研协作的
AI辅助环境配置(以 Codex、VPN、文献检索/对话工作流为主),提升后续阅读、整理和实验迭代效率(这里不展开写)。
这周的核心产出可以概括为:
- 理论上:从“做边预测复现”进一步明确为“边到链”的研究推进路线。
- 工程上:把日常科研辅助工具链打通,减少后续信息获取和代码协作阻力。
2. MECD 精读后的关键理解(基于文本3)
结合本周精读和前几次汇报积累,我对这条路线形成了更系统的判断:
2.1 任务本质定位更清晰
MECD / MECD+ 本质上是:
- 在“已切分事件 + 已有事件描述”的前提下,做事件间因果边判断。
- 更准确说是
event-level causal edge prediction on pre-segmented videos。
因此,当前方法并不直接解决“从原始连续视频自动发现事件图”这个更难的问题。
2.2 当前方法的优势与局限并存
优势:
- 事件级因果关系建模框架相对完整,作为基线非常有价值。
MECD+在完整图推理上比原版更系统,评测维度也更丰富。
局限(本周重点思考):
- 输入假设偏强,依赖已结构化事件与文本描述。
- 输出偏“静态边集合”,对“主因果链/中介链/机制转折”表达不足。
- 对 caption 依赖较高,存在“文本兜底”倾向。
- 对多解释并存与不确定性表达不足(主链/备选链/置信区间缺失)。
2.3 对课题定位的影响
这周最大的收获是进一步确认:
- 课题不应停留在“改进边预测”,而应推进到“事件链因果推理”。
- 研究策略上,先复现基线,再做链级结构化增强是更稳妥的路径。
3. 结合上周失败背景后的策略收敛
结合上周实验失败背景(轻量 baseline 与链式模块多轮尝试后,提升有限、因果类题型收益不稳定),本周对策略做了收敛:
- 不再把“直接加一个链模块就提升指标”作为预期。
- 先把 MECD / MECD+ 的任务边界吃透,再决定链级模块放在哪一层最有效。
- 明确失败根因之一是“边到链的过渡没有机制化”,不是简单参数问题。
- 因此把下一阶段目标改为:先稳定边级复现,再做结构化链组装,再接多智能体协同。
这意味着本周不是“换一个模型再试”,而是先把方法论站稳:从边级因果判别过渡到链级机制解释,避免重复掉进上周“有结构、没增益”的问题。
4. 多智能体与事件链组织方案(本周形成的可执行版本)
4.1 总体架构
基于文本3的中段方案,当前采用“共享编码器 + 多专家 Agent Head + 链组装器 + 全局仲裁器”的组织方式:
- 输入:预切分事件序列(视频片段 + 事件描述)。
- 中间层:多 agent 分别给出“边证据分数矩阵”。
- 输出层:链组装器从边图生成主链/辅助链/中介链,并由仲裁器融合冲突证据。
4.2 Agent 分工设计(对应你这周精读思路)
- 时间结构 Agent:利用事件顺序、间隔、阶段关系,抑制“离结果近即原因”的邻近偏置。
- 视觉证据 Agent:从动作变化、状态变化、交互关系中提取纯视觉因果证据。
- 语义解释 Agent:利用 caption/语义嵌入补充高层意图与常识约束。
- 反事实审查 Agent:对高置信边做 mask/unmask 与替换重估,过滤伪因果边。
- 链组装 Agent:不直接看原始输入,只消费边证据,生成主链/辅链/中介链。
- 全局仲裁器:融合各 agent 结果,处理冲突,输出最终因果图与链解释。
4.3 训练与推理方式(为什么能绕开“链监督不足”)
- 训练阶段:以边监督为主,每个 agent 学自己的边分数,融合器学最终边。
- 链阶段:不做强监督链生成,采用结构化搜索(时间前向约束 + 稀疏约束 + 连通性约束)。
- 解码候选:优先保留一条主链和若干辅助链,支持后续可解释分析。
对应损失可以落成:
L_edge(agent):各 agent 边监督损失L_fuse:融合器边监督损失L_cons:agent 与融合结果一致性约束L_sparse:抑制全连边- (可选)
L_cf:反事实敏感性约束
4.4 这套方案相对上周失败的改进点
- 从“单一链模块后接打分器”改为“多证据源先建边,再组装链”。
- 从“结果导向调分”改为“机制导向解释”,更容易定位错误来源。
- 从“黑箱增益”改为“可拆分评估”(边级、链级、反事实稳定性分别可测)。
- 研究路径更稳:先边级可复现,再链级可解释,再下游增强。
5. 当前问题与风险
- 数据与任务层面的天然限制仍在:链级强监督不足。
- 从“边级可复现”到“链级可解释”仍需额外评测设计支撑。
- 后续若进入多智能体方案,模块增多会带来实现复杂度和对齐成本上升。
6. 下周计划
- 继续推进并稳定跑通 MECD / MECD+ baseline 的关键流程。
- 对本周精读结论做最小化实现映射:
- 明确“多 agent 边分数 -> 链组装器”第一版接口。
- 梳理链级评测草案:
- 主链命中率、path-F1、中介识别、反事实稳定性。
- 继续优化 AI 辅助工作流:
- 把文献笔记、周报、实验日志统一成固定模板。
7. 本周总结
本周虽然没有追求新指标,但完成了对后续最关键的两项打底工作:
- 理论上:明确了 MECD 路线的适用边界与课题升级方向。
- 执行上:完成了 Codex + VPN 为核心的 AI 辅助科研工作流搭建。
整体进展符合预期。下一步将以“基线可复现 + 链级最小验证”为优先目标推进。