MECD 精读与思考 – 伶衣の博客

1. 本周工作总览

本周的重点不是跑新实验，而是把后续研究推进前最关键的两件基础工作做扎实：

系统精读 MECD / MECD+，明确方法边界、可复现路径和可创新空间。
完成面向科研协作的 AI辅助环境 配置（以 Codex、VPN、文献检索/对话工作流为主），提升后续阅读、整理和实验迭代效率（这里不展开写）。

这周的核心产出可以概括为：

理论上：从“做边预测复现”进一步明确为“边到链”的研究推进路线。
工程上：把日常科研辅助工具链打通，减少后续信息获取和代码协作阻力。

2. MECD 精读后的关键理解（基于文本3）

结合本周精读和前几次汇报积累，我对这条路线形成了更系统的判断：

2.1 任务本质定位更清晰

MECD / MECD+ 本质上是：

在“已切分事件 + 已有事件描述”的前提下，做事件间因果边判断。
更准确说是 event-level causal edge prediction on pre-segmented videos。

因此，当前方法并不直接解决“从原始连续视频自动发现事件图”这个更难的问题。

2.2 当前方法的优势与局限并存

优势：

事件级因果关系建模框架相对完整，作为基线非常有价值。
MECD+ 在完整图推理上比原版更系统，评测维度也更丰富。

局限（本周重点思考）：

输入假设偏强，依赖已结构化事件与文本描述。
输出偏“静态边集合”，对“主因果链/中介链/机制转折”表达不足。
对 caption 依赖较高，存在“文本兜底”倾向。
对多解释并存与不确定性表达不足（主链/备选链/置信区间缺失）。

2.3 对课题定位的影响

这周最大的收获是进一步确认：

课题不应停留在“改进边预测”，而应推进到“事件链因果推理”。
研究策略上，先复现基线，再做链级结构化增强是更稳妥的路径。

3. 结合上周失败背景后的策略收敛

结合上周实验失败背景（轻量 baseline 与链式模块多轮尝试后，提升有限、因果类题型收益不稳定），本周对策略做了收敛：

不再把“直接加一个链模块就提升指标”作为预期。
先把 MECD / MECD+ 的任务边界吃透，再决定链级模块放在哪一层最有效。
明确失败根因之一是“边到链的过渡没有机制化”，不是简单参数问题。
因此把下一阶段目标改为：先稳定边级复现，再做结构化链组装，再接多智能体协同。

这意味着本周不是“换一个模型再试”，而是先把方法论站稳：从边级因果判别过渡到链级机制解释，避免重复掉进上周“有结构、没增益”的问题。

4. 多智能体与事件链组织方案（本周形成的可执行版本）

4.1 总体架构

基于文本3的中段方案，当前采用“共享编码器 + 多专家 Agent Head + 链组装器 + 全局仲裁器”的组织方式：

输入：预切分事件序列（视频片段 + 事件描述）。
中间层：多 agent 分别给出“边证据分数矩阵”。
输出层：链组装器从边图生成主链/辅助链/中介链，并由仲裁器融合冲突证据。

4.2 Agent 分工设计（对应你这周精读思路）

时间结构 Agent：利用事件顺序、间隔、阶段关系，抑制“离结果近即原因”的邻近偏置。
视觉证据 Agent：从动作变化、状态变化、交互关系中提取纯视觉因果证据。
语义解释 Agent：利用 caption/语义嵌入补充高层意图与常识约束。
反事实审查 Agent：对高置信边做 mask/unmask 与替换重估，过滤伪因果边。
链组装 Agent：不直接看原始输入，只消费边证据，生成主链/辅链/中介链。
全局仲裁器：融合各 agent 结果，处理冲突，输出最终因果图与链解释。

4.3 训练与推理方式（为什么能绕开“链监督不足”）

训练阶段：以边监督为主，每个 agent 学自己的边分数，融合器学最终边。
链阶段：不做强监督链生成，采用结构化搜索（时间前向约束 + 稀疏约束 + 连通性约束）。
解码候选：优先保留一条主链和若干辅助链，支持后续可解释分析。

对应损失可以落成：

L_edge(agent)：各 agent 边监督损失
L_fuse：融合器边监督损失
L_cons：agent 与融合结果一致性约束
L_sparse：抑制全连边
（可选）L_cf：反事实敏感性约束

4.4 这套方案相对上周失败的改进点

从“单一链模块后接打分器”改为“多证据源先建边，再组装链”。
从“结果导向调分”改为“机制导向解释”，更容易定位错误来源。
从“黑箱增益”改为“可拆分评估”（边级、链级、反事实稳定性分别可测）。
研究路径更稳：先边级可复现，再链级可解释，再下游增强。

5. 当前问题与风险

数据与任务层面的天然限制仍在：链级强监督不足。
从“边级可复现”到“链级可解释”仍需额外评测设计支撑。
后续若进入多智能体方案，模块增多会带来实现复杂度和对齐成本上升。

6. 下周计划

继续推进并稳定跑通 MECD / MECD+ baseline 的关键流程。
对本周精读结论做最小化实现映射：
- 明确“多 agent 边分数 -> 链组装器”第一版接口。
梳理链级评测草案：
- 主链命中率、path-F1、中介识别、反事实稳定性。
继续优化 AI 辅助工作流：
- 把文献笔记、周报、实验日志统一成固定模板。

7. 本周总结

本周虽然没有追求新指标，但完成了对后续最关键的两项打底工作：

理论上：明确了 MECD 路线的适用边界与课题升级方向。
执行上：完成了 Codex + VPN 为核心的 AI 辅助科研工作流搭建。

整体进展符合预期。下一步将以“基线可复现 + 链级最小验证”为优先目标推进。