一、系统与文件基础指令 指令说明常用示例ls列出目录内容ls -la (显示隐藏文件和详情)cd切换目录cd ~ (回到家目录)pwd显示当前路径pwdcp复制文件/目录cp -r dir1 dir2 (递归复制目录)mv移动或重命名mv old.txt new.txtrm删除文件/目录rm -rf dir/ (慎用,强制递归删除)mkdir创建目…
近日,在使用autodl服务器和实验室服务器时,感觉传数据集或者权重非常不方便,常用的方式是通过hf-mirror进行,然而有时即使使用镜像,传输速度也特别慢,或者有的数据集难以获得。 所以记录一下如何使用https://github.com/qjfoidnh/BaiduPCS-Go.git去进行数据集的传输(有时候可以在百度网盘的分享中找到非官方…
1. 本周工作总览 本周的重点不是跑新实验,而是把后续研究推进前最关键的两件基础工作做扎实: 系统精读 MECD / MECD+,明确方法边界、可复现路径和可创新空间。 完成面向科研协作的 AI辅助环境 配置(以 Codex、VPN、文献检索/对话工作流为主),提升后续阅读、整理和实验迭代效率(这里不展开写)。 这周的核心产出可以概括为: 理论上:…
一、项目阶段性实验总结报告 1. 当前目标 本阶段的目标是验证这样一条路线是否有效: 基于 NExT-QA 的预提取视频特征,构建显式“事件链推理”模块,包括: 事件聚合(Latent Event Aggregation) Grounder Causal Linker Chain Search Chain-aware fusion 并考察它是否能:…
主线和任务整理 毕设:潜在事件链推理 期刊:在潜在事件链之上的多智能体协同因果推理 题目:基于多智能体协同的视频因果事件推理 这周,继续复现Flipped-VQA项目(把结构看了看,彻底跑通了原论文其他几个数据集),准备复用: 现成的 NExT-QA 数据流 稳定的预提取特征读取方式 可直接复用的初始 answerer 关于数据集事件链具体怎么建立…
事件图/GNN/子图检索本身”已经不够当主创新 2024 的多对象事件图表示学习 CLanG2025 的 event-graph 可解释推理 ENTER2026 的 GraphThinkerevent-graph thing或者把事件图当成长视频语义压缩的接口 SEG preprint 显式的事件链像是基础设施,不足以作为新论文的主要创新? 近年的…
有时候会遇到这种情况,无法下载gpt给的文件,此时尝试要求gpt给出的文件名称为英文,有较大概率解决问题。
Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering 提出跨模态因果关系推理框架(CMCIR),该框架包含因果感知视觉语言推理(CVLR)、时空 Transformer(STT)、视觉语言特征融合(VLFF)三大核心模块,通过前门和后门因果…
首先,应当做一部分的论文阅读。 InternVideo2:视频基础模型家族,强调多任务、多范式统一 TimeSformer:纯 Transformer 的时空建模代表作 ViCLIP:视频版 CLIP 表征 VideoChat:视频对话系统,强调时空推理/定位/因果等能力 Video-LLaVA(EMNLP 2024):视频与图像统一对齐再投影的策…
python D:\research\research_training\17\extract_multiactor_pairs_dataset.py --data_root "D:\research\research_training\10\test\test"--out_root "D:\research\research…