未分类 – 伶衣の博客

关于部分linux常用指令的整理

2026-4-28 14:18

|

68

|

0

|

未分类

1141 字

|

9 分钟

一、系统与文件基础指令指令说明常用示例ls列出目录内容ls -la (显示隐藏文件和详情)cd切换目录cd ~ (回到家目录)pwd显示当前路径pwdcp复制文件/目录cp -r dir1 dir2 (递归复制目录)mv移动或重命名mv old.txt new.txtrm删除文件/目录rm -rf dir/ (慎用，强制递归删除)mkdir创建目…

关于如何将数据集下载到服务器（通过BaiduPCS-Go）

2026-4-08 19:52

|

118

|

0

|

未分类

283 字

|

2 分钟

近日，在使用autodl服务器和实验室服务器时，感觉传数据集或者权重非常不方便，常用的方式是通过hf-mirror进行，然而有时即使使用镜像，传输速度也特别慢，或者有的数据集难以获得。所以记录一下如何使用https://github.com/qjfoidnh/BaiduPCS-Go.git去进行数据集的传输（有时候可以在百度网盘的分享中找到非官方…

MECD 精读与思考

2026-4-05 22:26

|

132

|

0

|

未分类

1867 字

|

8 分钟

1. 本周工作总览本周的重点不是跑新实验，而是把后续研究推进前最关键的两件基础工作做扎实：系统精读 MECD / MECD+，明确方法边界、可复现路径和可创新空间。完成面向科研协作的 AI辅助环境配置（以 Codex、VPN、文献检索/对话工作流为主），提升后续阅读、整理和实验迭代效率（这里不展开写）。这周的核心产出可以概括为：理论上：…

关于失败的一些总结

2026-3-29 21:39

|

171

|

0

|

未分类

3090 字

|

13 分钟

一、项目阶段性实验总结报告 1. 当前目标本阶段的目标是验证这样一条路线是否有效：基于 NExT-QA 的预提取视频特征，构建显式“事件链推理”模块，包括：事件聚合（Latent Event Aggregation） Grounder Causal Linker Chain Search Chain-aware fusion 并考察它是否能：…

毕设的进一步方案

2026-3-22 20:02

|

208

|

0

|

未分类

1267 字

|

6 分钟

主线和任务整理毕设：潜在事件链推理期刊：在潜在事件链之上的多智能体协同因果推理题目：基于多智能体协同的视频因果事件推理这周，继续复现Flipped-VQA项目（把结构看了看，彻底跑通了原论文其他几个数据集），准备复用：现成的 NExT-QA 数据流稳定的预提取特征读取方式可直接复用的初始 answerer 关于数据集事件链具体怎么建立…

新的思考

2026-3-15 15:12

|

233

|

0

|

未分类

1472 字

|

7 分钟

事件图/GNN/子图检索本身”已经不够当主创新 2024 的多对象事件图表示学习 CLanG2025 的 event-graph 可解释推理 ENTER2026 的 GraphThinkerevent-graph thing或者把事件图当成长视频语义压缩的接口 SEG preprint 显式的事件链像是基础设施，不足以作为新论文的主要创新？近年的…

关于chatgpt代码解释器会话过期

2026-3-10 21:42

|

276

|

0

|

未分类

51 字

|

几秒读完

有时候会遇到这种情况，无法下载gpt给的文件，此时尝试要求gpt给出的文件名称为英文，有较大概率解决问题。

关于毕设的初次思考

2026-3-08 23:14

|

282

|

0

|

未分类

2257 字

|

10 分钟

Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering 提出跨模态因果关系推理框架（CMCIR），该框架包含因果感知视觉语言推理（CVLR）、时空 Transformer（STT）、视觉语言特征融合（VLFF）三大核心模块，通过前门和后门因果…

关于毕设“基于视觉语言学习的跨模态事件链推理”初步调研与想法

2026-2-15 19:26

|

298

|

0

|

未分类

206 字

|

1 分钟内

首先，应当做一部分的论文阅读。 InternVideo2：视频基础模型家族，强调多任务、多范式统一 TimeSformer：纯 Transformer 的时空建模代表作 ViCLIP：视频版 CLIP 表征 VideoChat：视频对话系统，强调时空推理/定位/因果等能力 Video-LLaVA（EMNLP 2024）：视频与图像统一对齐再投影的策…

重新预处理数据

2026-2-10 13:59

|

346

|

0

|

未分类

335 字

|

2 分钟

python D:\research\research_training\17\extract_multiactor_pairs_dataset.py --data_root "D:\research\research_training\10\test\test"--out_root "D:\research\research…

分类： 未分类

分类：未分类