论文阅读 TokenSkip: Controllable Chain-of-Thought Compression in LLMs 提出TokenSkip方法,针对大语言模型(LLMs)中思维链(CoT)推理存在的长序列导致推理延迟高的问题,基于 CoT tokens 语义重要性差异的核心洞察,通过修剪低重要性 tokens 并微调模型,实现可控的…
环境3090(24g)*2 模型qwen1.5-14b-chat 参数 python -m vllm.entrypoints.openai.api_server --model /root/models/qwen1.5-14b-chat --tensor-parallel-size 2 #双卡并行 --trust-remote-code --hos…
1. 一段话总结 为解决现有Video LLM仅能对视频进行粗略描述、无法捕捉特定事件精确时间边界的问题,清华大学团队提出VTimeLLM——首个具备边界感知能力的Video LLM,其通过边界感知三阶段训练策略(第一阶段利用图像-文本对实现特征对齐,第二阶段借助多事件视频提升时间边界感知,第三阶段通过高质量视频指令微调对齐人类意图),在时间视频定…
一、调研方向聚焦 本次调研围绕“多船舶关系挖掘”核心方向,重点分析两篇论文在提取多个个体or群体的潜在关联的技术思路。 二、论文1:STMGF-Net_A_Spatiotemporal_Multi-Graph_Fusion_Network_for_Vessel_Trajectory_Forecasting_in_Intelligent_Mariti…
一、研究方向历史发展调研 从大规模轨迹或行为数据中发现潜在规则关系,是随着数据采集技术、计算能力以及相关理论的发展而逐步演进的,其历史发展大致可分为以下几个阶段: (一)初步探索阶段(20 世纪 90 年代 - 21 世纪初) 在这一阶段,数据采集手段相对有限,大规模轨迹和行为数据的获取难度较大,相关研究主要集中在小规模数据的简单分析上。此阶段的核…
输入:多目标轨迹信息+关联约束(知识、规则、语义等),输出:目标群组划分与目标间关系图 思路: 1.数据预处理与特征提取:用生成式模型(如 Diffusion)补全长时序离散轨迹的缺失值,同时融入基础规则(如物理运动约束)生成 “完整轨迹伪数据”,增强特征鲁棒性;用层级时序模型(如 Hierarchical Transformer)提取多尺度群体特…
Day1 学习笔记:MCP 与多智能体调度基础 1. 核心概念 MCP(Model Context Protocol) 定义:一种统一协议,帮助大模型调用外部工具、API 和数据源。 作用: 提供 统一接口,不管是数据库还是 Web API,都能以相同方式被调用。 提供 安全隔离,模型不会直接访问系统,而是通过 MCP 代理。 提供 上下文管理,让…
Lecture 1—Introduction and TCP/IP
关于NULL SQL 采用三值逻辑(TRUE、FALSE 和 UNKNOWN)。任何涉及 NULL 的比较或逻辑运算的结果都可能是 UNKNOWN,这可能会影响查询结果。 例如: 所以,要对null进行处理,需要使用is或者is not
常见bug类型