本周针对原本的任务,首先采用传统监督学习方法进行建模验证是否数据集可用。在数据处理阶段,将原始轨迹序列转换为固定维度特征向量,主要包括车辆航向角变化统计量、关键帧之间的相对变化特征以及轨迹点分布特征等。在模型选择上,尝试了多项逻辑回归进行三分类训练。实验结果表明,两类模型在训练集上也没有正常收敛,抛出了异常ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).。进一检查数据集后发现,轨迹数据中存在大量 N/A 或缺失的轨迹点,这些缺失值在特征阶段未得到充分处理,导致输入特征信息不稳定。本周工作由此初步定位当前性能瓶颈主要来源于数据质量问题,而非分类模型本身。下周计划对轨迹数据进行系统性清洗和有效性约束,在保证轨迹信息完整性的前提下,重新尝试基于 LoRA 的大模型微调方案完成三分类任务
暂无评论