DriveTransformer:GPT式Scalable端到端自动驾驶

主讲人:贾萧松 | 上海交通大学博士生

  • 开课时间

    2025.02.27 20:00

  • 课程时长

    100分钟

  • 学习人数

    769人次学习

立即学习
添加助教,领取课件

立即学习

DriveTransformer:GPT式Scalable端到端自动驾驶

当前端到端自动驾驶架构的串行设计导致训练稳定性问题,而且高度依赖于BEV,严重限制了其Scale Up潜力。在我们ICLR2025工作DriveTransformer中,不同于以往算法Scale Up Vision Backbone,我们设计了一套以Decoder为核心的无需BEV的大一统架构。在Scale Up提出的类GPT式并行架构后,我们发现训练稳定性大幅提高,并且增加参数量对于决策的收益优于Scale Up Encoder。在大规模的闭环实验中,通过Scale Up新架构到0.6B,我们实现了SOTA效果。本篇论文另外两名共一游浚琦和张致远为交大的大二、大三本科生。

直播精华文稿暂未上传
机器人与自动驾驶 规划控制 进阶
机器人与自动驾驶 环境感知 高级
计算机视觉 三维视觉 环境感知 进阶
计算机视觉 三维视觉 进阶