DriveVLM：自动驾驶与视觉语言模型的融合增强智能汽车场景理解和规划能力

DriveVLM 项目有由清华大学和理想汽车联合开发的一个自动驾驶辅助系统，旨在改善自动驾驶系统的场景理解和规划能力。

它利用了最新的视觉语言模型来更好地描述和分析驾驶环境，并通过分层规划模块来制定驾驶计划。此外，DriveVLM-Dual 系统结合了传统的3D感知技术，以提供更准确的空间推理和实时规划能力。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员