DriveVLM:自动驾驶与视觉语言模型的融合 增强智能汽车场景理解和规划能力

DriveVLM 项目有由清华大学和理想汽车联合开发的一个自动驾驶辅助系统,旨在改善自动驾驶系统的场景理解和规划能力。

它利用了最新的视觉语言模型来更好地描述和分析驾驶环境,并通过分层规划模块来制定驾驶计划。此外,DriveVLM-Dual 系统结合了传统的3D感知技术,以提供更准确的空间推理和实时规划能力。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
退出移动版