新闻详情

理想汽车发布下一代自动驾驶架构MindVLA

抱负轿车自动驾驭技能研制负责人贾鹏在NVIDIA GTC 2025宣布主题讲演《VLA:迈向自动驾驭物理智能体的要害一步》,共享了抱负轿车关于下一代自动驾驭技能MindVLA的最新考虑和发展。根据端到端+VLM双系统架构的最佳实践,及对前沿技能的敏锐洞悉,抱负自研VLA模型——MindVLA。VLA是机器人大模型的新范式,其将赋予自动驾驭强壮的3D空间了解才能、逻辑推理才能和行为生成才能,让自动驾驭可以感知、考虑和适应环境。

MindVLA不是简略地将端到端模型和VLM模型结合在一起,一切模块都是全新规划。3D空间编码器经过言语模型,和逻辑推理结合在一起后,给出合理的驾驭决议计划,并输出一组Action Token(动作词元),Action Token指的是对周围环境和自车驾驭行为的编码,并经过Diffusion(分散模型)进一步优化出最佳的驾驭轨道,整个推理进程都要产生在车端,而且要做到实时运转。

MindVLA将为用户带来全新的产品形状和产品体会,有MindVLA赋能的轿车是听得懂、看得见、找得到的专职司机。“听得懂”是用户可以经过语音指令改动车辆的道路和行为,例如用户在生疏园区寻觅超市,只需要经过抱负同学对车辆说:“带我去找超市”,车辆将在没有导航信息的情况下,自主周游找到目的地;车辆行进进程中,用户还可以跟抱负同学说:“开太快了”“应该走左面这条路”等,MindVLA可以了解并履行这些指令。

← 返回新闻列表