
2025 年 5 月 7 日,理想汽车正式开启 "理想 AI Talk 第二季" 主题活动,重磅推出理想 VLA 司机大模型,并以 "从动物进化到人类" 为核心主题。活动现场,理想汽车董事长兼 CEO 李想发表深度演讲,不仅阐述了对人工智能发展趋势的前沿思考,还围绕 VLA 司机大模型的功能价值、训练体系构建及研发过程中面临的挑战进行详细解读。此外,李想还结合自身经验,分享了对创业方法论和个人成长路径的独到见解,为行业发展与个人发展提供了新的思考维度。
李想将 AI 工具划分为信息、辅助、生产三个层级。当下,多数人仅把 AI 当作信息工具,但此类应用常产出大量无效信息,仅作参考。进阶为辅助工具后,AI 能提升效率,如辅助驾驶仍需人类介入。未来 AI 若发展成生产工具,可独立完成专业任务,大幅提升效率与质量。判断智能体是否真正智能,关键在于其能否成为生产工具,这也是人工智能爆发的节点,未来人工智能将如司机般承担生产职责。
1 实现VLA,需要不断进化
简单来说,理想汽车的 VLA不会突然就变得很厉害,而是一步步慢慢发展起来的。
现在大家用的 L2、L2 + 这些驾驶辅助功能,只能算是给开车帮忙的小助手。但 VLA 不一样,它的目标是让 AI 变成真正会开车的 “老司机”,成为交通领域里能独当一面干活的工具。对理想汽车来说,未来的 VLA 就像一个跟人一样会开车的智能系统。
VLA 的发展分三个阶段,对应着理想汽车辅助驾驶过去、现在和将来的发展。最开始,2021 年起理想做的辅助驾驶,是靠固定的程序和高精度地图来运行,就像简单的昆虫,只能按固定的模式行动。到了 2023 - 2024 年,他们开始用端到端结合视觉语言模型的辅助驾驶,这时候就像更聪明的哺乳动物,但还是不够智能。因为端到端模型遇到复杂路况就不太行了,虽然视觉语言模型能帮点忙,可这个模型是公开的通用版本,在开车这件事上不够专业,而且也没办法和人好好交流。
所以从 2024 年起,理想汽车就开始研究 VLA。等发展到第三阶段,VLA 就像拥有人类智慧一样。它不仅能像人眼一样,通过 3D 和 2D 视觉把周围路况看得清清楚楚,还能像人脑一样,理解看到的东西,通过语言交流,用 “思考” 的方式做决策,最后精准执行开车的操作,真正做到和人类开车一样灵活靠谱。
2 VLA训练过程三步走
理想汽车的 VLA,它的训练过程和人学开车很像,而且最终要让这个 AI 司机的开车习惯、安全意识都符合我们人类的想法。而训练方法,要分三步走。
第一步是先了解这个世界和交通的基本规则,VLA 训练时,会 “看” 大量高清的 2D、3D 图像数据,“读” 很多交通相关的文字资料,还要同时学习图像和文字结合的数据,然后再把它优化成能在汽车上快速运行的版本。
第二步,VLA 在基础模型上加入 “动作” 数据,也就是汽车行驶时的各种操作和周围环境变化的数据。有了这些数据,基础模型就升级成 VLA 司机大模型。这个模型还用上了 “快速思考方法”,能预判其他车辆的行驶轨迹和环境变化,所以它能在复杂的交通状况下,像老司机一样灵活应对、见招拆招。
最后,通过收集人类反馈,教 AI 司机遵守交通规则,比如红灯停绿灯行,还要适应国内的驾驶习惯,像变道打转向灯、礼让行人。把 AI 司机放到模拟的 “虚拟世界” 里反复练习,让它学会平稳驾驶,避免急刹车、急加速,减少碰撞风险。
经过这三步训练,VLA 司机大模型就能安装到汽车上正式 “上岗” 了。最后,这个 AI 司机是以 “司机智能体” 的形式和我们交互,你可以像跟真人司机说话一样,直接用日常语言给它下指令。简单的指令,比如 “左转”,汽车上的 VLA 模型就能直接处理;复杂的指令,比如 “找最近的停车场,避开拥堵路段”,就先由云端的基础模型分析,再交给 VLA 执行。
3 安全性和模型黑盒的问题
除了我们刚刚介绍的功能,VLA司机大模型还需解决安全性和模型黑盒的问题。
先讲安全性。就像能力越强的人越得守规矩一样,VLA 能力越强,越得有 “底线”,不能学坏习惯,比如随意加塞。为了让 VLA 像专业司机那样开车既安全又舒服,理想汽车下了大功夫。2024 年底,他们专门组建了 100 多人的团队,就像给 AI 司机上 “职业素养课”,教它遵守交通规则,养成好的驾驶习惯 。
再说说 “模型黑盒” 问题。这个问题就好比你不知道 AI 司机做决策时到底怎么想的,心里没底。理想汽车用了两种办法来解决:一是 “重建”,二是 “生成”,打造出一个跟现实交通情况一模一样的 “虚拟世界”(世界模型),这个虚拟世界里有所有的交通参与者和要素。借助这个虚拟世界,VLA 能低成本、准确地模拟现实中的各种路况,提前验证解决方案,这样就能搞清楚它是怎么做出开车决策的,解决 “摸不透” 的问题。
4 人工智能时代,扎实的基本功比走捷径重要
在人工智能时代,理想汽车重视基本功积累,通过从研究、研发到业务落地的系统化推进实现技术发展。面对辅助驾驶技术瓶颈,理想依靠自研团队优化芯片与模型适配,自研底层推理引擎解决运行难题。虽然受益于开源技术节省研发时间和成本,但仍坚持超预期投入自研基座模型,同时也开源自研的汽车操作系统。
今年 7 月理想汽车将迎十周年,回顾创业历程,李想始终秉持 “直面问题、解决痛点、持续学习” 的思维,尽管如今挑战升级,但团队协作让他无悔过往。面对 AI 发展,他强调应保留人性特质,守护人类生命力。理想汽车凭借增程电动、5C 超充、自研操作系统等技术创新突破行业难题,自研 VLA 更涉足 AI 无人区,未来将在辅助驾驶新赛道持续挑战极限,为行业和用户创造价值。
本文属于原创文章,如若转载,请注明来源:解读理想 AI Talk 第二季:VLA 大模型的发展与挑战https://auto.zol.com.cn/980/9809312.html