理想VLM有不少惊喜,但还不是端到端的终局

图灵汇官网

理想汽车在自动驾驶领域的新进展与挑战

引言

7月15日,理想汽车宣布向AD Max用户全量推送无图NOA功能,成为继华为系之后第二家完成这一推送的车企。此举覆盖了理想品牌的5款车型,超过24万用户,标志着理想在自动驾驶技术上取得重要突破。

第三代技术架构

理想汽车在智能驾驶发布会上展示了其正在研发的端到端+VLM(视觉语言模型)+世界模型的第三代技术架构。相较于传统的端到端技术路线,理想提出“双系统”理念,首次将VLM部署于Orin-X芯片,并采用了One Model端到端的架构模式。这一架构旨在通过集成感知与规划,形成一个数据驱动的大模型,以应对95%的驾驶场景需求。

技术亮点与进展

  • “双系统”理念:理想汽车的第三代技术架构通过“系统1”和“系统2”来模拟人类驾驶行为,分别对应快系统与慢系统,利用One Model端到端大模型,感知与规划整合为单一流程。
  • 模型验证与实际应用:理想智能驾驶副总裁朗咸朋表示,该技术架构已完成原型验证与实车部署,实际效果超过预期。
  • 技术路线展望:CEO李想透露,理想计划在年内或明年初推出基于One Model端到端的自动驾驶技术,这一时间表被认为是较为激进的。

行业对比与分析

  • 端到端技术的进展:当前行业对于“端到端”技术的理解不一,多数玩家仍处于决策规划模型化阶段,距离One Model端到端的全自动驾驶尚有距离。理想的目标是超越行业整体进度,实现One Model端到端的全面应用。
  • 算力与数据的挑战:算力与数据是自动驾驶技术的关键基础,特斯拉在算力与数据方面的投入显著领先国内其他玩家。理想在算力储备上在国内已属头部水平,但在数据量方面与特斯拉存在较大差距。

VLM的角色与应用

  • VLM概念引入:理想是国内首个将VLM(视觉语言模型)概念应用于自动驾驶领域的车企。VLM能够处理视觉输入,理解场景,并通过自然语言增强模型的可解释性。
  • 系统2的辅助作用:VLM作为系统2,负责提供复杂环境的理解、导航地图解析与交通规则解读,为系统1提供辅助,特别是对于系统1难以处理的特殊场景。

技术挑战与未来展望

  • VLM部署与优化:理想将VLM部署至Orin-X芯片,通过优化将推理性能从4秒降至0.3秒,显示出对时延问题的有效解决。尽管如此,VLM在端侧的实时性仍然受限,主要用于提供非实时辅助。
  • 行业影响与趋势:理想提出的双系统架构引发行业关注,VLM的应用被视为加速端到端技术上车的一种策略。然而,业界也在权衡VLM的算力投入与实际功能收益,以及特斯拉等领先企业的路径示范。

结论

理想汽车在自动驾驶领域的持续投入与技术创新,不仅展示了其在技术上的突破,也为行业提供了新的发展方向。面对算力与数据的挑战,以及VLM在实际应用中的局限性,理想正通过创新策略,推动自动驾驶技术的商业化进程。随着技术的不断进步与市场的需求增长,理想有望在未来引领自动驾驶领域的更多变革。

本文来源: 雷锋网 文章作者: 无人机之家
    下一篇

几个月前,理想刚经历“今年最困难的一个季度”,月交付量一度被问界反超,原计划在理想MEGA之后发布的纯电车型也推迟了发布。但是理想已经渐渐找回了自己的节奏。7月,理想共交付新车51000辆,创下单月新高,重回月销破5万的巅峰。去年12月,理