2024年,智驾行业最热门的话题无疑是端到端大模型的应用。随着AI大模型技术的进步,理想、小鹏、智己等多家车企在这方面的研究和生产逐渐深入。在最近关于端到端模型方向的讨论中,小鹏汽车副总裁、自动驾驶负责人李力耘博士在“小鹏P7+AI智驾技术分享会”上指出,实施端到端模型时很容易出现方向性错误。
在此次分享会上,李力耘博士首先概述了当前行业内三种主要的端到端发展路径及其优缺点。第一种方法是通过大量规则小模型的堆叠形成“大模型”,这种方法需要大量的规则工程师。第二种方法是“车端大模型”,即将端到端模型直接部署在车辆上,这种方式虽然见效快,但受制于车载算力限制,且随着训练数据量的增加,容易遇到瓶颈。第三种方法则是“云端大模型”,其参数量是车端模型的数十倍乃至数百倍,这远非单一车端大模型所能比拟。
简而言之,尽管选择前两种技术路线也能取得一定成果,但从长远角度来看,布局云端大模型才是赢得智驾竞争的关键。小鹏汽车很早就决定先构建一个强大的“云端大模型”,这一决策与全球领先的AI企业OpenAI的选择不谋而合。
据李力耘博士透露,小鹏的云端大模型参数量将是车端模型的80倍。如此庞大的参数量意味着云端大模型能够全面吸收智能驾驶的数据,不会遗漏重要信息。通过大规模的训练,该模型可以解决更多的长尾问题,从而覆盖更多驾驶场景,使XNGP系统达到L3级别的智能驾驶体验。目前,小鹏云端大模型的训练效率已经提高了2.6倍,预计到2025年,小鹏云端的算力将达到10EFlops以上。
对于采用轻雷达和轻地图的智驾方案来说,高算力的大模型既是基础也是门槛。小鹏的云端大模型能够充分利用摄像头提供的高信息量输入,使有效视觉信息量提升了8倍。基于这一优势,小鹏汽车推出了AI鹰眼视觉方案。相比传统的激光雷达方案,AI鹰眼视觉方案的摄像头信息量增加了80倍,摄像头能够感知的语义和颜色信息增加了100倍,反应速度也提升了3倍。
值得注意的是,AI鹰眼视觉方案将首次应用于小鹏P7+车型,并与现有车型的Max版本保持相同的用户体验。此外,李力耘博士还强调,小鹏的云端大模型是国内首个泛机器人领域的基础大模型,不仅适用于自动驾驶领域,还能应用于机器人和飞行汽车等多个领域。