具身智能是一种能够帮助人类完成各种任务的技术,例如照顾老人。本文将深入探讨这一领域的发展现状和未来前景。
具身智能的核心标准在于机器人能否解决实际问题,而非简单地按照L1-L5级别分类。当前,具身智能领域正快速发展,但敢于做出大胆预测的人并不多,高阳便是其中之一。
高阳是清华大学交叉信息研究院的助理教授,曾在加州大学伯克利分校获得博士学位,并与Pieter Abbeel等人合作完成了博士后研究。他目前领导着一个名为EVAR Lab的研究团队,致力于开发能够利用人工智能技术赋能机器人的通用框架。他的ViLa算法已被Figure AI采纳。
2024年,高阳与他人共同创立了千寻智能公司。这家公司以中国版的Figure 01著称,成立一年内便完成了三轮融资,总额达2亿人民币。千寻智能的目标是在十年内让10%的人类拥有自己的机器人。
在MEET 2025智能未来大会上,高阳博士分享了他对具身智能的看法,从模型架构、数据到产业应用等多个角度进行了深入探讨。这次会议吸引了众多产业代表参与,线下参会人数超过1000人,线上直播观众更是高达320万,得到了主流媒体的广泛关注。
高阳认为,过去一年具身智能领域的重要进展之一是模型预训练的方法。目前,大部分大模型都需要大量数据进行训练。因此,如何有效利用互联网上的数据进行预训练成为一个重要课题。例如,Google的RT-Trajectory模型采用了新的方法,通过中间表示来指导机器人的动作,减少了对人工数据的依赖。
高阳指出,制定具身智能的标准是为了衡量各公司的技术水平。然而,由于技术限制,短期内大多数机器人只能达到L2.99的水平。因此,标准应更多关注能否满足客户需求,例如机器人在不同场景下的可靠性。
高阳认为,目前我们正处于RobotGPT的1.0阶段,尽管现阶段的进展较为缓慢,但智能技术的发展是呈指数增长的。他预计,四年后我们将达到RobotGPT-3.5阶段,虽然不如预期高阶,但已经具备许多令人惊讶的功能。高阳相信,实现这一目标还需一段时间,但不会太遥远。
高阳坚信,在未来十年内,10%的人类将拥有自己的机器人。他认为,这不仅是技术发展的必然结果,也是人类社会进步的重要标志。