从语言模型到世界模型,让机器人真正理解物理世界 | 对话智澄AI胡鲁辉

图灵汇官网

导读

2024年,具身智能成为AI领域的一大热点。它是指人工智能与机器人技术深度融合,使机器人能够直接与物理世界互动。目前,人形机器人被视为具身智能最佳的硬件载体,这也促使全球范围内机器人公司如雨后春笋般涌现。

据公开数据显示,2024年上半年,专注于具身智能机器人的公司已超过70家。其中,华为等大厂也开始布局这一领域,初创企业更是频繁获得融资,有的甚至在产品未落地前就获得了数十亿元的估值。

具身智能的兴起与挑战

在具身智能领域,众多公司纷纷涌现,其中不乏华为这样的大企业。此外,许多初创企业也获得了大量投资,有的产品甚至在未落地前就被估值数十亿元。今年11月,一家名为Physical Intelligence的公司宣布完成4亿美元的新一轮融资,估值达到24亿美元。此外,李飞飞老师创立的空间智能公司World Labs也在短时间内完成了多轮融资。这些现象表明,具身智能已成为全球科技领域的热点之一。

机器人行业的竞争与技术路径

在具身智能领域,创业企业如何脱颖而出?胡鲁辉,智澄AI的创始人兼CEO,分享了他的见解。智澄AI是一家通用人工智能公司,核心技术是理解物理世界模型,旨在打造能够直接与物理世界互动的机器人。

胡鲁辉认为,世界模型与多模态大模型的主要区别在于输入和输出的数据形式。世界模型主要通过传感器直接感知外部环境信息,输出结果以时间序列数据为主,用于控制机器人。相比之下,多模态大模型则以图片、文字、视频、音频等形式交互,输出结果主要是信息。此外,物理智能需要与物理世界实时交互,对时效性要求较高。

智澄AI的发展策略

智澄AI成立于2024年初,胡鲁辉将其发展规划分为两部分:一是打造世界模型,持续进行技术创新和研发突破;二是实现产品落地应用。今年,智澄AI已相继完成了人工智能机器人原型一(TR1)和原型二(TR2)。胡鲁辉表示,尽管世界模型的研发是个持续过程,但产品迭代和商业落地速度很快,目前基本上每两个月进行一次迭代。

泛化能力的重要性

胡鲁辉指出,当前具身智能行业发展的关键挑战之一是机器人的泛化能力。为了应对这一挑战,智澄AI的泛化能力主要体现在三个方面:任务泛化、环境泛化和本体泛化。只有具备这三种泛化能力,机器人才能真正适应各种任务场景,具备真正的可用性。

智澄AI的产品研发与市场策略

智澄AI的战略是两条腿走路,一方面不断进行技术创新和研发突破,另一方面进行产品落地。胡鲁辉透露,目前智澄AI正在与多家头部客户进行深度合作,计划今年以技术产品迭代为主,明年开始产品落地和商业化应用。

未来展望

胡鲁辉表示,智澄AI将坚持物理智能为核心技术,不断加强自身技术能力的迭代,积极拥抱行业变化,推动机器人时代的到来。他还提到,尽管具身智能领域竞争激烈,但智澄AI凭借其独特的技术和市场策略,有望在未来取得显著成果。

智澄AI的创新与技术优势

胡鲁辉还谈到了智澄AI的技术创新和市场策略。他认为,智澄AI的优势在于其强大的泛化能力和技术创新。具体来说,智澄AI的机器人具备任务泛化、环境泛化和本体泛化的能力,能够适应各种复杂的任务和环境。此外,智澄AI的团队在智能工程和模型架构方面拥有丰富的实战经验,这为其在具身智能领域的领先地位奠定了基础。

物理智能与多模态大模型的区别

胡鲁辉进一步解释了物理智能与多模态大模型的区别。物理智能主要通过传感器直接感知外部环境信息,输出结果以时间序列数据为主,用于控制机器人。相比之下,多模态大模型则以图片、文字、视频、音频等形式交互,输出结果主要是信息。此外,物理智能需要与物理世界实时交互,对时效性要求较高。

具身智能的未来前景

胡鲁辉对未来具身智能的发展充满信心。他认为,具身智能将成为推动机器人时代到来的关键因素。尽管目前还面临许多挑战,但随着技术的不断进步和市场的不断发展,具身智能将在未来的机器人行业中扮演重要角色。

本文来源: 互联网 文章作者: 南方都市煲
    下一篇

导读:新智元报道编辑:乔杨【新智元导读】硕士毕业的老黄,不仅是院士,现在还是香港科技大学的荣誉博士。11月23日,在香港科技大学举行的博士学位授予仪式上,不仅梁朝伟被授予人文学荣誉博士学位,作为英伟达