清华团队重磅发现:机器人正迈向“ChatGPT时刻”!

图灵汇官网

导读:

清华大学交叉信息研究院的研究团队在预印本网站arXiv上发布了一篇论文,揭示了机器人在零样本泛化方面的重大突破。通过调整训练数据规模,研究团队发现机器人在新环境和新物体上的表现与环境多样性和接触物体的数量之间存在显著的幂律关系。

尽管研究成果显著,但机器人在商业和家庭应用方面仍需达到99.9%以上的成功率。为此,研究团队公布了相关代码、数据和模型,希望推动通用机器人的发展。与此同时,企业界也在努力将通用人工智能引入物理世界,如OpenAI等公司。

改写内容

清华大学交叉信息研究院的研究团队近期在预印本网站arXiv发布了论文,展示了机器人在零样本泛化方面的重大进展。通过系统调整训练数据规模,研究团队发现机器人在全新环境和物体上的表现与接触的不同环境和物体数量之间存在显著的幂律关系。

研究团队通过使用超过4万条人类演示数据和超过15000次的实际测试,发现策略的泛化性能与环境和训练时接触的物体数量之间存在显著的幂律关系。当环境多样性足够丰富时,单一环境中过度采集不同操作物体的数据所带来的效用将变得微乎其微。单个物体的演示数据达到800次时,性能开始趋于稳定。团队认为,每个物体有50次演示即可达到预期的泛化水平。

在8种全新的场景中,机器人的成功率高达90%,实现了真正的零样本泛化,无需任何微调即可泛化到新场景和新物体。这表明,只要有足够多的数据,机器人就能够像ChatGPT理解语言一样,自然地理解和适应物理世界。此外,这也简化了数据收集过程,原本可能需要数月才能完成的任务,现在只需几天甚至一个下午。

数据规模法则

清华大学的研究团队在探索具身智能领域的数据规模法则时,受到了大语言模型规模法则的启发。研究发现,数据规模法则展示了机器人策略在新环境中的性能与训练中的环境和物体数量之间的幂律关系。简单来说,训练中包含的环境和物体数量越多,泛化性能越好。此外,研究还发现提高数据质量比单纯增加数据量更为重要,数据的多样性是关键因素之一。

商业化前景

尽管研究团队的发现令人振奋,但机器人在商业和家庭应用方面仍需达到99.9%以上的成功率。目前的研究仅关注了单任务策略的数据规模,而多任务的通用性还需要进一步探索。此外,团队还发现了三个重要的模型规模化现象:视觉编码器必须经过预训练和完整微调;扩大视觉编码器的规模能显著提升性能;而扩大扩散模型的规模并未带来明显的性能提升。

为了推动通用机器人的发展,研究团队公布了相关代码、数据和模型。企业界也在积极努力,如OpenAI等公司正在致力于将通用人工智能引入物理世界,为机器人提供动力。

未来展望

尽管研究团队的成果令人期待,但他们认为,要实现真正的通用机器人还需要更多技术突破。研究团队的成员胡英东博士表示,他们的模型还不是真正通用的,无法处理用户可能给出的各种指令。不过,他们相信未来一定会出现通用机器人,只是时间尚未确定。

研究团队的发现已在多个现实场景中得到验证,胡英东博士认为这些实验结果最终将转化为实际应用,例如服务机器人在餐馆的应用,或者在养老院协助老年人护理,这些应用都将具有重要意义和深远影响。

本文来源: 互联网 文章作者: 电子工程世界
    下一篇

导读:划重点01首届珠海国际灵巧操作挑战赛暨具身智能产业大会于11月4-5日举办,珠海创新企业发布了11项技术攻关项目,金额超亿元。02具身智能有望成为继PC、智能手机、新能源汽车之后的下一个典型智能