机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

图灵汇官网

导读

清华大学交叉信息研究院的研究团队在具身智能领域取得了重大突破,发现了一种名为“data scaling laws”的规律,使得机器人能够实现真正的零样本泛化。这一发现有望彻底改变我们开发通用机器人的方式。

主要内容

清华大学团队的发现

研究团队在真实场景中收集了大量的人类演示数据,发现了一些重要的幂律关系:

  1. 新物体的泛化能力:机器人对新物体的泛化能力与训练物体数量呈幂律关系。
  2. 新环境的适应能力:机器人对新环境的适应能力与训练环境数量呈幂律关系。
  3. 环境-物体组合的泛化能力:机器人对环境-物体组合的泛化能力与训练的环境-物体对数量呈幂律关系。

数据收集策略

研究团队还解决了数据收集的问题,提出了优化策略:

  1. 环境数量:当环境数量足够多时,在单一环境中收集多种物体的数据收益有限。
  2. 物体数量:单个物体的演示数据容易达到饱和状态,每个物体只需约50次演示即可。

通过这些策略,研究团队在短时间内成功收集到了高质量数据,并在新场景中取得了高达90%的成功率。

模型规模的影响

研究团队在模型规模方面也有重要发现:

  1. 视觉编码器的预训练与微调:视觉编码器必须经过预训练和完整的微调。
  2. 视觉编码器的规模:扩大视觉编码器的规模可以显著提升性能。
  3. 扩散模型的规模:扩大扩散模型的规模并未带来明显的性能提升,这一现象仍需进一步研究。

未来展望

数据规模化正在推动机器人技术进入新的阶段。研究团队认为,提升数据质量可能比单纯增加数据量更为重要。未来,通过确定扩展数据类型和高效获取高质量数据的方法,机器人技术将取得更大的进展,实现更广泛的应用。

总结

清华大学交叉信息研究院的研究团队发现的“data scaling laws”为机器人技术的发展开辟了新的道路。这一发现不仅展示了机器人在处理新物体和新环境方面的强大能力,也为未来的机器人研究提供了宝贵的理论支持。

本文来源: 互联网 文章作者: 李佩珏
    下一篇

导读:划重点01中山大学和华为诺亚等单位的研究团队提出了一种全新的原语驱动的路径点感知世界模型PIVOT-R。02与现有方法相比,PIVOT-R通过关注与任务相关的路径点预测,提升机器人操作的准确性,