机器之心发布的Deepseek V3,使国产MoE大模型迅速在全球获得广泛关注,成为中国AI领域的领军者。作为中国具身智能的先锋企业,智元在2024年底推出了一项重大成果——与上海人工智能实验室等机构合作,开放了AgiBot World项目。这一举措标志着具身智能领域迎来了一个新的里程碑。
AgiBot World是一个汇集了数百万真实机器人数据的开源数据集。在这个数据集中,机器人不仅能完成简单的桌面任务,还能深度融入人们的日常生活。机器人与人类和谐共处的时代即将来临。
2024年,你心目中的未来机器人会是什么样子?它们是否会成为家庭中的“家务管家”,承担洗衣做饭的任务?或者在超市里扮演“打工人”的角色,负责拣货、收银和整理货架?亦或是工厂中的“永动机”,不间断地进行搬运和打包工作?
这些曾经只存在于科幻电影中的场景,如今正逐渐成为现实!
欢迎来到AgiBot World,这是一个汇集了数百万真实机器人数据的开源数据集。作为具身智能领域的关键数据集,AgiBot World有望成为引领我们进入新时代的重要工具,使得机器人的应用更加贴近实际,告别“虚拟角色”的局限。
通过AgiBot World,机器人的控制变得更加精细。例如,机器人能够优雅地插花,整个过程流畅自如,机械手抓取花材时也能做到轻柔无损。
机器人不仅可以优雅地插花,还可以高效地完成其他日常任务。比如,它能熟练地刷马桶,再也不用全家抽签决定谁来做这项工作。
谷歌的DeepMind曾通过整合多种不同机器人数据构建了Open X-Embodiment数据集,但由于缺乏统一的数据采集流程,许多数据的质量和格式参差不齐,甚至可能影响机器人的学习效果。
斯坦福、伯克利和谷歌等机构构建的DROID数据集虽然包含丰富的场景和技能,但存在大量低质量数据,给机器人的学习带来了困扰。相比之下,一些初创公司基于自采的高质量数据训练的模型,展示了强大的执行能力,进一步证明了高质量数据的重要性。
为了推动通用具身智能的研究,智元机器人联合上海人工智能实验室、国家地方共建人形机器人创新中心及上海库帕思,发布了全球首个基于真实场景、全能硬件平台和全程质量控制的百万真机数据集——AgiBot World。
这一里程碑式的项目旨在构建国际领先的开源技术基础,标志着具身智能领域进入了新的发展阶段。通过汇聚顶尖资源和技术力量,各方将共同推动具身智能的发展,加速人类迈向通用人工智能的新时代。
AgiBot World相比Google的Open X-Embodiment数据集,其数据量大出10倍,场景覆盖面广达100倍,数据质量也达到了工业级标准。
AgiBot World数据集涵盖了八十余种日常生活中的技能,从基础操作如抓取、放置、推、拉,到复杂的精细操作如搅拌、折叠、熨烫等,几乎涵盖了日常生活中所需的绝大部分动作。
AgiBot World数据集诞生于智元自建的大规模数据采集工厂与应用实验基地,总面积超过4000平方米,包含3000多种真实物品,真实复刻了家居、餐饮、工业、商超和办公五大核心场景。这些场景全面覆盖了机器人在生产和生活中的典型应用需求,为机器人提供了一个高度真实的环境。
AgiBot World包含超过100种真实场景,按家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)进行分布。此外,80%的任务为长程任务,时长集中在60秒到150秒之间,且涵盖多个原子技能,是DROID和OpenX-Embodiment工作的5倍。该数据集包含了3000多种物品,基本涵盖了这五大场景,并且仍在不断扩展和丰富中。