「源神」稚晖君又双叒叕开源,这一次机器人直接进入人类生活!

图灵汇官网

导读

机器之心发布的Deepseek V3,使国产MoE大模型迅速在全球获得广泛关注,成为中国AI领域的领军者。作为中国具身智能的先锋企业,智元在2024年底推出了一项重大成果——与上海人工智能实验室等机构合作,开放了AgiBot World项目。这一举措标志着具身智能领域迎来了一个新的里程碑。

AgiBot World是一个汇集了数百万真实机器人数据的开源数据集。在这个数据集中,机器人不仅能完成简单的桌面任务,还能深度融入人们的日常生活。机器人与人类和谐共处的时代即将来临。

未来机器人的应用场景

2024年,你心目中的未来机器人会是什么样子?它们是否会成为家庭中的“家务管家”,承担洗衣做饭的任务?或者在超市里扮演“打工人”的角色,负责拣货、收银和整理货架?亦或是工厂中的“永动机”,不间断地进行搬运和打包工作?

这些曾经只存在于科幻电影中的场景,如今正逐渐成为现实!

AgiBot World简介

欢迎来到AgiBot World,这是一个汇集了数百万真实机器人数据的开源数据集。作为具身智能领域的关键数据集,AgiBot World有望成为引领我们进入新时代的重要工具,使得机器人的应用更加贴近实际,告别“虚拟角色”的局限。

开源项目地址

通过AgiBot World,机器人的控制变得更加精细。例如,机器人能够优雅地插花,整个过程流畅自如,机械手抓取花材时也能做到轻柔无损。

日常任务演示

机器人不仅可以优雅地插花,还可以高效地完成其他日常任务。比如,它能熟练地刷马桶,再也不用全家抽签决定谁来做这项工作。

具身智能数据集的现状

谷歌的DeepMind曾通过整合多种不同机器人数据构建了Open X-Embodiment数据集,但由于缺乏统一的数据采集流程,许多数据的质量和格式参差不齐,甚至可能影响机器人的学习效果。

斯坦福、伯克利和谷歌等机构构建的DROID数据集虽然包含丰富的场景和技能,但存在大量低质量数据,给机器人的学习带来了困扰。相比之下,一些初创公司基于自采的高质量数据训练的模型,展示了强大的执行能力,进一步证明了高质量数据的重要性。

AgiBot World的特点

为了推动通用具身智能的研究,智元机器人联合上海人工智能实验室、国家地方共建人形机器人创新中心及上海库帕思,发布了全球首个基于真实场景、全能硬件平台和全程质量控制的百万真机数据集——AgiBot World。

这一里程碑式的项目旨在构建国际领先的开源技术基础,标志着具身智能领域进入了新的发展阶段。通过汇聚顶尖资源和技术力量,各方将共同推动具身智能的发展,加速人类迈向通用人工智能的新时代。

数据集的优势

AgiBot World相比Google的Open X-Embodiment数据集,其数据量大出10倍,场景覆盖面广达100倍,数据质量也达到了工业级标准。

多样化任务

AgiBot World数据集涵盖了八十余种日常生活中的技能,从基础操作如抓取、放置、推、拉,到复杂的精细操作如搅拌、折叠、熨烫等,几乎涵盖了日常生活中所需的绝大部分动作。

全域场景

AgiBot World数据集诞生于智元自建的大规模数据采集工厂与应用实验基地,总面积超过4000平方米,包含3000多种真实物品,真实复刻了家居、餐饮、工业、商超和办公五大核心场景。这些场景全面覆盖了机器人在生产和生活中的典型应用需求,为机器人提供了一个高度真实的环境。

具体场景示例

  • 家居场景:再现真实住宅布局,包括卧室、客厅、厨房、卫生间等核心空间,可以实现家务清洁、物品整理和厨房任务等。
  • 超市场景:高度还原超市货架布局与收银区设计,包含生鲜、日用、冷冻等多个品类区域,可以模拟物品上架、货物盘点、顾客引导、无人结算等。
  • 餐厅场景:模拟前厅、后厨与用餐区域,包括点餐台、备餐区、餐桌等,可以实现餐厅服务(点餐、上菜、清理餐桌)、食材传递、后厨协作等。
  • 工业场景:模拟分拣与物流自动化,复刻工业仓库与生产线,包括分拣系统、打包设备、传输带等,可以实现物料分拣、包装打包、物流搬运等。

应用场景展示

  • 客厅:机器人可以使用工具进行全面大扫除,地面的碎屑、灰尘和液体都无所遁形。
  • 电视:机器人可以精确控制掸子掸灰,或者用软布清理桌面的污垢,同时避免划伤表面。
  • 厨房:机器人可以轻松完成切菜、拌料、装盘等工作,也可以清洗瓶子和碗盘。
  • 超市:机器人可以精准控制扫码枪扫描、结算货物,并提供装袋服务。
  • 工厂:机器人在流水线上利用机械臂将物品放入指定的包装盒中,实现物品自动打包。

数据集详细信息

AgiBot World包含超过100种真实场景,按家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)进行分布。此外,80%的任务为长程任务,时长集中在60秒到150秒之间,且涵盖多个原子技能,是DROID和OpenX-Embodiment工作的5倍。该数据集包含了3000多种物品,基本涵盖了这五大场景,并且仍在不断扩展和丰富中。

本文来源: 互联网 文章作者:
    下一篇

导读:2024 年初,英伟达创始人黄仁勋和 9 台机器人登场 GTC 大会的照片曾在科技圈刷屏。2024 年末,又传来英伟达将大力押注机器人的新消息。据媒体报道,其将于 2025 年上半年推出最新一代