「源神」稚晖君又双叒叕开源，这一次机器人直接进入人类生活！

投稿
APP
微信扫一扫获取更多

「源神」稚晖君又双叒叕开源，这一次机器人直接进入人类生活！

2024-12-30 12:57:02

导读

机器之心发布的Deepseek V3，使国产MoE大模型迅速在全球获得广泛关注，成为中国AI领域的领军者。作为中国具身智能的先锋企业，智元在2024年底推出了一项重大成果——与上海人工智能实验室等机构合作，开放了AgiBot World项目。这一举措标志着具身智能领域迎来了一个新的里程碑。

AgiBot World是一个汇集了数百万真实机器人数据的开源数据集。在这个数据集中，机器人不仅能完成简单的桌面任务，还能深度融入人们的日常生活。机器人与人类和谐共处的时代即将来临。

未来机器人的应用场景

2024年，你心目中的未来机器人会是什么样子？它们是否会成为家庭中的“家务管家”，承担洗衣做饭的任务？或者在超市里扮演“打工人”的角色，负责拣货、收银和整理货架？亦或是工厂中的“永动机”，不间断地进行搬运和打包工作？

这些曾经只存在于科幻电影中的场景，如今正逐渐成为现实！

AgiBot World简介

欢迎来到AgiBot World，这是一个汇集了数百万真实机器人数据的开源数据集。作为具身智能领域的关键数据集，AgiBot World有望成为引领我们进入新时代的重要工具，使得机器人的应用更加贴近实际，告别“虚拟角色”的局限。

开源项目地址

HuggingFace：https://huggingface.co/agibot-world
Github：https://github.com/OpenDriveLab/agibot-world
项目主页：https://agibot-world.com/

通过AgiBot World，机器人的控制变得更加精细。例如，机器人能够优雅地插花，整个过程流畅自如，机械手抓取花材时也能做到轻柔无损。

日常任务演示

机器人不仅可以优雅地插花，还可以高效地完成其他日常任务。比如，它能熟练地刷马桶，再也不用全家抽签决定谁来做这项工作。

具身智能数据集的现状

谷歌的DeepMind曾通过整合多种不同机器人数据构建了Open X-Embodiment数据集，但由于缺乏统一的数据采集流程，许多数据的质量和格式参差不齐，甚至可能影响机器人的学习效果。

斯坦福、伯克利和谷歌等机构构建的DROID数据集虽然包含丰富的场景和技能，但存在大量低质量数据，给机器人的学习带来了困扰。相比之下，一些初创公司基于自采的高质量数据训练的模型，展示了强大的执行能力，进一步证明了高质量数据的重要性。

AgiBot World的特点

为了推动通用具身智能的研究，智元机器人联合上海人工智能实验室、国家地方共建人形机器人创新中心及上海库帕思，发布了全球首个基于真实场景、全能硬件平台和全程质量控制的百万真机数据集——AgiBot World。

这一里程碑式的项目旨在构建国际领先的开源技术基础，标志着具身智能领域进入了新的发展阶段。通过汇聚顶尖资源和技术力量，各方将共同推动具身智能的发展，加速人类迈向通用人工智能的新时代。

数据集的优势

AgiBot World相比Google的Open X-Embodiment数据集，其数据量大出10倍，场景覆盖面广达100倍，数据质量也达到了工业级标准。

多样化任务

AgiBot World数据集涵盖了八十余种日常生活中的技能，从基础操作如抓取、放置、推、拉，到复杂的精细操作如搅拌、折叠、熨烫等，几乎涵盖了日常生活中所需的绝大部分动作。

全域场景

AgiBot World数据集诞生于智元自建的大规模数据采集工厂与应用实验基地，总面积超过4000平方米，包含3000多种真实物品，真实复刻了家居、餐饮、工业、商超和办公五大核心场景。这些场景全面覆盖了机器人在生产和生活中的典型应用需求，为机器人提供了一个高度真实的环境。

具体场景示例

家居场景：再现真实住宅布局，包括卧室、客厅、厨房、卫生间等核心空间，可以实现家务清洁、物品整理和厨房任务等。
超市场景：高度还原超市货架布局与收银区设计，包含生鲜、日用、冷冻等多个品类区域，可以模拟物品上架、货物盘点、顾客引导、无人结算等。
餐厅场景：模拟前厅、后厨与用餐区域，包括点餐台、备餐区、餐桌等，可以实现餐厅服务（点餐、上菜、清理餐桌）、食材传递、后厨协作等。
工业场景：模拟分拣与物流自动化，复刻工业仓库与生产线，包括分拣系统、打包设备、传输带等，可以实现物料分拣、包装打包、物流搬运等。

应用场景展示

客厅：机器人可以使用工具进行全面大扫除，地面的碎屑、灰尘和液体都无所遁形。
电视：机器人可以精确控制掸子掸灰，或者用软布清理桌面的污垢，同时避免划伤表面。
厨房：机器人可以轻松完成切菜、拌料、装盘等工作，也可以清洗瓶子和碗盘。
超市：机器人可以精准控制扫码枪扫描、结算货物，并提供装袋服务。
工厂：机器人在流水线上利用机械臂将物品放入指定的包装盒中，实现物品自动打包。

数据集详细信息

AgiBot World包含超过100种真实场景，按家居（40%）、餐饮（20%）、工业（20%）、商超（10%）和办公（10%）进行分布。此外，80%的任务为长程任务，时长集中在60秒到150秒之间，且涵盖多个原子技能，是DROID和OpenX-Embodiment工作的5倍。该数据集包含了3000多种物品，基本涵盖了这五大场景，并且仍在不断扩展和丰富中。