在机器人学领域,如何让机器人在未知环境中独立执行任务,一直是科研界面临的一大挑战。以往的研究往往需要针对每一种特定环境,对机器人进行额外的定制化训练,这不仅耗时长且成本高昂。然而,近期一项由美国纽约大学、Meta平台以及机器人公司Hello Robot共同发起的研究,为我们提供了一个崭新的解决方案。
研究团队开发出了一套名为“机器人实用模型”(Robot Utility Models, RUMs)的人工智能体系,旨在赋予机器人在全新环境下执行基本任务的能力,无需额外的训练或调整。这些模型通过零样本学习,使得机器人能够快速适应未知环境。
研究团队精心构建了五种RUMs,分别专注于完成如开门、开抽屉、拾取纸巾、拾取纸袋以及摆正圆柱形物体等基础任务。在实际测试中,这些模型在未见环境中的平均成功率达到惊人的90%。这一成绩展示了RUMs在不同场景和任务上的广泛适应性。
为了提升数据收集效率,研究团队创新地采用了一种低成本方案,即利用固定在经济型拾取器上的iPhone设备,在纽约市和泽西市的40个不同环境中,对每项任务录制了大约1000次演示。随后,基于这五个数据集,研究人员训练了机器学习算法,构建了五个RUM模型。这些模型最终被部署在一款名为Stretch的机器人身上进行实地测试。Stretch配备了一个轮子、一根高杆和一个可伸展的手臂,手臂上搭载了一部iPhone。
在初步测试阶段,机器人的任务完成率为74.4%。通过运用OpenAI的GPT-4o大语言模型进行自我检查和重试,研究团队成功将这一比率提升至90%。这不仅体现了RUMs在不同环境下的高效性能,同时也展示了人工智能技术之间的互补优势。
RUMs模型的成功不仅预示着机器人技术在适应复杂环境方面取得了重大进展,而且通过利用廉价的商用机器人和常见的智能手机,展示了高效自动化系统并不一定需要昂贵的硬件支持。这一成果对于加快机器人在真实世界中的部署,节省时间和资源具有重要意义。同时,利用大模型进行自我检查和错误纠正,也凸显了人工智能技术之间的协同效应。
研究团队已公开发布了RUMs的源代码、数据、模型、硬件设计以及实验和部署视频,此举旨在促进全球范围内的研究和创新。沙菲乌拉对此充满期待:“我们的目标是训练一个模型,使其能在互联网上供人下载并应用于家中的机器人上。”
RUMs的出现标志着机器人学习与适应能力的里程碑式突破。通过实现零样本环境适应,这些模型不仅为机器人在复杂多变的真实世界中执行任务提供了可能,也为推动机器人技术在日常生活中广泛应用铺平了道路。随着技术的不断进步和更多研究的投入,我们有理由相信,未来的机器人将更加智能、灵活且易于部署,为人类带来更加便捷的生活体验。