星动纪元近期发布了一款名为ERA-42的端到端原生机器人大模型,该模型与自主研发的五指灵巧手星动XHAND1相结合,实现了单一模型驱动五指灵巧手完成超过100项复杂精细的操作任务,包括拧紧螺钉、敲打钉子、倒水等。
ERA-42模型使星动XHAND1能够使用各种工具完成多种复杂的操作任务。这款模型具有强大的通用性和灵巧操作能力,无需预编程技能,只需少量数据收集,便能在不到两小时内学会新任务,并持续快速地学习更多技能。
ERA-42模型具备三个关键要素:统一模型、端到端流程和规模化能力。首先,统一模型能够泛化多种任务和环境,通过整合视觉、语言、触觉和身体姿态等信息,实现对不同任务和环境的适应。其次,端到端流程无需人工设计特征或预编程,通过简洁的神经网络链路完成任务,提高了灵活性和开发效率。最后,规模化能力使得模型通过不断积累数据,实现自我完善,不仅提升了性能,还在未知任务中表现出色的自适应和泛化能力。
星动纪元采用大规模视频数据学习策略,涵盖无标注的视频数据、公开的机器人数据、人类活动数据以及遥操作数据,从而降低了数据收集成本。此外,他们还将世界模型融入原生机器人大模型中,使模型不仅具备行动能力,还能理解物理世界,预测未来行动轨迹,并迅速响应外部干扰,从而优化行为直至任务完成。
与传统夹爪机器人相比,ERA-42和星动XHAND1能够使用多种工具,完成更通用、灵巧性更强、复杂度更高的操作任务。例如,通过简单的彩色方块抓取数据训练后,ERA-42能够成功实现从未见过的多样化物体的抓取泛化。
ERA-42展示了强大的抗干扰能力,尤其是在面对单任务或长序列任务时,模型规模越大,任务成功率也越高,这与大语言模型训练中的“Scaling效应”相似。
硬件方面,星动纪元推出了全新的硬件平台,以支持AI应用。星动XHAND1拥有12个主动自由度,采用纯电驱方式驱动五指关节,每个手指配备高分辨率触觉阵列传感器,提供精确的三维力触觉和温度信息。
依托ERA-42,星动纪元的通用人形机器人在通用性和泛化性方面大幅提升,结合其在复杂地形上的稳定行走和奔跑能力,以及上下肢协同作业能力,潜在的应用场景将更加多样化,真正实现原生的通用具身智能体的产业化落地。