Figure突破性进展:机器人VLA模型Helix发布!

图灵汇官网

芝能科技出品

2025年2月21日,美国人形机器人初创公司Figure宣布了其最新成果Helix,这是一款创新的视觉-语言-动作(VLA)模型。该模型旨在推动机器人技术在家庭环境中的广泛应用。

Helix将视觉感知、语言理解和动作控制紧密结合,使人形机器人拥有前所未有的高频精细控制能力,特别是在两台机器人协同工作时。相比传统技术,Helix实现了低功耗和无需任务特定调整的通用行为控制,减少了对专家编程的依赖。

此外,Helix通过独特的“双系统”架构,突破了现有机器人系统在速度和泛化能力上的限制,标志着具身智能技术的新阶段。

Helix的技术创新

机器人智能的革新

Helix模型的核心突破在于首次采用了“系统1+系统2”的架构。

  • 系统1(S1):这是一个高速视觉运动策略,运行速度高达200Hz,能将从系统2获取的语义信息迅速转化为精细的机器人动作。S1主要负责实时控制与反应,确保机器人能够根据环境变化快速调整,尤其在协作任务中表现优异。

  • 系统2(S2):这是一个基于大规模预训练的视觉-语言模型(VLM),以较低频率(7-9Hz)运行,主要负责理解场景、解析语言和设定高层目标。S2为机器人提供宏观语义信息,帮助其做出决策。

这种解耦架构让每个系统按最佳节奏运作,克服了传统机器人系统在速度和泛化能力之间的权衡。系统1负责即时反应,系统2则负责深度思考和决策,两者无缝协作,大大提升了机器人执行任务的灵活性和精确度。

多机器人协作的突破

Helix还支持多台机器人协同工作。过去,机器人协作需要复杂的协调机制和任务分配,而Helix使得两台机器人可以通过共享模型在同一任务中协同工作。

这种能力不仅限于简单的操作,还包括复杂的物体抓取与传递任务。例如,两个机器人可以互相传递物品,或者共同完成需要多台机器人的协作任务。这种能力为未来机器人集群的应用奠定了基础,特别是在家庭环境中,多个机器人可以根据任务需求灵活分工,协同完成复杂的家务任务,极大地提高了机器人的实际应用价值。

Helix还增强了机器人抓取任务的能力。搭载Helix的Figure机器人可以通过自然语言指令,抓取各种小型物品,即使这些物品从未见过。这打破了传统机器人仅能处理已知物品的局限,使得机器人能够在更加复杂和动态的家庭环境中执行任务。

通过自然语言指令,机器人无需事先学习特定的物品识别或抓取动作,而是能够实时根据环境变化做出灵活反应,这为机器人在开放环境中的应用提供了极大的便利。

Helix的应用前景

具身智能的商业化时代

随着Helix的发布,Figure不仅在技术上取得重大突破,也在商业化进程中迈出坚实步伐。Helix的低功耗、高效能和无需任务微调的特性,使其能在较低门槛下实现商业化部署。其微型化设计使得Helix能在嵌入式低功耗GPU上运行,适用于多种应用场景,包括家庭、办公和工业环境。

家庭环境一直是机器人技术的一大挑战。相比受控的工业环境,家庭中的物品形态各异,空间布局千变万化,机器人的任务复杂度也更高。Helix能够根据自然语言指令执行任务,显著提升了机器人的适应性和灵活性,使其在家庭环境中的应用前景广阔。例如,机器人可以帮助家庭成员清理房间、整理杂物,甚至完成如烹饪等复杂的任务。这种灵活的执行能力,使得Helix有可能成为家居自动化的核心驱动力。

Helix的另一个优势是其低成本的商业化潜力。Helix模型的训练只需少量高质量数据,并且通过一次训练即可实现高度泛化,避免了传统机器人技术中需要大量人工干预的过程。这使得Helix不仅在技术上具有竞争力,也在成本上具有显著优势。Figure表示,Helix可以在低功耗GPU上运行,这为其大规模部署提供了可能。

未来,随着技术的不断进步,Helix有望在更多商业化场景中得到应用,从而推动机器人产业的快速发展。根据Figure的计划,未来四年内,公司将量产10万台人形机器人,标志着其从实验室技术走向日常生活的商业化应用。如果这一目标实现,意味着Helix将成为具身智能领域的代表性技术之一,对家庭、医疗、安保等多个行业产生深远影响。

随着技术的不断完善,机器人不仅能完成重复性工作,还将逐步具备处理复杂、动态任务的能力,改变我们对家庭生活和工作环境的认知。

本文来源: 互联网 文章作者: 青年汇聚
    下一篇

导读:世界上第一台人形机器人长啥样?人形机器人掌握的第一项人类技能不是踢球、不是遛狗,也不是搬运重物,那是什么?2月23日,在2025全球开发者先锋大会漕河泾会场举行的《具身智能:解锁未来世界的钥匙》