Figure突破性进展：机器人VLA模型Helix发布！

投稿
APP
微信扫一扫获取更多

Figure突破性进展：机器人VLA模型Helix发布！

青年汇聚

2025-02-23 22:13:06

图灵汇官网

芝能科技出品

2025年2月21日，美国人形机器人初创公司Figure宣布了其最新成果Helix，这是一款创新的视觉-语言-动作（VLA）模型。该模型旨在推动机器人技术在家庭环境中的广泛应用。

Helix将视觉感知、语言理解和动作控制紧密结合，使人形机器人拥有前所未有的高频精细控制能力，特别是在两台机器人协同工作时。相比传统技术，Helix实现了低功耗和无需任务特定调整的通用行为控制，减少了对专家编程的依赖。

此外，Helix通过独特的“双系统”架构，突破了现有机器人系统在速度和泛化能力上的限制，标志着具身智能技术的新阶段。

Helix的技术创新

机器人智能的革新

Helix模型的核心突破在于首次采用了“系统1+系统2”的架构。

系统1（S1）：这是一个高速视觉运动策略，运行速度高达200Hz，能将从系统2获取的语义信息迅速转化为精细的机器人动作。S1主要负责实时控制与反应，确保机器人能够根据环境变化快速调整，尤其在协作任务中表现优异。
系统2（S2）：这是一个基于大规模预训练的视觉-语言模型（VLM），以较低频率（7-9Hz）运行，主要负责理解场景、解析语言和设定高层目标。S2为机器人提供宏观语义信息，帮助其做出决策。

这种解耦架构让每个系统按最佳节奏运作，克服了传统机器人系统在速度和泛化能力之间的权衡。系统1负责即时反应，系统2则负责深度思考和决策，两者无缝协作，大大提升了机器人执行任务的灵活性和精确度。

多机器人协作的突破

Helix还支持多台机器人协同工作。过去，机器人协作需要复杂的协调机制和任务分配，而Helix使得两台机器人可以通过共享模型在同一任务中协同工作。

这种能力不仅限于简单的操作，还包括复杂的物体抓取与传递任务。例如，两个机器人可以互相传递物品，或者共同完成需要多台机器人的协作任务。这种能力为未来机器人集群的应用奠定了基础，特别是在家庭环境中，多个机器人可以根据任务需求灵活分工，协同完成复杂的家务任务，极大地提高了机器人的实际应用价值。

Helix还增强了机器人抓取任务的能力。搭载Helix的Figure机器人可以通过自然语言指令，抓取各种小型物品，即使这些物品从未见过。这打破了传统机器人仅能处理已知物品的局限，使得机器人能够在更加复杂和动态的家庭环境中执行任务。

通过自然语言指令，机器人无需事先学习特定的物品识别或抓取动作，而是能够实时根据环境变化做出灵活反应，这为机器人在开放环境中的应用提供了极大的便利。

Helix的应用前景

具身智能的商业化时代

随着Helix的发布，Figure不仅在技术上取得重大突破，也在商业化进程中迈出坚实步伐。Helix的低功耗、高效能和无需任务微调的特性，使其能在较低门槛下实现商业化部署。其微型化设计使得Helix能在嵌入式低功耗GPU上运行，适用于多种应用场景，包括家庭、办公和工业环境。

家庭环境一直是机器人技术的一大挑战。相比受控的工业环境，家庭中的物品形态各异，空间布局千变万化，机器人的任务复杂度也更高。Helix能够根据自然语言指令执行任务，显著提升了机器人的适应性和灵活性，使其在家庭环境中的应用前景广阔。例如，机器人可以帮助家庭成员清理房间、整理杂物，甚至完成如烹饪等复杂的任务。这种灵活的执行能力，使得Helix有可能成为家居自动化的核心驱动力。

Helix的另一个优势是其低成本的商业化潜力。Helix模型的训练只需少量高质量数据，并且通过一次训练即可实现高度泛化，避免了传统机器人技术中需要大量人工干预的过程。这使得Helix不仅在技术上具有竞争力，也在成本上具有显著优势。Figure表示，Helix可以在低功耗GPU上运行，这为其大规模部署提供了可能。

未来，随着技术的不断进步，Helix有望在更多商业化场景中得到应用，从而推动机器人产业的快速发展。根据Figure的计划，未来四年内，公司将量产10万台人形机器人，标志着其从实验室技术走向日常生活的商业化应用。如果这一目标实现，意味着Helix将成为具身智能领域的代表性技术之一，对家庭、医疗、安保等多个行业产生深远影响。

随着技术的不断完善，机器人不仅能完成重复性工作，还将逐步具备处理复杂、动态任务的能力，改变我们对家庭生活和工作环境的认知。