在过去的一年里,OpenAI重新燃起了对机器人领域的兴趣。这并不令人意外,因为OpenAI已经投资了多家初创企业,这些企业致力于为Figure和Physical Intelligence等机器人公司开发软硬件。此外,OpenAI还恢复了四年前解散的内部机器人软件团队。
目前,OpenAI似乎计划将这种兴趣提升到一个新的水平。据知情人士透露,该公司最近在考虑研发一款人形机器人。人形机器人通常具有两条手臂和两条腿,这与大多数在仓库或工厂中常见的一条机械臂执行重复任务的机器人截然不同。人形机器人的开发者认为,相比于需要改变物理环境以适应新型机器人,人形机器人能更灵活地完成人类在日常生活中常见的各种任务。
不过,尽管OpenAI对人形机器人的研究表现出兴趣,但其当前的重点依然是诸如推理模型这样的关键技术,这些模型能够协助自动化多种软件工程和分析任务。然而,这一举动表明OpenAI的野心正在不断扩大,它已经涉足从搜索、网络浏览器到服务器芯片、数据中心规划等多个领域。一些人预计,随着市场需求的增长,OpenAI(以及谷歌)开发人形机器人只是时间问题。据埃隆·马斯克预测,这类产品可能带来高达1万亿美元的市场机会。
值得一提的是,OpenAI的兴趣可能与其投资的两家专注于人形机器人技术的初创公司Figure和1X Technologies形成直接竞争。今年早些时候,OpenAI宣布与Figure合作,为其机器人提供先进的AI模型。此后,Figure展示了一系列新功能,如能够流畅地与人类交流,这在很大程度上得益于OpenAI的支持。
同样,OpenAI的其他产品也在与自己的客户和合作伙伴形成竞争。例如,2022年11月,OpenAI发布了ChatGPT,这使得其竞争对手Jasper措手不及。随后,OpenAI推出了自己的搜索引擎,与客户Perplexity形成竞争;同时,其编码和文档产品Canvas也与另一家客户、投资组合公司Cursor发生了正面冲突。
要实现人形机器人的稳定运行,研究人员还需要解决许多技术难题,包括在未知环境中自主导航,以及处理突发事件,如当机器人正在叠衣服时,有人突然向它扔来一件衬衫,导致机器人不知所措。大型语言模型在这些场景中起着关键作用,它们可以帮助机器人与人类有效沟通,并赋予机器人对世界及其不同概念之间关系的基本理解。
此外,多模态模型——那些能够理解和生成文本、图像及音频的模型——也能赋予机器人“看见”并更好地理解周围环境的能力。从生成式人工智能中汲取的技术,如用于图像生成的扩散技术,也有助于机器人克服物理障碍,如撞墙。
然而,OpenAI在人形机器人领域的雄心壮志也促使它更加依赖中国市场。就像在电动汽车行业一样,中国在机器人供应链和制造方面发挥着至关重要的作用。然而,与中国的更紧密合作可能会受到特朗普政府政策的影响。为了获得新政府的支持,OpenAI一直在强调在美国建立数据中心和人工智能基础设施的重要性,并致力于确保美国在人工智能领域保持领先地位。