人形机器人正在吸引越来越多的关注,尤其是在2024年8月被Gartner列入技术成熟度曲线的萌芽期之后。然而,近期关于这项技术的热度似乎在快速攀升。多家企业密集推出新产品,资本市场的反应也异常活跃,各类媒体报道更是层出不穷。
然而,在一片热闹之中,一个严肃的问题浮出水面:这样的热度是否会让行业陷入泡沫危机?一旦泡沫破裂,人形机器人行业又该如何应对?带着这些问题,《每日经济新闻》记者专访了京城机电旗下的配天机器人CTO郭涛。
郭涛建议,适度的市场热度对行业发展是有益的,因为它能让更多人认识到这项技术的重要性。但从长远来看,真正的进步需要脚踏实地的努力,通过攻克一个个技术难题,让机器人技术逐步走向实际应用。从应用的角度出发,郭涛认为,目前的具身人工智能还无法全面实现通用化。尽管人形机器人领域再次受到关注,他更倾向于关注那些更加贴近现实需求的方向。
通用化的人工智能听起来很诱人,但它背后可能隐藏着一个难以调和的矛盾:它既要具备强大的学习能力,又要能够灵活应对各种未知情况,同时还要拥有出色的环境适应性。配天机器人认为,这些要求之间存在一种“三角制约”,即很难同时满足所有条件。
例如,传统的工业机器人虽然能高效处理复杂任务,但它们通常需要针对特定环境和任务进行专门设计;而自主移动机器人虽然灵活性较高,却只能完成一些简单的搬运或清洁工作;至于远程操控型机器人,则需要专业人士全程参与操作才能完成复杂的任务。这些对比表明,即使有了先进的AI技术,要打造一款真正意义上的通用机器人仍然充满挑战。
市场上之所以对人形机器人表现出极大兴趣,很大程度上是因为AI大模型带来了无限遐想空间。当AI技术和机器人技术相结合时,理论上可以赋予机器人更强的学习能力和适应性,以及更自然的人机交互体验。然而,仅仅依靠大语言模型就能克服具身智能面临的诸多限制吗?
郭涛指出,大语言模型与具身智能在应对变化方面的要求完全不同。比如,让一个人形机器人去清洗餐具,它必须能够适应水温的变化、洗涤剂不足等情况,这对系统提出了极高的实时响应要求。相比之下,大语言模型一旦完成训练,其对外部环境变化的感知能力就会变得相当有限。
此外,具身智能所需的训练数据量远小于大语言模型。郭涛解释说,为了训练一个大语言模型,往往需要数万亿级别的文本数据支持,而且全球范围内的网民每天都在通过聊天、分享照片或视频等方式为这些模型提供源源不断的输入。但在机器人领域,却没有这样便捷的方式来积累行为数据,特别是在工业场景下,数据往往属于敏感信息且高度分散。
如何平衡泛化能力和商业价值之间的关系,是决定具身人工智能能否成功实现产业化的重要因素。郭涛认为,在缺乏足够数据的情况下追求极致性能是不可能实现的,但这并不意味着这条路走不通。在他看来,与其盲目追求所谓的“完全泛化”,不如先专注于解决特定场景下的具体问题,这样不仅能更快地找到盈利模式,也能逐步积累必要的行业经验和技术储备。
工业制造不仅仅是大规模流水线作业,还有很多个性化需求亟待满足。传统工业机器人由于依赖预先设定好的程序,难以很好地适应多样化的生产需求。比如,在船舶制造业中,许多订单数量很少,但涉及到的技术细节却极为复杂。在这种情况下,传统的工业机器人往往显得力不从心。
为此,配天机器人近年来开始探索更具适应性的解决方案。作为国内较早涉足工业机器人领域的公司之一,配天不仅开发出了适用于焊接、打磨、分拣等多个领域的标准化产品,还在尝试将这些技术推广到更多细分市场中去。例如,他们发现,焊接是一项非常重要的工业应用,占据了很大一部分市场份额。因此,公司将重点放在提升焊接机器人的智能化水平上,希望通过优化算法和服务体系,让更多客户受益。
郭涛提到,实现局部泛化并非一蹴而就的事情,而是需要循序渐进地推进。他们计划首先选定几个关键领域开展试点项目,并根据反馈不断迭代改进。一旦某个领域的解决方案得到了市场的认可,就可以将其扩展到其他相关场景中去。他认为,只要坚持正确的方向,随着时间推移,整个行业将会迎来更大的发展机遇。