2025，AI Agent还在起跑线

投稿
APP
微信扫一扫获取更多

2025，AI Agent还在起跑线

天平广播

2025-02-07 07:19:30

图灵汇官网

导读

在未来几年，关于智能体的讨论会更加频繁，但如何解决商业化难题才是更为迫切的问题。李小东撰文指出，2024年全球科技峰会上，话题从“大模型参数竞赛”转向“智能体落地场景”，标志着行业认知的重大转变。人们逐渐意识到，AI的价值不仅在于庞大的参数量，更在于其能否像水一样渗透到现实世界的各个角落。

在过去两年，混合专家架构（MoE）和神经符号系统等技术的迭代，使得智能体不再单纯依赖“暴力训练”，而是通过知识注入和逻辑推理的结合，逐步逼近人类的专业能力。全球科技巨头和初创公司纷纷投入资源到AI智能体的研发中，人们甚至产生了智能体即将进入成熟期的错觉。

这种感觉的背后，是行业对智能体定义的微妙变化。与马文·明斯基时代的“自主生命体”理念不同，如今在大模型取得突破性进展的情况下，留给智能体应用落地的时间窗口愈发紧迫。智能体被定义为具备自主感知和行动能力的产品形态，这标志着它们在AI应用落地中的重要地位。

从Anthropic、Google DeepMind到OpenAI，从字节跳动、百度等头部大厂到kimi、智谱等新兴势力，各家公司都在探讨如何利用这项技术颠覆现有行业格局，使智能体真正成为连接实验室与实际应用场景的桥梁。然而，看似繁荣的落地案例实际上只是技术长跑中的零星里程碑。例如，特斯拉Optimus机器人能分拣零件，但遇到传送带故障时仍需人工干预；Anthropic的Computer Use让用户可以指挥Claude操作电脑，但在复杂流程中成功率仅有15%。

这些情况并非个例。当前大多数智能体主要在高度结构化的环境中运行，而现实世界的复杂性远远超出实验室的设定。站在2025年的节点上，尽管被寄予“颠覆生产力”的厚望，智能体依然处于爆发前夜。

坚信行业前景的人认为，随着大模型技术的普及和算力基础设施的完善，智能体将开启一个比移动互联网更大的市场。据麦肯锡和Gartner的研究预测，到2027年，智能体将渗透大部分企业工作流，释放万亿美元的经济价值。我们看到的不是技术的极限，而是一个全新的起点，技术、商业和社会的碰撞正在开始，真正的变革将在混沌中重塑规则。

智能体爆发前夜

许多人认为，AI智能体可以实现工作流程的自动化。事实上，早在多年前，就有企业开始尝试使用基于规则的系统处理简单任务，比如根据预设的知识库自动回答客户的基本问题。最接近智能体形态的产品是IBM Watson这类规则引擎驱动的专家系统和Siri等单点交互工具，但这些系统依靠预设规则和简单的决策树运行，局限性非常大：当面对复杂业务场景时，系统需要工程师编写数以万计的if-then规则，任何微小的规则调整都可能导致系统需要重新设计。

真正革命性的突破出现在2015年前后，随着深度学习技术的发展，AI开始具备自主学习和环境适应能力。谷歌DeepMind团队的AlphaGo在2016年击败围棋世界冠军，标志着人工智能从“机械执行者”向“策略制定者”的转变。彼时的智能体作为基于计算机程序和算法构建的智能实体，也开始具备了基于数据自我迭代的能力，但由于算法泛化能力和场景理解的局限，尚未达到完全自主决策的程度。AlphaGo虽然在围棋领域超越了人类，但无法将其能力迁移到其他场景中。

直到大模型的出现，2020年GPT-3的问世标志着智能体进入了一个新的认知革命，体现在两个方面：一是AI认知的泛化，二是人机交互方式的改变。2022年底，ChatGPT的破圈验证了大模型作为“通用认知引擎”的可能性，随后多模态大模型的爆发，被视为智能体的“成人礼”。GPT-4、Gemini等模型展示了跨模态能力，使智能体初步具备了人类的多感官协同能力。

在这种背景下，具备持续学习能力的AI智能体在一定程度上有望突破工具属性，成为具有商业思维的“数字员工”，即大家现在所说的“企业智能助手”的雏形。与此同时，大模型API调用成本的下降，使得中小企业也能负担得起智能体的部署。据多家研究机构测算，大模型推动智能体部署成本下降了60%-80%。

智能体低门槛、高适配、强进化的应用特征，使得不少为摆脱商业化困境的AI玩家将其视为新的突破口。人们对智能体的终极期待是构建一套“企业认知中枢”，这不仅是执行命令的工具，更是沉淀知识、优化流程、预测风险的核心引擎。这一愿景在过往受限于技术碎片化与成本壁垒，而如今，大模型的泛化能力、多模态融合与成本下降，终于让商业社会看到了破壁的机会。

行业现状冰火两重天

Anthropic CEO Dario Amodei曾断言，未来2-3年内，AI可能在几乎所有任务上超越人类，五年内智能体将渗透90%的企业工作流。智能体之所以成为风口，本质上是市场对“第二代数字化转型”的豪赌。如果说2000-2020年实现了业务流程数字化，那么当下正进入“用智能体重构业务本质”的新阶段。

根据CB Insights，2023年全球AI初创公司融资总额达到425亿美元。而伽马数据显示，过去一年全球AI产业融资金额超过4000亿元，同比增长超77%，其中智能体相关的初创企业融资占比尤为显著。然而，资本市场的狂热与产业实践的谨慎形成了微妙的张力。综合各类机构调研，2024年全球仅小部分智能体部署项目实现盈利，多数企业仍在为“如何让AI理解业务逻辑”而头疼。这种矛盾映射出一个现实：智能体从技术演示到商业闭环之间仍有巨大的鸿沟。

从技术布局看，头部公司的探索方向已现分野。例如，OpenAI的Sam Altman押注“通用智能体”，试图通过GPT构建可适应任意场景的认知引擎，刚刚发布的“Operator”能接管用户电脑操作，例如自动编写代码并调试运行，但是否能避免此前Anthropic Computer Use所暴露的控制能力脆弱性，还需进一步验证；而微软CEO纳德拉选择深度嵌入路线，将Copilot植入Office、Teams等产品矩阵，试图把智能体变成企业工作流的“隐形中枢”，但在供应链管理等复杂场景中，其智能体因缺乏行业知识库支持，也曾引发过合规危机。

具体到智能体的商业化路径，不同类型的公司也呈现出不同的思路：以OpenAI、谷歌和字节跳动为首的平台基建型玩家，和以Anthropic为代表的垂直深耕型选手。平台型与垂直型智能体公司的分野，本质上映射出技术普惠与深度价值的两条进化路径。OpenAI的GPTs上线三个月即吸引超300万开发者，用户通过自然语言指令创建各种智能体，这种“对话即开发”的模式将生态扩张速度提升了10倍，但繁荣背后暗藏隐忧。据SimilarWeb监测，GPTs商店中近70%的智能体生命周期不足30天，同质化工具泛滥导致用户付费意愿持续走低。

用生态化的平台来聚拢开发者，这种玩法在互联网早期就已显现，本质上是科技巨头之间的军备竞赛。然而，平台型玩家虽占据流量与开发者优势，却难免广度稀释精度的悖论。当微软Copilot企业版用户抱怨其生成的财务报告频繁出现会计准则误用时，OpenAI工程师坦言“通用模型在专业场景的知识深度，不足人类专家的1/10”。

垂直型路径则选择向产业纵深处掘金，为了和OpenAI等公司差异化竞争，Anthropic在发布Computer Use之外，还把目光锁定在金融、医疗等对合规审查、风险评估要求极高的领域，以满足这些刚需场景为切入点，提供“宪法AI”约束，用Claude API满足客户的私有化部署。不同于OpenAI的“通用模型+生态扩张”，Anthropic采用“可控性+行业适配”方案，其原因是通过平台形式卖铲子，而是在自身技术优势的基础上，满足行业在AI时代对安全、精准、定制化服务日益增长的需求。

聚焦细分领域且能快速落地的方案，对于科创型公司来说更具实践意义。国外AI科技公司LangChain调查了从工程师、产品经理到商业领袖和高管共计1300多名企业人士，调研的企业里，超过一半用Agent来进行研究和总结的工作，其他依次为个人生产力工具、客户服务、代码生成等方面。在过去两年里，各类AI智能体产品在全球各行各业释放出极大的潜力。主打金融、法律文档智能分析的Hebbia.ai、为企业客户定制AI客服的Sierra，以及职业教育领域的Sana Labs等，都有不错的增长。

资本的疯狂涌入，推动这些新玩家们的融资规模与估值双双飙升。但与此同时，市场卷起的巨大泡沫，一些智能体初创公司的PS Ratio（市销率）甚至超过50倍，远超此前SaaS行业平均水平。例如，Sierra这家成立不到两年的公司，估值已经达到45亿美金，成为智能体初创企业中最热门的投资标的之一。

这种现象也意味着规模天花板。Gartner数据显示，专注金融合规的智能体公司年均营收增速仅为平台型企业的1/3，且客户获取成本持续攀升，部分赛道已出现用80%资源争夺20%头部客户的残酷内卷。

从平台型到垂直型，两种路径的角力实则指向产业的根本矛盾：通用智能体的开放生态能快速铺量却难挖深井，垂直解决方案虽能创造高毛利但复制成本陡增。于是，一些公司已悄然调整战略。Anthropic在Claude API中开放“宪法规则自定义”接口，允许企业将内部合规条款植入模型。这种“可拆卸的垂直化”或许预示着未来智能体市场的终局形态：平台提供基础认知引擎，垂直模块则像App Store中的专业应用般自由组合，最终在开放与封闭、普惠与深度的平衡中重塑商业。

但这些，还仅仅是一种预测。

智能体还在起跑线

回到智能体本身，行业领袖的反应更为冷静。Meta的扎克伯格坦言：“我们高估了短期进展，低估了长期挑战——让智能体真正理解人类意图，可能还需要十年。”英伟达的黄仁勋则预测，“只有当智能体开始改造企业利润表时，真正的革命才刚开始。”

这两种观点看似矛盾，前者警示短期高估，后者强调长期革命性，但背后其实是对当前智能体技术瓶颈和商业化局限下的认知。当前智能体的自然语言交互能力虽已突破语法层面，但在深层语义理解上仍存缺陷，在动态环境和跨系统的协作中，智能体仍存在各种可靠性不足的问题。在商业化层面，不少公司面临成本和收益失衡的问题，波士顿咨询调研显示，企业智能体项目中不到20%达到预期ROI，多数企业仍在“试水”阶段。

如果将视线放到国内，情况将更加复杂。事实上，国内和国外的智能体发展，一开始差异并不明显，但现在差别越来越大。具体表现为，国外在智能体领域的融资规模不断攀升，产品力不断增强，部分超级公司正在崛起；而国内目前大多还停留在概念阶段，这种情况与当年SaaS行业相似。

从中国信通院发布的《2024年人工智能发展报告》来看，在金融、医疗、制造等领域的智能体公司数量庞大，但受限于高部署成本和商业化落地难度，企业级市场的盈利项目占比屈指可数。这一差距背后，是技术路径、产业生态和商业逻辑的多重差异。

目前国外大部分智能体产品的交付，仍沿用软件定制开发或按时订阅的商业路径，这得益于其SaaS化基因和成熟的软件生态基础。另一方面，智能体对传统线下生产和运营流程的替代更加精细，可替代的人力环节更多，因此拥有广阔的发展空间。商业发展的本质是要缩短传统流程，并尽可能降低成本。当成本比原来降低更多时，新的模式就会取代旧模式。但相比之下，国产AI的发展并非是因为软件生态成熟，有了AI如虎添翼；相反，国内软件生态原本就不够完善，缺乏类似Hugging Face的模型库、Databricks的数据处理平台，行业内的API标准化也不足，增加了企业的集成成本。

这种情况导致在AI领域，国内还需要去弥补软件生态方面缺失的功课。更棘手的是，企业客户习惯为“功能模块”付费，但拒绝为“决策能力”溢价。一些头部厂商的智能体一旦报价超过客户预期的范围，客户流失率甚至能达到90%。

因此，在2025年的节点上，清醒地认识到，伴随AI从玩具变成工具，但如果要把智能体从生产力工具变成真正的生产力，这场变革还未抵达交卷的程度，它不会遵循摩尔定律的节奏跃进，而是在试错与迭代中蹒跚前行。