随着近期腾讯、百度等互联网巨头相继接入DeepSeek,DeepSeek不仅控制了微信和百度搜索这两个主要入口,还全面融入腾讯和百度的生态系统,影响了数亿用户。
一方面,互联网巨头接入第三方DeepSeek反映了他们无奈和被动的局面。DeepSeek在性能、成本和易用性方面的优势,使得自主研发的模型显得逊色,迫使巨头通过接入来维持竞争力。
另一方面,巨头们希望通过现有生态系统快速整合先进技术,巩固市场地位。他们试图通过整合生态和组织变革,将DeepSeek转化为自身的竞争优势。
自生成式AI问世以来,一个关键问题是如何将AI应用于更广泛的场景。以前的AI大模型大多难以实现深度场景化应用,因为需要打通大量数据孤岛和应用场景。这些数据和场景通常由不同的互联网平台分割开来。
据IDC报告,中国互联网行业中73%的数据集中在腾讯、阿里、字节等前十平台上,但跨平台数据调用的成功率不足5%。例如,淘宝、京东等电商用户的浏览记录和购买历史与抖音、微博等社交平台的兴趣标签数据相互独立。用户在不同平台上的行为数据分散,导致AI难以构建完整的用户画像。
在搜索领域,尽管各大头部模型如Kimi、智谱等都具备联网搜索功能,但目前所有能联网的AI只能抓取公域信息,而无法获取公众号平台等私域内容。这种私有流量池的存在,实际上将大量用户数据牢牢掌控在少数平台手中。
DeepSeek的出现改变了这一现状。凭借强大的性能和低廉的成本,DeepSeek的“生态朋友圈”已经扩展到智能硬件、汽车、传媒、互联网、半导体等多个行业。
在这种趋势下,各大巨头认识到,市面上的大模型众多,但将来真正能够“一统天下”的,很可能是像DeepSeek-R1这样在性能和成本方面均表现出色的“超级模型”。
即便借助第三方模型的性能仍能保持流量优势,腾讯、百度等大厂也不会放弃自主研发的模型。腾讯更新了其APP,推出了混元推理模型T1。这显示出巨头们并未放弃自主研发,而是通过外部技术弥补自身短板,试图在技术依赖与自主可控之间寻求平衡。
DeepSeek之所以能成功,得益于其高效的多头潜在注意力(MLA)机制。这种机制使模型在面对多个选择时,能同时考虑多个方向,并选出最佳路径,从而提高效率并节省资源。
尽管DeepSeek公开了模型的权重参数,竞争对手也难以完全复现这种选择逻辑,因为这需要大量的测试数据和实战经验。这不仅是一个算法调整的问题,还需要深入理解语言模型的内在机制。
DeepSeek吸引了一批顶尖AI人才的原因之一是其扁平化、灵活的组织结构。创始人梁文锋表示,DeepSeek不鼓励内部竞争和加班,给予员工极大的自由度,让他们可以自行选择任务并使用算力。这种文化吸引了具有海外经验的顶尖人才加入,如潘梓正、Junxiao Song等。
在AI时代,“大模型需要更多数据、操作权限”与“各平台独立、割裂的场景生态”之间的矛盾日益显著。这背后既有技术能力的限制,也有商业逻辑的制约,例如数据共享涉及利益重构,但现有商业模式难以平衡各方诉求。
未来的互联网生态趋势是“平台为主”还是“AI优先”?从当前中国AI竞争格局来看,传统互联网巨头的各种超级APP形成的“数据+场景”护城河难以撼动。
未来的破局点可能在于“数据流动性×场景适配性×商业可行性”的多元平衡,而非单一维度的突破。短期内,传统互联网巨头与第三方AI企业可能会通过合作实现共赢。但从长远来看,第三方可能逆袭,尤其是在AI带来认知效率极大提升的情况下,可能会倒逼巨头进一步开放接口。
在技术突破、政策与商业模式的动态博弈下,传统巨头的护城河并非绝对不可撼动,AI优先的趋势可能在特定领域逐步显现。