AI已经成为各大科技巨头竞争的关键领域,而蚂蚁集团在这一领域的布局尤其值得关注。2024年12月30日,支付宝宣布推出新一代AI视觉搜索产品“探一下”。该产品基于自研的多模态大模型技术,能够提供更快速、有用且有趣的生成式搜索服务。
AI已经成为各大科技公司争夺的重要领域,而蚂蚁集团在这方面的布局尤为引人注目。2024年12月30日,支付宝推出了新一代AI视觉搜索产品“探一下”。这款产品基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供更快、更有用、更有趣的生成式搜索服务。
蚂蚁集团在AI领域的布局已初具规模,尤其是在自建算力集群、自研大模型等方面。在过去两年里,蚂蚁集团自建了万卡异构算力集群,自主研发了百灵大语言模型和多模态大模型。应用层面,推出了三大AI管家,让AI“有手有脚”能够处理事务,开创了新型的办事型AI形态。在生态方面,蚂蚁集团以支付宝商业生态为中心,发布了智能体开发平台“百宝箱”,为千万商家提供AI支持。
马云在蚂蚁集团的20周年晚会上表示,未来20年AI带来的变革将超出所有人的预期。蚂蚁集团正尝试以支付宝为核心,利用AI加速科技驱动力,AI有望成为蚂蚁集团的重要组成部分,甚至成为打造新蚂蚁的推动力。
与大多数科技巨头布局的AI社交、AI视频、AI音乐等热门领域不同,支付宝通过“探一下”切入了一个全新的生成式AI视觉搜索赛道。Tech星球体验发现,“探一下”基于蚂蚁百灵多模态大模型技术,能够提供更快速、有用且有趣的生成式搜索服务。用户可以在支付宝首页点击“扫一扫”向左滑动,或者在支小宝App中快速访问“探一下”。
不同于传统的扫五福等玩法,支付宝上线的“探一下”不仅融合了原有的AR扫描功能,还具备三个特色核心功能:探知识、探灵感、探文本。这些功能兼具实用性和趣味性。
探知识:能够识别内容并在捕捉画面主体后生成识别结果,并据此进行发散性的信息智能推荐。例如,用户在购买手机时可以通过“探知识”查看手机的配置信息、设计灵感等。
探文本:可用于文本提取和翻译,适用于跨境游客、跨境商家和海淘买家等群体。例如,当遇到外文菜单或商品详情页时,可以快速提取关键信息并翻译。
探灵感:能够为静态图片添加趣味解读,让用户在网上晒图时不再为文案发愁。Tech星球发现,“探灵感”在小红书上受到了许多用户的欢迎。
尽管“探一下”在创新性和实用性方面表现出色,但仍有一些需要改进的地方,例如在光线、角度、距离等实际场景因素影响下的识别准确性问题。
搜索技术已经经历了20年的演变,但始终未能彻底革新搜索结果的呈现方式。在Make 2024钉钉生态大会上,钉钉COO傅徐军提到传统搜索引擎存在的问题,表示这些搜索引擎难以精准理解用户的真实意图,只能提供机械化的搜索结果。生成式AI技术为搜索带来了新的可能性,许多企业都在尝试革新搜索技术。例如,Google旗下的Google Lens也在不断扩展功能边界,但其核心理念仍是以“搜”为主。相比之下,“探一下”通过视觉大模型的识别和思考,基于生成式AI技术给出系统性的答案,而非碎片化的信息。
20年前,中国正式接入国际互联网,诞生了一批传奇性互联网企业。如今,随着技术红利见顶和互联网市场的饱和,对于蚂蚁集团这样的互联网公司来说,急需探索新技术、挖掘新盈利点,寻求突破。AI技术可能成为像网络宽带一样的使能技术,催生新的商业形态。
蚂蚁集团确立了“AI First”的方针,涵盖了大模型、知识图谱、运筹优化、图学习以及可信AI等多个领域,构建起自身的技术体系。在2024外滩大会上,蚂蚁集团推出了多项成果,包括AI生活管家App“支小宝”、升级版AI金融管家“蚂小财”、面向医疗及泛健康行业的“AI健康管家”等。同时,蚂蚁集团启动了支付宝智能体生态开放计划,上线智能体开发平台“百宝箱”,吸引了外部开发者参与,丰富了生态多样性。
以百灵大模型为核心驱动力,蚂蚁集团为各应用赋予了多模态理解和生成等能力,推动了产品稳定运行与更新。例如,2024年支付宝五福节期间,百灵大模型服务近6亿人次,通过AI互动玩法提升了用户体验。
除了内部研发,蚂蚁集团还通过投资与合作拓展边界。2024年,蚂蚁集团投资成立了多家AI相关企业,例如在上海成立“上海蚂蚁灵波科技有限公司”,聚焦具身智能领域;8月领投秘塔科技超1亿元的新一轮融资,推动AI搜索技术的发展。
支付宝还在垂直行业中持续泛化AI能力,例如针对政务场景打造了政务AI解决方案,提高了民生服务分发效率,发挥了AI在实际场景中的作用。
大模型的竞争是一场关于技术、资金、人才的较量。AI能否成为开启蚂蚁集团新业务大门的关键,助力其实现新一轮的成长蜕变,值得期待。