持续攻坚大模型安全技术,蚂蚁集团、清华大学联合发布“蚁天鉴2.0”

图灵汇官网

智能安全时代:大模型安全防护新纪元——蚁天鉴2.0的崛起

创新亮点概览:蚂蚁集团与清华大学强强联手,于全球人工智能盛会中首发大模型安全一体化解决方案“蚁天鉴”2.0,旨在稳固大模型技术广泛落地的安全基石。

功能革新:新版“蚁天鉴”特设AI鉴真功能,全面增强对图像、视频等多媒体内容的真伪鉴别与深度伪造检测能力。同时,智能体测评模块显著升级,包括构建行业首例“测评智能体”,新增“大模型X-ray”与“大模型基础设施测评”两大功能,形成涵盖大模型基础设施安全评估、大模型风险透视、应用安全测评、AIGC滥用防范、证件伪造识别、以及防御策略在内的综合安全防护体系。

技术创新:“蚁天鉴”2.0通过自动化智能体测评技术,优化模型全生命周期的安全评估流程。其中,“大模型X-ray”功能穿透模型结构,揭示潜在风险源,实现从源头预防安全漏洞。而“大模型基础设施测评”则深入分析算法组件与软件系统,确保模型供应链及运行环境的安全可控。

应用案例:该安全解决方案已在医疗、金融、政务等领域成功部署,有效应对行业特定的信息安全与隐私保护、内容风险管控挑战。蚂蚁AI金融助手“支小宝”融合“蚁天鉴”优势,通过精细化的风险管理、全面评测及用户交互安全策略,确保大模型应用的安全性与精准度。

行业洞察:《大模型安全实践白皮书(2024)》的问世,标志着国内首个大模型安全实践指南的诞生。此白皮书不仅提炼出大模型安全建设的核心策略与技术框架,还通过具体案例展示了在金融、医疗、政务等行业的安全应用实践,为大模型安全生态的构建提供重要参考。

行业高峰会议:全球顶尖专家与产业精英齐聚一堂,围绕大模型安全技术、产业应用及发展趋势展开深度交流。会议聚焦大模型如何安全可靠地推动产业转型,促进数字经济的繁荣发展。

蚂蚁集团的先驱探索:作为国内早期关注大模型安全的领军企业之一,蚂蚁集团在该领域持续深入研究与实践,引领大模型安全技术的发展趋势。随着“蚁天鉴”2.0的推出与商业化的推进,蚂蚁集团正积极塑造一个更为安全、可信的数字未来。

本文来源: 图灵汇 文章作者: 赵建松