百度文心大模型3.5 在IDC技术评估报告拿下7个满分

图灵汇官网

在国内的众多AI大模型竞争中,哪家的实力最强?全球领先的IT市场研究和咨询公司IDC最近发布的《AI大模型技术能力评估报告,2023》给出了答案。报告指出,百度的文心大模型3.5在12项指标中取得了7项满分,这反映了该模型在基础技术和产业应用方面的深度和广度。

IDC的评估涵盖了产品的技术能力、服务生态以及行业应用三大方面,共考察了多项指标,其中“算法模型”和“行业覆盖”是衡量大模型能力的关键指标。当前,大模型正处于快速发展的阶段,产品和技术能力、行业应用能力变得尤为重要。

在产品技术能力方面,“算法模型”尤为关键,它决定了大模型的应用效果。只有通过算法模型技术的突破,实现具有广泛应用优势的大模型,才能更好地覆盖各个行业,从而让各行各业都能享受到技术进步带来的好处,解决AI落地难度大的问题。

在行业应用能力方面,广度是各大模型厂商最为关心的指标。“行业覆盖”通过企业级客户数量和落地行业的数量来衡量,体现了大模型在实际应用中的实力,反映了其通用性和行业结合的能力。

“算法模型”和“行业覆盖”这两个核心指标之间存在紧密联系,行业覆盖的广度是算法模型通用性的直观体现,也为算法模型能力的持续提升提供了正向反馈,形成了良性循环。

在此次评估中,百度文心大模型在这两项指标上均获得了唯一的满分,充分展示了其在技术优势和行业应用方面的领先地位。这是IDC首次提出AI大模型技术能力评估框架,国内主流大模型厂商如百度、阿里、腾讯、华为、科大讯飞、360、商汤等共14家参与了此次评估。结果显示,百度的AI大模型整体竞争力处于领先水平,是技术突破者和应用引领者。百度文心在模型能力、工具平台、生态布局以及行业覆盖上都表现出色,并已进入商业化探索阶段。

文心大模型在此次评估中获得了算法模型维度的唯一满分,充分体现了百度在大模型核心技术上的领先优势。百度自2019年起便专注于预训练模型的研发,先后发布了知识增强型的文心系列模型。不久前,百度正式推出了文心大模型3.5版本,在基础模型、知识增强、检索增强等多项核心技术上取得突破,各项能力都有显著提升。

多个公开的测评显示,文心大模型3.5版支持下的文心一言在中文能力方面表现突出,甚至超越了GPT-4,在综合能力上超过了ChatGPT,远远领先于其他大模型。

文心大模型的成功归功于百度“芯片-框架-模型-应用”四层技术栈的优势、知识增强的核心特色和繁荣的大模型生态系统。据报道,百度自主研发的飞桨平台有效支撑了大模型的高效训练和推理。飞桨与文心的协同优化,使得文心大模型3.5最新版本的效果提升了50%,训练速度提高了2倍,推理速度提升了30倍。知识增强作为文心大模型的核心特色之一,实现了更高的效率、更好的效果和更强的可解释性。

在大模型生态方面,百度文心已形成企业、教育、社区三位一体的生态体系。最新数据显示,百度拥有超过750万开发者基础,20万企业生态基础,开展了多层次的大模型人才培训、企业赋能和开发者运营。百度还设立了10亿创投基金,鼓励大模型创意,促进大模型生态的繁荣。

文心大模型在中国拥有最大的产业应用规模,行业覆盖方面也获得了唯一满分。AI大模型已从单纯拼参数发展到拼应用,进入大规模可复制的产业落地阶段。百度文心大模型源于产业实践,服务于产业实践,率先提出了行业大模型的落地思路,联合国家电网、浦发银行、泰康、吉利、哈尔滨市、深圳燃气、TCL、上海辞书出版社等企业单位,合作发布了11个行业大模型,是行业内最早和广泛深入推动行业大模型的厂商。

例如,在能源电力领域,百度与国家电网有限公司合作,基于百度文心大模型,联合训练电力行业大模型,应用于电网设备和客户服务等实际业务场景,显著提升了电网运营的精细化、自动化和智能化水平。百度还与深圳燃气合作,发布了燃气行业大模型,解决了燃气企业运营场景复杂、安全风险识别困难等问题。

未来,所有企业都将高度依赖大模型,所有产品都将基于大模型进行开发。百度文心大模型将继续发挥其算法模型的技术优势,助力各行业中国企业将大模型内化为生产力工具,加速智能化转型,构建面向全球的强大竞争力。

本文来源: 网络 文章作者: 平措卓玛
    下一篇

【环球网科技综合报道】1月25日,记者从小马智行获悉,在首批获得北京市高级别自动驾驶示范区高速测试资质的基础上,小马智行近日又获得天津市交通运输委、天津市工业和信息化局和天津市公安局三家政府单位联合认