讯飞星火V4.0重磅发布,多项测试夺魁,硬核实力超越GPT-4 Turbo

图灵汇官网

国产大模型星火V4.0发布,开启个性化与行业深度赋能新篇章

6月27日,科大讯飞董事长刘庆峰在星火大模型V4.0的发布会现场,阐述了国产大模型的发展新阶段。这款全面对标GPT-4 Turbo的星火大模型V4.0,实现了整体超越,标志着自主可控的国产大模型正迈向个性化、专属化与深度赋能各行各业的新台阶。

发布亮点与算力集群
现场展示了基于“飞星一号”——全国首个国产万卡算力集群的星火大模型V4.0。该模型在文本生成、语言理解、知识问答、逻辑推理、数学能力等多个方面实现显著提升,尤其在图文识别能力上表现出色。星火V4.0的应用效果已在科研、金融、医疗、司法、办公等领域超越了GPT-4o。

测试结果与中高考表现
经过国内外中英文12项主流测试集的严格测试,星火V4.0在八项关键指标上实现了对GPT-4 Turbo的超越,特别是在理解和推理能力方面,星火V4.0展现出压倒性的优势。在近期的中高考中,星火大模型不仅参与了模拟考试,而且在高考真题实测中,各科成绩均位列第一,被评价为“更擅长解题的大模型”。同样,在中考实测中,星火也取得了优异成绩,尤其是在北京中考横评中。

长文本能力与内容溯源
星火V4.0在长文本通用能力方面与GPT-4 Turbo持平,并针对性地解决了长文档知识问答中的“幻觉”问题。演示中,以四大名著《西游记》为例,星火V4.0迅速且精准地回答了关于唐僧对孙悟空使用紧箍咒次数的问题,并详细列出了相关章节,展现了其强大的内容分析与理解能力。

个性化应用与用户增长
随着星火APP安卓端下载量超过1.31亿次,星火大模型加持下的讯飞智能硬件销量同比增长70%,月均使用次数超过4000万。个性化能力的升级成为了用户关注的焦点。星火APP围绕C端用户推出了“个人空间”、“个人数字健康空间”等创新应用,旨在提供更贴近用户需求的服务。

面向B端的创新服务
为了满足企业和特定岗位的需求,星火企业智能体平台提供了定制化的服务,如为企业员工打造“更懂自己”的企业助理,以及面向销售、采购和招评标等岗位的专属性辅助工具。代码智能体iFlyCode集成的六大场景智能体将采纳率从30%提升至52%,显著增强了企业智能体的实用性。

国产大模型的普及与展望
星火V4.0的发布标志着国产大模型在技术与应用层面取得了重要突破,其在个人与企业层面的广泛应用,预示着AI技术将在更多领域发挥关键作用。随着星火V4.0的推出,更多个人与企业用户能够亲身体验国产大模型带来的便利与效率提升,未来国产大模型有望加速普及,推动AI技术在各行各业的深入应用,解决更多实际问题。

本文来源: 图灵汇 文章作者: 张珂珂