国产大模型首超GPT-4o,李开复:中美顶尖模型的时间差只有五个月

图灵汇官网

导读:

零一万物近日发布了全新的旗舰模型——Yi-Lightning,该模型在多项指标上超越了GPT-4o,跻身全球顶尖大模型公司行列。


零一万物新推出的旗舰模型Yi-Lightning在全球范围内表现优异,尤其在中文子榜单上排名世界第二,与o1-mini等模型并列。为了实现这一成就,零一万物采用了先进的Mixture of Experts (MoE)混合专家模型架构,并运用了多阶段训练模式和混合注意力机制,从而降低了训练和推理的成本。


此外,零一万物与多家知名企业如阿里云、360等建立了合作关系,共同推动其toB业务的发展。与此同时,零一万物还推出了AI 2.0数字人,提供了包括动作训练和表情生成在内的多种功能,还推出了一套适用于门店短视频的解决方案。


在近期的国内大模型行业中,关于是否应该放弃预训练的讨论日益激烈。然而,零一万物对此进行了澄清,表示将继续坚持预训练,同时积极探索其他训练方式。零一万物在训练Yi-Lightning时,采用了MoE混合专家模型架构和多阶段训练模式,并引入了混合注意力机制,以提高模型性能并降低成本。


在发布会上,李开复展示了不同模型对莎士比亚作品《李尔王》的翻译,Yi-Lightning的表现尤为出色,证明了预训练的重要性。李开复表示,尽管中国在某些方面仍落后于美国,但零一万物有信心在短时间内缩小差距。


除了技术上的突破,零一万物还在商业上进行了调整,尤其是在toB业务上取得了显著进展。自发布Yi-Large以来,零一万物已与多家知名企业达成合作,推动toB业务的发展。在toC领域,零一万物计划在海外寻找机会,逐步探索国内市场。


目前,Yi-Lightning已上线Yi大模型开放平台,每百万token的价格仅为0.99元,直逼行业最低价。零一万物希望通过这一举措,吸引更多开发者使用其模型,同时保持合理的利润空间。


展望未来,中国大模型产业正进入“耐力赛”阶段。如何利用大模型赋能各行各业,提升企业的生产力,将成为重要的议题。这不仅关系到大模型在各行业的应用前景,还将影响全球的创新格局。

本文来源: 互联网 文章作者: 袁琳琳
    下一篇

导读:划重点 01法国AI创企Gladia成功融资1600万美元,推出多语言实时音频转录和分析引擎。 02该引擎提供超过100种语言的高级实时转录功能,延迟低于300毫秒。 03目前,Gladia的A