国产大模型首超GPT-4o，李开复：中美顶尖模型的时间差只有五个月

投稿
APP
微信扫一扫获取更多

国产大模型首超GPT-4o，李开复：中美顶尖模型的时间差只有五个月

袁琳琳

2024-10-16 19:45:40

图灵汇官网

导读：

零一万物近日发布了全新的旗舰模型——Yi-Lightning，该模型在多项指标上超越了GPT-4o，跻身全球顶尖大模型公司行列。

零一万物新推出的旗舰模型Yi-Lightning在全球范围内表现优异，尤其在中文子榜单上排名世界第二，与o1-mini等模型并列。为了实现这一成就，零一万物采用了先进的Mixture of Experts (MoE)混合专家模型架构，并运用了多阶段训练模式和混合注意力机制，从而降低了训练和推理的成本。

此外，零一万物与多家知名企业如阿里云、360等建立了合作关系，共同推动其toB业务的发展。与此同时，零一万物还推出了AI 2.0数字人，提供了包括动作训练和表情生成在内的多种功能，还推出了一套适用于门店短视频的解决方案。

在近期的国内大模型行业中，关于是否应该放弃预训练的讨论日益激烈。然而，零一万物对此进行了澄清，表示将继续坚持预训练，同时积极探索其他训练方式。零一万物在训练Yi-Lightning时，采用了MoE混合专家模型架构和多阶段训练模式，并引入了混合注意力机制，以提高模型性能并降低成本。

在发布会上，李开复展示了不同模型对莎士比亚作品《李尔王》的翻译，Yi-Lightning的表现尤为出色，证明了预训练的重要性。李开复表示，尽管中国在某些方面仍落后于美国，但零一万物有信心在短时间内缩小差距。

除了技术上的突破，零一万物还在商业上进行了调整，尤其是在toB业务上取得了显著进展。自发布Yi-Large以来，零一万物已与多家知名企业达成合作，推动toB业务的发展。在toC领域，零一万物计划在海外寻找机会，逐步探索国内市场。

目前，Yi-Lightning已上线Yi大模型开放平台，每百万token的价格仅为0.99元，直逼行业最低价。零一万物希望通过这一举措，吸引更多开发者使用其模型，同时保持合理的利润空间。

展望未来，中国大模型产业正进入“耐力赛”阶段。如何利用大模型赋能各行各业，提升企业的生产力，将成为重要的议题。这不仅关系到大模型在各行业的应用前景，还将影响全球的创新格局。