Baichuan 2 完胜 LLaMA2，本土开源大模型的时代来了

投稿
APP
微信扫一扫获取更多

Baichuan 2 完胜 LLaMA2，本土开源大模型的时代来了

星小海

2023-09-12 00:00:00

图灵汇官网

导读：

本土大模型时代的加速到来已成为行业共识，然而其实际进程之迅速超出了所有预期。近期，中国本土大模型在全球范围内崭露头角，尤其在国际知名开源平台HuggingFace上，百川智能的两款开源模型Baichuan7B及Baichuan13B受到了全球开发者的热烈追捧，其Baichuan开源系列在过去一个月内的下载次数已突破347万次，荣登下载量榜首。

领先与超越：Baichuan2系列的强势登场

百川智能不仅没有止步于此，而是持续推动开源生态的发展。9月6日，该企业举办了以“百川汇海，开源共赢”为主题的大型模型发布会，宣布正式开源Baichuan 2系列大模型，包括7B、13B的基础版和对话版，并提供了4比特量化版本，且全部免费供商用。Baichuan 2系列大模型的发布，不仅标志着中国开源大模型时代的到来，更实现了对LLaMA2的全面超越。

Baichuan2：全方位超越LLaMA2

Baichuan 2系列大模型在MMLU、CMMLU、MedQA USMLE等多个基准测试中表现出色，特别是在总体性能、垂直领域、数学与编程、多语言、安全性和中间检查点方面，显著领先于LLaMA2，甚至接近GPT的水平。相比于之前的Baichuan-13B-chat版本，Baichuan2-13B-Chat在安全性、对话能力、逻辑推理、语义理解和代码编写方面均有显著提升，各项指标均有大幅提升。

巨大的参数效率与创新的开源模式

Baichuan2系列模型在70亿参数的情况下，已经能够与拥有130亿参数的LLaMA2模型相匹敌，这表明在同等参数规模下，Baichuan2系列模型具备强大的竞争力。百川智能在研发过程中，借鉴了丰富的搜索经验，对大量模型训练数据进行了多维度的质量评估，确保了模型的质量和效率。此外，百川智能首次公布了从3000亿到2.6万亿Token模型训练全过程的Check Ponit，为大模型训练提供了透明的流程指导，开创了中文大模型领域的先河。

开源新模式与全面开放

不同于传统的开源模式，百川智能的开源策略更加彻底和开放，不仅开源模型权重，还分享了数据处理、模型结构优化、Scaling Law、过程指标等关键信息，这为大模型的学术研究提供了前所未有的支持。Baichuan2-7B的技术报告更是详尽地揭示了模型训练的全过程，使得研究者能够深入了解模型的构建细节，极大地促进了国内大模型科研工作的进展。

选择开源大模型的新标准

对于选择开源大模型的决策者而言，Baichuan2系列的推出无疑提供了新的考量标准。相较于OpenAI的API限制和LLaMA的地域和语言局限，Baichuan2不仅在性能上优于LLaMA2，还提供了全面的开源支持和更高的适应性，解决了中文环境应用需求的难题。Baichuan系列开源模型正引领着全球开源社区进入中文开源大模型的新时代，标志着中国在通用人工智能领域的重要贡献。