优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练

图灵汇官网

引领智能时代:国产算力驱动技术创新与繁荣

在人工智能时代,算力成为推动技术进步和创新的核心驱动力。面对AI算力需求激增、高端芯片供应受阻及技术封锁的挑战,自主可控的国产技术方案成为关键。通过壮大国产智算集群规模,我们能突破重重限制,促进国产大模型产业生态的繁荣。

作为一家中立、安全的云计算服务提供商,优刻得深耕人工智能智算领域,与国内主要AI芯片厂商紧密合作,共同构建了“国产千卡智算集群”,现已投入商业运营。北京智源人工智能研究院作为首批用户,标志着优刻得自主可控的国产GPU算力底座已具备支撑大模型研发与验证的能力,双方在国产AI智算领域的合作正式展开。

国产千卡智算集群:千亿参数大模型的训练与推理

优刻得国产智算集群依托国产通用GPU构建,旨在快速搭建大规模分布式训练环境,支持上千卡规模、千亿参数级别的大模型训练和推理任务,有效应对算力瓶颈,加速AI算力的国产化进程。

集群采用软硬件一体化设计,提供低延迟、高吞吐、高可用的IB网络环境,并支持GDR技术,确保在算力获取、数据传输和算力调度方面的高效运行。在精心适配和优化后,集群在上海青浦智算中心全面部署,智源研究院正利用国产算力,高效推进大模型的训练与推理工作。

突破算力瓶颈,技术自主可控

依托国内知名AI芯片厂商自主研发的高性能GPU IP,优刻得国产智算集群具备强大多精度混合算力、64GB高带宽显存和先进多卡互联技术,特别适用于千亿参数AI大模型的训练和推理,同时增强了技术的自主性。在计算精度、稳定性、易用性和算力利用率方面,集群展现出优异性能,助力智源研究院在千亿MoE大模型训练上取得显著成果。

支持异构混训,提升模型研发效率

面对多元异构算力的发展趋势,智源团队正积极探索在多芯片上实现大模型稳定高效训练与推理的并行框架。通过与优刻得、国产芯片厂商的合作,构建“混训集群”,验证了国产算力与英伟达主流计算平台混合组网、异构混训的可行性。

生态兼容,加速业务发展

优刻得国产智算集群全面兼容CUDA等主流GPU生态系统,实现CUDA应用的零成本迁移,快速适配,确保对行业领先人工智能模型的高效支持。集成多种深度学习编程框架,集群提供完善的软件栈工具,支持高效集群管理和资源优化,加速人工智能领域的布局和发展。

随着全球AI服务市场的变化,国内对于建设自主可控智算平台的需求日益凸显。优刻得致力于打造高性能AGI算力底座,携手合作伙伴共建大型国产智算集群,通过全栈智算解决方案,服务于大模型训练和推理,不断推动我国科技创新与智算产业升级,迈向新的高度。

本文来源: 图灵汇 文章作者: 刘泽乌兰