1月16日,UALink联盟发布了最新的董事会名单,阿里云成功加入,将与AMD、AWS、微软、谷歌、苹果等公司共同推动新一代GPU互连技术的研发及标准制定。UALink 1.0规范预计于2025年第一季度发布,该规范支持单个计算单元(Pod)内的1024个GPU互连,单个通道(lane)的数据传输速率可达200Gbps。
随着人工智能模型的发展和应用的快速增长,多GPU互连协同计算已成为AI基础设施升级的关键。为了探索更高性能且更加开放的AI芯片级互连技术,UALink联盟于2024年10月正式成立,成为当前全球最重要的AI纵向互连(Scale Up)国际组织之一。UALink与目前由英伟达主导的NVLink技术不同,它由AI产业链上的多家公司共同参与研发,旨在制定统一的开放互连标准,从而促进相互兼容的AI硬件生态系统的发展,为更大规模和更复杂的AI应用提供更高效的基础设施支持。
UALink联盟的创始董事会成员包括AMD、Astera Labs、AWS、Cisco、Google、HPE、Intel、Meta和Microsoft等公司。近期,阿里云、苹果、新思科技等三家公司也加入了这个联盟。UALink联盟董事会主席鲍曼(Kurtis Bowman)指出,阿里云在技术方面的深厚积累将有助于UALink联盟定义出更贴近实际业务需求的Scale Up互连规范,同时也期待新成员在推动UALink协议的发展和构建行业生态方面发挥重要作用。
阿里云的超高速互连负责人孔阳表示,作为全球领先的云计算服务提供商,阿里云始终致力于通过开放合作的方式推进AI服务器的Scale Up互连技术发展,以应对日益增长的AI算力需求和复杂的业务场景挑战。“阿里云自主研发的磐久AI Infra2.0服务器,开放性地定义了AI计算节点和互连系统,能够在统一的硬件架构下支持主流的AI解决方案,创新实现了AI领域的‘一云多芯’。”