十万块英伟达H100打造,马斯克宣布“全球最大 AI 训练集群”投用

图灵汇官网

科技资讯 | 马斯克宣布孟菲斯超级计算机集群启动训练

马斯克于7月23日宣布,孟菲斯超级计算机集群(Memphis Supercluster)已在当地时间凌晨4:20开始进行训练,对xAI团队、X团队以及英伟达及其支持公司表示了衷心的感谢。孟菲斯,作为美国田纳西州的第二大城市,此次被选为超级计算机集群的所在地。

该集群的硬件配置极为强大,搭载了10万个英伟达H100 GPU,采用了液冷散热系统,并采用了单一的RDMA网络互连架构,使其成为全球最顶级的AI训练集群。从GPU规模上看,它已经超过了全球Top500榜单上的所有超级计算机,包括全球最强的Frontier(37,888个AMD GPU)、Aurora(60,000个Intel GPU)以及微软Eagle(14,400个Nvidia H100 GPU)。

马斯克的目标是在今年12月之前训练出全球最强大的人工智能(Grok3),而孟菲斯超级计算机集群正是他实现这一宏伟目标的关键支柱。

在3月达成协议之后,这个“超级计算机工厂”(Gigafactory of Compute)迅速开始建设。大孟菲斯商会上个月确认,马斯克旗下的xAI正在筹备建立一个新的“超级计算机工厂”。为了履行协议,xAI已口头承诺改善孟菲斯的公共基础设施,包括新建一个变电站和污水处理设施。

孟菲斯电力、天然气和水务公司的CEO预估,xAI在孟菲斯的工厂每小时可能消耗高达150兆瓦的电力,相当于为10万户家庭供电,且预计每天至少需要100万加仑的冷却水。

孟菲斯市议员Pearl Walker上周指出,社区对此表示担忧,民众担心水资源短缺以及能源供应紧张。

早在5月份,xAI就宣布获得了60亿美元的资金用于AI开发。目前,xAI正在为孟菲斯超级计算站点发布职位招聘广告,包括光纤工头、网络工程师和项目经理等职位。

本文来源: 互联网 文章作者: 每日要闻
    下一篇

导读:AI技术对于商业模式未通的商汤科技而言,此番奔赴奥运赛场,或许只是追追热点、提升品牌知名度,而其应用场景落地与商业化进程,恐怕不会带来实质性的改变。 @新熵原创 作者丨颜 编辑丨九犁 AI黑科技