美国阿贡国家实验室近日宣布,其超级计算机Aurora已经全面投入运行,并正式向全球科学界开放。Aurora自2015年首次公布以来,历经多次延期,最终在2023年完成部署。该超级计算机拥有超过1 FP64 ExaFLOPS的模拟计算能力,并且在人工智能和机器学习方面具备11.6混合精度ExaFLOPS的性能。
Aurora最初计划在2018年完成,但由于英特尔停止生产Xeon Phi处理器,项目进度受到严重影响。随后,由于英特尔7纳米工艺的延误,Aurora的开发也经历了多次推迟,直至2023年才最终完成。
尽管硬件在2023年6月就已经安装完毕,但系统直到2024年5月才达到Exascale性能。在此期间,系统仅对少数选定的研究人员开放。根据HPL-MxP基准测试,Aurora实现了11.6混合精度ExaFLOPS的性能。
Aurora由166个机架组成,每个机架包含64个计算节点,总计10624个计算节点。每个节点配备了两个Xeon Max处理器和64GB HBM2E内存,并搭载了六个英特尔数据中心Max“Ponte Vecchio”GPU,所有设备通过液冷系统进行高效的散热。
Aurora配置了21248个CPU和110万个x86核心,配备了19.9PB的DDR5内存和1.36PB的HBM2E内存。此外,它还拥有63744个专为AI和高性能计算优化的GPU,总共有8.16PB的HBM2E内存。系统采用了1024个节点,每个节点配有220PB的存储容量和31TB/s的带宽,整体架构基于HPE的Shasta架构和Slingshot互连技术。