
Meta 宣布其人工智能(AI)研究超级计算机 RSC 搭载 NVIDIA DGX A100、网络及 AI 软件,能提供 Meta AI 研究 5 exaflops 的运算能力,以及由 NVIDIA 系统、InfiniBand fabric 及 AI 软件针对跨数千个 GPU 进行最佳化。
Meta希望藉由RES来训练超过一万亿个参数的AI模型,而RES采用760个NVIDIADGXA100系统运算节点,这组合着总共6,080个NVIDIAAA100 GPU,并通过NVIDIA Quantum每秒200Gb连接速度的InfiniBand相连,能够提供每秒1,896次浮点运算(petaFLOPS)的TF32效能。
而Meta在2017年就已经采用22,000个NVIDIA V100 Tensor Core GPU进行每日35,000个AI训练工作,至于RSC的早期性能测试显示,对比旧系统效能在训练大型NLP模型可达到3x倍速度提升,以及20x倍的计算机视觉效能增长。
RSC 该系统于今年稍晚全面部署后,有望成为迄今完成设置的最大 NVIDIA DGX A100 系统。
赞 (0)
打赏
微信扫一扫
