Nvidia今天公布超级计算机DGX SuperPOD 世界排名第22

Nvidia今天公布超级计算机DGX SuperPOD 世界排名第22

来自网络

Nvidia 今天公布了世界上第22快的超级计算机 DGX SuperPOD,该超级计算机提供了人工智能基础设施,满足了该公司无人驾驶车辆部署计划的大量需求。

这个系统是用96台 NVIDIA DGX-2H 超级计算机和 Mellanox 互连技术在短短三周内建成的。 提供9.4千兆次的处理能力,它有能力训练安全自动驾驶汽车所需的大量深层神经网络,客户可以从任何 DGX-2合作伙伴购买本系统的全部或部分设计。

自动驾驶汽车的人工智能训练是计算机密集型的终极挑战。

一个单独的数据收集工具每小时产生1太字节的数据,这些数据被用来训练有关道路规则的算法ーー以及在车辆中运行的深层神经网络中发现潜在的故障,然后在一个连续的循环中重新训练这些神经网络。

据Nvidia 负责人工智能基础设施的副总裁提到,人工智能的领导力需要计算机基础设施的领导力。几乎没有人工智能的挑战比训练自动驾驶车辆更为艰巨,这需要对神经网络进行成千上万次的再训练,以满足极端精确性的需求。

通过1536 NVIDIA V100张量核心 gpu 与 NVIDIA NVSwitch 和 Mellanox 网络结构相互连接,DGX SuperPOD 可以处理数据,其性能堪比同等规模的超级计算机。该系统全天候工作,优化自动驾驶软件,重新训练神经网络,使其周转时间比以前快得多。

例如,DGX SuperPOD 硬件和软件平台用不到两分钟就可以训练 ResNet-50。 当这个人工智能模型在2015年发布时,它花了25天的时间来训练当时最先进的系统,一个 NVIDIA K80 GPU。 可以提供18,000倍的速度。

虽然其他具有类似性能水平的 TOP500系统是由成千上万的服务器构建的,但是 DGX SuperPOD 只占用了一小部分空间,大约比它的排名邻居小400倍。

Nvidia DGX 系统已经被其他有着大量计算需求的组织所采用,从宝马(BMW)、大陆(Continental)、福特(Ford)和 Zenuity 等汽车公司,到 Facebook、微软(Microsoft)和Fujifilm等企业,以及理研(Riken)和美国能源部(Department of Energy)等国家实验室的研究领导者。

这种规模的系统通常需要6-9个月才能部署完毕,但是 DGX SuperPOD 只需要3个星期,工程师们遵循一种规范的、经过验证的方法。