移动互联网

MLPerf全球AI基准测试发榜,浪潮AI服务器斩获半数冠军

2021/7/1 22:58:00

北京2021年7月1日 /美通社/ -- 美国东部时间6月30日,国际权威AI基准测试MLPerf?公布2021年最新榜单,在固定任务(Closed)赛道的全部8项模型训练任务中,浪潮获得4项性能第一,斩获半数冠军。

MLPerf?由图灵奖得主大卫·帕特森(David?Patterson)联合谷歌、斯坦福、哈佛大学等知名学术机构发起成立,是影响力最广的国际AI性能基准评测。此次性能评测基于最新MLPerf? Training V1.0基准,涵盖了图像分类(ResNet)、医学影像分割(U-Net3D)、目标物体检测(SSD)、目标物体检测(Mask R-CNN)、语音识别(RNN-T)、自然语言理解(BERT)、智能推荐(DLRM)以及强化机器学习(Minigo)8类AI应用场景,每类场景都包含固定任务(Closed)和开放优化(Open)两类性能竞赛。

除浪潮外,Google、NVIDIA、Intel、DELL等12家厂商也参与了此次MLPerf?训练基准测试,竞争十分激烈。最终,浪潮在固定任务(Closed)赛道的全部8项任务中,获得图像分类ResNet、自然语言理解BERT、目标检测SSD和智能推荐DLRM4项训练任务性能冠军,其中,浪潮NF5688M6获得ResNet、DLRM和SSD的单机训练性能第一,NF5488A5获得BERT的单机训练性能桂冠。


凭借卓异的软硬件系统优化能力,浪潮将MLPerf?训练基准的单机效率进一步提升至新的高度。相比2020年MLPerf? Training v0.7榜单,浪潮刷新了图像分类、自然语言理解、目标检测(SSD)和智能推荐4项任务的单机训练性能纪录,将模型训练耗时分别缩短了17.95%、56.85%、18.61%和42.64%,凸显出优质AI服务器在AI模型训练效率上的巨大价值。

浪潮在MLPerf?基准评测中的出色表现,得益于在AI计算系统创新上卓越的系统设计能力和全栈优化能力。在硬件层面,针对AI训练中常见的密集IO传输瓶颈,浪潮PCIe Retimer Free设计实现了CPU-GPU间通道免中继高速互联,大幅降低通信延迟,极大提升了AI训练效率;同时,针对高负载多GPU协同任务调度,对NUMA节点与GPU之间的数据传输进行全面优化和深度调校,确保训练任务中的数据IO无阻塞;此外,在散热层面,针对目前业界功率最高的500W 80GB A100 GPU,浪潮率先开发的先进片上液冷系统,确保GPU在全功率甚至超频负载下依然稳定工作,将AI计算系统的性能发挥到极致。

在不断斩获MLPerf?冠军的同时,浪潮也把竞赛过程中探索出的高效优化方法回馈至MLPerf社区,推动AI技术的共同进步。在MLPerf? Training v0.7中,浪潮开创性提出效率更高的ResNet收敛性优化方案:在ImageNet数据集上,仅使用85%的迭代步数就达到了75.9%的目标精度,该优化方案将训练性能提升了15%。目前,该方案已被社区成员采纳,并广泛应用到MLPerf? Training V1.0测试中,这也是此次ResNet任务成绩得以大幅提升的重要原因。

自2020年至今,浪潮参与了MLPerf? training v0.7, Inference v0.7, Inference v1.0, training v1.0四次竞赛。已经累计斩获41项冠军。

浪潮是全球领先的AI计算厂商,AI服务器市场份额全球第一,在中国的市场份额已连续四年保持在50%以上。浪潮致力于AI计算平台、资源平台和算法平台的研发创新,并通过元脑生态与AI领先企业共同推进AI产业化和产业AI化进程。


版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号