中國AI服務器，刷新全球18項性能基準測試紀錄

允中發自凹非寺

量子位編輯 | 公衆號 QbitAI

美國東部時間10月21日，全球倍受矚目的權威AI基準測試MLPerf公佈今年的推理測試榜單，浪潮AI服務器NF5488A5一舉創造18項性能記錄，在數據中心AI推理性能上遙遙領先其他廠商產品。

MLPerf是當前全球最具影響力的AI計算基準評測組織，由圖靈獎得主大衛·帕特森（DavidPatterson）聯合谷歌、斯坦福、哈佛大學等單位共同成立，每年組織全球AI訓練和AI推理性能測試併發榜。此次MLPerf的AI推理基準測試有全球23家公司和單位參與，在數據中心及邊緣等場景進行AI計算產品的性能比試。今年MLPerf訓練榜單已於7月公佈。

浪潮NF5488A5獲數據中心AI性能絕對優勢

此次浪潮NF5488A5一舉創造18項MLPerf推理性能記錄，成爲創紀錄最多的AI服務器。今年的測試中，數據中心AI性能最受關注，全部參與機構提交了507項性能測試數據。浪潮NF5488A5創下了數據中心22個賽項中的13項性能記錄以絕對優勢領先，NVIDIA DGX取得了5項數據中心性能記錄。而在此前的MLPerf訓練榜單中，NF5488A5在最核心的Resnet50訓練任務中也創下了性能記錄，單機性能高居榜首。

△浪潮NF5488A5創造18項MLPerf推理性能新記錄

性能大幅提升3倍，全棧AI能力優勢凸顯

在此次基準測試中，浪潮AI服務器NF5488A5在開放優化(Open)和固定任務(Closed)的ResNet50基準性能測試中，均表現優異，相比2019年MLPerf推理榜單的服務器最好性能提升高達3倍。

△ 2019、2020年 ResNet50推理性能對比

NF5488A5是浪潮自研的新一代AI服務器，是此次MLPerf全球競賽中唯一可以在4U空間內支持8塊安培架構A100芯片實現NVLink高速互聯的AI服務器。浪潮NF5488A5在系統拓撲上採用了超低延遲設計，支持PCIe 4.0全鏈路極致優化，高頻通信單元採用一級拓撲最近連接，最大限度提升處理器到AI芯片間的通信性能。同時，通過配置NUMA節點，確保每顆處理器與其直連的GPU之間通信性能最優，最大限度降低通信延遲。此外，NF5488A5通過深度優化系統結構設計，確保設備可在高溫環境下穩定運行。

本次基準測試中，浪潮展示出了卓越的AI計算軟硬件協同優化能力。在硬件層面，通過對CPU、GPU硬件性能的精細校準和全面優化，使CPU性能、GPU性能、CPU與GPU之間的數據通路均處於對AI推理最優狀態；在軟件層面，結合GPU硬件拓撲對多GPU的輪詢調度優化使單卡至多卡性能達到了近似線性擴展；在深度學習算法層面，結合GPU Tensor Core 單元的計算特徵，通過自研通道壓縮算法成功實現了模型的極致性能優化，在精度無損的情況下性能提升近2倍。

△ 各服務器MLPerf AI推理性能對比（以浪潮NF5488A5爲基準，越高越好）

浪潮是全球領先的AI計算領導廠商，其AI服務器在中國的市場份額已連續三年保持在50%以上。浪潮致力於AI計算平臺、資源平臺和算法平臺的研發創新，並通過元腦生態與AI領先企業共同推進AI產業化和產業AI化進程。

— 完—

中國AI服務器，刷新全球18項性能基準測試紀錄

熱門新聞

週熱門

中國AI服務器，刷新全球18項性能基準測試紀錄

勞動節，聊聊AI究竟在替代誰的工作？

618淘寶京東均取消預售：大促開始進入冷靜期

3300億美元不夠用！多家AI獨角獸錢包告急，裁員、CEO離職不斷，大模型創業要降溫？

餘承東，要All in汽車了？

談談將業務部門納入數據產品開發的重要性

同時管理10家超級明星公司，馬斯克是如何做到的？

快手不再那麼需要辛巴

餘承東卸任華爲終端BG CEO，終端COO何剛接任｜36氪獨家

“全球最大的家電企業”要赴港上市，不爲募資爲了什麼？

如何建立受監管的良好的數據交易市場

小米兄弟正排隊IPO

高通脹讓美國人民水深火熱

誰會讓企業數字化轉型提前進入大結局

8點1氪丨李佳琦前助理付鵬註銷全網賬號；魯迅家屬已向樂樂茶發律師函；雀巢回應200萬瓶巴黎水被銷燬

馬斯克希望老朋友再拉一把

熱門新聞

週熱門