破一項紀錄很難,更難的是破多項紀錄。

日前,業界公認的AI基準性能評測平臺MLPerf官網放出了各大廠商的參賽測試成績,其中寧暢信息產業(北京)有限公司(以下簡稱“寧暢”)搭載NVIDIA T4 /A100 GPU卡的Nettrix X640 G30 AI服務器,在ResNet、BERT、DLRM等基準性能測試中取得30項世界第一。

這不是寧暢第一次在性能測試領域獲得如此殊榮。早在今年9月國際知名標準性能評測機構SPEC的CPU2017測試中,寧暢的R620 G30服務器就曾打破16項世界紀錄;算上之前的測試,寧暢R620 G30服務器共計擁有並保持24項SPEC世界紀錄。

這些成績讓人好奇——寧暢是一家怎樣的公司?在整個業界看來已成爲“紅海”的服務器市場,寧暢作爲新玩家的目標如何,能否佔據自己的一席之地呢?我們下面就嘗試對這些問題一探究竟。

行業“老兵”創業,實力不可小覷

主流服務器市場已很久沒有新鮮血液加入,更多的是廠商間的合併與協作,比如IBM與聯想、HPE與新華三都走了類似的道路。也正因爲如此,中國服務器市場的玩家實際上變得越來越少,即便放眼全球,HPE與Cray的合併也符合了“分久必合”的大趨勢,一年前放眼市場,服務器市場格局似乎已定。

寧暢服務器品牌發佈現場

但寧暢的出現打破了這樣的局面,這家註冊於2019年12月的公司是一家全新的服務器廠商。但組建寧暢的團隊成員卻是行業老兵。在官網上我們看到這樣的描述:“寧暢團隊專注服務器領域已有15年,早在寧暢公司創立前,核心團隊研發服務器產品廣泛應用於互聯網、電信、金融、醫療、教育等行業”。

這也是我們意料之中的情形,畢竟上榜MLPerf和SPEC在內的許多測試都需要專業的技術和多年的積澱,並非一朝一夕能夠完成。你可千萬不要以爲這些項目只要製造出一臺服務器就可以送去測試了,其實這背後還包括了大量優化的工作,甚至MLPerf測試本身就設計了“優化賽道”,鼓勵企業進行特定AI應用優化。

從這個角度來說,寧暢能夠拿下30項第一絕非僥倖,證明這家公司在技術領域的深厚儲備。而在市場策略上,寧暢也打破了傳統銷售中標準服務器的模式,走上“精細定製化”的道路,爲各種規模的客戶提供差異化的服務器定製服務。

“定製化”這三個字說起來容易,但是在實際生產中不同行業、不同客戶都會提出五花八門的需求,而寧暢要做的就是聆聽客戶的差異化需求並給出切實可行的方案。單就這一點,就意味着寧暢有着強大的設計與研發團隊,並且在製造和成本控制上實現了業內一流水準。

這次的MLPerf測試比賽就是最好的證明。

瞄準差異化定製,寧暢打造多卡“性能猛獸”

X640G30 AI服務器是寧暢精心打造的一款AI服務器,它最大的特點就是超大的擴展空間和靈活多變的設配能力,如最高可支持10張NVIDIA A100 PCIe卡或21張NVIDIA T4 PCIe卡,無論是進行AI訓練還是AI推理都變得遊刃有餘。而在這次MLPerf測試中,X640 G30 AI服務器的表現也相當搶眼。

16卡配置X640 G30部分測試分數對比圖

同配置下更能看出不同品牌的差異化,這種差異化一方面是硬件的差異,另一方面也體現了軟件優化的層級。對比行業同配置AI服務器,X640 G30 AI服務器搭配四張A100 GPU卡的情況下,在Resnet50、SSD、RNN-T、BERT、DLRM等10項測試中分數值取得世界第一;搭配16張T4 GPU卡配置的情況下,X640G30打破六項世界紀錄,性能一騎絕塵。

X640 G30平均單卡測試分數對比

同樣的領先也出現了平均單卡性能方面(單卡平均性能=整機測試結果/搭載GPU卡個數),X640 G30 AI服務器在提交成績的13家服務器廠商中也表現搶眼,獲得了11項性能第一成績。由此看來,無論是單卡、多卡還是平均性能,X640 G30 AI服務器都表現出了強大的領先優勢,這也與寧暢對於產品的錘鍊與打磨分不開。

如今“軟件定義XX”的概念越來越普及,也讓許多人看到了軟件的提升作用而忽視了硬件的表現。但即便是工業標準服務器,不同廠商的x86就一樣嗎?答案是否定的,不然無論是MLPerf還是SPEC測試就都沒有存在的意義。事實上,一款合格的服務器出廠之前要經過大量測試與配置設置,而不同品牌對這些測試的要求上限也不同。

寧暢服務器產品家族

寧暢的服務器也是如此。在滿足“行業標準”這個底線之外,爲提升品質、爲用戶帶來更好體驗,寧暢服務器除了進行“常規壓力測試”之外,還涵蓋了電磁耐受性、高溫高熱、跌落震動等多個層面的測試,進一步保障了服務器自身的穩定性與可靠性,也有助於產品性能的最大化發揮。

作爲電子設備,電流是零部件之間溝通的唯一手段,而保證電性能可靠、信號質量純淨也是保障服務器穩定的第一道屏障。爲此,寧暢服務器在設計之初就進行過Base function基本驗證測試、Efficiency效率測試、Inrush Current電流衝擊測試、Overshoot&Undershoot過沖和下衝測試等等,確保電性能的穩定性。

在確定了電流穩定性和板級嚴謹測試之外,兼容性也是一臺服務器必須要進行的測試。爲此寧暢針對客戶需求,對於內存、硬盤(HDD、SSD、NVMe)、網卡、陣列卡等常見擴展卡的兼容性測試,同時這些測試都會使用客戶自用操作系統去做全面驗證,模擬客戶體驗並給出反饋。更重要的是,在這個環節還會進行性能模擬測試,這也就是剛剛我們提到的SPEC測試相關內容。

作爲主打“精細化定製”的服務器廠商,寧暢需要最大限度快速滿足客戶需求,因此開發出了“自動化測試”系統平臺,用寧暢人自己的話說就“好比一臺車要在高速路上邊跑邊組裝、邊檢驗,車停下來便完成所有測試與裝配,用戶接過方向盤就可開走”。

寧暢自動化測試能力

說起來容易做起來難。其實放眼整個行業,像寧暢一樣具備全面自動化測試能力廠商屈指可數。憑藉着行業的深厚積澱,寧暢研發的自動化測試平臺NASA(Nettrix Autotest and Stress Application)則可以從測試環境搭建、測試日誌收集、測試數據分析,到最後的測試bug提交,已實現全面自動化,測試用例自動化覆蓋高達95%以上。

保障了穩定性、兼容性,寧暢還要考慮到客戶對配置、BMC、BIOS等底層系統以及接口的設置要求。從市場端來看,超過半數客戶的服務器都需要定製化以組建數據中心,如大家熟知的BAT,以及互聯網後浪:字節、美團、拼多多等,都有自己管理、配置數據中心的標準。而這種定製化數據中心的需求,對於衆多中小互聯網企業同樣存在。

這也是寧暢打出“普惠定製”牌的底氣,依託自己技術積累降低“定製化”服務器行業門檻,做大市場蛋糕。

中標6000萬元訂單,服務器定製化呈新藍海

日前,寧暢官網爆出了中標某 “互聯網大廠”6000萬元大單消息。雖然並沒有說出這家公司的名字,但我們可以看到寧暢產品以及技術實力,已獲得行業頭部用戶的認可。

截至10月,寧暢公衆號文章顯示,寧暢已中標的互聯網權威用戶已涵蓋搜索、視頻、雲計算諸多行業。許多人都覺得服務器定製化的業務太高端,要求太高、利潤太薄,許多企業也不太願意參與。

但是寧暢服務器從發佈到現在的半年多時間看來,這部分業務卻有着非常大的市場,除了之前以互聯網爲代表的超大規模數據中心之外,其實5G、移動通訊、電信以及邊緣計算等多個領域的客戶也同樣有定製化服務器的需求,這也恰恰是符合寧暢所強調的“行業精細化”的範疇。

當然,獲得某項或者多項第一,打破世界紀錄亦或是中標千萬大單都是硬實力表現,但對於初創公司寧暢只能說是“萬里長征邁出了第一步”,未來更長更遠的路還在等待着它,我們也希望寧暢能不斷挑戰自我,爲更多客戶提供符合業務需求的優質產品。

相關文章