NVIDIA發佈重磅最新軟件應用、硬件系統以及與寶馬集團合作

NVIDIA提出了下一代計算的願景,該願景將全球信息經濟的重心從服務器轉移到了新型的強大且靈活的數據中心。

NVIDIA創始人兼首席執行官黃仁勳在其加州住宅的廚房中錄製的六集同時發佈的主題演講中,介紹了NVIDIA最近對Mellanox的收購,還有重盼所歸的基於NVIDIAAmpereGPU架構的新產品以及重要的最新軟件技術。

這場主題演講原計劃於3月底在聖何塞舉行的NVIDIAGPU技術大會上現場直播,但因冠狀病毒疫情而受到影響。

“我要感謝正前線抗擊COVID-19所有勇敢的戰士們。”黃仁勳在開場時說到,“NVIDIA正在與研究人員和科學家合作,使用GPU和AI計算來治療、緩解、控制和追蹤這種大規模傳染性疾病。”

NVIDIA也宣佈了其NVIDIAClara醫療平臺的更新,旨在對抗COVID-19新型冠狀病毒。

“研究人員和科學家們正在使用NVIDIA加速計算來挽救生命——這完美地詮釋了我們公司的宗旨:通過製造計算機,解決普通計算機不能解決的問題。”黃仁勳說。

演講主要圍繞作爲現代全球信息經濟機房的數據中心如何變化,以及在上月完成交易的收購案雙方NVIDIA和Mellanox如何共同推動這些變化的願景。

“數據中心是新的計算單元,NVIDIA正在加速從芯片到CPU和GPU的連接方式,再到整個軟件堆棧,以及最終跨整個數據中心的性能提升。”

數據中心規模計算的系統優化

首先,NVIDIA爲這種新型的數據中心規模計算優化了新的GPU架構,集AI訓練和推理於一身,並實現了靈活且彈性的加速。

NVIDIAA100是第一個基於NVIDIAAmpere架構的GPU,提供了在NVIDIA八代GPU裏最大的性能提升,它還可用於數據分析,科學計算和雲圖形,並已全面投產並交付給全球客戶。

全球18家領先的服務提供商和系統構建商正在將NVIDIAA100整合到他們的服務和產品中,其中包括阿里雲、AWS、百度雲、思科、DellTechnologies、GoogleCloud、HPE、MicrosoftAzure和甲骨文。

相比上一代,NVIDIAAmpere架構的A100將性能提升了20倍。A100的五大關鍵特性包括:

超過540億個晶體管,使其成爲世界上最大的7納米處理器

帶有TF32的第三代TensorCore核心,這是一種新的數值格式,可加速開箱即用的單精度AI訓練。NVIDIA廣泛使用的TensorCore現在更加靈活,快速,且更易於使用

結構稀疏性(Structuralsparsity)加速,這是一種新的高效技術,可以利用AI數學固有的稀疏性來獲得更高的性能

多實例GPU(Multi-instanceGPU或MIG),允許將一個A100分割爲多達七個獨立的GPU,每個GPU都有自己的資源

第三代NVLink技術,使GPU之間的高速聯接能力加倍,從而可以使多個A100服務器充當一個巨型GPU

以上這些特性促成了A100性能的提升:與NVIDIA上一代的Volta架構相比,訓練性能提高了6倍,推理性能提高了7倍。

NVIDIADGXA100具備5Petaflops的性能

NVIDIA還將發售第三代NVIDIADGXAI系統—基於NVIDIAA100的NVIDIADGXA100—世界上第一臺5petaflops服務器。每臺DGXA100可以分割爲多達56個獨立運行的實例。

這使得單個服務器可以“縱向擴展”以完成諸如AI訓練之類的計算密集型任務,或者“橫向擴展”以進行AI部署或推理。

該系統的最初使用者是美國能源部的阿貢國家實驗室,該實驗室將利用該集羣的AI和計算能力更好地理解和對抗COVID-19。此外,還有佛羅里達大學和德國人工智能研究中心。

美國能源部阿貢國家實驗室,將使用DGXA100賦能的AI和算力更好地瞭解並抗擊COVID-19

A100也將作爲HGXA100提供給雲合作伙伴和服務器製造商。

一套由五臺DGXA100系統提供動力的數據中心,其成本僅爲100萬美元,功耗僅爲28千瓦,但其性能足以媲美一套典型數據中心(由50臺用於AI訓練的DGX-1系統和600個總功耗高達630千瓦的CPU系統構成,成本超過1100萬美元)。

NVIDIA還宣佈了下一代DGXSuperPOD。它由140臺DGXA100系統和Mellanox網絡技術搭建而成,可提供700petaflops的AI性能,堪比全球20臺最快的計算機中的任何一臺。

新一代DGXSuperPOD實現了強達每秒70petaflops的AI算力

NVIDIA正在用四個DGXSuperPOD來擴展自己的數據中心,爲其內部超級計算機SATURNV,增加了2.8exaflops的AI計算能力(總計4.6exaflops),使其成爲世界上最快的AI超級計算機。

NVIDIA同時也發佈了NVIDIAEGXA100,將強大的實時雲計算功能帶到了邊緣。其NVIDIAAmpere架構GPU提供了第三代TensorCore和新的安全功能。得益於其NVIDIAMellanoxConnectX-6SmartNIC,它還具有安全且快速的聯網功能。

當今世界上最重要的應用軟件

NVIDIAGPU將爲主要軟件應用程序提供動力,以加速三個關鍵用途:管理大數據,創建推薦系統和構建實時會話式AI。

隨着機器學習的有效性推動公司收集了越來越多的數據,這些新工具應運而生。積極的反饋使我們體驗到的數據收集量呈指數級增長。

爲了幫助各類組織順應潮流,NVIDIA宣佈在Spark3.0上支持NVIDIAGPU加速,大數據分析將成爲當今世界上最重要的應用程序之一。

基於RAPIDS的Spark3.0,打破了提取,轉換和加載數據的性能基準。它已經幫助AdobeIntelligentServices將計算成本降低了90%。

關鍵的雲分析平臺(包括AmazonSageMaker,AzureMachineLearning,Databricks,GoogleCloudAI和GoogleCloudDataproc)都將藉助NVIDIA加速。

黃仁勳還宣佈推出了NVIDIAMerlin,這是一個用於構建下一代推薦系統的端到端框架,該系統正迅速成爲更加個性化互聯網的引擎。Merlin將創建一個100TB數據集推薦系統所需的時間從四天減少到20分鐘。

他還詳細介紹了NVIDIAJarvis,這是一個新的端到端平臺,可以充分發揮NVIDIAAI平臺的強大功能,創建實時多模態對話式AI。

他通過一個演示來展示了與名爲Misty的AI進行交互的過程,Misty可實時理解並回答一系列有關天氣的複雜問題。

自2018年在SIGGRAPH上發佈NVIDIARTX以來,NVIDIA在實時光線追蹤方面取得了迅猛發展,當時宣佈的NVIDIAOmniverse可以讓位於不同地方使用不同工具的設計師,在同個設計的不同部分同時工作。現在已經可供搶先體驗客戶使用。

自動駕駛汽車

自動駕駛汽車是我們這個時代最大的計算挑戰之一,NVIDIA將持續通過NVIDIADRIVE推動整個行業發展。

NVIDIADRIVE將使用全新OrinSoC和NVIDIAAmpereGPU,以實現能效和性能,入門級ADAS系統開發所需功率僅需5瓦,併爲L5級別robotaxi系統提供2,000TOPS的性能。

現在,汽車製造商僅需單一計算架構和軟件堆棧,即可將AI集成到每一輛車中。汽車製造商可以利用一種架構來開發整個車隊,並利用整個車隊來進行軟件開發。

NVIDIADRIVE生態系統現已覆蓋汽車、卡車、一級汽車供應商、下一代出行服務、初創公司、地圖服務和仿真。NVIDIA將在NVIDIADRIVE技術套件中增加用於管理整個自動駕駛車隊的NVIDIADRIVERC。

機器人技術

NVIDIA還將繼續推進其NVIDIAIsaac軟件定義的機器人平臺,宣佈寶馬集團已選擇NVIDIAIsaac機器人技術爲其下一代工廠提供動力。

每56秒鐘,寶馬集團在全球的30家工廠就會生產一輛汽車:40種不同型號的汽車,每種都有數百種不同的選擇,3000萬個零件來自全球近2,000家供應商。

寶馬集團加入了一個龐大的NVIDIA機器人技術全球生態系統,該生態系統涵蓋配送、零售、自主移動機器人、農業、服務業、物流、製造和醫療保健。

未來,工廠實際上將成爲巨大的機器人。“裏面的所有運動部件都會由AI驅動。”黃仁勳說。“將來,每個批量生產的產品都將被逐一量身定製。”

相關文章