來源:極客公園

作者/宛辰

編輯/鄭玄

今年的GTC,老黃又放了一堆“核彈”。

9月20日晚上11點,英偉達CEO黃仁勳的主題演講爲2022GTC揭開序幕。一個半小時的時間裏,他介紹了英偉達下一代RTXGPU和支持AI工作流的新型雲服務,以及各種新系統、芯片和軟件。

對於遊戲玩家和創作者而言,他們將獲得首批基於全新NVIDIAAdaLovelace架構的GPU。較上一代旗艦GPURTX3090Ti,此次發佈的RTX4090的性能將提升至前者的四倍。

但在這場演講裏,4090也只是“開胃菜”。在剩下的一個多小時,黃仁勳介紹了英偉達在企業級市場和汽車市場的進展。

首先是今年3月發佈的新一代計算卡“H100”,黃仁勳宣佈NvidiaH100TensorCore現在已經全面投產,預計將在10月份上市。爲元宇宙開發搭建的Omniverse平臺也迎來全面更新,並將推出OmniverseCloud——一款IaaS雲服務產品。

而在汽車領域,英偉達公佈了新一代自動駕駛芯片Thor,並放棄了此前發佈的Atlan。據英偉達透露,極氪將首發搭載該芯片,時間爲2025年,此外如小鵬汽車、輕舟智能等也將使用該芯片。

GeForceRTX40系列

首先是最受關注的GeForceRTX40系列顯卡,會前曾有傳言此次GTC40系列顯卡有可能缺席,結果並沒有成真。

今年GTC英偉達發佈了40系列兩款高端顯卡,其中GeForceRTX4090將於10月12日上市,建議零售價12999元起;GeForceRTX4080將於11月推出,採用12GB和16GB顯存兩種配置版本,建議零售價分別爲7199元和9499元起。

上一代RTX3090和RTX3080的首發價分別爲11999元和5499元,40系列顯卡的價格提升了不少,但相比上一代產品,40系列的性能也有了顯著提升。根據黃仁勳介紹,GeForceRTX4090的性能將提升至上一代RTX3090Ti的4倍,GeForceRTX4080也比上一代產品在性能和功耗上有很大進步。

“和加速計算一樣,計算機圖形也是一項全棧挑戰。”黃仁勳解釋道,“若要實現突破,需要在架構、設計和算法方面進行創新。”

而在上述幾個維度,尤其是架構和算法上,40系列新顯卡都有跨越式的提升。

在架構方面,40系列顯卡建立在全新的第三代RTX架構——即AdaLovelace(Ada架構)。在優化的4N工藝下,AdaGPU可以集成760億個晶體管和超過18000個CUDA核心,比上一代AmpereGPU多了70%。

新架構下,所有三類處理器均有改進,包括:SM多單元流處理器、RTCore和TensorCore。值得注意的是,單個AdaGPU即可支持RacerX(基於物理定律的仿真)的運行。

在算法上,40系列顯卡在基於深度學習的神經網絡渲染上取得了突破——引入了第三代DLSS技術。

光線追蹤所需的計算量近乎瘋狂,CGI電影的每一幀畫面渲染都需要數小時。英偉達RTX打開了實時光線追蹤世界的大門,並且,通過引入基於深度學習的超分辨率技術,進一步提高了遊戲幀率。

DLSS3通過將新幀和上一幀進行比較來了解場的變化,從而利用AI生成全新幀。與傳統渲染相比,它能將遊戲性能提高多達4倍。在這項技術的加持下,無論是對GPU性能要求較高的遊戲還是受到CPU限制的遊戲,都將從中受益。

老黃總結道:相較於4年前首次引入實時光線追蹤技術,今天藉助AI,英偉達在4年內將光追的性能升了16倍;與此同時,GPU中負責此類計算的晶體管數量並沒有以同比增加,一些像素通過計算得出,而大多數像素則通過AI預測得出。

另外值得注意的是,此次英偉達只發布了兩款40系列的高端顯卡,這與遊戲顯卡市場需求疲軟、英偉達急於去庫存有一定關係。

黃仁勳在會後接受分析師採訪時表示:終端市場目前需求疲軟,英偉達減少了供應,來幫助下游消化3080、3080積壓的庫存,並預計用兩個季度完成。對於Ada架構的新顯卡,英偉達會在這個季度開始進行小規模生產,並在明年進行更多的公佈。

此外,對於市場環境是否會影響4080和4090顯卡的銷售,黃仁勳認爲,4080、4090主要針對高端遊戲玩家,受到的市場影響較小。

簡單來說,4080和4090兩款高端旗艦顯卡相較上一代性能有明顯提升,有換代需求的高端玩家依然會正常購買。但對於4070、4060這些在性能上與3080、3080這些上一代旗艦性能相近的產品,爲了避免影響下游去庫存,英偉達會在更晚的時間點發布。

Omniverse推出雲服務

互聯網的下一次演化方向被視作元宇宙,而英偉達對於元宇宙的理解是“數字孿生”。英偉達於2019年正式推出Omniverse,一個用來構建和運行元宇宙應用的平臺。

簡單來說,Omniverse是一個實時的大型3D數據庫,一個可以共享的3D世界,一個基於USD構建的網絡;同時,它也是一個計算平臺,使用者可以編寫在Omniverse上運行的應用,這些應用如同進入Omniverse虛擬世界的門戶。

此外,英偉達也編寫了一些Omniverse應用,例如用於協作的Create和View,用於合成數據生成的Replicator,以及用於數字孿生模擬的IsaacSim和DriveSim。

作爲一個新的計算平臺,Omniverse由三部分構成:RTX計算機(供創作者、設計師和工程師使用)、OVX服務器(用來託管與Nucleus數據庫的連接並運行虛擬世界模擬)以及第三部分:NVIDIAGDN(進入Omniverse的門戶)。

會上,黃仁勳介紹了第二代OVX系統,後者將由AdaLovelaceL40數據中心GPU提供支持,該GPU現已全面投產。

此外,英偉達還宣佈推出OmniverseCloud。這是一款Iaas產品,可連接在雲上、本地或單個設備上運行的Omniverse應用。

黃仁勳介紹:新的Omniverse容器現已可以部署到雲端,該容器包括用於合成數據生成的Replicator、用於擴展渲染農場的Farm以及用於構建和訓練AI機器人的IsaacSim。

Omniverse上雲一方面意味着將進一步方便協作,提升效率;另一方面,也意味着英偉達數字孿生業務將覆蓋更大的應用場景和客戶。

黃仁勳表達了自己對元宇宙的看法:未來,所有的產品都將具有數字孿生。製造商利用數字孿生模擬產品在物理世界中的作用和性能。如果不對軟件的數字孿生版本進行測試,則無法大規模部署該軟件所運營的的物理產品。

黃仁勳列舉了很多客戶案例來解釋不同領域的公司如何利用Omniverse,比如爲工廠、物流倉庫、自動化生產線和工業廠房創建數字孿生;如何利用Omniverse實現團隊互聯,以全保真度可視化他們的數據並生成合成數據,從而訓練AI模型,模擬數字孿生。

自動駕駛:放棄Atlan,擁抱Thor

最後,多少有點出乎意料,英偉達公佈了新一代自動駕駛平臺Thor。

目前,想要實現汽車中的主動安全、停車、駕駛員監測、攝像頭後視鏡、集羣和車載信息、娛樂系統等功能通常需要不同的計算機提供支持。而未來,它們將由在中央計算機上運行的軟件統一提供支持,並隨着時間的推移不斷改進。

去年,英偉達推出了Atlan,一款1000TOPS的SoC。雖然這款產品還沒有投產,但是黃仁勳宣佈Atlan不再是第一了,它將被Thor取代。

新推出的DRIVEThor平臺,集成了基於Hopper的TransformerEngine、基於Ada的GPU和基於Grace的CPU。

黃仁勳表示,Hopper的Transformer引擎以及VisionTransformer的快速變革,它們都至關重要,必須納入到下一代的機器人處理器,而Ada中多實例GPU的發明將有助於車載計算資源的集中化可將成本降低數百美元,Grace的CPU則正好擁有非常出色的單線程性能。

基於這些基礎,Thor的吞吐量是上一代Atlan的兩倍,交付的性能也是Atlan的兩倍以上。並且,Thor能夠與目前被用於量產汽車、可提供每秒254萬億次浮點運算性能的DRIVEOrin無縫銜接。

使用場景上,Thor處理器可以應用在機器人、醫療儀器、工業自動化和邊緣AI系統等。

對於英偉達取消Atlan的原因,黃仁勳在會後接受分析師採訪時表示,Atlan的產品包括GPU、CPU和TensorCore三個關鍵的架構。這三個架構,在過去兩年都發生了巨大的進步。每過兩年。機器人系統的研發都會迎來重大更新,這是他們做出取消Atlan直接做Thor的原因。

此外,黃仁勳還進一步透露,除了會上公佈的極氪等中國車廠,到2025年,奔馳、捷豹路虎等車企的車隊,都會由英偉達提供全棧式的解決方案。公司預計未來在汽車業務領域中的商業化速度以及競爭將會加劇。目前英偉達大概有110億美金的在手訂單和汽車業務相關。

相關文章