作者 | 冬梅、核子可樂

來源 | Ai前線

上週,英偉達股價一週內上漲了 25%,市值直逼萬億美元,其創始人黃仁勳的身價也突破了 330 億美元。

春風得意的黃老闆於 5 月 29 日現身在中國臺北舉辦的 COMPUTEX 大會,並在大會上發佈了面向所有行業的生成式 AI 平臺。“我們正在重新發明計算機,加速計算和人工智能標誌着計算正在被重新定義。”黃仁勳表示。

黃仁勳正在帶領英偉達從一家芯片公司轉向提供 AI 計算系統的公司,他此前稱,人工智能的 iPhone 時刻已經來臨。

英偉達發佈超級芯片 GH200 和 AI 計算平臺

受 AI 熱潮的推動,英偉達也在硬件領域緊跟技術潮流,發佈了一系列產品和解決方案:推出大內存生成式 AI 超級計算機 DGX GH200,可加速生成式 AI 設計的 Grace Hopper 超級芯片 GH200 已全面投產;推出全新加速以太網平臺 Spectrum-X,爲遊戲提供定製化 AI 模型代工服務;與全球最大的營銷服務機構 WPP 合作打造生成式 AI 內容引擎,多家世界頂級電子製造商採用英偉達生成式 AI 工具與 Omniverse 平臺構建先進的數字工廠。

據悉,NVIDIA® GH200 Grace Hopper 超級芯片將爲全球各地即將上線的系統提供運行復雜 AI 和 HPC 工作負載所需的動力。在 COMPUTEX 上,黃仁勳公佈了關於 GH200 Grace Hopper 超級芯片的更多細節。

NVIDIA® GH200 Grace Hopper 超級芯片使用 NVIDIA NVLink®-C2C 互連技術,將基於 Arm 的 NVIDIA Grace CPU 和 Hopper GPU 架構互聯,實現了高達 900GB/s 的總帶寬,比傳統加速系統中的標準 PCIe Gen5 通道高出 7 倍,算力有了很大程度的提高,並且能夠滿足要求最苛刻的生成式 AI 和 HPC 應用。

具體來說, GH200 超級芯片是將 72 核的 Grace CPU、H100 GPU、96GB 的 HBM3 和 512 GB 的 LPDDR5X 集成在同一個封裝中,擁有高達 2000 億個晶體管。這種組合提供了 CPU 和 GPU 之間驚人的數據帶寬,高達 900 GB/s,爲某些內存受限的工作負載提供了巨大的優勢。

值得一提的,英偉達正式發佈了一款新型大內存 AI 超級計算機——由 NVIDIA GH200 Grace Hopper 超級芯片和 NVIDIA NVLink Switch System 驅動的 NVIDIA DGX 超級計算機,旨在助力開發面向生成式 AI 語言應用、推薦系統和數據分析工作負載的巨型、下一代模型。

DGX GH200 的細節還不太清楚,但已確認英偉達使用了一種新的 NVLink Switch 系統,包含 36 個 NVLink 開關,將 256 個 GH200 Grace Hopper 芯片和 144TB 的共享內存連接成一個單元,英偉達 CEO 黃仁勳表示,GH200 芯片爲“巨型 GPU”。英偉達表示,256 顆 Grace Hopper 超級芯片將 DGX GH200 的“AI 性能”提升到了 exaflop(一百萬萬億次)。

NVIDIA 加速計算副總裁 Ian Buck 表示:“生成式 AI 正在迅速帶來業務變革,解鎖醫療、金融、商業服務等行業的新機遇並加速這些行業的研發工作。隨着 Grace Hopper 超級芯片的全面投產,全球的製造商很快將會提供企業使用專有數據構建和部署生成式 AI 應用所需的加速基礎設施。”

ChatGPT 問世後,芯片行業變天了

2022 年,英偉達發佈了 H100——這是其有史以來最強大、也最昂貴的處理器之一,單位價格約爲 4 萬美元。當時看來,這款產品的發佈時機並不理想,企業客戶紛紛在巨大的通脹壓力下削減開支。

但就在 11 月,ChatGPT 橫空出世後,情況發生了變化。

英偉達首席執行官黃仁勳表示,“剛剛經歷艱難的一年,情況似乎一夜之間就出現了轉機。”OpenAI 打造的這款熱門聊天機器人堪稱“尤里卡時刻”(或頓悟時刻),“立即創造出巨大需求”。

ChatGPT 的迅速躥紅在全球領先的科技巨頭和初創公司之間掀起一波軍備競賽,各方開始競相爭奪寶貴的 H100 資源。黃仁勳稱這款產品是“全球首個爲生成式 AI 專門設計的計算機芯片”,能夠幫助 AI 系統更快輸出順暢自然的文本、圖像和內容。

就在過去一週,在正確的時間推出正確的產品再次成爲決勝的關鍵。英偉達上週三宣佈,其截至 7 月的本季度銷售額預計將達 110 億美元,較華爾街之前的估計高出 50% 以上。這波強勁浪潮背後,無疑是衆多大型科技公司恢復數據中心支出和瘋狂採購 AI 芯片的現實需求。

投資人對此番預測也給出了積極回應,僅上週四一天之內就讓英偉達公司的市值增加了 1840 億美元。於是這家已經是全球最有價值的芯片公司在估值方面開始逼近萬億大關。

英偉達成爲生成式 AI 飛速發展的首批贏家。這項技術有望重塑各行各業,帶來巨大的生產力提升並取代數百萬個工作崗位。

而 H100 芯片將加快這一技術飛躍。H100 基於名爲“Hopper”的英偉達全新芯片架構,以美國編程先驅 Grace Hopper 的名字命名,如今已經是整個硅谷最炙手可熱的稀缺資源。

黃仁勳表示,“就在我們着手將 Hopper 投入量產之際,AI 突破到來了。”也就是說,Hopper 剛好是在 ChatGPT 正式亮相的幾周之前開始大規模生產。

黃仁勳對於持續收益的信心,很大程度來自與芯片製造巨頭臺積電的密切合作。雙方計劃擴大 H100 的生產規模,以滿足微軟、亞馬遜和谷歌等雲服務商,Meta 等互聯網大廠以及其他企業客戶的爆發式需求。

CoreWeave 是一家專注 AI 的雲基礎設施初創公司。作爲首批收到 H100 的客戶之一,公司首席戰略官 Brannin McBee 表示“這已經成爲地球上最稀缺的工程資源之一”。

也有部分客戶要等待半年之久,才能拿到自己用來訓練大規模數據模型的 H100 芯片供應。更多 AI 初創公司則紛紛表示擔心,稱在需求起飛那一刻,H100 就將面臨供不應求。

英偉達成爲了 AI 浪潮中的首批贏家

馬斯克也已經爲自己的 AI 初創公司 X.ai 買下大量英偉達芯片,他本人也在本週《華爾街日報》的活動中表示,目前 GPU“比藥品更難獲得”,還開玩笑說“而且這種情況在舊金山隨處可見”。

“計算成本已經飆升至天文數字,最低的准入門檻也是投入 2.5 億美元爲生成式 AI 系統構建服務器硬件。”

事實證明,H100 特別受到微軟和亞馬遜等大型科技企業的歡迎。他們正紛紛建立以 AI 工作負載爲中心的更多數據中心。此外,OpenAI、Anthropic、Stability AI 和 Inflection AI 等 AI 初創公司也在密切關注 H100 的性能承諾,希望藉助它的力量加快產品發佈、降低訓練成本。

英偉達超大規模與高性能計算業務負責人 Ian Buck 表示,“從購買難度來講,沒錯,新架構 GPU 就是不容易買到。”肩負增加 H100 以滿足需求這項艱鉅任務的 Buck 承認,“目前供不應求已經成爲規模性事件”,部分大客戶正瘋狂採購數以萬計的 GPU。

這種性能極強的芯片負責充當數據中心的“加速器”,其搭載的 800 億個晶體管達到最新款 iPhone 處理器晶體管數的 5 倍。儘管 H100 的售價高達 2020 年發售的上代 A100 芯片的 2 倍,但早期買家紛紛表示其性能至少提高了 3 倍,所以仍然極具性價比。

作爲 Stable Diffusion 圖像生成服務背後的廠商,Stability AI 聯合創始人兼 CEO Emad Mostaque 表示“H100 解決了長期困擾 AI 模型創建者的可擴展性問題”。“這非常重要,它能讓我們更快訓練出更大的模型,真正將研究問題轉化爲工程問題。”

雖然 H100 的發佈可謂正當其時,但英偉達在 AI 領域的突破實際源自近 20 年前的軟件創新。

英偉達的 Cuda 軟件誕生於 2006 年,作用就是讓 GPU 在圖形之外作爲其他工作負載類型的加速器。待時間來到 2012 年左右,“AI 終於找上了我們。”

加拿大的研究人員們很快意識到 GPU 非常適合用於創建神經網絡,這是一種由人腦內神經元間相互作用啓發而來的 AI 形式,後來成爲 AI 開發的新焦點。Buck 感慨道,“我們花了近 20 年才最終走到了今天。”

英偉達如今擁有的軟件工程師比硬件工程師還多,這也使其得以支持後續幾年出現的多種不同類型的 AI 框架,也使其芯片在訓練 AI 模型所需要的統計計算方面愈發高效。

Hopper 是首個針對 transformers 進行優化的架構,而 transformers 則是支持 OpenAI 聊天機器人明星的底層 AI 方法。通過與 AI 研究人員的密切合作,英偉達在 2017 年就注意到了 transformers 的出現,並開始相應調整自己的軟件。

AI 初創企業投資方 Air Street Capital 的普通合夥人 Nathan Benaich 指出,“英偉達可以說比其他人更早看到了未來,並將重點放在了 GPU 可編程方面。在發現機遇並押下賭注之後,英偉達獲得了持續領先於競爭對手的優勢。”

Benaich 估計,英偉達比其他競爭對手要領先約兩年。但他也補充稱,“英偉達硬件和軟件方面的市場地位恐怕還達不到堅不可摧的水平。”

Stability AI 的 Mostaque 對此表示贊同。“谷歌、英特爾和其他公司打造的下一代芯片正在迎頭趕上。而且隨着軟件標準化的普及,就連 Cuda 也不足以構成可靠的技術護城河。”

但對 AI 領先的另一些從業者來說,華爾街本週的熱情似乎有點過度樂觀。不過芯片諮詢公司 D2D Advisory 創始人 Jay Goldberg 仍然承認,“從目前的情況看,AI 半導體市場仍然保持着英偉達贏家通喫的局面。”

相關文章