來源:中國經營報

本報記者 李玉洋 上海報道

3月21日晚,英偉達(NASDAQ:NVDA)召開的GTC開發者大會猶如“深水炸彈”,在AI領域掀起巨浪。而讓人印象最深刻的,是英偉達創始人兼CEO黃仁勳提出的全新概念:“我們正處於AI的‘iPhone時刻’。”

黃仁勳所謂AI的“iPhone時刻”,即AI技術正在迎來爆發式增長,將成爲數十年來最有前途的技術領域之一。在此次GTC 2023大會上,英偉達發佈了專爲ChatGPT這樣的大語言模型設計的GPU H100 NVL、AI超級計算服務DXG Cloud等多款針對AI的最新技術。

值得注意的是,英偉達還發布了讓計算光刻變得更加“聰明”的軟件庫cuLitho。儘管英偉達此前針對生物製藥、化學、氣候預測、量子計算等領域也發佈過一些中間件和軟件庫,但都屬於常規操作,這次針對芯片製造工藝——計算光刻的舉動顯得有點特別。

有受訪者告訴《中國經營報》記者,cuLitho是一個用於運算式微影函式庫,可以縮短先進製程芯片的光罩時程、拉昇良率並大幅減低晶圓製作的能耗,英偉達此舉意義重大。“英偉達的計算光學加速,確實對先進節點的光刻有所幫助。”一家國內排名靠前的IC設計公司研發人員表示,常規的光學近場修復耗時耗力,尤其是5nm節點以下工藝挑戰很大,用AI加速能夠分擔很大一部分工作量。

AI的“iPhone時刻”

在本次大會上,黃仁勳多次提及生成式AI,將ChatGPT稱爲AI的“iPhone時刻”。2022年11月底,OpenAI發佈聊天機器人ChatGPT,迅速引發全球旋風,僅用兩個月全球獨立訪問用戶便過億。

黃仁勳認爲,生成式AI是一種新型計算機,一種可以用人類語言進行編程的計算機,每個人都可以命令計算機來解決問題,這之前是隻有程序員才能接觸的領域,而現在每個人都能是程序員。正如此前的互聯網一樣,生成式AI也將重塑每個行業。

針對部署像ChatGPT這樣的大語言模型(LLM),英偉達發佈了AI 重磅產品H100 ,它將英偉達的兩個H100 GPU拼接在一起。“當前唯一可以實際處理ChatGPT的GPU是英偉達HGX A100。與前者相比,現在一臺搭載四對H100和雙NVLINK的標準服務器速度能快10倍,可以將大語言模型的處理成本降低一個數量級。”黃仁勳說。

英偉達還介紹,會把由8塊旗艦版A100或H100芯片集成的DGX超級AI計算系統通過租賃的方式開放給企業,每月租金爲37000美元,以推動加速這輪大語言模型引領的AI繁榮。

“我們在歐美與雲服務提供商合作,提供英偉達的DGX系統AI超級計算機的能力。在中國,我們有特別定製的Ampere和Hopper芯片。這些會通過中國雲提供商,比如阿里巴巴、騰訊、百度這些企業提供落地的能力,我完全相信他們有能力去提供頂級的系統服務,對於中國初創公司一定會有機會來開發自己的大語言模型。”黃仁勳在接受媒體採訪時表示。

此外,英偉達還推出雲服務NVIDIA AI Foundations,提供語言、數據和生物學模型的定製服務,與Adobe、GettyImages、Shutterstock等進行合作。

“人工智能的iPhone時刻已經開始。”黃仁勳指出,人工智能發展至今,對社會的影響可能像蘋果iPhone打開智能手機市場那樣。

用軟件做建模的計算光刻

據黃仁勳介紹,所謂計算光刻就是爲芯片生產製作光掩模(photomask)的技術,掩膜是一種平面透明或半透明的光學元件,上面有芯片加工所需的圖案,並通過曝光將圖案轉移到光刻膠層上。

光刻加工過程開始後,通過控制光刻機的曝光和開關操作,可以將光束根據掩膜上的圖案進行分割和定位,使得光束只照射到需要曝光的區域,從而將芯片上的圖案轉移到光刻膠層上,實施芯片光刻。

“其實,光刻就像是用‘光刀’在晶圓上‘雕刻’一樣。而雕刻需要刻出特定圖案。這個圖案首先要呈現在光掩膜上。掩膜板就像是漏字板,激光一照,通過鏡頭,漏字板上的圖案也就落到了硅片上。”長期關注半導體行業發展的資深觀察人士黃燁鋒生動地解釋光刻原理。

事實上,晶體管、器件、互聯線路都需要經過這樣的光刻步驟。因爲每種芯片都要經歷多次曝光,所以光刻中使用的掩膜數量不盡相同。“實際生產要複雜得多,比如現在的芯片上下很多層,不同的層就需要不同的光刻和掩膜板,且某些層如果器件間距很小,就可能需要多次光刻。”黃燁鋒說。比如,NVIDIA H100(臺積電4N工藝,800億晶體管)需要89張掩膜,英特爾(Intel)的14nm CPU需要50多張掩膜。

黃燁鋒指出,光刻過程其實很反常識,比如要在晶圓上光刻一個類似“+”的圖案,那麼掩膜板要做成形似二維碼樣的圖案。對此,英偉達先進技術副總裁Vivek Singh解釋說,半導體經過幾十年的發展,晶體管互聯間距變得越來越小,但“大概30年前,晶體管的尺寸變得比(光刻機所用的)激光波長還要小,於是衍射效應就產生了,晶體管成像就會變得模糊。”

“對於相機而言,當光圈小到某種程度以後,照片受到衍射效應的影響就會顯著增大,導致畫面解析力的大幅下降。實際上,超高像素(或小像素)也受制於衍射效應。”黃燁鋒表示,儘管光刻機所用光源也發生過幾次大的迭代,比如目前討論最多的DUV(深紫外線)和EUV(極深紫外線),但哪怕是波長顯著變小的EUV極紫外光刻,其波長與器件間距之間的差異,也變得比過去更小,“換句話說,光刻圖案未來將一步步走向模糊,或者說沒有很高的保真度。”

因此,計算光刻得以切入,藉助計算光刻緩解衍射效應所帶來的像差對芯片製造的不良影響。據黃燁鋒介紹,此前ASML中國就曾提起過計算光刻,計算光刻已是ASML(阿斯麥)的“鐵三角”業務之一。“ASML說計算光刻是通過軟件對整個光刻過程來做建模和仿真,對工藝流程做優化,比如說形貌優化、掩膜板修正等。”他說。

GPU通用計算加速的又一方向

隨着晶體管和互聯線寬的持續微縮,掩膜板的複雜度越來越高,相應的對計算光刻的算力要求也變高。

“按照過去15年的趨勢,如果某個foundry(集成電路代工廠)現有3座數據中心,那麼未來10年內就要100座這樣的數據中心。”Vivek Singh說,“功耗方面,45兆瓦可能還能接受,但如果是45千兆瓦,問題就比較大了。對此,英偉達給出的回答是全新的 AI 加速技術cuLitho。”

Vivek Singh還提到,包含於計算光刻中的OPC(光學臨近效應修正)含有大量矩陣乘法運算,這種運算很適用於GPU加速。說到底,計算光刻也是GPU通用計算加速的某個應用方向,站在這個角度看,就不難理解英偉達發佈cuLith加速庫了。

此前,這種“精雕細琢”的計算光刻依賴CPU(圖形處理器)服務器集羣。據介紹,英偉達cuLitho可以實現在500套DGX H100(包含4000顆Hopper GPU)完成與4萬顆CPU運算服務器相同的工作量,但速度快40倍,功耗低9倍。

可見,GPU加速後,生產光掩模的計算光刻工作用時可以從兩週減少到8小時。臺積電可以通過在500個DGX H100系統上使用cuLitho加速,將功率從35MW降至5MW,從而替代用於計算光刻的4萬臺CPU服務器。也就是說,傳統的計算模式兩週才能完成的任務,同時使用英偉達的芯片和軟件就能在一夜之間搞定。

值得注意的是,黃仁勳還提到了cuLitho在臺積電2nm工藝中的使用。藉助cuLitho,臺積電可以縮短原型週期時間,提高晶圓產量,減少芯片製造過程中的能耗,併爲2nm及以上的生產做好準備。據悉,臺積電將於6月開始對cuLitho進行生產資格認證,並會在2024年對2納米制程開始風險性試產,2025年開始量產。

“可以大膽預測,對於IC設計中的版圖設計,這個AI工具(指cuLitho)應該也會有很大幫助。”前述國內IC設計公司研發人員表示。不過,對於cuLitho是否運用AI,Vivek Singh並沒有明確回答。

對於是否支持舊工藝的問題,Vivek Singh表示,cuLitho是用作提升解析力、消除衍射的計算光刻,那麼對於存在這種需求的工藝來說都適用。“不過,我認爲這還涉及到成本和foundry的選擇問題,包括cuLitho究竟能多大程度提升良率。”黃燁鋒說。

英偉達方面表示,除了臺積電之外,還正在與ASML、Synopsys合作,將這種技術推向市場。Synopsys表示,正將cuLitho軟件庫整合到EDA軟件中,而ASML則是“與英偉達在GPU和cuLitho方面緊密合作,計劃將GPU支持整合到所有的計算光刻軟件產品中”。

相關文章