作者: 吳斯旻

[ “十四五”期間,伴隨“東數西算”工程推進,大數據中心投資將以每年超過20%的速度增長。 ]

目前,國內外雲計算市場保持較高熱度,對建設數據中心的需求維持高位。受此影響,與數據中心相關的高性能計算也成爲全球芯片研發企業角逐的焦點。

根據市場研究公司Dell Oro預測,亞馬遜、Meta、谷歌、微軟在今年上半年、下半年數據中心資本支出分別有望增長 18%、36%。在我國,據國家發改委預計,“十四五”期間,伴隨“東數西算”工程推進,大數據中心投資還將以每年超過20%的速度增長,累計帶動各方面投資將超過3萬億元。國家發改委相關負責人還表示,“東數西算”工程需要加大服務器芯片、操作系統等軟硬件產品規模化應用。

“和其他應用領域相比,數據中心因爲需要集中處理海量的數據,對核心芯片的計算能力、傳輸帶寬、處理延遲以及功耗都有比較高的需求。”中科馭數高級工程總監袁曉飛在接受第一財經採訪時稱。

與此同時,隨着國內高性能計算、AI計算及邊緣計算需求的提升,超算、智算及邊緣數據中心將得到進一步發展。因此,作爲底層硬件,滿足該類數據中心算力、算效要求的國產高性能芯片也受到市場廣泛關注。

但不同於資本市場的高熱度,多名受訪行業人士對於數據中心所需算力芯片的國產替代水平仍持謹慎態度,認爲國外芯片巨頭公司壟斷高端芯片市場的局面仍待進一步打破。

“現階段,中國在算力供給方面,仍存在關鍵技術國產化水平不足、應用支撐多樣化能力欠缺等問題,亟待加快推動數據中心相關芯片的核心技術攻關,以逐漸形成產業鏈、供應鏈上下游全域的自主可控。”中國信息通信研究院(下稱“信通院”)雲計算與大數據研究所副總工程師郭亮稱。

“東數西算”下的“芯”機遇

與其他算力芯片應用領域相比,集中海量數據的數據中心,對其核心芯片的算力、算效都有更高要求和技術門檻。

“隨着‘東數西算’工程推進,算力供給需要實現產業佈局均衡、算力供給充足、技術創新活躍、綠色低碳發展的高標準目標,這會讓互聯網、雲計算等數據中心下游企業激發提升核心硬件設備整體性能的需求,也會倒逼上游芯片企業的研發升級。”郭亮告訴第一財經。

據信通院的研究和統計數據,隨着數字技術向經濟社會各領域全面持續滲透,全社會對通用算力的需求預計每年仍以20%以上的速度快速增長,智算算力需求更加強勁;“東數西算”工程通過對全國算力基礎設施的提質增效和佈局優化,會加速算力需求釋放,算力需求的實際增長速度將遠超20%。

那麼,在“東數西算”的新風口,何種類型的芯片會率先受益?

賽迪顧問集成電路產業研究中心高級諮詢顧問池憲唸對第一財經表示,隨着數據中心、雲計算等高性能計算應用的發展,單一類型和架構的算力芯片已無法勝任。在未來,“CPU(用於通用技算)+加速芯片”的異構計算芯片或將是高性能計算領域的市場主導。其中,加速芯片包括AI芯片、GPU(圖形處理器)、DPU(專用數據處理器)、FPGA等。

所謂異構計算芯片,袁曉飛解釋稱,即通過對硬件電路結構進行特定、有針對性的優化,在相同的芯片面積和能耗條件下,提升數倍甚至數十倍的數據處理能力。

工信部在去年11月公佈的《“十四五”信息通信行業發展規劃》中也提到,加快算力設施智能化升級,推進多元異構的智能雲計算平臺建設,增強算力設施高速處理海量異構數據和數據深度加工能力。

但即便有加速芯片分擔數據處理任務,在現有數據中心的基礎架構中,作爲專注於處理通用計算類任務的CPU,還需要承擔網絡、存儲、安全等任務,有效算力在總體算力中的佔比逐漸下降,這讓CPU依舊“不堪重負”。

在此背景下,近兩年來,國內外多家芯片巨頭企業陸續佈局DPU產業。DPU是以數據爲中心構造的異構處理器,通過將那些“CPU處理效率低下,GPU處理不了”的負載卸載到DPU上,以進一步爲算力基礎設施——數據中心“降本增效”。

大禹智芯CTO王昕溥告訴第一財經,“東數西算”背景下,數據需要實現高速扭轉,而DPU可以提高數據中心IT設備的能效比,會在政策加持下迎來發展機遇期。在未來,CPU、GPU、DPU各司其職、物盡其用將成爲數據中心算力芯片發展的趨勢。

國產替代短期內仍難實現

面對“東數西算”工程給國產芯片市場帶來的潛在增長空間,資本市場已掀起陣陣熱潮。但多名受訪專家和企業界人士對第一財經表示,數據中心相關芯片的關鍵核心技術尚存在“卡脖子”難題,國產替代短期內仍難實現。

郭亮稱,與美國、歐洲等發達國家相比,我國算力芯片自主研發能力存在一定差距。芯片作爲算力的重要依託,憑藉技術壁壘高、開發難度大等特點,被歐、美、韓、日等巨頭企業壟斷,中高端芯片和雲端芯片市場尤甚。“儘管我國芯片企業技術水平快速提升,華爲、阿里、寒武紀等企業取得明顯進展,但整體水平仍存在較大提升空間。”

他向第一財經提供了一組數據:在數據中心所需算力芯片中,AI應用所需芯片方面,95%以上來自英偉達、AMD等國際芯片巨頭企業;GPU芯片方面,騰訊雲、阿里雲、平安雲、百度雲等國內計算平臺主要依託英偉達的GPU提供技術支撐;FPGA芯片被賽靈思、英特爾、萊迪思、美高森美四大巨頭企業壟斷,國產FPGA市場份額僅佔1%左右,差距明顯;國產專用芯片(ASIC)主要包括NPU、BPU等,高端芯片仍被歐美韓日企業壟斷。

除了技術壁壘,即便研發成果,國產芯片的商業化還受芯片適配能力的限制。

“由於生態的不完善,算法在國內很多加速芯片上使用時,需要針對加速芯片做專有化的算法適配。”郭亮表示。

他舉例稱,芯片和算法的關係可以類比爲手機和充電接口,TypeC、Micro USB、Lightning等不同的充電接口無法應用在同一款手機上。當前,在國產芯片市場上,華爲、寒武紀等廠商已陸續推出了十餘種自主化加速芯片,這意味着一個算法要在多個加速芯片上進行適配或者多個算法在一個加速芯片上進行適配。在移植適配過程中,或存在算法移植後精度下降、部分算子不支持、算法移植適配後性能不理想等諸多問題。

王昕溥也認爲,芯片的成功研發和規模化商用離不開與相關產業的生態合作,軟硬件的協同發展。“一個成功的國產芯片研發團隊,在擁有過硬的芯片及硬件研發能力的同時,需要與客戶(數據中心、雲計算廠商等)進行及時交流,以客戶可用性爲宗旨,並注重驅動、系統、接口等周邊配套軟件研發,爲用戶提供真正靈活高效實用的國產數據中心芯片產品。”

《“十四五”信息通信行業發展規劃》在“統籌佈局綠色智能的數據與算力設施”一節中也強調,要加強軟件與芯片適配。

芯片製造也被“卡脖子”?

由於採用代工生產模式,對於國內芯片研發企業而言,即便已經設計出符合數據中心、雲計算等客戶需求的芯片,產能問題仍將是決定其能否準確把握“東數西算”商機的關鍵一環。

“代工生產是重資產投入。就國內市場來看,正常情況下,國內代工企業可以滿足芯片量產或者產能需求。”袁曉飛稱。

但他同時表示,由於具備28納米(nm)以下的先進工藝製程批量流片生產經驗的國內從業人員仍較爲缺乏,製造出符合數據中心高性能需求的算力芯片確有“卡脖子”難題。

供應鏈的穩定性也制約着數據中心芯片製造。從原材料供給的角度來看,烏克蘭是全球半導體原料氣體供應大國,其中氖氣佔據全球近七成產量。由於俄烏衝突引發的斷“氖”風波,是否會對國內數據中心產業造成影響?

袁曉飛認爲,短期內,數據中心產業會受到一定影響,下游企業的硬件成本會有所增高。但各大代工廠商正在積極擴建產能,相應關鍵基礎原材料會逐漸找到新的供應替代,供需矛盾會逐步緩解。“不管供需如何緊張,都不會減緩前端芯片研發的產業化步伐,這是行業趨勢和市場需求所推動的。”

“事實上,國內芯片原材料供應已得到較爲充分的保障,總體來看,地緣衝突對於國內數據中心所需芯片的製造影響有限。”郭亮分析稱,,從氖氣產能來看,中國電子特氣的自主化產能已取得了突破性進展,氖氣等多種電子特氣的產能充足。數據顯示,從2014年到2021年氖氣供應量增長幅度超過600%,在滿足國內企業供給要求的同時,還可以進行出口;與此同時,電子特氣成爲國家產業投資的重點目標,使得國產特種氣體已經具備產業化能力。

相關文章