中國算力產業依然面臨需求碎片化、國產基礎軟件生態和配套芯片不強、傳輸能力不足、無效算力增多、人才緊缺、難互通協同等諸多挑戰。

編輯丨林志佳

來源:鈦媒體

“算力”相關產業近期持續火爆。

據中國信息通信研究院測算,截至2021年底,中國算力核心產業規模超過1.5萬億元,關聯產業規模超過8萬億元。其中,雲計算市場規模超過3000億元,互聯網數據中心(服務器)市場規模超過1500億元,AI 核心產業規模超過4000億元。

同時,“算力”發展也受到了資本市場關注。數據顯示,自今年4月底起,A股算力相關概念板塊指數漲幅高達26%。

“算力已經成爲繼熱力、電力之後新的關鍵生產力。”工業和信息化部副部長張雲明7月30日在中國首屆算力大會上表示,國內算力產業近五年平均增速超過30%,算力規模超過150EFlops(每秒15000京次浮點運算次數),排名全球第二,第一是美國。

所謂“算力”,是指設備通過處理數據,實現特定結果輸出的計算能力。2018年諾貝爾經濟學獎獲得者William  Nordhaus在《計算過程》一文中提出:“算力是設備根據內部狀態的改變,每秒可處理的信息數據量。”

小至芯片、手機、PC,大到汽車、互聯網、人工智能(AI)、數據中心、比特幣、超級計算機、航天火箭,“元宇宙”概念以及48萬億元規模的中國數字經濟等,“算力”都在其中發揮着基礎核心作用。沒有算力就沒有各種軟硬件的正常應用。

實際上,算力既是信息基礎設施的重要組成部分,也是承載數據和運算運行的平臺,更是數字經濟時代計算、存儲、網絡能力的一種綜合體現。

目前,算力已經成爲拉動中國經濟增長核心引擎之一。據信通院數據顯示,算力投入能顯著提升經濟價值:每1元的算力投入,可以帶動3-4元的GDP(國內生產總值)經濟產出,實現經濟增長的倍增效應。計算力指數越高對經濟的拉動作用越顯著。

隨着今年國家推出“東數西算”工程,地方上也進一步加碼佈局。發改委公佈的數據顯示,今年以來,全國10個國家數據中心集羣中,新開工項目25個,帶動各方面投資超過1900億元。預計“十四五”期間,大數據中心投資還將以每年超過20%的速度增長,累計帶動投資超過3萬億元。

算力還是中美未來科技競爭的關鍵因子。去年4月,美國商務部對中國國家超級計算濟南中心、深圳中心、無錫中心、鄭州中心等中國超算實體列入“實體清單”。有行業人士告訴鈦媒體App,“算力的重要性在於,它是國家競爭能力高低的核心指標,也是中長期的投資抓手。”

不過,中國算力產業依然面臨需求碎片化、國產基礎軟件生態和配套芯片不強、傳輸能力不足、無效算力增多、人才緊缺、難互通協同等諸多挑戰。正如中國工程院院士王恩東在算力大會上所說,中國算力產業未來要加強頂層規劃,規範產業發展,不能“躺平”,更要避免一哄而上、低水平重複的問題。

雲岫資本合夥人兼CTO趙佔祥接受鈦媒體App採訪時表示,服務器芯片“國產替代”需要長時間佈局,有一個循序漸進的過程,同時還需要軟件生態、人才、芯片性能、客戶支持等資源整合,“這是一個全方位的工程(體系)。”

提升算力就是要“撒錢”堆服務器

2018年9月,颱風“山竹”到來之前,深圳市氣象臺發佈了雷暴及大雨預警。一個小時後,深圳全城下起了大暴雨。

深圳氣象局能夠如此準確的公佈降雨、雷暴等災害性天氣,主要來源於雲計算、AI、5G等技術以及災害性天氣 AI 氣象預測模型,捕捉雷達、雲圖等數據中的時空關係實現氣象預警。實際上,氣象 AI 預測模型背後擁有每年約300TB的數據,那麼就需要大量算力支撐,才能讓模型應用,AI 技術實現產業落地。

而在浙江橫店,每年有大量的影視作品在後期製作時需要對動畫和特效進行渲染,而這類渲染工作就需用到大量的算力。考慮成本的情況下,這些後期工程文件會通過雲平臺,將其上傳至貴州、內蒙這些西部地區的數據中心進行計算。

這些算力應用背後,服務器的作用功不可沒。中國科學院院士鄔賀銓表示,算力產業鏈很長,數據中心是算力產業裏突出的中心環節。

按應用領域劃分,算力包括兩種:計算量小的通用算力,以及數據中心、超級計算機等在內的HPC(高性能計算)算力。

僅從算力經濟來看,主要分爲三個層次:

第一層次是算力的“基礎設施建設”。作爲新型生產力,算力離不開工具和技術。而基礎設施是算力的工具,包括高性能芯片、數據中心、網絡等基礎設施建設爲算力、應用以及產業發展提供可持續發展的保障。

第二個層次是算力應用。得益於基礎設施的進步、數據推動算力水平的不斷提升,雲計算、大數據、AI、物聯網、5G等應用都將發展,從而帶來計算方法的革新,提高計算效率,拉動算力發展。

第三個層次是算力與實體經濟產業的融合。工業互聯網、金融科技、自動駕駛、智慧醫療等產業數字化加速、新的需求以及產生的大量數據,讓超大算力得以“施展才華”。

相對於中國超14億人的算力應用和消費市場,數據中心、芯片半導體等算力基礎設施產業鏈,則是中國目前急需佈局的重點領域之一。

作爲算力的主要承載,數據中心就是一個容納核心計算服務和基礎設施的服務器機房(物理場所),可用於存儲和計算數據。

數據顯示,2019年,中國在用的數據中心數量達到2213個,其中超大型、大型數據中心數量佔比12.7%。與之對比的是,美國超大型數據中心佔到全球總量40%,國內數據中心建設仍有較大空間。

2021年5月,中國提出“東數西算”工程,計劃在國內8個地方啓動建設國家算力樞紐節點,規劃10個國家數據中心集羣,將東部算力需求以及產生的數據,通過網絡引導到中國西部地區的數據中心處理、計算和存儲。預計在2025年,中國將有望建成全國一體化數據中心繫統。

藉助“東數西算”東風,今年以來,阿里、華爲、商湯、浪潮,以及國內三大電信運營商——中國移動、中國聯通、中國電信等,在蘇州、呼和浩特、成都等地大量投資,建立及運營新的數據中心或計算中心。

中國移動副總經理高同慶表示,預計2021年內,中國移動數據中心投產能力超過117萬架。2022年,中國移動算力網絡資本開支達數百億元,未來還將繼續在算力領域加大投入。目前中國移動長三角數據中心位於南京江北新區,投資超200億元。

“國內提出‘東數西算’,是利用西部比較充裕的能源,比較廉價的電費,以及有可能利用再生能源,更好滿足低碳的需要。”鄔賀銓表示。

不過鄔賀銓也質疑稱,“東數西算”工程難以互通,從而讓算力與存儲容量無法得到最佳利用。

他以廣東數據中心規劃爲例,“他們設計省內算力70%,省外算力30%。按理說,省外就是冷數據,應該佔比80%,那與省外算力30%差別很大,這是否意味着,80%是指存儲容量而非算力的比例?另外,在市場經濟條件下,東部與西部並非固定配對,如何各自做到容量最佳利用?”

而作爲AI技術三要素(數據、算力、算法)之一,算力在 AI 中也發揮了關鍵作用。商湯科技聯合創始人林達華告訴鈦媒體App,在青島市西海岸新區,利用其 AI 大裝置算力以及算法技術支持下,商湯對千萬級海量遙感影像樣本數據進行深度學習,形成多種面向業務應用場景的算法模型。在城市違建治理、生態環境監測、河湖四亂治理等方面實現了問題的高效發現和治理覈查。

此外,當前中國的算力建設還受到碳中和、碳達峯目標的制約:一是工信部發布的《新型數據中心發展三年行動計劃(2021-2023年)》等政策,面對算力設施的建設方針和能耗管理趨於嚴格,如2023年新建大型及以上數據中心電能利用率(PUE)將被要求降到1.3;二是能耗“雙控”背景下,地方政府對於建設高能耗算力設施的積極性在降低。

因此,國內外頭部IT企業也開始部署液冷技術。業內人士告訴鈦媒體App,目前高功率服務器應用越來越多,其可在同等溫度下大幅提升數據中心的運算效率,爲提升高功率服務器散熱需求,同時降低散熱能耗,業內通常採用冷板、浸沒、噴淋三類液體冷卻服務器方案,通過將CPU(中央處理器)、GPU(圖形處理器)等服務器部件與冷板液冷的冷板緊密貼合,或與浸沒液冷直接接觸,提升服務器散熱系統換熱能力,實現高功率運算。

阿里雲數據中心設施模型在2022中國算力大會展示。下面兩端物體是浸沒液冷的CDU,也叫冷源分配單元,它起到內外換熱的作用,把吸收服務器熱量的液體收集後,在CDU內部與外部冷源進行換熱,是一箇中間裝置;上面兩端則是浸沒液冷的一種冷源形態,圖中是給集裝箱內的液冷tank進行散熱用,設備類型可能是冷塔、乾冷器、冷機等(圖片來源:鈦媒體App編輯拍攝)

無錫數字經濟研究院執行院長吳琦表示,一些規模小、能耗大、技術更新緩慢的企業和設施將面臨淘汰,電能利用效率高的產品會是未來算力市場的主流。

政企花了錢,算力也難用

中國首屆算力大會上,中國工程院院士劉韻潔直言,目前不管是算力網絡,還是算力面臨着諸多挑戰。如果不能解決這些問題,算力網絡將難以構建(實現)。

實際上,算力網絡是基於數據中心等算力基礎設施,將海量數據通過雲、邊、端協同方式,實現智能計算與網絡連接。華爲發佈的《通信網絡2030》提到,算力網絡代表了從“面向人的認知”向“面向機器認知”(AI)的網絡設計理念的重要變化,聯接海量用戶數據與多級算力服務。

因此,劉韻潔的說法意味着,政府、企業花了大量的資金投入算力基礎建設,但如果算力網沒有構建好,算力也很難使用。

劉韻潔認爲,目前算力網絡面臨三個主要挑戰:

一是實時性嚴重缺乏,目前互聯網幾乎沒有實時性的能力,而實時性的能力,不論是工業、能源還是電力,都提出了確定性網絡的具體指標;二是帶寬的挑戰,FAST(500米口徑球面射電望遠鏡)每天產生的數據大概超2000TB,這些數據與全球網絡共享,網絡帶寬的不確定性導致傳輸效率低;三是當前“煙囪化算力”難互聯、難協同,這就造成算力利用率低,使得算力成本增加,如何將“算力”和“網”深度融合在一起,也是一個非常大的挑戰。

以國有企業“寶武鋼鐵集團”爲例。武鋼通信技術有限公司總工程師陳巍崴曾在2021年7月提到,寶武集團工廠存在大量非雲化設備,且協議不開放、工業連接組模不豐富,對接耗費成本;再就是工控網、管理網和互聯網多網並存,網絡安全無法有效管控。傳統“盡力而爲”的網絡已經無法滿足寶武集團數字化及新業務。

實際上,算力網絡、基礎設施的互聯互通、轉移新平臺設施一直是企業的核心難題——阿里雲沒有騰訊雲、華爲雲平臺接口,美國Oracle數據庫的信息資料沒辦法轉移等。

2021年3月,作爲金融領域的國有企業,中國郵政儲蓄銀行發佈採購前公示,而且是單一來源採購,理由是:當前多個核心生產系統使用美國Oracle(甲骨文)數據庫進行數據存儲和處理,無法替換。隨後6月,郵儲銀行以1.45億元與甲骨文簽下續約合作。

那麼,如何解決“全國算力一張網”的難點與挑戰?

劉韻潔院士提出,建立以“大帶寬、低時延、超低抖動、極高可靠”爲主要特徵的確定性網絡,支撐產業核心應用加速雲化、線上化、智能化,將真正改變產業互聯網模式。“無論是智慧醫療、能源、交通,以及未來的元宇宙,沒有確定性的網絡會有問題。”

與此同時,中國也在努力逐步解決這一難題。今年6月15日,中國正式上線“中國算力網-智算網絡”,將整個算力網絡接入中央批准成立的鵬城實驗室的鵬城雲腦、北京、杭州等9個算力中心,總算力超過2000PFlops(每秒200億億次浮點運算)。

華爲公司副總裁、計算產品線總裁鄧泰華認爲,中國算力網是一個大工程。目前中國有電力網、高鐵網、通信網,未來有算力網,尤其利用大型的算力資源連成一張網。

國產化依然難行

作爲“算力”的極限領域,中國超級計算機一直受到美國超級電腦的壓制。

2016年,美國以擔心中國“天河二號”進行核子研究爲由,禁止英特爾出口芯片給中國。隨後於2016年,利用上海高性能集成電路設計中心自研設計的SW26010處理器,中國自主研發出“神威·太湖之光”超級計算機,以93014.6TFlops問鼎世界第一。

不過,到了2018年6月,“神威·太湖之光”被美國IBM研發的Summit OLCF-4超級電腦所超越。

2021年4月起,美國商務部對多家中國超級計算機實體列入“實體清單”,其中包括天津飛騰信息技術有限公司、上海高性能集成電路設計中心、成都申威科技有限責任公司,以及中國國家超級計算濟南中心、深圳中心、無錫中心、鄭州中心等。更早之前,美國對華爲海思、中芯國際、商湯等“算力”產業鏈相關企業進行制裁。

截止發稿前,Top500網站數據顯示,目前全球超算排名第一的是,美國能源部及芯片巨頭AMD、HPE慧與科技合作研發的Frontier(OLCF-5)全球首臺百億億次級計算機。而中國“神威·太湖之光”排名第六,“天河二號”則排名第八。

在中美博弈持續升級的大背景下,目前包括服務器芯片、軟件系統、數據庫等領域仍依賴於國外產品,“算力”產業的國產化依然難行。

其中在服務器整機市場方面,IDC數據顯示,2021年全球服務器市場出貨量和銷售額分別爲1353.9萬臺和992.2億美元,其中中國銷售佔比達25.3%。2022年第一季度,全球服務器市場份額排名前五,分別是美國戴爾(份額高達16%)、中國浪潮(10%)、美國惠普、美國AMD、中國聯想(不足5%)。

操作系統裝機量方面,數據顯示,儘管互聯網領域的服務器操作系統,實現100%國產化,但通信、金融和政企領域依然有35%以上,仍依賴國外操作系統,例如美國微軟的Windows、IBM的Redhat等。

算力數據庫方面,中國軟件協會數據顯示,國內集中式數據庫市場,國外品牌仍佔據90%以上;關係型數據庫領域,美國微軟(21.6%)、甲骨文(21.4%)和亞馬遜(8.5%)共佔市場總份額的50%以上。

最重要的服務器芯片領域,無論是通用處理器還是加速處理器,英特爾(Intel)、AMD和英偉達佔據國內85%以上的服務器芯片市場,國產處理器及關鍵零部件份額較低。

“這其實還是一個軟件生態的問題,因爲英偉達、英特爾等國外的軟件生態太強了,國內企業想要追上來難度很大,需要投入很長時間與大量資源。”趙佔祥對鈦媒體App表示,Windows等操作系統需要幾十萬開發者,而國內很難調動這麼多資源,因此國內服務器需要長期依賴國外芯片企業。

7月31日結束的中國計算機學會(CCF)芯片大會上,清華大學教授魏少軍就表示,國產服務器芯片的產品能力不行,無法具有足夠的市場競爭力。例如,國內芯片無法實現服務器中非常重要的配置併發多線程(SMT)能力,而國外芯片在這個問題上已經全面突破,國產芯片技術依然落後。

“我們花了很多精力去建立AI平臺,實際上不可用,或者說它並沒有想象的那麼好。說的更好聽一點,還沒有達到我們所需要的要求,仍需要時間等待。”魏少軍表示。

一家國產GPU芯片企業高管告訴鈦媒體App,很多國產服務器板卡都無法在客戶數據中心上“跑動”,因爲適配度較差。

今年以來,阿里、騰訊、字節都紛紛開啓了“造芯”模式,均與服務器有關。但一位芯片行業人士對鈦媒體App表示,互聯網“造芯”無法從根本上解決國內服務器依賴進口芯片的情況。

在趙佔祥看來,這些互聯網企業“造芯”主要原因是自身服務器的降本增效。

目前,浪潮、阿里雲、騰訊雲等國內廠商,仍大部分使用美國芯片企業的產品。其中,騰訊雲的星星海處理器均爲AMD、英特爾定製開發;阿里雲第七代雲服務器ECS的CPU則採用英特爾第三代Xeon可擴展處理器;浪潮服務器所使用的芯片大部分來自英特爾、AMD、英偉達三家,部分服務器則使用寒武紀的 AI 芯片。

“算力建設的最大難點還是在於半導體與集成電路製造。而在服務器芯片領域,無論是通用處理器還是GPU芯片,對國外的依賴程度非常高,解決問題的難度也非常大。”王恩東認爲,中國要集中力量打造國產CPU芯片,打破技術壁壘,不能煙囪林立。

張雲明表示,下一步工信部將要加速推進高端芯片、核心算法等算力關鍵核心技術的研發突破,攻克關鍵技術,支持企業、科研機構開展聯合攻關,增強算力產業鏈、供應鏈自主可控能力,並在綠色低碳發展等方面發力。

“不能說芯片初創企業一旦虧損就不投資了。我認爲,更多的民間資本應該要投資長期會虧損、對國家很重要的芯片企業,而且政策上要鼓勵其早點上市,給這些虧損公司融資提供一個比較好的通道。”趙佔祥說。

相關文章