看得見的是各種智慧服務,看不見的是新型的基礎設施,而支撐智慧化轉型的正是以雲計算、大數據、人工智能(AI)爲核心的智慧計算。疫情期間,騰訊和阿里每天都在擴充雲計算資源,用於支撐日益增多的視頻會議、在線辦公等業務。百度地圖則利用其每天響應千億次位置服務請求所產生的大數據,通過數據定向、分析等途徑助力流行病學調查。

伴隨生產力的升級,社會基礎設施也在發生變化。農業時代的基礎設施比較簡單,就是水利、交通等;在工業時代,則是人們熟悉的“鐵公機”(鐵路、公路、機場)、電網等;而智慧時代,必將需要新型的基礎設施。可以和電力基礎設施做個類比。電力基礎設施提供電力服務,其核心是生產電力的地方(即發電廠),像三峽電站、大亞灣核電站。智慧時代的新型基礎設施要能夠對外提供各種算力的服務、數據的服務和AI的服務等,其核心就是計算力的生產中心。

計算是在不斷發展的,從最初的數值計算逐漸演變爲科學計算、關鍵計算和智慧計算。每種計算都有相應的計算力中心支撐。科學計算的算力中心是超算中心;承載當前企業應用、政府應用和個人應用的算力中心是數量衆多的各類數據中心;當前AI計算需求正呈指數級增長,未來將佔據80%以上的計算需求,承載這種需求的就是AI算力中心,即智算中心。

智算中心是智慧時代最主要的計算力生產中心和供應中心,它以融合架構計算系統爲平臺,以數據爲資源,能夠以強大算力驅動AI模型對數據進行深度加工,源源不斷地產生各種智慧計算服務,並通過網絡以雲服務形式提供給組織及個人。智算中心正在成爲經濟社會運行的重要基礎設施。

智算中心的三個基本要求:

智算中心要成爲新基建的源動力必須滿足三個基本要求:開放標準、集約高效和普適普惠。開放標準要求智算中心從硬件到軟件、從芯片到架構、從建設模式到應用服務都應該是開放的、標準的;集約高效要求智算中心的建設要有超大規模,要採用領先的技術,保證自身的先進性;普適普惠則要求智算中心發揮基礎設施的社會價值,服務大衆。

首先來看開開放標準。IT的歷史其實是一部開源開放的歷史。從傳統的基礎軟件開源,到雲計算、大數據、算法框架等新型基礎軟件的開源,再到芯片開放、硬件基礎架構開放,開源開放變革了IT產業的生產模式和應用服務模式,持續推動着信息技術的發展,促進了整個IT產業的生態繁榮。開源開放的軟硬件是智算中心發展的必由之路。

基礎設施必然要以規模效應來實現降本增效,要能夠快速高質量建設。這就要求智算中心要採用預生產、標準化、模塊化的硬件來實現“裝配式”建設。從標準化的節點單元、整機櫃,到標準化的微模塊數據中心,實現智算中心的快速建設。同時,不同的智算中心要能夠互聯互通,要能夠做到管理上的互操作,統一的調度分發和監控運維,實現業務上的互連接和數據上的互流通。

其次,超大規模的基礎設施要求智算中心應該是集約高效的。智算中心應採用先進的技術理念,融合架構代表着數據中心體系結構的未來發展方向。通過硬件重構和軟件定義,智算中心不僅可以實現存儲資源和異構計算資源的彈性組合,也可以通過連接、池化和重構技術實現多種計算資源的高效協同。這些計算資源既包括目前使用的處理器、GPU、AI芯片等,也包括未來可能帶來更大計算能力的量子計算、生物計算等。智算中心應採用浸沒式液冷等領先的冷卻技術,配合餘熱回收、相變儲能等循環節能技術,達到電源使用效率(Power Usage Effectiveness,PUE)接近於1的目標,實現綠色節能。

再次,智算中心作爲基礎設施,要服務於大衆,提供算力服務、數據服務和智能服務,從而支撐智慧城市、智能製造、智能家居以及智能醫療等行業的智慧化轉型。但是行業用戶的智慧轉型仍然存在着巨大的技術鴻溝,包括如何選擇最合適的算法模型,如何從軟硬件兩方面對算法進行性能優化,如何對面向特定領域的智能算法進行高效敏捷的開發部署等諸多問題。要填補這些鴻溝,需要智算中心提供整合的、易用的開放服務平臺。智算中心應建設先進的AI算力基礎平臺、AI算力調度平臺、AI算法模型來打造AI開放服務平臺,匯聚並賦能AI應用的開發者,加速開發各種各樣的智慧應用,加速產業AI化。

相關文章