原標題:阿里雲12年:向下紮根,向上生長

過去十多年,雲計算從零起步發展到萬億規模,且仍以兩位數增速持續攀升。Gartner預測2021年全球雲計算市場規模預計將達到1.7萬億元。

在規模持續攀升的同時,作爲雲計算領域的頭部企業,阿里雲更在意的是自己爲數字化轉型做出什麼有價值的貢獻。

“我們今天最大的挑戰是如何去定義雲計算未來是怎麼樣子的,去引領數字化轉型的進程。在這個進程裏面提供有競爭力、差異化的能力和產品。”在2021杭州雲棲大會期間,阿里雲智能總裁張建鋒表示,公司近幾年推出的一系列產品就是爲了能夠引領未來。

過去兩天,阿里雲連續發佈了多款重磅產品,包括自研通用CPU、自研服務器磐久、神龍4.0、龍蜥雲操作系統、阿里靈傑AI平臺等等。此前一週,發佈了釘閃會、釘釘文檔、釘釘項目等多款協同辦公工具,並宣佈低代碼平臺在8個月內新增86萬應用、入駐開發者已達90萬人。

這一系列動作,展示了阿里雲對於未來發展的思考:雙向生長。向下,持續夯實雲基礎技術;向上,爲數字化提供一個標準化的開發平臺。

不止步於雲計算

雲計算深入硬件領域,始於2017年。時年冬,亞馬遜AWS發佈了一款自研的雲服務器硬件——Nitro,這一消息讓整個科技圈一片沸騰。這意味着,雲服務商——這一典型認知上的軟件企業開始“殺入”硬件領域。

而在45天前,阿里雲發佈了第一款由雲廠商自主研發的雲硬件——神龍雲服務器。

地球東西兩端的兩家雲廠商,不約而同地走到了同一個路口,開始鑽研硬件。他們其實都是爲了解決同一個問題:用一款爲雲而生的硬件架構,解決雲虛擬化損耗的問題。

虛擬化損耗是雲計算行業的一大難題。雲的一項基本工作是將物理服務器虛擬化,再將虛擬化後的“雲服務器”提供給用戶使用。例如,用戶性能需求高時,用8核16G服務器;需求低時用2核1G服務器,以此來實現雲的彈性。

然而,因爲虛擬化的過程中需要分出一部分CPU用於調度,因此會造成性能“損耗”,極端場景下,損耗甚至能超過一半。

2015年,阿里雲的虛擬化技術架構從KVM更換至Xen,將虛擬化的損耗從極端場景下的50%降低至10%左右。那已是軟件算法的極限,再進一步的可能性幾乎爲零。

想要徹底解決問題,只能從硬件入手。

2016年,阿里雲祕密啓動了一項代號爲“X-Dragon”項目,將外部雲盤存儲、VPC網絡等資源嵌入專屬板卡,專門做調度工作,從而避免了調度“打架”造成的損耗。一年多以後,神龍雲服務器正式面世,這款搭載了專屬硬件板卡的裸金屬服務器,史上首次將雲計算性能損耗降至0。

自此,雲計算開始向下進入硬件領域。

亞馬遜AWS推出了針對EC2 Inf1機器學習應用的芯片AWS Inferentia,谷歌發佈了一款爲數據中心設計的機器學習芯片,直接命名爲“Cloud TPU”。阿里旗下的平頭哥推出了RISC-V處理器玄鐵910、自研AI芯片含光800、自研通用服務器CPU。

目前,平頭哥擁有處理器IP、AI芯片及通用CPU等產品,旗下玄鐵系列處理器出貨量已達25億顆;兩年前問世的阿里第一顆芯片含光800已實現規模化應用,通過阿里雲服務了搜索推薦、視頻直播等行業客戶。

“我們芯片團隊這兩年能力成長還是非常快的,因爲含光是ASIC的芯片,它的功能、複雜度可能與通用CPU來比還是有很大不一樣的。所以你能設計通用CPU,就是能力很大的檢驗。”張建鋒認爲,能力主要體現在大型工程的管理能力、技術判斷、芯設計到中間交付等。

芯片研發是一項高投入、高風險的事情。以芯片研發環節的流片爲例,流片一次需費時數月,花費高達數千萬美金。

迄今爲止,全球雲廠商中只有阿里雲和AWS成功研發了通用服務器CPU芯片。此前,AWS推出也曾推出自研Garviton 2服務器CPU。

構建以云爲核心的IT技術體系

爲何雲計算廠商非要“死磕”自研服務器、CPU等硬件產品?

首先,最直接的考量是成本。

阿里雲、AWS、微軟管理着數百萬臺服務器規模的大型數據中心,以100萬臺服務器體量計算,CPU芯片成本可達到10億乃至幾十億美元。若採用自研服務器,可以有效降低成本。以手機行業類比,安卓手機採購一枚高通驍龍800系列旗艦處理器,價格約120美元,而蘋果自研iPhone處理器A系列成本價不足50美元,且性能甚至更優。

幾年前,爲了解決虛擬化損耗問題,阿里雲、亞馬遜AWS分別推出神龍和Nitro,大幅降低了雲計算的使用成本。在2019年的AWS技術峯會中,亞馬遜透露,基於Nitro架構的計算實例、內存實例、GPU實例價格分別下降35%至49%不等。

另一重考量,是構建一個以云爲核心的IT技術體系。

雲的核心價值是“按需使用”形成彈性,用戶計算高峯時配置高性能,低谷時則降低性能。這背後就是雲的“池化”能力,通過虛擬化,將計算、存儲等幾項工作分離,形成一個個大資源池,需要時隨時提供。

然而,雲計算的解耦模式與傳統IT中計算、存儲、內存綁定模式所需的能力大相徑庭,市場上的IT硬件都是爲傳統模式設計的,沒有專門爲雲設計的IT架構。比如,傳統IT像是一條廣闊公路,注重的是單條公路的修繕能力;而云是100條公路同時開通,重要的是這100條公路的協調能力。

“我們的交換機都是自研的,這些交換機並非與其他產品有技術代差,但它們更適合在雲計算的超級數據中心中使用。”張建鋒認爲,構建更適合雲的硬件體系,是雲計算步入深水區的關鍵一役。

雲是天然的平臺屬性,當千行百業邁向數字化轉型時,雲就是數字底座。阿里雲反覆強調“做深基礎”,就是不斷強化數字底座的能力,基礎越深,底座就越穩。在此基礎上,足夠強大的自研產品體系就是這個底座的有力支撐。

張建鋒認爲自研CPU是“爲雲而生”,他介紹說,“雲上負載是大規模、高併發的情景,而CPU有兩類,一類是單核性能非常強,第二類是有很多核,多核工作。從測試結果看,多核表現明顯優於單核表現,所以大家可以看到,自研CPU的核數多達128核。”

與自研CPU一同面世的,還有自研雲服務器磐久、神龍4.0、龍蜥操作系統和阿里AI一體化平臺靈傑,並迎來自研數據庫PolarDB的重磅升級。

一系列產品的發佈不僅是單點技術的進步,更是從芯片、服務器、虛擬化架構、服務器操作系統到數據庫、AI能力的全方面升級。一套完整的、以云爲核心的基礎技術體系展現在世界面前。

阿里雲、AWS、谷歌等廠商均有類似“做深基礎”的動作,通過對芯片、虛擬架構、雲操作系統、數據庫等各層面雲技術的自研和不斷突破,構建出一個以云爲核心的IT技術體系,進而形成一套爲雲量身定製的軟硬件技術架構。這不僅是雲計算的發展方向,更是對整體IT產業鏈的變革和重塑。

爲企業數字化提供標準化開發平臺

在向下持續夯實基礎的同時;阿里雲還在思考如何爲企業數字化提供一個標準化的開發平臺,將轉型的門檻降至最低。

在底層技術層面,幾個月前,阿里雲宣佈了“一雲多芯”策略,飛天雲操作系統全面兼容x86、ARM、RISC-V等多種CPU架構。

過去,如果用戶想同時選用ARM、x86等CPU,只能採用多雲協同,爲ARM集羣和x86集羣各自建設存儲與網絡的配套設備,不僅成本高、資源浪費,而且還會帶來多雲管理問題。而一雲多芯將不同架構CPU的算力標準化,向下屏蔽硬件差異性,向上提供一致性服務。

這意味着企業可以同時選用多種CPU架構的服務器,綜合使用多種優勢,無需考慮適配問題。

在此基礎上,企業進行數字化轉型,也應該不必顧慮應用開發問題——順應這一思路,阿里雲採用了“雙向生長”模式,向下屏蔽硬件,提供標準化服務,向上繼續生長,“長”出一個最直接的應用開發平臺。

2020年9月,阿里雲推出“雲釘一體”戰略,即將釘釘作爲一種新型操作系統和應用開發平臺,讓不懂代碼的非技術人員也能按需開發企業應用,用最低成本滿足企業數字化轉型所需。今年1月,釘釘發佈低代碼應用開發平臺,這是一種將各種開發程序模塊化,使普通用戶不必懂代碼編程,也能通過“拖拉拽”方式開發應用的新模式。

過去,數字化常常成爲許多企業的一筆爛賬。從外部諮詢、業務部門提需求開始,信息部門進行開發或者外部招投標,然後經歷“需求-開發-測試-上線-維護”;走完一個週期,往往又是新的部門需求、新週期開啓,最後每多一個系統,就多出一個煙囪,導致即使是一箇中小企業,內部也依然煙囪林立。在“雲釘一體”的構想中,“企業應該擁有數字化的自主權”,每個普通的非技術員工,可以根據業務需求自己開發應用,他面對的應該是由低代碼應用開發平臺構成的簡單界面,背後,AI、大數據、數據庫、雲操作系統、CPU各種技術層層堆疊,共同支撐。

釘釘的低代碼平臺推出後8個月,平臺入駐開發者增加至90萬人,金蝶、用友、紛享銷客等頭部廠商入駐,低代碼應用新增86萬個,全平臺“釘應用”數量超過150萬。

這樣的低代碼平臺切合了企業數字化轉型的需要,與微軟、谷歌雲的方向不謀而合,微軟打出Teams+Azure戰略,該戰略實施後,微軟在兩年內市值翻倍;谷歌將雲與應用結合,將G Suite更名爲Worksapce,爲用戶提供全套協同辦公軟件。

除了企業層面,對於消費者而言,在今年的雲棲大會上,阿里云爲設計師用戶打造了專屬的一體機,採用阿里最新的無影架構,能過有效地提升設計師的使用體驗。

過去,人們購買電腦需要先配置處理器、顯卡、內存、硬盤,再決定安裝哪種系統,並將應用下載到本地使用。如今,用戶無論在雲電腦還是其他設備上登陸無影,過去在Windows、Linux、安卓或國產操作系統的3D渲染、視覺設計、編程環境、手機遊戲等軟件,10多個演示應用圖標聚集於一屏。用戶無需切換系統,無需下載,即點即用。單應用經過適配,目前最高可使用1024核CPU和8塊高性能GPU。

雲入深處,待新世界

相關文章