曾經,作爲電腦的大腦,計算機需要CPU。計算機內存儲的數據、外圍的設備和其他組建要麼將數據輸入CPU,要麼接受CPU的指令。

後來,爲了減輕CPU的壓力,GPU應運而生。雖然GPU的出現是爲了減輕CPU在圖像處理方面的壓力,但是由於其優秀的並行處理能力,如今GPU不侷限於圖像渲染,還應用於人工智能、深度學習、大數據分析等領域。

到了現在,隨着核心網、匯聚網朝着100G、200G發展,接入網也達到50G、100G,CPU無法提供足夠的算力來處理數據包。因此,出現了“性能帶寬增速比失調”的問題。AWS形象地稱之爲“數據中心稅”——還未運行業務程序,接入網絡數據就要佔去許多計算資源。

舉一個例子,在雲計算場景下,虛擬機之間的數據轉發,通常而言20個VM需要消耗的算力,如果用Xeon的多核CPU來處理大概需要5個核的算力,這是將一筆比很大的開銷。

阿里雲彈性計算產品線負責人張獻濤曾經算了一筆賬,阿里雲營收規模已經達到上百億元,如果存儲、網絡佔用約10%的CPU資源,則意味着年損失10多億元。

因此,爲了繼續減輕CPU的負擔,DPU登上舞臺。對於CPU處理效率低下同時GPU也處理不了的負載,就可以卸載到專用的DPU進行處理。

DPU的概念是由英偉達帶火的。在2020年上半年,英偉達以69億美元的對價收購以色列網絡芯片公司 Mellanox Technologies,並與同年推出BlueField-2 DPU,從此拉開了DPU發展的序幕。

英偉達首席執行官黃仁勳表示:“DPU將是未來計算的三大支柱之一。CPU用於通用計算、GPU用於加速計算,而DPU在數據中心移動數據,進行數據處理。”

DPU最早落地的領域是雲計算,很多雲服務商早就意識到了問題,AWS從2015年就已經探索DPU的發展,收購芯片廠商Annapurna Labs,推出Nitro芯片。雖然當時還沒有“DPU”這一名字,但Nitro被公認爲是DPU的早期形態。之後,2017年AWS正式推出了Nitro,將網絡、存儲和安全任務卸載到基於Arm架構的專用設備上。

同樣是2017年,爲了解決隨着雲計算業務規模的擴大,資源爭搶、算力損失的問題,阿里雲推出了神龍(X-Dragon),通過虛擬化來達到轉接CPU存儲、網絡等基礎功能的目的。很快,阿里雲就把天貓雙十一當做試驗場併成功運營,後來上汽成了第一家神龍架構的試驗客戶。

回看過去,我們可以將2017這一年稱之爲DPU元年。

三年後英偉達將其命名爲DPU之後,纔有了一個統一的叫法。目前來看,真正實現大規模商用DPU架構的,全球只有兩家:亞馬遜的AWS,以及阿里雲。

而云服務商中,不止亞馬遜與阿里雲佈局DPU,同樣看中雲服務的騰訊雲也加入了DPU的研發。以統一算力底座,降低總體成本爲目的,騰訊自研了水杉和銀杉兩代DPU。目前,騰訊自研DPU已經支撐公有云外部客戶,以及微信、QQ、騰訊會議等自研業務上雲。

去年加入雲計算的新成員字節跳動也宣佈將自研DPU,計劃通過火山引擎雲產品的方式對外服務。

在雲廠商的來勢洶洶下,芯片廠商也並非無動於衷。

當初帶火DPU的英偉達,自然對DPU有所部署。英偉達計劃在2022年推出性能更強的BlueField3;到2022年,英偉達計劃推出第三代DPU;2024年推出集成其GPU模塊的BlueField4。

Marvell最新推出的OCTEON 10系列DPU,採用了Armv9架構的Neoverse N2 CPU內核和臺積電5nm製程工藝,支持最新的PCIe 5.0 I/O與DDR5內存。作爲DPU的重要補充,Marvell還爲OCTEON 10引入了內部機器學習(ML)引擎。這樣,從本質上講,Marvell正在成爲英偉達的直接競爭對手。

英特爾也參與戰局,在2021年6月發佈首款IPU產品,將其視爲雲戰略的重要支柱之一,助力數據中心網絡加速走向可編程的分佈式架構。2022年4月,英特爾公佈收購雲解決方案公司Granulate的協議,以提升自身在雲計算系統的綜合協調性;2022年5月,英特爾發佈第二代IPU,並公佈將在2023—2024年間上線第三代IPU的消息。基於端到端可編程能力,英特爾不斷在“雲端”實現高效運算,解鎖數據中心基礎設施的新潛力。

DPU的賽道上也逐漸出現了中國企業的身影,並且隨着DPU風口的漸起成功融到資金。目前來說,國內比較受到關注的DPU初創企業包括:雲豹智能、中科馭數、芯啓源、雲脈芯聯、星雲智聯、大禹智芯。

今年6月,大禹智芯宣佈完成A輪融資,融資金額未公佈,該輪融資由前海方舟旗下的智慧互聯產業基金、中原前海基金和齊魯前海基金共同投資,融資資金將用於產品研發和推廣。

雲豹智能同樣在6月完成了B輪融資,據悉本輪雲豹投後估值約90 億元,而本輪投資方包括騰訊、淡馬錫、深創投、華西村股份旗下投資平臺一村資本、民生銀行上市金融控股平臺民銀資本、耀途資本,這是騰訊第3 次投資這家成立不到 2 年的 DPU 公司。

9月,中科馭數宣佈完成超以往輪次融資規模的數億元B輪融資,由金融街資本領投,建設銀行旗下建信股權跟投,老股東靈均投資、光環資本、泉宗資本連續三輪追投。

芯啓源在去年11月完成數億元的Pre-A4 輪融資後,今年3月宣佈再獲超億元戰略投資,本輪融資由國家集成電路產業基金旗下子基金上海超越摩爾領投,老股東允泰資本繼續堅定跟投。

可以看到,在DPU的熱潮下,不少初創企業紛紛拿到鉅額融資。但作爲數據處理的一大將,DPU需要與CPU、GPU同量級的投入,可是市場規模遠不如CPU、GPU。據統計,2021年全球DPU市場規模達到50.7億美元,CPU市場規模則可達532億美元,這其中是10倍的差距。

有業內人士做過一個估算,在終端場景,大芯片的銷量至少需要達到數千萬級別纔能有效攤薄一次性的研發成本;在數據中心場景,則需要50萬甚至100萬以上的銷量,纔能有效攤薄研發成本。

根據海外做 DPU 的初創公司如 Fungible 和 Pensando 等需要的資深開發人員規模、研發時間、需要購買的 IP 和測試工具以及這些公司融到的資金去估算,開發這樣複雜的高端通用的 DPU 芯片大概需要 3 億美元以上的成本,才能實現客戶量產。

這注定了DPU不可能是一個簡單的創業“遊戲”。

DeepTech曾經總結了打造一個成功的 DPU 芯片企業,至少需要兼具的六大條件:一是具備高端芯片開發經驗;二是要有大量商業落地的經驗;三是有成功創業經驗的團隊;四是對雲計算客戶業務非常熟悉;五是與雲計算大廠客戶緊密合作,有豐富的場景實戰經驗;六是必須要鉅額融資。

創始人經歷來看,不少初創公司或缺乏高端芯片開發經驗,或缺乏頭部雲服務商合作的經驗等,是否能走到最後還是一個問號。

雲豹智能創始人蕭啓陽,博士畢業於美國斯坦福大學,後續在硅谷創辦 RMI 公司;中科馭數創始人鄢貴海是中科院背景;芯啓源,創始人盧笙有銷售 USB 和 TCAM 芯片的背景;大禹智芯創始人李爽是前美團公有云的負責人,對雲業務有一定的認識,這四家家公司創始人都有相關背景。

雲脈芯聯、星雲智聯等企業的創始人在公開資料中,並沒有開發高端芯片和創業的經驗。雲脈芯聯創始人劉永鋒是技術出身,曾在阿里和華爲工作過,在公開信息沒有查到其創始人有開發高端芯片和創業的經驗;星雲智聯,兩位創始人是夏廬生和於勇。夏廬生曾擔任安信證券研究中心通信行業首席分析師,公開信息查不到於勇在芯片行業的背景。

即使強如英偉達,其DPU發佈兩年左右,使用的人數也尚且不多,更何況是本就在芯片方面發展相對欠缺的中國芯片初創企業。目前能夠拿出成績的僅有中科馭數、雲豹智能兩家企業。

成立僅一年後,中科馭數第一顆芯片就已成功完成流片,並取得了業界數據庫與時序數據處理融合加速芯片零的突破。中科馭數的第三代DPU芯片的研發迭代也已經接近尾聲。中科馭數第二代DPU芯片K2已於今年年初投片,預計在10月回片。

雲豹的第一款 DPU SoC(系統級芯片)正在開發階段,計劃於明年量產。去年底雲豹已發佈基於 FPGA 版本的 DPU 雲霄。

與 CPU、GPU 等一樣,DPU 結構複雜、開發週期長、投入大。起步於2020 年和 2021 年的中國DPU初創企業,算上前期團隊組建時間,開發週期也僅在 1 年左右,何時能出現量產的產品是市場都在期待的。

實際上,梳理中國DPU行業商業模式後,能將其分爲兩種。

一種是以芯啓源爲代表的,通過自研中高級軟件、外購處理器和網絡芯片的方式,這類方式門檻適中,DPU產線核心研發團隊需至少10人,預判在5至8年收回前期成本。

另一種是以中科馭數和雲豹爲代表的,自研處理器微架構和中高級軟件,外購網絡芯片的方式,這類方式門檻較高,DPU產線核心研發團隊需具備至少40人。

DPU沒有統一的標準、需要與雲計算基礎設施緊密綁定、產品的通用性問題、沒有明確的大客戶,這些都是DPU創業會遇到的問題。

目前要解決DPU標準化應用,還存在一定挑戰。由於數據中心本身的複雜性,各大廠商一方面採用商用現貨組件(即COTS)來構建系統,追求低成本,一方面又設法分層服務化,打造面向不用類型客戶的標準化產品,但除此之外的所有技術實現幾乎都是“八仙過海,各顯神通。”

中科馭數創始人鄢貴海也表示:“有的廠商強化IO能力、有的關注路由轉發、有的重視存儲卸載、有的關注安全加密,不一而足。”而上層負載不同,也必然對底層架構有各異的需求,這也許是目前DPU標準化面臨的最大挑戰。

責任編輯:劉萬里 SF014

相關文章