算力“比肩”國際大廠的國產通用GPU芯片長啥樣？WAIC現場見真身

在本次WAIC展區現場，國產AI芯片成爲明星，芯片作爲AI計算的算力基礎，大量芯片企業展出了實際產品。

此次壁仞科技面向公衆首次展出了兩顆芯片：BR100和BR104。壁仞在宣傳中提到“創下全球（通用GPU芯片的）算力記錄”“單芯片算力達到PFLOPS（每秒千萬億次計算）級別”“峯值算力是國際廠商在售旗艦產品3倍以上”。

據介紹，壁仞科技於2019年在上海成立，由商湯科技原總裁張文創立，主要研發通用GPU芯片產品。

現場展示的BR100芯片，官方介紹，16位浮點算力達到1000T以上、8位定點算力達到2000T以上，單芯片峯值算力達到PFLOPS級別，達到國際廠商在售旗艦產品3倍以上，創下國內互連帶寬紀錄。

在技術規格上，BR100芯片在國內率先採用Chiplet技術，新一代主機接口PCIe 5.0，支持CXL互連協議，具有高算力、高通用性、高能效三大優勢。

由於Chiplet技術通過縮小單個計算芯粒的面積，可以同時提升產能與良率，進而降低硅片成本，支持更靈活的產品策略。

工作人員稱，Chiplet設計讓壁仞可以通過一次流片，同時得到兩種芯片，大大加快了迭代速度，同時覆蓋不同層級的市場。比如，BR104擁有一個計算芯粒，BR100則將兩個計算芯粒用Chiplet（小芯片）技術封裝在一起，以達到BR104兩倍的算力，這兩者的區別主要在於BR100是兩片相同的chiplet封裝到一起。

基於芯片，壁仞還展出了具體的硬件產品。包括基於BR100的壁礪100和BR104的壁礪104，這兩款產品分別以OAM（OCP Accelerator Module，OCP加速器模組）與PCIe板卡的形態存在，功耗分別對應550W和300W。

如此高的功耗，現場工作人員稱，壁仞對產品做出了特別設計：板卡上採用快速均溫技術，增加了熱腔體積和撞風面積，有效提升了散熱效率。而對於OAM，特殊的散熱設計也由於特殊設計，也保證了散熱效率。

值得一提的是，壁仞還展示了OAM服務器海玄，實現8張計算卡互聯，理論峯值算力（BF16）達到8 PFLOPS；512GB HBM2e內存；支持PCIe 5.0和CXL；1.8TB/s對分互連帶寬；最大功耗7kW。

不過，在芯片、模組、服務器外，壁仞並未展出相關落地應用。現場工作人員解釋，目前芯片產品已經公佈，要到量產出貨後，才能由合作伙伴開發最終落地應用。目前除芯片外，還需要進一步在軟件生態、開發環境上作出努力，比如壁仞目前有一支團隊響應開發者需求，加速芯片初期應用、AI模型的適配和優化。