在本次WAIC展區現場,國產AI芯片成爲明星,芯片作爲AI計算的算力基礎,大量芯片企業展出了實際產品。

此次壁仞科技面向公衆首次展出了兩顆芯片:BR100和BR104。壁仞在宣傳中提到“創下全球(通用GPU芯片的)算力記錄”“單芯片算力達到PFLOPS(每秒千萬億次計算)級別”“峯值算力是國際廠商在售旗艦產品3倍以上”。

據介紹,壁仞科技於2019年在上海成立,由商湯科技原總裁張文創立,主要研發通用GPU芯片產品。

現場展示的BR100芯片,官方介紹,16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單芯片峯值算力達到PFLOPS級別,達到國際廠商在售旗艦產品3倍以上,創下國內互連帶寬紀錄。

在技術規格上,BR100芯片在國內率先採用Chiplet技術,新一代主機接口PCIe 5.0,支持CXL互連協議,具有高算力、高通用性、高能效三大優勢。

由於Chiplet技術通過縮小單個計算芯粒的面積,可以同時提升產能與良率,進而降低硅片成本,支持更靈活的產品策略。

工作人員稱,Chiplet設計讓壁仞可以通過一次流片,同時得到兩種芯片,大大加快了迭代速度,同時覆蓋不同層級的市場。比如,BR104擁有一個計算芯粒,BR100則將兩個計算芯粒用Chiplet(小芯片)技術封裝在一起,以達到BR104兩倍的算力,這兩者的區別主要在於BR100是兩片相同的chiplet封裝到一起。

基於芯片,壁仞還展出了具體的硬件產品。包括基於BR100的壁礪100和BR104的壁礪104,這兩款產品分別以OAM(OCP Accelerator Module,OCP加速器模組)與PCIe板卡的形態存在,功耗分別對應550W和300W。

如此高的功耗,現場工作人員稱,壁仞對產品做出了特別設計:板卡上採用快速均溫技術,增加了熱腔體積和撞風面積,有效提升了散熱效率。而對於OAM,特殊的散熱設計也由於特殊設計,也保證了散熱效率。

值得一提的是,壁仞還展示了OAM服務器海玄,實現8張計算卡互聯,理論峯值算力(BF16)達到8 PFLOPS;512GB HBM2e內存;支持PCIe 5.0和CXL;1.8TB/s對分互連帶寬;最大功耗7kW。

不過,在芯片、模組、服務器外,壁仞並未展出相關落地應用。現場工作人員解釋,目前芯片產品已經公佈,要到量產出貨後,才能由合作伙伴開發最終落地應用。目前除芯片外,還需要進一步在軟件生態、開發環境上作出努力,比如壁仞目前有一支團隊響應開發者需求,加速芯片初期應用、AI模型的適配和優化。

相關文章