文 | 呂棟

日前,市場上傳出消息,在今年7月舉行的華爲雲開發者大會上,華爲將發佈一款直接對標ChatGPT的多模態千億級大模型產品,名爲“盤古Chat”,產品主要面向To B/G政企端客戶。

6月5日,一位華爲雲高層人士就這一消息獨家回覆觀察者網稱:“假的”。

今年以來,在國內這輪AI大模型競賽中,百度、阿里、商湯、科大訊飛等已相繼推出“類ChatGPT”產品,並不斷將AI概念引向高潮,而華爲到目前爲止,尚未推出ChatGPT這種AI聊天機器人產品。

但從歷史資料來看,華爲其實很早就已開始佈局AI大模型。

今年4月,國金證券發佈的研報顯示,華爲盤古大模型從2020年啓動研發,2021年4月正式發佈,到2022年聚焦行業應用落地,其進化路徑可分爲L0-L1-L2三個階段,上層是在下層的基礎上演化而來。L0是指基礎大模型,包括NLP(中文語言)大模型、CV(視覺)大模型、多模態大模型、科學計算大模型以及Graph(圖網絡)大模型。

同樣在4月,華爲雲AI領域首席科學家田奇透露,過去幾年,華爲主要聚焦打造“盤古”系列的預訓練大模型。大模型誕生分兩個階段:第一是預訓練階段,由海量數據來運行鏈路的通用底座基礎模型;第二是針對下游的千行百業的具體的任務,基於行業數據進行微調,同時華爲也佈局了第三步,即大模型迭代。

根據華爲披露的信息,從發展關鍵節點來看,華爲於2021年4月發佈了盤古NLP大模型、盤古視覺大模型、盤古科學計算大模型;2021年9月,推出用於藥物研發細分場景的大模型;2022年,與能源集團合作發佈了盤古礦山大模型、盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型。

田奇透露,過去的2022年,華爲盤古大模型主要是AI for Industry(AI賦能產業),希望爲煤礦、水泥、電力、金融、農業等行業創造更多產業價值,目前已有多個案例。例如,盤古CV大模型目前覆蓋工業質檢、物流倉庫監控、時尚輔助設計等行業;盤古NLP大模型覆蓋智能文檔檢索、智能ERP、小語種大模型等領域,去年交付一個阿拉伯語千億參數大模型;盤古科學計算大模型也用在了氣象預報、海浪預測等方向。

一些市場分析稱,與其他廠商相比,華爲的優勢或在於擁有完整的產業鏈和較強的算力調配能力。浙商證券研報顯示,在訓練千億參數的盤古大模型時,華爲團隊調用了超過2000塊昇騰910芯片,進行了超2個月的數據訓練能力。還有傳言稱,華爲每年大模型訓練調用GPU/TPU卡超過4000片,3年的大模型算力成本高達9.6億元人民幣。

與此同時,華爲也在大模型商標領域持續佈局。企查查信息顯示,華爲技術有限公司於2023年4月19日申請註冊兩枚“HUAWEI NETGPT”商標,國際分類爲科學儀器、網站服務,當前商標狀態爲申請中。商標結構均爲純英文。同時商標申請進度顯示,華爲已成功註冊多枚“盤古”“PANGU”商標。其中華爲早在2019年就已經申請“PANGU”商標,該商標於2021年註冊成功。

相關文章