美國當地時間11月28日,亞馬遜雲科技(AWS)在拉斯維加斯的re:Invent大會上發佈了兩款自研芯片Graviton4和Trainium2,並推出企業級AI聊天機器人“Amazon Q”(下稱“Q”)搶佔AI硬件市場。

生成式AI熱潮下,儘管雲計算廠商對自研AI芯片熱情高漲,但英偉達GPU目前仍是企業進行AI訓練及推理的算力首選。

當天,英偉達創始人兼CEO黃仁勳也穿着標誌性的皮衣現身大會現場,與亞馬遜雲科技CEO Adam Selipsky一起宣佈擴大戰略合作。雙方將聯合推出先進的基礎設施、軟件及服務,包括亞馬遜雲科技將支持英偉達最新推出的H200 GPU,託管英偉達的人工智能訓練即服務(AI-training-as-a-service)平臺DGX Cloud。此外,雙方正設計世界上最快GPU驅動的雲AI超級計算機,配置16384顆NVIDIA GH200超級芯片,以及構建更多基於英偉達芯片的雲實例等,提高生成式AI、HPC高性能計算性能。

作爲此次大會的重頭戲,Graviton4和Trainium2分別瞄準數據中心通用計算和人工智能訓練場景。亞馬遜雲科技稱,基於Arm架構的服務器芯片Graviton4與前一代Graviton3處理器相比,性能提升30%,獨立核心增加50%以上,內存帶寬提升至少75%。

而Trainium2則是面向AI大模型的高性能訓練芯片,與第一代Trainium芯片相比,Trainium2訓練速度提升至4倍,能夠部署在多達10萬個芯片的計算集羣中,大幅降低了模型訓練時間,同時能效提升多達2倍。

據界面新聞了解,目前最先進的大模型通常包含數千億甚至數萬億個參數或變量,這爲芯片的計算能力帶來了諸多挑戰,既要保證高性能、安全可靠,也要低成本。Tranium2主要強調的也是低成本、高能效和更快的訓練能力。

Tranium2已有了早期客戶,數據分析平臺公司Databricks以及由亞馬遜支持的OpenAI競爭對手Anthropic都計劃使用Trainium2芯片訓練大模型。

除自研定製芯片外,亞馬遜雲科技還推出首個基於生成式AI開發的應用——辦公助手“Q”,可通過聊天方式實現輔助雲端開發、服務響應、企業數據查詢等功能。

Q並非面向消費市場,而是圍繞企業需求設計,其定位類似於一個專家助理。但Adam Selipsky特別強調,Q不會使用企業客戶數據來訓練其底層模型,Q的生成結果也不會跨越不同數據權限間的防火牆。Q可以設置爲僅對安全團隊的相關安全問題進行響應,非公司內部或與業務無關者,無法獲得安全問題答案。

事實上,在提及亞馬遜雲科技此前推出的Bedrock AI基礎模型服務時,Adam Selipsky也重點強調了安全與隱私問題。他還“不點名”地提到了最大競爭對手微軟。

“你不會希望看到雲供應商受制於一家模型提供商,而是需要一個真正的選擇……過去10天發生的事件已經非常清楚地表明瞭這一點。” Adam Selipsky說。他口中的“事件”指的是OpenAI剛剛經歷的一場戲劇性的人事動盪。

re:Invent至今已舉辦了12年,雲市場的競爭環境也增加了很多變量——儘管亞馬遜雲科技在公有云領域保持着領先優勢,但競爭對手微軟Azure憑藉與OpenAI的深度合作關係,正不斷擴大市場份額。

據市場調查機構Canalys公佈的最新報告,亞馬遜雲科技今年第二季度佔全球雲基礎設施服務(IaaS)支出爲30%,同比增長12%。與去年同期相比,亞馬遜雲科技收入增長已減少一半以上,這也促使該公司加大對人工智能領域投資,以尋找更多增長動力。同期,微軟Azure同比增長了26%,佔據26%市場份額,增長率高於亞馬遜雲服務。而AI熱潮很可能將進一步促進市場加大對微軟雲計算業務的支出,因爲Azure承載着OpenAI和Meta等公司的AI計算需求。

相關文章