英特爾發佈Gaudi 3：對標英偉達H100，預計Q2向OEM廠商出貨丨最前線

作者丨邱曉芬

編輯丨蘇建勳

美國當地時間4月9日，英特爾舉辦了面向客戶和合作夥伴的英特爾on產業創新大會。毫無預兆，這場大會上，英特爾首次介紹了他們的GPU產品Gaudi 3，向英偉達發起衝擊。

儘管英偉達不久前的GTC大會上已經發布了他們最強的 Blackwell GPU，不過英特爾Gaudi 3主要還是瞄準了英偉達的主力產品H100。英特爾Gaudi 3將帶來4倍的BF16 AI計算能力提升，以及1.5倍的內存帶寬提升。

英特爾副總裁Das Kamhout介紹，若應用在70億、130億參數Llama2模型，以及1750億參數GPT-3模型上，採用英特爾Gaudi 3時的模型訓練時間，相比於英偉達H100將縮短50%，同時推理吞吐量提高50%。

在GPU中，網絡連接也是一項關鍵重點。在英特爾Gaudi 3中，英特爾採用的是以太網網絡，允許企業靈活地從單個節點擴展到擁有數千個節點的集羣、超級集羣和超大集羣，支持大規模的推理、微調和訓練。

英特爾方面稱，英特爾Gaudi 3將於2024年第二季度面向OEM廠商出貨，名單包括戴爾、HPE、聯想和Supermicro。

不僅僅是 GPU產品的進展，英特爾此次還發布了另外一款宣佈面向數據中心、雲和邊緣的英特爾至強6處理器，具體包括兩款新產品。

其中，配備能效核的英特爾至強6處理器（代號爲Sierra Forest），與第二代英特爾至強處理器相比，每瓦性能提高2.4倍，機架密度提高2.7倍，將於2024年第二季度推出。

配備性能核的英特爾至強6處理器（代號爲Granite Rapids），與使用FP16的第四代英特爾至強處理器相比，可將token的延遲時間最多縮短6.5倍，能夠運行700億參數的Llama-2模型。

根據cnvrg.io的調研結果，2023年只有10%的企業成功將其生成式AI項目產品化。爲了改變現狀，英特爾還在打造他們的 AI生態。

此次發佈會上，英特爾還宣佈和多家企業合作，爲企業AI創建一個開放平臺。在這一平臺上，通過檢索增強生成（RAG），讓企業用戶能夠通過開放的 LLM功能，更容易部署生成式AI。

另外，英特爾此次還更新了不少端側產品的更新節奏——

英特爾宣佈將於2024年推出的下一代英特爾酷睿Ultra客戶端處理器家族（代號Lunar Lake），處理器將具備超過100 TOPS平臺算力，在神經網絡處理單元（NPU）上也將帶來超過46 TOPS的算力，從而爲下一代AI PC提供強大支持。

另外，英特爾也發佈了涵蓋英特爾酷睿Ultra、英特爾凌動處理器和英特爾銳顯卡系列產品在內的全新邊緣芯片。這些產品主要面向零售、工業製造和醫療等關鍵領域，所有新品將於本季度上市。

英特爾公司首席執行官帕特·基辛格表示，“從PC到數據中心再到邊緣，英特爾正在讓AI走進千行百業。英特爾最新的Gaudi、至強和酷睿平臺將提供靈活的、可定製化的解決方案，滿足客戶和合作夥伴不斷變化的需求，把握住未來的巨大機遇。”

“我們即將再次改變世界”——這是帕特·基辛格在發佈會上留下的最後一句話。

AI重構一週年，百度想做好這三件事