作者丨邱曉芬

編輯丨蘇建勳

美國當地時間4月9日,英特爾舉辦了面向客戶和合作夥伴的英特爾on產業創新大會。毫無預兆,這場大會上,英特爾首次介紹了他們的GPU產品Gaudi 3,向英偉達發起衝擊。

儘管英偉達不久前的GTC大會上已經發布了他們最強的 Blackwell GPU,不過英特爾Gaudi 3主要還是瞄準了英偉達的主力產品H100。 英特爾Gaudi 3將帶來4倍的BF16 AI計算能力提升,以及1.5倍的內存帶寬提升。

英特爾副總裁Das Kamhout介紹,若應用在70億、130億參數Llama2模型,以及1750億參數GPT-3模型上,採用英特爾Gaudi 3時的模型訓練時間,相比於英偉達H100將縮短50%,同時推理吞吐量提高50%。

在GPU中,網絡連接也是一項關鍵重點。在英特爾Gaudi 3中,英特爾採用的是以太網網絡,允許企業靈活地從單個節點擴展到擁有數千個節點的集羣、超級集羣和超大集羣,支持大規模的推理、微調和訓練。

英特爾方面稱,英特爾Gaudi 3將於2024年第二季度面向OEM廠商出貨,名單包括戴爾、HPE、聯想和Supermicro。

不僅僅是 GPU產品的進展,英特爾此次還發布了另外一款宣佈面向數據中心、雲和邊緣的英特爾至強6處理器,具體包括兩款新產品。

其中,配備能效核的英特爾至強6處理器(代號爲Sierra Forest),與第二代英特爾至強處理器相比,每瓦性能提高2.4倍,機架密度提高2.7倍,將於2024年第二季度推出。

配備性能核的英特爾至強6處理器(代號爲Granite Rapids),與使用FP16的第四代英特爾至強處理器相比,可將token的延遲時間最多縮短6.5倍,能夠運行700億參數的Llama-2模型。

根據cnvrg.io的調研結果,2023年只有10%的企業成功將其生成式AI項目產品化。爲了改變現狀,英特爾還在打造他們的 AI生態。

此次發佈會上,英特爾還宣佈和多家企業合作, 爲企業AI創建一個開放平臺。在這一平臺上,通過檢索增強生成(RAG),讓企業用戶能夠通過開放的 LLM功能,更容易部署生成式AI。

另外,英特爾此次還更新了不少端側產品的更新節奏——

英特爾宣佈將於2024年推出的下一代英特爾酷睿Ultra客戶端處理器家族(代號Lunar Lake),處理器將具備超過100 TOPS平臺算力,在神經網絡處理單元(NPU)上也將帶來超過46 TOPS的算力,從而爲下一代AI PC提供強大支持。

另外,英特爾也發佈了涵蓋英特爾酷睿Ultra、英特爾凌動處理器和英特爾銳顯卡系列產品在內的全新邊緣芯片。這些產品主要面向零售、工業製造和醫療等關鍵領域,所有新品將於本季度上市。

英特爾公司首席執行官帕特·基辛格表示,“從PC到數據中心再到邊緣,英特爾正在讓AI走進千行百業。英特爾最新的Gaudi、至強和酷睿平臺將提供靈活的、可定製化的解決方案,滿足客戶和合作夥伴不斷變化的需求,把握住未來的巨大機遇。”

“我們即將再次改變世界”——這是帕特·基辛格在發佈會上留下的最後一句話。

相關文章