英特尔发布Gaudi 3：对标英伟达H100，预计Q2向OEM厂商出货丨最前线

作者丨邱晓芬

编辑丨苏建勋

美国当地时间4月9日，英特尔举办了面向客户和合作伙伴的英特尔on产业创新大会。毫无预兆，这场大会上，英特尔首次介绍了他们的GPU产品Gaudi 3，向英伟达发起冲击。

尽管英伟达不久前的GTC大会上已经发布了他们最强的 Blackwell GPU，不过英特尔Gaudi 3主要还是瞄准了英伟达的主力产品H100。英特尔Gaudi 3将带来4倍的BF16 AI计算能力提升，以及1.5倍的内存带宽提升。

英特尔副总裁Das Kamhout介绍，若应用在70亿、130亿参数Llama2模型，以及1750亿参数GPT-3模型上，采用英特尔Gaudi 3时的模型训练时间，相比于英伟达H100将缩短50%，同时推理吞吐量提高50%。

在GPU中，网络连接也是一项关键重点。在英特尔Gaudi 3中，英特尔采用的是以太网网络，允许企业灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群，支持大规模的推理、微调和训练。

英特尔方面称，英特尔Gaudi 3将于2024年第二季度面向OEM厂商出货，名单包括戴尔、HPE、联想和Supermicro。

不仅仅是 GPU产品的进展，英特尔此次还发布了另外一款宣布面向数据中心、云和边缘的英特尔至强6处理器，具体包括两款新产品。

其中，配备能效核的英特尔至强6处理器（代号为Sierra Forest），与第二代英特尔至强处理器相比，每瓦性能提高2.4倍，机架密度提高2.7倍，将于2024年第二季度推出。

配备性能核的英特尔至强6处理器（代号为Granite Rapids），与使用FP16的第四代英特尔至强处理器相比，可将token的延迟时间最多缩短6.5倍，能够运行700亿参数的Llama-2模型。

根据cnvrg.io的调研结果，2023年只有10%的企业成功将其生成式AI项目产品化。为了改变现状，英特尔还在打造他们的 AI生态。

此次发布会上，英特尔还宣布和多家企业合作，为企业AI创建一个开放平台。在这一平台上，通过检索增强生成（RAG），让企业用户能够通过开放的 LLM功能，更容易部署生成式AI。

另外，英特尔此次还更新了不少端侧产品的更新节奏——

英特尔宣布将于2024年推出的下一代英特尔酷睿Ultra客户端处理器家族（代号Lunar Lake），处理器将具备超过100 TOPS平台算力，在神经网络处理单元（NPU）上也将带来超过46 TOPS的算力，从而为下一代AI PC提供强大支持。

另外，英特尔也发布了涵盖英特尔酷睿Ultra、英特尔凌动处理器和英特尔锐显卡系列产品在内的全新边缘芯片。这些产品主要面向零售、工业制造和医疗等关键领域，所有新品将于本季度上市。

英特尔公司首席执行官帕特·基辛格表示，“从PC到数据中心再到边缘，英特尔正在让AI走进千行百业。英特尔最新的Gaudi、至强和酷睿平台将提供灵活的、可定制化的解决方案，满足客户和合作伙伴不断变化的需求，把握住未来的巨大机遇。”

“我们即将再次改变世界”——这是帕特·基辛格在发布会上留下的最后一句话。

氪星晚报｜小红书内测自研大模型“小地瓜”；苹果iPad操作系统据悉受到欧盟数字市场法案约束；美的集团股份有限公司向港交所提交上市申请书