作者丨邱晓芬

编辑丨苏建勋

美国当地时间4月9日,英特尔举办了面向客户和合作伙伴的英特尔on产业创新大会。毫无预兆,这场大会上,英特尔首次介绍了他们的GPU产品Gaudi 3,向英伟达发起冲击。

尽管英伟达不久前的GTC大会上已经发布了他们最强的 Blackwell GPU,不过英特尔Gaudi 3主要还是瞄准了英伟达的主力产品H100。 英特尔Gaudi 3将带来4倍的BF16 AI计算能力提升,以及1.5倍的内存带宽提升。

英特尔副总裁Das Kamhout介绍,若应用在70亿、130亿参数Llama2模型,以及1750亿参数GPT-3模型上,采用英特尔Gaudi 3时的模型训练时间,相比于英伟达H100将缩短50%,同时推理吞吐量提高50%。

在GPU中,网络连接也是一项关键重点。在英特尔Gaudi 3中,英特尔采用的是以太网网络,允许企业灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模的推理、微调和训练。

英特尔方面称,英特尔Gaudi 3将于2024年第二季度面向OEM厂商出货,名单包括戴尔、HPE、联想和Supermicro。

不仅仅是 GPU产品的进展,英特尔此次还发布了另外一款宣布面向数据中心、云和边缘的英特尔至强6处理器,具体包括两款新产品。

其中,配备能效核的英特尔至强6处理器(代号为Sierra Forest),与第二代英特尔至强处理器相比,每瓦性能提高2.4倍,机架密度提高2.7倍,将于2024年第二季度推出。

配备性能核的英特尔至强6处理器(代号为Granite Rapids),与使用FP16的第四代英特尔至强处理器相比,可将token的延迟时间最多缩短6.5倍,能够运行700亿参数的Llama-2模型。

根据cnvrg.io的调研结果,2023年只有10%的企业成功将其生成式AI项目产品化。为了改变现状,英特尔还在打造他们的 AI生态。

此次发布会上,英特尔还宣布和多家企业合作, 为企业AI创建一个开放平台。在这一平台上,通过检索增强生成(RAG),让企业用户能够通过开放的 LLM功能,更容易部署生成式AI。

另外,英特尔此次还更新了不少端侧产品的更新节奏——

英特尔宣布将于2024年推出的下一代英特尔酷睿Ultra客户端处理器家族(代号Lunar Lake),处理器将具备超过100 TOPS平台算力,在神经网络处理单元(NPU)上也将带来超过46 TOPS的算力,从而为下一代AI PC提供强大支持。

另外,英特尔也发布了涵盖英特尔酷睿Ultra、英特尔凌动处理器和英特尔锐显卡系列产品在内的全新边缘芯片。这些产品主要面向零售、工业制造和医疗等关键领域,所有新品将于本季度上市。

英特尔公司首席执行官帕特·基辛格表示,“从PC到数据中心再到边缘,英特尔正在让AI走进千行百业。英特尔最新的Gaudi、至强和酷睿平台将提供灵活的、可定制化的解决方案,满足客户和合作伙伴不断变化的需求,把握住未来的巨大机遇。”

“我们即将再次改变世界”——这是帕特·基辛格在发布会上留下的最后一句话。

相关文章