re:Invent 2018：Amazon首次展示Inferentia定製機器學習預測芯片

至頂網軟件頻道消息：今天AWS推出了一款專爲機器學習設計的新處理器芯片，這也是Amazon在雲計算領域雄心勃勃的另一個標誌。

這款名爲Inferentia的芯片將通過AWS EC2計算服務、SageMaker AI服務和（今天公佈的新服務）Amazon Elastic Inference提供，旨在加速由機器學習模型執行的推理或預測過程，爲Amazon Alexa和自動駕駛汽車等服務提供動力。

Inferentia芯片是由Amazon幾年前成立的芯片設計公司Annapurna Labs設計，據稱它與GPU（主要來自於Nvidia公司，一直是機器學習的首選芯片）相比具有低延遲和低成本等優點。

預計Inferentia芯片將於明年上市。AWS首席執行官Andy Jassy在今天上午的re:Invent大會主題演講中簡要介紹了Inferentia芯片，但他給出的設計或者規格細節很少，只是說Inferentia芯片支持多種數據類型和所有主流框架，如PyTorch和TensorFlow和MXNet。此外它還將提供數百的TOPS性能，聚合起來可以實現上千的TOPS性能。

Inferentia芯片是本週以來AWS宣佈推出第二款芯片。週一晚上，AWS宣佈推出名爲Graviton的處理器，該處理器可通過AWS EC2雲計算服務提供給雲客戶。Graviton是基於智能手機、網絡路由器和各種其他設備中使用的Arm架構，並將逐漸用於計算機服務器中，例如AWS設計用於海量數據中心的計算機服務器。

Moor Insights＆Strategy總裁兼首席分析師Patrick Moorhead表示：“AWS宣佈將自開自己的支持多種框架的機器學習推理芯片是一個重大的消息。與Google Cloud不同，這項AWS服務將廣泛應用並具有彈性。目前AWS針對推理提供CPU、GPU、FPGA、以及現在自己的ASIC。”

在過去幾年中我們看到，市場中出現了大量新芯片用於特定應用的優化，特別是機器學習和人工智能。例如，Google提供對自定義Tensor處理單元芯片的雲訪問。芯片設計興起的一個原因是，所謂的超大規模數據中心企業需要對他們的硬件進行儘可能多的效率優化。

所有這些都讓數據中心領導者英特爾處於了守勢。英特爾收購了Altera和Movidius等多家公司，爲其核心X86產品線增加了新的芯片設計和專業技術。此外英特爾還調整了X86芯片（如目前的至強產品線），以更好地應對機器學習和其他任務。

Amazon還發布了Elastic Inference，這是一項由GPU提供支持的深度學習推理加速服務。Jassy表示，這項服務僅根據需要提供儘可能多的AWS計算實例，可以節省高達75％的推理成本。

此外，AWS推出了一系列與人工智能相關的服務和產品，包括自主模型汽車Deep Racer，開發者可用來研究強化學習，預訂價爲249美元。

查看原文 >>