AWS之後，阿里雲發佈適用於AI的異構計算解決方案， FPGA會成爲雲計算標配嗎？

隨着機器學習、深度學習等AI技術日益廣泛的應用，圖片、視頻、語音等非結構化數據的挖掘、識別、處理等，都對高效率、低延遲的實時計算提出了更高的要求。“異構計算”的作用日益凸顯。

根據阿里雲官方消息，1月21日，阿里雲發佈異構計算解決方案，包括彈性GPU實力和FPGA解決方案，適合人工智能領域的應用。

其中，彈性GPU方案，適合視頻、渲染和人工智能應用等場景，自2016年底開放邀測，可以提供2048到8192個並行處理核心，搭配32GB的DDR5顯存，最高提供15.08TFOPS單精度和1TFLOPS雙精度浮點性能，並支持多種開放的渲染與計算加速協議和軟件框架。同時配備了實例存儲功能，可以獲得與SSD雲盤相比十數倍性能提升的前提下，讀寫延遲可穩定在200us左右。官方同時表示，該產品支持包月、包年的預付費支付模式，同時也支持按小時付費的使用模型。根據阿里雲提供的資料，2016年下半年，Zerolight基於雲計算技術開發了實時汽車三維展示軟件，軟件性能提升15~20%。

FPGA解決方案方面，阿里雲採用了多家FPGA方案。官方表示，以 Arria 10 FPGA爲例，可以做到單位能耗計算能力達 45 GFLOPS/W，深度學習每瓦性能是 Intel E5-2699 v3 CPU 的 4 倍。在語音識別的業務應用方面，單塊 FPGA 的方案可以做到 64 個 2.5Ghz broadwell CPU 物理核的性能，但延遲只有 CPU 的一半。智能安防廠商瑞爲技術就是其客戶之一，官方稱單臺FPGA服務器一秒就能實現3000萬次人臉比對，將IPC的接入能力提升5倍以上，且服務端建設費用大幅下降。

自智能移動終端興起以來，包括嵌入式電子產品在內，都面臨高性能與低功耗之間的矛盾。除了在二者之間找平衡，也使得異構計算成爲新的趨勢，讓每一個任務匹配更合適的功能單元，降低晶體管的浪費，提升整體效率。而到了人工智能時代，不管是模型訓練還是模型應用的過程中，都對算力有了更高的要求，GPU的作用凸顯，FPGA也開始日益受到重視。阿里雲這次發佈的異構計算解決方案，也是選了這兩個方向。

兩個方案之中，FPGA的解決方案或許更值得關注。2016 年， Ignite 大會上，微軟 CEO Satya Nadella 就與Catapult 項目的老大 Doug Burger 一起做了 FPGA 加速機器翻譯的演示，當時的演示效果是每秒 1 Exa-op (10^18) 的機器翻譯運算能力。而在此前，微軟已經開始使用FPGA加速Bing 搜索、 Azure雲計算了。

而在實際的應用端，已經搶下公有云雲計算市場半壁江山的AWS也於2016年發佈了相關的產品，名爲F1，採用的是FPGA + PCIe Fabric + SSD結合的高計算方案。當時，F1提供了不同價位的加速卡，最多的套件包含8個FPGA芯片（16nm Xilinx UltraScale Plus FPGA），其中每個FPGA有250萬個邏輯單元和6800個DSP引擎，套件包括有ECC保護的64GiB DDR4內存和PCIe X16接口，同時爲了方便使用，還會免費提供FPGA開發環境AMI及硬件開發包HDK，開發者可以按小時付費，無限次燒寫。

雲+AI正成爲趨勢，這套FPGA方案的推出，對於對算力要求高的AI行業來說，可以節省不少開發的時間與費用。對於那些本來數據就在雲端的AI應用開發者來說，更是如此。

本文圖片來自：Yestone 邑石網正版圖庫