隨着機器學習、深度學習等AI技術日益廣泛的應用,圖片、視頻、語音等非結構化數據的挖掘、識別、處理等,都對高效率、低延遲的實時計算提出了更高的要求。“異構計算”的作用日益凸顯。

根據阿里雲官方消息,1月21日,阿里雲發佈異構計算解決方案,包括彈性GPU實力和FPGA解決方案,適合人工智能領域的應用。

其中,彈性GPU方案,適合視頻、渲染和人工智能應用等場景,自2016年底開放邀測,可以提供2048到8192個並行處理核心,搭配32GB的DDR5顯存,最高提供15.08TFOPS單精度和1TFLOPS雙精度浮點性能,並支持多種開放的渲染與計算加速協議和軟件框架。同時配備了實例存儲功能,可以獲得與SSD雲盤相比十數倍性能提升的前提下,讀寫延遲可穩定在200us左右。官方同時表示,該產品支持包月、包年的預付費支付模式,同時也支持按小時付費的使用模型。根據阿里雲提供的資料,2016年下半年,Zerolight基於雲計算技術開發了實時汽車三維展示軟件,軟件性能提升15~20%。

FPGA解決方案方面,阿里雲採用了多家FPGA方案。官方表示,以 Arria 10 FPGA爲例,可以做到單位能耗計算能力達 45 GFLOPS/W,深度學習每瓦性能是 Intel E5-2699 v3 CPU 的 4 倍。在語音識別的業務應用方面,單塊 FPGA 的方案可以做到 64 個 2.5Ghz broadwell CPU 物理核的性能,但延遲只有 CPU 的一半。智能安防廠商瑞爲技術就是其客戶之一,官方稱單臺FPGA服務器一秒就能實現3000萬次人臉比對,將IPC的接入能力提升5倍以上,且服務端建設費用大幅下降。

自智能移動終端興起以來,包括嵌入式電子產品在內,都面臨高性能與低功耗之間的矛盾。除了在二者之間找平衡,也使得異構計算成爲新的趨勢,讓每一個任務匹配更合適的功能單元,降低晶體管的浪費,提升整體效率。而到了人工智能時代,不管是模型訓練還是模型應用的過程中,都對算力有了更高的要求,GPU的作用凸顯,FPGA也開始日益受到重視。阿里雲這次發佈的異構計算解決方案,也是選了這兩個方向。

兩個方案之中,FPGA的解決方案或許更值得關注。2016 年, Ignite 大會上,微軟 CEO Satya Nadella 就與Catapult 項目的老大 Doug Burger 一起做了 FPGA 加速機器翻譯的演示,當時的演示效果是每秒 1 Exa-op (10^18) 的機器翻譯運算能力。而在此前,微軟已經開始使用FPGA加速Bing 搜索、 Azure雲計算了。

而在實際的應用端,已經搶下公有云雲計算市場半壁江山的AWS也於2016年發佈了相關的產品,名爲F1,採用的是FPGA + PCIe Fabric + SSD結合的高計算方案。當時,F1提供了不同價位的加速卡,最多的套件包含8個FPGA芯片(16nm Xilinx UltraScale Plus FPGA),其中每個FPGA有250萬個邏輯單元和6800個DSP引擎,套件包括有ECC保護的64GiB DDR4內存和PCIe X16接口,同時爲了方便使用,還會免費提供FPGA開發環境AMI及硬件開發包HDK,開發者可以按小時付費,無限次燒寫。

雲+AI正成爲趨勢,這套FPGA方案的推出,對於對算力要求高的AI行業來說,可以節省不少開發的時間與費用。對於那些本來數據就在雲端的AI應用開發者來說,更是如此。

本文圖片來自:Yestone 邑石網正版圖庫

相關文章