中國航空報訊:近日,在2018德國IFA展會上,華爲消費者BG CEO餘承東以“奇點將至”之名,正式發佈了麒麟980。作爲全球首款量產的7nm手機芯片、雙NPU加持,麒麟980共拿下全球六項第一,相比上一代旗艦——10nm工藝製程的麒麟970,980性能提升約20%,能效提升約40%,邏輯電路密度提升60%,即原來的1.6倍。

衆所周知,傳統芯片遵循摩爾定律,以提升單位面積內晶體管的數量,來提升芯片的性能。工藝提升,於企業而言,芯片的製造成本更低;於用戶而言,芯片體積減小、功耗更少。

而目前芯片製造工藝普遍停留在10nm,7nm工藝則一度被稱爲“最逼近硅基半導體工藝的物理極限”。因而,麒麟980的7nm工藝,則是走在了手機芯片的前沿。

AI方案各家着眼點不同

手機上的終端AI應用於2017年由蘋果及華爲帶起一波浪潮,二者幾乎同時在其主打方案——蘋果A11 Bionic與麒麟970中引入了NPU硬件神經計算網路單元,大幅加速終端與邊緣AI計算落地時程。

同時期的其他方案供應商,多半隻能通過軟件來模擬AI功能,這導致一來計算性能不足,使得AI場景在應用時明顯會感覺到遲滯,無法隨心所欲;二來,AI計算包含了複雜的數學與邏輯計算,需要處理大量的數據,因此缺乏硬件設計的方案在功耗及發熱等層面的表現亦更爲疲弱;最後,如果是以丟回雲端處理再回傳結果的做法,除了遲延性的問題,雲端存儲個人數據所建立的學習模型,又可能牽涉到個人數據隱私疑慮。也因此,諸如蘋果或華爲的本地端AI方案也就成爲手機AI發展主流。

以硬件NPU而言,A11Bionic的神經網絡專用加速模塊比較特殊,目前只用在了Face ID人臉解鎖上,沒有開放給第三方。而華爲的NPU則是支持了標準AI框架,並且對第三方開發者開放,由此所衍生的整體生態效應非常具有想象空間,也可看出華爲極力打造自有AI生態的強烈企圖心。

即將在2018下半年推出的新款手機方案中,硬件AI計算單元基本上已經是必備要件,這主要歸功於蘋果和華爲帶動的潮流效應,而可以預期的是,蘋果與華爲也必定會在此處持續加強,以延續先前的優勢。但聯發科等追隨者也不甘示弱,AI計算單元成爲其主流芯片方案中的標配功能。聯發科將採用與高通同樣的GPU與DSP混合計算,這種設計雖然彈性高,但能耗表現並不漂亮,而高通則傳言未來將全面走向硬件AI計算設計。

手機成爲全能接口:他傻瓜你聰明背後隱藏龐大商機

爲什麼要重視AI在手機上的發展?各家廠商或方案公司之所以爭先恐後要推出相關產品,主要就是因爲手機是作爲日常陪伴用戶時間最長的消費類電子產品,其上捆綁的應用已經成爲用戶黏着性最高的商業接口,不論是遊戲,或者是智能語音服務,其對接的是龐大無比的商機,任何對此趨勢有基本認知的廠商都不會輕易放過這塊市場大餅。

這些所謂的AI功能,其目的之一就是爲了帶給消費者更便利的日常生活,儘量用最少的程序就可以完成最大多數的工作步驟,很多關鍵問題的判斷就是交由AI來處理。換言之,通過AI輔助,麻煩瑣碎的工作都交由手機來代勞,使用者只要動動手,甚至連動手都不用,動口就好。

然而AI並不是先天就什麼都懂,它必須通過訓練才能獲得處理這些工作流程的“知識”,在主流的AI神經網絡框架中,我們可以通過對龐大樣本的觀察與學習,訓練出可解決特定應用問題的模型。而這也是包含華爲在內的各大手機廠商所努力的方向。

即將引入硬件NPU的高通

作爲全球最大的手機方案供應商,高通過去通過Hexagon與GPU、CPU協同工作,達成對主流AI框架的計算加速能力,雖然在效率上還是明顯落後蘋果與華爲的硬件方案,但總是給市場一個交代。

然而,異構計算(Heterogeneous computing)雖然彈性高,且可以有效利用芯片中的不同類型計算架構,但目前AI計算方案講求的是更高的能效表現,而在手機等移動終端上,更顯重要,雖然高通的異構計算已經屬於相當高效的技術,但仍與ASIC有一定的落差,也因此,在使用針對AI加速框架進行性能的評比應用時,高通很明顯要落後採用硬件NPU的競爭對手,未來如果AI模型往更復雜的方向發展,或者是同時需要執行多種AI服務,那麼在發展空間上就可能會明顯不如競爭對手了。

不過,高通也不是不知應變,根據市場傳聞,其在下一代中高端方案驍龍700系列中,將引入硬件NPU設計,而如果成真,其下一代高端方案,也就是驍龍855,也將可能沿用同樣的方式。

而目前高通也引進了包含商湯等多家AI算法設計公司所設計出來的應用框架,想要快速衝刺相關市場,不過高通目前的AI性能還有相當大的改善空間,如果要負載更復雜、多元的AI計算,恐怕還是要等到下一世代的AI設計問世。高通將在12月正式發佈新一代的高端AI手機方案,按照往例,明年初就可以見到實際終端產品。

三星:走出自己的路

三星作爲全球最大的手機廠商,其勢力涵蓋終端、消費、雲端服務、半導體制造與設計等領域,而其中,手機市場是其最重視的一塊,而爲了推動其手機市場的佈局,三星過去亦步亦趨的追隨包含蘋果與高通的步伐,並將學習到的設計精髓轉化爲自有的方案設計。

目前三星主要的芯片來源包含了自行設計的Exynos系列、高通的驍龍系列、聯發科的低端MT系列,以及展訊的SC系列,市場從最高端,到最低等級,以及可能會被我們直接當作電子垃圾的產品,幾乎都有覆蓋。

目前Exynos 9810是三星的主力自產高端產品,今年的Galaxy S9系列、Note9系列都可見到其身影,其採用的AI計算方式與高通類似,主要是通過DSP、GPU與CPU的協同計算,不過三星有個特殊的做法,那就是視覺相關的處理交由硬件,而非異構計算。

目前的9810採用脫胎自Cortex-A75的M3定製架構,並搭配Cortex-A55作爲小核心,而與華爲最大的不同是,三星在GPU規模上相當捨得下工本,其Mali-G72核心數量配置高達18個,比麒麟970多出6個,雖然芯片成本會較高,但可以在較低的時鐘頻率達到更穩定、更好的效能表現,換言之,能效也更好。

而9810中有個VPU計算單元,顧名思義,是用來處理視覺方面的計算工作,這個單元應該是硬件設計,但只能用來處理比較固定的功能,三星也未公開發布任何支持該計算單元的可編程或開發套件框架。

而下一代方案,也就是Exynos 9820,將會採用ARM DynamIQ架構設計,並且將以“2+2+4”三叢集形式打造,其中兩組大核將採用三星第四代自主架構“M4”,第二道兩組大核則以ARM Cortex-A75構成(也可能以Cortex-A76取代),而小核部分則將以4組ARMCortex-A55構成。

AI部分則將可能維持9810的做法,那就是採用VPU硬件處理單元來處理部分視覺計算工作,並搭配既有的異構計算方式來處理標準AI計算框架,也就是半軟半硬的方式。

最後,9810採用的是三星10nm工藝,而9820將可能是三星7nm案首發,但因爲三星的7nm採用EUV技術,目前還在調試中,真正量產最快也要今年底或明年初,這也可能讓9820成爲最晚推出的次世代AI手機芯片方案。

蘋果:賺走最多錢的手機公司搞AI

蘋果基本的手機芯片佈局是每年一款,當然,爲了配合如平板電腦或者是手錶等其他終端的產品時程,也會在不特定的時間點發布相關方案。而蘋果最新的手機芯片是去年發表的A11 Bionic,內建的硬件NPU是最大特色。而蘋果在其芯片中往往都使用較少的核心,相較對手都已經走到8核以上,蘋果A11還只是個6核產品,但其表現出來的性能數據卻遠遠超越所有競爭對手,其原因包括蘋果對其使用的Arm架構深度定製化,並捨得爲了特定性能目的來堆加更多晶體管,因此其芯片製造成本往往也都比同時期的手機芯片方案更高。但此策略成功推動手機的銷售,並創造更高的獲利,因此每一代方案蘋果也就更捨得堆料,形成正向發展。

A11使用的是臺積電10nm工藝,這也是少數幾次沒有使用到三星代工工藝的蘋果芯片,由於目前蘋果的開發套件中,只開放GPU計算能力給開發者,而GPU也負擔包括第三方AI應用的訓練或推理的工作,對蘋果而言,GPU的份量也越來越重要,這也是之所以蘋果要推動自有GPU架構的發展。

雖然目前所採用的PowerVR架構在性能與菜單現上相當出色,該公司也願意配合蘋果進行高度定製工作,但這對於蘋果而言仍遠遠不足,而展望未來蘋果對其GPU架構的佈局,將可能是個結合繪圖、計算以及推理、訓練的全功能AI優化設計,當然,爲了能耗表現,推理工作可能還是維持獨立的NPU單元來進行。

而未來A12將會如何?其實在現階段也只能猜測,唯一能確定的只有使用7nm製造工藝這點。而在架構方面,根據過去的慣例,性能的增長肯定是不能忽略的,畢竟對手也都在積極追趕,今年對手的主流方案都已經在整體性能上有相當大的改善,也拉近了與A11的距離,A12肯定會在CPU與GPU方面進行更深度的改造,不論是增加更多的處理管線,更優化CPU或GPU內部的流水線設計,抑或者粗暴的堆加核心,都是可能的做法。

至於在關鍵的AI硬件單元方面,除了強化效率以外,也可能就規模方面進行擴展,藉以壓制華爲或高通等即將面世的下一代AI方案。

查看原文 >>
相關文章