智能手機早期誕生時,它的智能只能說是“Smart”。發展至今,我們再說到智能手機時,它的智能早已超越了“Smart”而變爲了“AI”(人工智能)。不得不說,近年來,伴隨着AI技術更多、更廣泛地應用於智能手機當中,用戶開始漸漸地感覺到,手邊的這臺便攜智能終端是真的開始智能了,其最大的體現就是功能的進一步豐富與好用。

AI美顏早已成爲大多數用戶自拍首選功能

與此同時,還有一個問題擺在消費者的面前,那就是“選擇”。據不完全統計,僅今年上半年,全新發布的智能手機就有幾十款,面對這麼多的產品,用戶該如何選擇?成爲大多數消費者購機的主要困擾。於是,爲了幫助消費者更好地去挑選帶有AI功能的智能手機產品,繼智能手機性能、拍照“跑分”後,終於,又來了針對AI性能的“跑分”。

當下,隨着“AI跑分”逐漸“成熟”(並非真的成熟,僅僅是越來越多地出現在大衆視野中),究竟該如何解讀這樣的一個“跑分”?從消費者的角度來看,如何理解這樣的“跑分”?“AI跑分”是否具有參考價值?一系列的問題進一步困擾着廣大的消費者。早先,筆者的一位友人也曾問道,難道不是像性能與拍照跑分一樣,分高就證明性能好、分低就證明性能差嗎?筆者負責任地告訴他,當然不是!至於爲什麼?那正是這篇文章想要跟你講的!

AI性能究竟取決於什麼?

瞭解AI技術的人想必都會懂得,AI技術並不是簡單的運算快慢可以評判得了的。考慮到大多數用戶並非對AI技術瞭解得那麼深入,在正式開始講講“AI跑分”複雜在哪前,筆者認爲還是有必要普及一些有關終端側AI性能的基本知識。

人工神經網絡

無論是終端側AI還是雲端側AI,在爲用戶提供服務的過程中,決定服務質量優劣的一大因素,就是神經網絡。如今,我們常說的神經網絡主要是指受人類大腦活動方式的啓發打造的算法模型。在其正式投入使用前,神經網絡首先需要經過訓練階段,也就是常說的機器學習階段。即通過大量數據的學習,讓人工神經網絡可以基於數據得出一些結論、或者是基於特定數據完成新的推理。例如小米智能手機的AI魔法換天功能,就是在一套算法中,大量學習了帶有“天”的圖片爲數據基礎,進而演化到在功能實現的過程中,算法自己可以準確地識別出圖片中“天”的所在,並自動進行替換。

小米10 PRO 5G AI魔法換天樣張

因此,算法模型的完善與否,自然成爲決定AI性能的關鍵因素之一。當然,算法還是要運行在硬件上,以智能手機上的終端側AI來說,除了算法模型的質量外,運算能力當然也是評判AI性能的重要標準。而AI跑分,往往就是針對硬件的能力進行測試,並將測試結果帶入到一套打分體系下,加以權重後,形成一個最終得分來展現終端AI性能的優劣。

聽方法論似乎覺得沒什麼不妥,但在實際執行的過程中,可就沒有想象中那麼簡單了。如今,令廣大消費者大呼AI跑分看不懂的關鍵在於不同第三方機構提供的AI跑分結果大相徑庭。究竟應該相信誰?消費者顯然已經看懵了。

AI跑分大相徑庭背後,反映出了什麼?

究竟爲什麼智能手機AI跑分的成績會出現截然不同的結果呢?爲了說明這樣一個問題。在此,筆者針對目前市面上比較常見的三大AI跑分軟件、機構進行詳細講解,儘可能做到通俗易懂讓消費者可以做到一目瞭然!

AIMark

首先是AIMark,它是當下比較常見的一款安裝在智能手機上的AI跑分軟件,是由魯大師開發,主要採用了面向圖像分類、圖像識別和圖像分割的ResNet-34、Inception-V3、Mobilenet-SSD和DeepLab-v3+模型來進行測試。

在評分標準上,終端設備在AIMark獲取的分值取決於移動平臺處理數據集和執行特定目標識別的效率(簡單說就是“跑”算法的速度以及識別的準確率)。

先來看下由國外著名硬件測試網站Hothardware整理的幾組跑分成績:

可以看到,在AIMark的測試中,高通驍龍865移動平臺的表現脫穎而出,這主要取決於865移動平臺所支持的第五代Qualcomm人工智能引擎AI Engine。因此,在結果中Galaxy S20 Pro和一加8的AI跑分成績遠超其他終端。

第五代Qualcomm人工智能引擎AI Engine

同時,我們還可以看到,儘管Pixel 4 XL和Galaxy Note 10都搭載驍龍855移動平臺,但由於採用了不同的軟件配置和人工神經網絡應用支持,兩款機型的表現有很大差異。

AITuTu

AITuTu也是目前市面上爲智能手機進行AI跑分時常用的APP,它也是採用了面向圖像分類的Inception-v3神經網絡以及面向目標檢測的MobileNet-SSD來進行測試。評分標準上,基於終端處理數據的速度以及準確性來衡量綜合分值。

同樣的幾組跑分如下:

在AITuTu的跑分結果上看,採用高通驍龍移動平臺的終端設備依舊領先。

蘇黎世AI跑分應用(ETH AI Benchmark)

蘇黎世AI跑分也是如今經常被廠商所提及的第三方AI跑分機構,相比此前的兩款跑分APP,蘇黎世的AI Benchmark評估的是一些關鍵的AI和計算機視覺算法的速度、準確率和內存要求。測試方案包括圖像分類與人臉識別方法、用於圖像超分辨率和圖像增強的人工神經網絡、玩Atari遊戲和進行背景虛化模擬的AI模型以及自動駕駛系統中所用的算法。算法結果能夠以可視化圖形的方式呈現,進而瞭解其在不同AI領域的最新表現。

這裏通過兩個ETH AI Benchmark的版本(v3、v4)測試成績來分析:

首先是比較早版本的ETH AI Benchmark v3,可以看到,得分的情況似乎不太平衡。從最終得分的確定過程可以看到,v3版本的跑分尤其重視浮點(FP)運算的性能,讓浮點運算的權重很高。因此,包含針對浮點運算單獨優化的專用AI處理器的麒麟990得分遙遙領先。

接下來是ETH AI Benchmark v4的測試結果:

從v4的測試結果不難看出,在這個版本的評分過程中,降低了浮點運算的權重,因此,麒麟990勝出的分值相比v3版本來說,大幅降低,但由於v4版本依然讓FP16浮點運算保持了很高的權重,因此AI Benchmark的此次版本更新並未影響原有趨勢,對於這點,我們在下圖拆解的AI Benchmark的細項測試中可以更明顯地看出端倪。

其中的Avg。 Init Times (ms),也就是“平均初始化時間”的數值越低越好

由於第五代Qualcomm人工智能引擎AI Engine更重視INT8定點模式,因此搭載驍龍865移動平臺的三星最新機型在INT8性能上更好,準確度也更高,並且能夠獲得INT8帶來的省電優勢。

此外,還需要注意的是,如上圖所示,蘇黎世AI跑分還有一個問題在於,其採用的是Android NN API(安卓平臺基礎SDK)。但實際上,使用驍龍SDK的廠商比例爲94%,使用Android NN API的比例小於1%。而蘇黎世跑分由於不支持驍龍SDK,導致在測試中並不能發揮出驍龍平臺的全部AI性能。而在AIMark和AITutu上則由於能夠支持驍龍SDK讓該平臺的AI性能得到了更好的發揮。

看過了這些測試,究竟反映出了什麼呢?筆者進行了一個簡單的總結:

一、是否支持特定SDK會對AI跑分結果造成影響

SDK是什麼?其中文譯名是“軟件開發工具包”,一般來說,是AI硬件供應商提供給軟件開發者、以方便其在軟件端實現AI功能的開發者工具。例如,高通有名爲SNPE的SDK、聯發科技有NeuroPilot、海思有HiAI等等。從上面的AI跑分表現可以看到,當軟件基於某家廠商的SDK進行測試時,優勢還是非常明顯的!而這種優勢並不是“作弊”,而是通過軟件的兼容性優化將硬件的AI性能發揮到極致,畢竟AI是通過軟件與硬件的結合實現。因此,似乎目前市面上的AI跑分的做法都過於極端,對於廠商SDK的支持情況不同導致它們走向了不同的結果,這樣得到的分數,很難讓用戶一目瞭然地瞭解智能手機的AI性能。

二、對INT8與FP16運算的支持

在蘇黎世AI跑分的單項得分中我們可以看到,麒麟990與驍龍865分別針對不同的數據格式進行了適配優化。高通更重視INT8,華爲則選擇了FP16。其實,這兩種在AI計算深度學習模型中常見的數據格式並沒有優劣、好壞之分。只是在手機端的AI應用中,往往要根據實際使用場景進行綜合考量的選擇。在現實場景下,目前大多數智能手機應用採用的是INT8,因其總體上能效更高,並且採用INT8的AI模型效率和精度也在不斷提升。相比之下,目前FP16可以帶來較高的精度,但實際上絕大多數消費者應用並不需要,並且其也會帶來成倍增長的能耗;顯然,INT8對於智能手機似乎要更合適一些。

另外,需要補充的一點是,高通在AI方面一直不同於其他廠商,採取的是異構設計思路,也就是利用多種不同引擎協同完成AI任務,以在精度和功耗之間取得最佳平衡。比如驍龍865實現的是高性能、低功耗、連接、安全等特性結合在一起的全系統AI,包括CPU、GPU、Hexagon處理器、ISP、Qualcomm傳感器中樞、安全處理單元、調制解調器,甚至Quick Charge等等。我們剛剛一直在談的INT8主要是基於其中Hexagon處理器的支持——包括INT8、INT16定點運算;而與此同時,其GPU實現的AI計算則最主要是FP16、FP32浮點運算。從中,我們就能看出,爲了實現其所說的“在精度和功耗之間取得最佳平衡”的結果,高通對INT8和FP16等等的優化實現是有一個很精細化的分工的。

三、AI跑分智能表現終端設備AI性能的一方面

AI跑分現階段顯然還無法做到像CPU、GPU跑分那樣,通過多個維度來進行測試,並得出一個比較公認的分數供用戶參考。顯然,各家AI跑分所使用的用於測試的算法模型以及方法都太過單一,不太能夠還原用戶真實使用AI應用的場景。因此,大部分的分數對於用戶來說,參考價值有限。以目前的測試情況,不排除有廠商針對測試算法模型進行單獨優化獲取高分的可能。

寫在最後

筆者認爲,針對AI跑分這件事來說,消費者還需要牢記那句經典廣告語,“別看廣告,看療效!”隨着智能手機AI技術的應用逐漸豐富,諸如AI魔法換天、AI美顏、AI瘦身、AI魔法分身、AI語音助手等越來越多的應用在智能手機端落地。目前的AI跑分,最需要注意的是它們各自針對INT8定點與FP16浮點性能的權重差別,因爲二者的差別在上述三種常見的AI跑分評分體系中,佔據了極大的話語權。

就目前消費者可以買到的智能手機產品來看,INT8在移動應用中是最爲常見的。因此,就目前的市場情況來看,INT8足以滿足目前絕大多數主流消費者的使用需求。而FP16並不適合主流消費者,並且更加耗電。

落到產品端,根據三家AI跑分的測試結果來看,採用高通驍龍移動平臺的智能終端,在Qualcomm人工智能引擎AI Engine的加持下,對INT8進行了很好的優化,加之目前大部分安卓端調用AI運算的應用均採用了高通提供的SDK,軟硬相結合的情況下,使得基於高通驍龍移動平臺打造的AI智能手機可將AI性能發揮到極致,並且,不會因此而犧牲續航,這顯然是用戶願意看到的!

相關文章