事實上,這項技術已經經歷了一場“工業革命”,使得某些算法在搜索數據庫和查找匹配項方面比其他算法高出20倍,這些數字來自於NIST發佈的“當前臉部識別供應商測試”結果。NIST測試了由45個不同供應商開發的127種算法。這些算法被該機構稱爲“行業的大部分”,它們使用一個主要數據庫,其中包含來自具有良好姿態的1230萬個人的2660萬張肖像照片。由於照片的質量很高,最準確算法的匹配識別錯誤率僅爲0.2%。作爲對比,同樣的測試在2014年至少有4%的失敗率,而2010年的失敗率爲5%。NIST還在一個“原生圖像”數據庫上測試了這些算法,該數據庫包含來自新聞攝影和業餘攝影的人臉圖像。這一批算法中表現最好的有來自微軟、IDEMIA和中國人臉識別公司依圖開發的算法。改進的祕訣是什麼?NIST表示,其中之一是廣泛採用了卷積神經網絡,這是對2014年臉部識別和機器學習技術的一個改進。報告寫道:“精度的提高主要得益於將先前的方法與基於深度卷積神經網絡的方法進行集成或完全替換。”因此,人臉識別經歷了一場工業革命,算法對質量差的圖像的容忍能力越來越高。無論革命是否繼續或已經進入一個更高級的階段,隨着機器學習體系結構的進一步發展,更大的數據集得以組裝,基準得到進一步利用,我們可以期望看到更多的成果。”NIST計算機科學家、報告的作者之一Patrick Grother在一份聲明中表示:“該測試顯示了行業對卷積神經網絡的大規模應用,這在五年前並不存在。由大約25名開發人員開發的算法勝過了我們在2014年報告的最準確算法。”但是有一個針對所有改進的重要警告——性能分佈不均勻。報告指出:“識別準確率在很大程度上取決於算法,更常見的是依賴於算法的開發者。在特定情況下的識別錯誤率有時是幾千分之一,有時會超過百分之五十。因此,一些開發人員的算法非常沒有競爭力,不應該部署。”換言之,在許多情況下,最精確的算法要比另一些算法精確得多。“這意味着在選擇新一代軟件時,你需要適當地考慮準確性,”Grother警告說。此外,即使性能良好的算法也難以應對某些自然產生的挑戰,比如質量差的照片、衰老的面孔甚至雙胞胎。NIST測試的高性能算法中沒有一個能正確識別雙胞胎。在2019年,NIST計劃再發布兩份關於臉部識別準確度的報告—一份詳述了由49位開發人員提交的另外90種算法的結果,另一份是關於“臉部識別中的人口相關性”的報告。 隨着臉部識別算法的廣泛應用,準確性成爲一個很大的關注點。美國一羣民主黨議員給亞馬遜CEO Jeff Bezos寫了一封信,表達了他們對亞馬遜Rekognition軟件的準確性(或缺乏準確性)的“嚴重關切”:“臉部識別技術有朝一日會成爲執法人員保護美國公衆和維護公共安全的有用工具。然而,此時,我們對此類產品抱有嚴重關切,因爲此類產品存在重大的準確性問題,給有色人羣帶來了不當負擔,並可能扼殺美國人在公共場合行使《第一修正案》權利的意願。”
相關文章