來源:大數據文摘

“看”這個動作一直被認爲是生物所獨有的。

當工程師第一次“教”計算機“看”這個動作時,他們理所當然地認爲計算機可以像人類眼睛一樣進行觀看。

約克大學(York University)計算機科學家約翰·託索斯(John Tsotsos)說道,上世紀六十年代有關計算機視覺的第一批提案“顯然是由人類視覺的特徵所驅動的”。

但是現在情況已經大不相同,人工“神經網絡”處理可視數據的方式與人類的越來越相似。

計算機視覺已經從三維發展到了廣闊的領域。現在,計算機可以在某些視覺任務上勝過人類,比如利用圖片特徵分清狗和狼,以及檢測醫學圖像中的異常情況。

人類的反饋過程與計算機視覺的前饋方法完全不同

基於計算機視覺的神經網絡過程很簡單。把接收的圖像作爲輸入端,通過一系列步驟對其進行處理,首先檢測像素,然後檢測邊緣和輪廓,檢測整個對象,最終對它們的外觀做出猜測。由於整個過程屬於流水線設置,又被稱爲“前饋”系統。

關於人類視覺,我們不瞭解得太多,但我們知道人類視覺並非如此。

在最近的文章“數學模型揭示視覺祕密”(A Mathematical Model Unlocks the Secrets of Vision)中,Quanta介紹了一種新的數學模型,該模型試圖解釋人類視覺的中心奧祕:大腦的視覺皮層是如何根據從視網膜接收到的少量信息,創造出生動、準確的世界表象的。

該模型表明,視覺皮層通過一系列神經反饋迴路實現這一“壯舉”,這些反饋迴路將來自外界數據的細微變化細化爲我們眼前出現的各種圖像。此反饋過程與計算機視覺的前饋方法非常不同。

康奈爾大學神經科學家喬納森·維克多(Jonathan Victor)表示:“這項工作確實發現了人類視覺皮層與計算機視覺之間的複雜程度和某種意義上的差異。”

計算機視覺根本不需要人類視覺的啓發?

在某些方面,答案顯然是否定的。

傳入視覺皮層的信息受到解剖學的限制:相對較少的神經將視覺皮層與外界聯繫在一起,這限制了皮質使用的視覺數據量。

而計算機不必擔心帶寬問題,因此沒有必要使用稀疏信息方法。“如果有無限的計算能力和內存,是否還需要稀疏任何東西?答案可能不是!”Tsotsos說。

但是Tsotsos認爲無視人類的視野是錯誤的。

目前計算機擅長的分類任務是計算機視覺的“低端成果”。爲了完成這些任務,只需要在海量數據集中找到相關性即可。對於更高階的任務,例如從多個角度掃描對象以確定是什麼,這種關聯法就行不通了,可能還是需要人類把關。

去年接受Quanta採訪時,人工智能先驅Judea Pearl提出這一觀點時更爲籠統,他認爲相關性訓練從長遠來看不會使AI系統發展得太遠。

例如,人類視覺的關鍵特徵是具有雙重能力。我們接收視覺信息的同時對所見所聞得出結論。當這個結論令人震驚時,我們會再看一遍,通常第二眼便會告訴我們真實的情況。以前饋方式工作的計算機視覺系統通常缺乏此功能,這導致計算機視覺系統有時甚至不能完成某些簡單的視覺任務。

計算機視覺系統值得期待

人類視覺還缺少另一個更微妙,更重要的東西。

人類的視覺系統是需要幾年的時間才能成熟的。Tsotsos和他的合作者在2019年發表的一篇論文中發現,人們直到17歲左右才能夠完全在混亂擁擠的找到他們的目標。其他研究顯示,識別面孔的能力一直不變直到20歲左右纔有所改善。

計算機視覺系統通過分析大量數據來工作。它們的基礎架構是固定的,並且不會像大腦發育的方式一樣隨着時間的推移而成熟,如果基礎機制如此不同,結果是否也會不一樣?Tsotsos認爲計算機視覺系統值得期待。

他說:“用這些深度學習方法中進行學習與人類學習無關——天花板即將到來了,這些系統將無法繼續發展。”

相關報道:

https://www.quantamagazine.org/computers-and-humans-see-differently-does-it-matter-20190917/

未來智能實驗室是人工智能學家與科學院相關機構聯合成立的人工智能,互聯網和腦科學交叉研究機構。

未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)雲腦研究計劃,構建互聯網(城市)雲腦技術和企業圖譜,爲提升企業,行業與城市的智能水平服務。

相關文章