谷歌和一羣遊戲科學家已經對多年的海底錄音進行了人工智能調查,希望能夠創建一種可以發現座頭鯨交談的機器學習模型。這是該公司新推出的“人工智能”計劃的一部分,該計劃明顯主要用於面部識別和廣告定位。

Google

鯨魚在尋找更好的覓食地,更溫暖的水域,在社交聚會時旅行的時間相當多。但這些運動很難追蹤。幸運的是,鯨魚互相呼喚並以獨特的方式唱歌,這些歌曲可以在水下遠距離傳播。

因此,通過在海底部署的全球聽力設備網絡,您可以跟蹤鯨魚的運動 - 如果您想聽多年的背景噪音是可以獲取的。這就是我們在很長一段時間內工作的方式,計算機幫助減輕了負擔。谷歌團隊與NOAA合作,認爲這是機器學習系統與人才的良好匹配。

這些AI模型非常適合瀏覽特定模式的大量噪聲數據,這就是爲什麼它們應用於像射電望遠鏡和閉路電視攝像機那樣的大量數據。

在這種情況下,數據是來自太平洋各地的十幾個水聽器的數年錄音。這個數據集已經在很大程度上進行了篩查,但谷歌的研究人員希望看到一個AI代理人是否可以做一次艱苦而耗時的工作,首先通過它並用物種名稱標記有趣的聲音 - 在這種情況下,它可以很容易地成爲一個不同的鯨魚或其他東西。

鯨歌,未知的“窄帶”噪音。

有趣的是,但回想起來並不奇怪,音頻沒有被分析 - 相反,音頻變成了可以尋找模式的圖像。這些頻譜圖是一段頻率隨時間變化的聲音強度的記錄,並可用於各種有趣的事情。碰巧它們也可以被機器學習和計算機視覺研究人員很好地研究,Google開發了各種有效方法分析它們。

機器學習模型提供了座頭鯨呼叫的示例,並學習瞭如何在一組樣本數據中以合理的準確度識別它們。爲此,AI進行了各種實驗以確定哪些設置是最佳的 - 例如,什麼長度的剪輯易於處理而不是過長,或者可以安全地忽略哪些頻率。

最後的努力將數據年份劃分爲75秒的剪輯,模型能夠以90%的準確度確定剪輯是否包含“駝背單位”或相關的鯨魚聲音。當然,這不是一個小錯誤,但是如果你相信機器,你可以節省相當多的時間 - 或者你的實驗室助理的時間。

第二種努力依賴於所謂的無監督學習,其中系統類型設定了關於鯨魚聲音和非鯨魚聲音之間的相似性的規則,創建了研究人員可以分類並找到相關羣體的情節。

可視化無監督模型如何分類各種聲音。

它提供了更有趣的可視化,但它更難以解釋,並且無論如何似乎沒有像更傳統的方法那樣產生一組有用的分類。

與在各種學術領域中類似的機器學習應用一樣,這不會取代仔細人類的觀察和文檔,而是會豐富它們。從科學中脫離一些笨拙的工作,研究人員可以專注於他們的專業,而不是陷入重複統計和長達數小時的數據分析會議。

查看原文 >>
相關文章