據國外媒體報道,一家名爲“華麗琴鳥”(Lyrebird)的加拿大初創公司發明了一套人工智能系統,用戶只需使用一段長約1分鐘的錄音,便可合成講話者的聲音。

 

  該人工智能系統可利用語音模仿算法仿製某人的聲音,還能聲情並茂地朗讀各類文本,雖然這一語音複製技術聽上去挺有趣,但也可能產生嚴重後果,因爲使用者可用其假冒他人身份。

 

語音模擬技術

  新型語音模擬技術可合成任何人聲 或將導致身份冒用

  該初創公司以蒙特利爾大學博士生們研發的深度學習模型爲基礎。公司名爲“華麗琴鳥”,這是一種原產澳大利亞的鳥類,可同時模仿20種不同生物的聲音。

 

  該公司使用人工智能系統,將一段語音中的個人特徵壓縮成一段獨特的編碼。研發人員稱,將該編碼輸入算法後,不到半秒鐘便可生成1000個句子,該算法不僅能合成語音,還能對聲音進行控制,賦予其憤怒、同情或緊張等情感,官網上以特朗普、奧巴馬和希拉里的聲音爲例,演示了該技術的準確程度。

 

  研發人員稱,這一技術可得到廣泛運用,如充當個人助理、用名人的聲音閱讀有聲書、或爲殘疾人合成“演講”等,在動漫電影和視頻遊戲中也將有用武之地, “‘華麗琴鳥’是首家利用一小段錄音、便可準確複製他人聲音的公司。這樣的技術可引發嚴重的社會問題。”研究人員在官網上寫道。

 

語音模擬技術

  華麗琴鳥

  “錄音常被視作強有力的證據,許多國家的司法系統尤其看重這一點。而不法分子可利用我們發明的技術輕易操縱錄音,從而破壞了錄音作爲證據的可信度。”研發人員承認,該技術可能導致危險後果,如“通過竊取他人身份誤導外交官、或進行欺詐等”,該團隊認爲,等到該技術對公衆開放之後,錄音便不應被視作驗明正身的證據。

 

  該公司表示,這一技術目前仍處在研發階段,且未提及具體發佈時間及費用。

相關文章