美國流媒體巨頭Spotify近日爲播客推出了一項新的人工智能語音翻譯功能,贏得了X公司老闆埃隆·馬斯克的讚譽。

Spotify正在測試一項新的人工智能功能,該功能名爲“語音翻譯(Voice Translation)”,可以克隆播客主播的聲音,並使用相同的語氣,節奏和速度,提供西班牙語,法語和德語的無縫聽力體驗。

該工具是Spotify在OpenAI 的自動語音識別 (ASR) 系統Whisper的幫助下開發的,使用了語音轉文本生成AI模型來翻譯音頻文件,並使用語音複製模型來匹配原始說話者的風格。

這項技術的早期測試已經在一些流行的英語播客上進行了,Spotify打算將這一功能擴展到更多的播客,甚至嘗試爲多語種主持人提供人工智能配音的內容。

知名播客主持人和計算機科學家萊克斯·弗裏德曼在X平臺上發帖,表達了他對Spotify的人工智能翻譯和語音克隆能力的興奮之情。

馬斯克回應了一個表示驚歎的“Wow”。

責任編輯:於健 SF069

相關文章