近年來,AI語音技術的迅猛發展,對有聲閱讀行業產生了巨大影響;

未來,AI語音是否會完全取代真實的人聲?

AI時代,有聲閱讀將面臨怎樣的機遇與挑戰?

這是有聲閱讀行業面臨的時代課題。

圖片

4月24日,在以“深化全民閱讀,建設書香中國”爲主題的第二屆全民閱讀大會舉辦期間,“有聲有勢——AI時代有聲閱讀的機遇與挑戰”主題活動在杭州舉辦。

本次活動由中國廣播電視社會組織聯合會指導,中廣聯合會有聲閱讀委員會主辦。中國廣播電視社會組織聯合會副會長童剛、中國版權協會理事長閻曉宏、中廣聯合會有聲閱讀委員會會長王秋等出席活動並致辭。

在圓桌論壇環節,活動邀請到多位業內專家和代表,共同探討AI時代有聲閱讀面對的機遇和挑戰。

主持人:浙江傳媒學院播音主持藝術學院教授 劉興宇

嘉賓:著名演播藝術家 李野墨

          雲聽首席戰略官 李正國

          科大訊飛虛擬人業務線總經理 郜靜文

圓桌論壇開始,播放了科大訊飛製作的短片《雨水》。

·點擊收看·

圖片

劉興宇

剛纔,主持人給我們留了一個問題:紀錄片《雨水》的配音來自何方?大家在紀錄片的尾聲,已經看到了紀錄片的製作來自科大訊飛。我們現場就有科大訊飛虛擬人業務線總經理郜靜文女士,我們先請郜總給我們揭曉謎底。

圖片

郜靜文

這是科大訊飛最新發布的smart TTS語音技術。2018年,央視《創新中國》欄目復刻了李易老師的聲音,那是我們第一次參加紀錄片的配音。我們還請了技術專家進行優化,同時還有配音導演、後期共同完成。剛纔看到的紀錄片,加了最新的大計算的技術,大模型和預訓練的技術。現在用起來,只需要後期編輯獨立完成,人工智能的老師就不用參與了。這就是這三年人工智能的發展,也是我們在有聲場景下的不斷積累,我們希望給大家帶來更好更大量的有聲閱讀內容。

圖片

劉興宇

剛剛這位演播者的聲音復刻了之後,我們是不是可以給他任何文本,他都有可能生成這樣質量的配音或演播?

圖片

郜靜文

是的。我們有一個平臺叫訊飛製作,它也是現在媒體、新媒體常用的軟件,用戶需求越來越大,音視頻的需求也越來越大,所以需要有快速的工具來輔助我們做內容生產。

圖片

劉興宇

如果未來有高質量的AI語音介入有聲閱讀領域,將對有聲產品生產帶來極大的便利。2018年科大訊飛復刻了李易的聲音;2021年,它還復刻了已故播音藝術家夏青的聲音。李正國老師來自中央廣播電視總檯音頻聚合平臺雲聽,請李老師講一講雲聽在AI技術的應用方面大體用在哪些領域?

圖片

李正國

雲聽是2020年3月成立的,它很年輕。但從誕生那一天開始,雲聽就非常關注AI在有聲閱讀領域的應用與發展。概括來說,雲聽在AI領域的應用是三年三大步,一年一臺階。2021年,雲聽完善了基礎內容的建設,然後不斷關注新技術的發展,尤其是AI技術在有聲閱讀領域的應用。衆所周知,新聞資訊一直是雲聽着力打造的重點。在2021年,雲聽20多個編輯一天只能生產有聲新聞資訊100多條。到2022年運用AI技術後,同樣的編輯人員同樣的工作條件,雲聽可以日產1000多條,工作效率大幅提升。今年我們全面引入AI技術,從新聞拆條編輯,到內容的審覈,我們已經基本上實現了AI替代人工的功能。現在的總體使用效果還是不錯的。接下來我們要做AI智能電臺,這是我們下一步的研發工作。在音頻平臺,AI的介入恐怕不僅僅是語音合成的使用了,應該說是AI技術的全面使用,包括在內容生產和內容分發的領域。

圖片

劉興宇

李野墨老師平時關注AI嗎?或者您聽過AI播的書嗎?

圖片

李野墨

那倒是沒聽過,但我對這事確實是很關注的,因爲我在誦讀行當裏也有很多的朋友和學生。剛纔聽了《雨水》以後,確實給我了很大的震撼。我是堅定地認爲AI會很快地大行其事的,儘管它現在還存在着某些不足。就比方說像《雨水》吧,要以我們這些幹這行的人來說,其實還是能聽出很多問題來的。問題大概有兩方面:一是技術方面的問題,這種技術很快就能改過來的,它慢慢地會有越來越來越高的理解力;另外就是聲音源問題,現在AI界能採到的聲音源,高質量的佔比並不大,更多的是一些沒受過什麼訓練、沒有多少經驗的聲音,所以他們本身在誦讀中的毛病會帶到產品裏來。當然,這也是很容易就能解決的。所以我覺得,AI一定會大行其事。因爲它高效廉價,所以一定會受歡迎的。

圖片

劉興宇

李老師講到了兩點,我非常認同。第一就是能復刻到高質量的演播者的聲音,其實是很少的。所以爲什麼李易的復刻、夏青先生的復刻,包括剛纔這個《雨水》一推出來以後,馬上在行業中引發大量的討論,就說明這樣好的內容、好的聲音其實罕見的。另外一點,就是廉價的快速複製。李老師播一部長書可能要經過很長時間的醞釀,但對於AI來說,很快就能生成了。我們還想聊一個話題,李老師講到優秀演播者的聲音復刻太少了,比如說您會貢獻您的聲音嗎?您會允許出現一個AI李野墨嗎?

圖片

李野墨

我認爲這個話題其實是沒有意義的,因爲AI李野墨是不可能存在的。你們能夠做到的是有點像李野墨聲音的那麼一個東西,它跟李野墨沒關係。就是說我從業這麼多年,我雖然做的可能不太好,但是我一直在努力地向聽我的人張揚我的個性,展示我的內心,並試圖與聽者之間建立一種交流,所以我的聲音不管它好聽還是不好聽,它只是一種媒介、一個外在形式、一種工具。而這個東西離開了李野墨這個人的內心,離開了我這個主體,它沒有意義。

圖片

劉興宇

李老師講到的是他自己從內心的表達、情感的表達層面來說的話。我想再探討另外一個層面的問題,就是關於版權。我們都知道,人的形象權的規定已經很規範了,但對聲音版權的規定還沒有那麼細緻。你們在做聲音復刻的時候,考慮聲音版權的事嗎?

圖片

郜靜文

這對我們來說是非常重要的因素,如果說我們獲取的版權是不安全的,那麼未來我們的使用也是不安全的。我們對版權的理解大概分兩層:一層是聲音採集的合規和安全性,比如說我們有一個小程序,用戶錄一句話,機器就能模仿你的聲音。只有錄音文本里一定是他親自讀的內容,才能復刻。我們在談判聲音授權的時候,也一定是獲得本人同意進行AI化的,老師也可以要求說只能用在哪些場景。在版權談判中,要尊重第一版權人,這就是我們在版權獲取和版權保護上面。第二,AI化的聲音到底有沒有版權?其實現在法規上沒有定義,是模糊狀態。我覺得還需要進行很長時間的探討。

圖片

劉興宇

我覺得從研發端注重聲音版權的保護,這恐怕是非常重要的。李正國老師負責的雲聽是AI聲音的應用端,從應用端的角度,比如說您在使用AI聲音的時候,您會考慮版權的事嗎?

圖片

李正國

我一定會考慮。前幾年我去傳統廣播媒體調研,有些主持人對AI技術強烈排斥,認爲AI技術有可能奪了他的飯碗,所以當時我們想採集這個主持人的聲音素材用於AI技術的時候,他根本就不提供,也不授權。現在在AI聲音版權領域,目前法律是空白。如何界定主持人、藝術家的聲音版權?我覺得還需要技術專家來研發,比如說類似於人的指紋是獨一無二的,那麼聲紋是不是獨一無二的呢?像李野墨老師的聲音,隨着AI的技術高度發達後,它模仿的聲音,會不會有一天您自己都辨別不出來真僞?

圖片

李野墨

絕對不會。哈哈~

圖片

劉興宇

李正國老師在調研的時候發現我們專業的播音員主持人會很謹慎,是因爲我們作爲從業者,已經意識到了我們聲音的價值。我們開場前普通人在玩這個小程序的時候,有沒有注意到我們要把聲音授權出去?

圖片

李野墨

不是,我想插一句話,你們三個人剛纔說的一個事情,是有一個概念沒有弄清楚。人的聲音不是一架小提琴或者是一架鋼琴,誰都可以來play。人的聲音絕不僅僅是可以聽到的,外化的聲音。如果我發現誰復刻我的聲音,我就告誰,哈哈,我死了也不許你復刻。

圖片

劉興宇

我們今天聽到了一個對於自己的聲音版權堅定的保護者。

圖片

李野墨

我不是在捍衛我的聲音,我是在捍衛我這個人。因爲你復刻了我的聲音,熟悉它的人家就聽,這是另外的事。但是你且不說品位問題,有些我肯定不可能去讀的東西,你可以拿它來讀,甚至你拿的那個反黨反社會主義的,誰擔這個罪名?

圖片

劉興宇

是的。所以不要把聲音跟誦讀者之間割裂開來,人聲不是樂器的聲音,人聲是跟這個人連在一起的,所以我覺得剛纔郜總說我們很謹慎,因爲沒有這方面法律,所以李老師的意見是,希望政府儘快出臺這樣的法律,對吧?離開了這個主體,聲音沒有意義。我想我們三位都會同意,最終無論AI怎麼發展,恐怕人都是不可或缺的。

圖片

李野墨

我不是針對AI,不持排斥和敵對態度。我覺得它大有可爲。

一位聽衆現場朗誦了《面朝大海春暖花開》,聲音採集後,AI技術生成了另一首詩歌《我愛這土地》。

圖片

劉興宇

在技術發展過程中,我們一邊在思考怎麼來保持技術的理性,但對於有聲閱讀來說,永遠不能放棄的,還有藝術的溫度。就像李野墨老師作爲演播者,爲文字賦予的那種溫度、那種魅力、那種情感。所以我想,我們怎麼能夠在技術的理性和藝術的溫度之間,尋找到完美的平衡點?我想這是我們在座的各位,包括有聲閱讀領域的從業者們,要一直思考的問題。無論AI技術怎麼發展,人性的溫度恐怕永遠都是我們要堅守的。

圖片
圖片
相關文章