近年来,AI语音技术的迅猛发展,对有声阅读行业产生了巨大影响;

未来,AI语音是否会完全取代真实的人声?

AI时代,有声阅读将面临怎样的机遇与挑战?

这是有声阅读行业面临的时代课题。

图片

4月24日,在以“深化全民阅读,建设书香中国”为主题的第二届全民阅读大会举办期间,“有声有势——AI时代有声阅读的机遇与挑战”主题活动在杭州举办。

本次活动由中国广播电视社会组织联合会指导,中广联合会有声阅读委员会主办。中国广播电视社会组织联合会副会长童刚、中国版权协会理事长阎晓宏、中广联合会有声阅读委员会会长王秋等出席活动并致辞。

在圆桌论坛环节,活动邀请到多位业内专家和代表,共同探讨AI时代有声阅读面对的机遇和挑战。

主持人:浙江传媒学院播音主持艺术学院教授 刘兴宇

嘉宾:著名演播艺术家 李野墨

          云听首席战略官 李正国

          科大讯飞虚拟人业务线总经理 郜静文

圆桌论坛开始,播放了科大讯飞制作的短片《雨水》。

·点击收看·

图片

刘兴宇

刚才,主持人给我们留了一个问题:纪录片《雨水》的配音来自何方?大家在纪录片的尾声,已经看到了纪录片的制作来自科大讯飞。我们现场就有科大讯飞虚拟人业务线总经理郜静文女士,我们先请郜总给我们揭晓谜底。

图片

郜静文

这是科大讯飞最新发布的smart TTS语音技术。2018年,央视《创新中国》栏目复刻了李易老师的声音,那是我们第一次参加纪录片的配音。我们还请了技术专家进行优化,同时还有配音导演、后期共同完成。刚才看到的纪录片,加了最新的大计算的技术,大模型和预训练的技术。现在用起来,只需要后期编辑独立完成,人工智能的老师就不用参与了。这就是这三年人工智能的发展,也是我们在有声场景下的不断积累,我们希望给大家带来更好更大量的有声阅读内容。

图片

刘兴宇

刚刚这位演播者的声音复刻了之后,我们是不是可以给他任何文本,他都有可能生成这样质量的配音或演播?

图片

郜静文

是的。我们有一个平台叫讯飞制作,它也是现在媒体、新媒体常用的软件,用户需求越来越大,音视频的需求也越来越大,所以需要有快速的工具来辅助我们做内容生产。

图片

刘兴宇

如果未来有高质量的AI语音介入有声阅读领域,将对有声产品生产带来极大的便利。2018年科大讯飞复刻了李易的声音;2021年,它还复刻了已故播音艺术家夏青的声音。李正国老师来自中央广播电视总台音频聚合平台云听,请李老师讲一讲云听在AI技术的应用方面大体用在哪些领域?

图片

李正国

云听是2020年3月成立的,它很年轻。但从诞生那一天开始,云听就非常关注AI在有声阅读领域的应用与发展。概括来说,云听在AI领域的应用是三年三大步,一年一台阶。2021年,云听完善了基础内容的建设,然后不断关注新技术的发展,尤其是AI技术在有声阅读领域的应用。众所周知,新闻资讯一直是云听着力打造的重点。在2021年,云听20多个编辑一天只能生产有声新闻资讯100多条。到2022年运用AI技术后,同样的编辑人员同样的工作条件,云听可以日产1000多条,工作效率大幅提升。今年我们全面引入AI技术,从新闻拆条编辑,到内容的审核,我们已经基本上实现了AI替代人工的功能。现在的总体使用效果还是不错的。接下来我们要做AI智能电台,这是我们下一步的研发工作。在音频平台,AI的介入恐怕不仅仅是语音合成的使用了,应该说是AI技术的全面使用,包括在内容生产和内容分发的领域。

图片

刘兴宇

李野墨老师平时关注AI吗?或者您听过AI播的书吗?

图片

李野墨

那倒是没听过,但我对这事确实是很关注的,因为我在诵读行当里也有很多的朋友和学生。刚才听了《雨水》以后,确实给我了很大的震撼。我是坚定地认为AI会很快地大行其事的,尽管它现在还存在着某些不足。就比方说像《雨水》吧,要以我们这些干这行的人来说,其实还是能听出很多问题来的。问题大概有两方面:一是技术方面的问题,这种技术很快就能改过来的,它慢慢地会有越来越来越高的理解力;另外就是声音源问题,现在AI界能采到的声音源,高质量的占比并不大,更多的是一些没受过什么训练、没有多少经验的声音,所以他们本身在诵读中的毛病会带到产品里来。当然,这也是很容易就能解决的。所以我觉得,AI一定会大行其事。因为它高效廉价,所以一定会受欢迎的。

图片

刘兴宇

李老师讲到了两点,我非常认同。第一就是能复刻到高质量的演播者的声音,其实是很少的。所以为什么李易的复刻、夏青先生的复刻,包括刚才这个《雨水》一推出来以后,马上在行业中引发大量的讨论,就说明这样好的内容、好的声音其实罕见的。另外一点,就是廉价的快速复制。李老师播一部长书可能要经过很长时间的酝酿,但对于AI来说,很快就能生成了。我们还想聊一个话题,李老师讲到优秀演播者的声音复刻太少了,比如说您会贡献您的声音吗?您会允许出现一个AI李野墨吗?

图片

李野墨

我认为这个话题其实是没有意义的,因为AI李野墨是不可能存在的。你们能够做到的是有点像李野墨声音的那么一个东西,它跟李野墨没关系。就是说我从业这么多年,我虽然做的可能不太好,但是我一直在努力地向听我的人张扬我的个性,展示我的内心,并试图与听者之间建立一种交流,所以我的声音不管它好听还是不好听,它只是一种媒介、一个外在形式、一种工具。而这个东西离开了李野墨这个人的内心,离开了我这个主体,它没有意义。

图片

刘兴宇

李老师讲到的是他自己从内心的表达、情感的表达层面来说的话。我想再探讨另外一个层面的问题,就是关于版权。我们都知道,人的形象权的规定已经很规范了,但对声音版权的规定还没有那么细致。你们在做声音复刻的时候,考虑声音版权的事吗?

图片

郜静文

这对我们来说是非常重要的因素,如果说我们获取的版权是不安全的,那么未来我们的使用也是不安全的。我们对版权的理解大概分两层:一层是声音采集的合规和安全性,比如说我们有一个小程序,用户录一句话,机器就能模仿你的声音。只有录音文本里一定是他亲自读的内容,才能复刻。我们在谈判声音授权的时候,也一定是获得本人同意进行AI化的,老师也可以要求说只能用在哪些场景。在版权谈判中,要尊重第一版权人,这就是我们在版权获取和版权保护上面。第二,AI化的声音到底有没有版权?其实现在法规上没有定义,是模糊状态。我觉得还需要进行很长时间的探讨。

图片

刘兴宇

我觉得从研发端注重声音版权的保护,这恐怕是非常重要的。李正国老师负责的云听是AI声音的应用端,从应用端的角度,比如说您在使用AI声音的时候,您会考虑版权的事吗?

图片

李正国

我一定会考虑。前几年我去传统广播媒体调研,有些主持人对AI技术强烈排斥,认为AI技术有可能夺了他的饭碗,所以当时我们想采集这个主持人的声音素材用于AI技术的时候,他根本就不提供,也不授权。现在在AI声音版权领域,目前法律是空白。如何界定主持人、艺术家的声音版权?我觉得还需要技术专家来研发,比如说类似于人的指纹是独一无二的,那么声纹是不是独一无二的呢?像李野墨老师的声音,随着AI的技术高度发达后,它模仿的声音,会不会有一天您自己都辨别不出来真伪?

图片

李野墨

绝对不会。哈哈~

图片

刘兴宇

李正国老师在调研的时候发现我们专业的播音员主持人会很谨慎,是因为我们作为从业者,已经意识到了我们声音的价值。我们开场前普通人在玩这个小程序的时候,有没有注意到我们要把声音授权出去?

图片

李野墨

不是,我想插一句话,你们三个人刚才说的一个事情,是有一个概念没有弄清楚。人的声音不是一架小提琴或者是一架钢琴,谁都可以来play。人的声音绝不仅仅是可以听到的,外化的声音。如果我发现谁复刻我的声音,我就告谁,哈哈,我死了也不许你复刻。

图片

刘兴宇

我们今天听到了一个对于自己的声音版权坚定的保护者。

图片

李野墨

我不是在捍卫我的声音,我是在捍卫我这个人。因为你复刻了我的声音,熟悉它的人家就听,这是另外的事。但是你且不说品位问题,有些我肯定不可能去读的东西,你可以拿它来读,甚至你拿的那个反党反社会主义的,谁担这个罪名?

图片

刘兴宇

是的。所以不要把声音跟诵读者之间割裂开来,人声不是乐器的声音,人声是跟这个人连在一起的,所以我觉得刚才郜总说我们很谨慎,因为没有这方面法律,所以李老师的意见是,希望政府尽快出台这样的法律,对吧?离开了这个主体,声音没有意义。我想我们三位都会同意,最终无论AI怎么发展,恐怕人都是不可或缺的。

图片

李野墨

我不是针对AI,不持排斥和敌对态度。我觉得它大有可为。

一位听众现场朗诵了《面朝大海春暖花开》,声音采集后,AI技术生成了另一首诗歌《我爱这土地》。

图片

刘兴宇

在技术发展过程中,我们一边在思考怎么来保持技术的理性,但对于有声阅读来说,永远不能放弃的,还有艺术的温度。就像李野墨老师作为演播者,为文字赋予的那种温度、那种魅力、那种情感。所以我想,我们怎么能够在技术的理性和艺术的温度之间,寻找到完美的平衡点?我想这是我们在座的各位,包括有声阅读领域的从业者们,要一直思考的问题。无论AI技术怎么发展,人性的温度恐怕永远都是我们要坚守的。

图片
图片
相关文章