AI时代，有声阅读迎来机遇还是挑战？圆桌辩论全放送

近年来，AI语音技术的迅猛发展，对有声阅读行业产生了巨大影响；

未来，AI语音是否会完全取代真实的人声？

AI时代，有声阅读将面临怎样的机遇与挑战？

这是有声阅读行业面临的时代课题。

4月24日，在以“深化全民阅读，建设书香中国”为主题的第二届全民阅读大会举办期间，“有声有势——AI时代有声阅读的机遇与挑战”主题活动在杭州举办。

本次活动由中国广播电视社会组织联合会指导，中广联合会有声阅读委员会主办。中国广播电视社会组织联合会副会长童刚、中国版权协会理事长阎晓宏、中广联合会有声阅读委员会会长王秋等出席活动并致辞。

在圆桌论坛环节，活动邀请到多位业内专家和代表，共同探讨AI时代有声阅读面对的机遇和挑战。

主持人：浙江传媒学院播音主持艺术学院教授 刘兴宇

嘉宾：著名演播艺术家 李野墨

云听首席战略官 李正国

科大讯飞虚拟人业务线总经理 郜静文

圆桌论坛开始，播放了科大讯飞制作的短片《雨水》。

·点击收看·

刘兴宇

刚才，主持人给我们留了一个问题：纪录片《雨水》的配音来自何方？大家在纪录片的尾声，已经看到了纪录片的制作来自科大讯飞。我们现场就有科大讯飞虚拟人业务线总经理郜静文女士，我们先请郜总给我们揭晓谜底。

郜静文

这是科大讯飞最新发布的smart TTS语音技术。2018年，央视《创新中国》栏目复刻了李易老师的声音，那是我们第一次参加纪录片的配音。我们还请了技术专家进行优化，同时还有配音导演、后期共同完成。刚才看到的纪录片，加了最新的大计算的技术，大模型和预训练的技术。现在用起来，只需要后期编辑独立完成，人工智能的老师就不用参与了。这就是这三年人工智能的发展，也是我们在有声场景下的不断积累，我们希望给大家带来更好更大量的有声阅读内容。

刘兴宇

刚刚这位演播者的声音复刻了之后，我们是不是可以给他任何文本，他都有可能生成这样质量的配音或演播？

郜静文

是的。我们有一个平台叫讯飞制作，它也是现在媒体、新媒体常用的软件，用户需求越来越大，音视频的需求也越来越大，所以需要有快速的工具来辅助我们做内容生产。

刘兴宇

如果未来有高质量的AI语音介入有声阅读领域，将对有声产品生产带来极大的便利。2018年科大讯飞复刻了李易的声音；2021年，它还复刻了已故播音艺术家夏青的声音。李正国老师来自中央广播电视总台音频聚合平台云听，请李老师讲一讲云听在AI技术的应用方面大体用在哪些领域？

李正国

云听是2020年3月成立的，它很年轻。但从诞生那一天开始，云听就非常关注AI在有声阅读领域的应用与发展。概括来说，云听在AI领域的应用是三年三大步，一年一台阶。2021年，云听完善了基础内容的建设，然后不断关注新技术的发展，尤其是AI技术在有声阅读领域的应用。众所周知，新闻资讯一直是云听着力打造的重点。在2021年，云听20多个编辑一天只能生产有声新闻资讯100多条。到2022年运用AI技术后，同样的编辑人员同样的工作条件，云听可以日产1000多条，工作效率大幅提升。今年我们全面引入AI技术，从新闻拆条编辑，到内容的审核，我们已经基本上实现了AI替代人工的功能。现在的总体使用效果还是不错的。接下来我们要做AI智能电台，这是我们下一步的研发工作。在音频平台，AI的介入恐怕不仅仅是语音合成的使用了，应该说是AI技术的全面使用，包括在内容生产和内容分发的领域。

刘兴宇

李野墨老师平时关注AI吗？或者您听过AI播的书吗？

李野墨

那倒是没听过，但我对这事确实是很关注的，因为我在诵读行当里也有很多的朋友和学生。刚才听了《雨水》以后，确实给我了很大的震撼。我是坚定地认为AI会很快地大行其事的，尽管它现在还存在着某些不足。就比方说像《雨水》吧，要以我们这些干这行的人来说，其实还是能听出很多问题来的。问题大概有两方面：一是技术方面的问题，这种技术很快就能改过来的，它慢慢地会有越来越来越高的理解力；另外就是声音源问题，现在AI界能采到的声音源，高质量的占比并不大，更多的是一些没受过什么训练、没有多少经验的声音，所以他们本身在诵读中的毛病会带到产品里来。当然，这也是很容易就能解决的。所以我觉得，AI一定会大行其事。因为它高效廉价，所以一定会受欢迎的。

刘兴宇

李老师讲到了两点，我非常认同。第一就是能复刻到高质量的演播者的声音，其实是很少的。所以为什么李易的复刻、夏青先生的复刻，包括刚才这个《雨水》一推出来以后，马上在行业中引发大量的讨论，就说明这样好的内容、好的声音其实罕见的。另外一点，就是廉价的快速复制。李老师播一部长书可能要经过很长时间的酝酿，但对于AI来说，很快就能生成了。我们还想聊一个话题，李老师讲到优秀演播者的声音复刻太少了，比如说您会贡献您的声音吗？您会允许出现一个AI李野墨吗？

李野墨

我认为这个话题其实是没有意义的，因为AI李野墨是不可能存在的。你们能够做到的是有点像李野墨声音的那么一个东西，它跟李野墨没关系。就是说我从业这么多年，我虽然做的可能不太好，但是我一直在努力地向听我的人张扬我的个性，展示我的内心，并试图与听者之间建立一种交流，所以我的声音不管它好听还是不好听，它只是一种媒介、一个外在形式、一种工具。而这个东西离开了李野墨这个人的内心，离开了我这个主体，它没有意义。

刘兴宇

李老师讲到的是他自己从内心的表达、情感的表达层面来说的话。我想再探讨另外一个层面的问题，就是关于版权。我们都知道，人的形象权的规定已经很规范了，但对声音版权的规定还没有那么细致。你们在做声音复刻的时候，考虑声音版权的事吗？

郜静文

这对我们来说是非常重要的因素，如果说我们获取的版权是不安全的，那么未来我们的使用也是不安全的。我们对版权的理解大概分两层：一层是声音采集的合规和安全性，比如说我们有一个小程序，用户录一句话，机器就能模仿你的声音。只有录音文本里一定是他亲自读的内容，才能复刻。我们在谈判声音授权的时候，也一定是获得本人同意进行AI化的，老师也可以要求说只能用在哪些场景。在版权谈判中，要尊重第一版权人，这就是我们在版权获取和版权保护上面。第二，AI化的声音到底有没有版权？其实现在法规上没有定义，是模糊状态。我觉得还需要进行很长时间的探讨。

刘兴宇

我觉得从研发端注重声音版权的保护，这恐怕是非常重要的。李正国老师负责的云听是AI声音的应用端，从应用端的角度，比如说您在使用AI声音的时候，您会考虑版权的事吗？

李正国

我一定会考虑。前几年我去传统广播媒体调研，有些主持人对AI技术强烈排斥，认为AI技术有可能夺了他的饭碗，所以当时我们想采集这个主持人的声音素材用于AI技术的时候，他根本就不提供，也不授权。现在在AI声音版权领域，目前法律是空白。如何界定主持人、艺术家的声音版权？我觉得还需要技术专家来研发，比如说类似于人的指纹是独一无二的，那么声纹是不是独一无二的呢？像李野墨老师的声音，随着AI的技术高度发达后，它模仿的声音，会不会有一天您自己都辨别不出来真伪？

李野墨

绝对不会。哈哈~

刘兴宇

李正国老师在调研的时候发现我们专业的播音员主持人会很谨慎，是因为我们作为从业者，已经意识到了我们声音的价值。我们开场前普通人在玩这个小程序的时候，有没有注意到我们要把声音授权出去？

李野墨

不是，我想插一句话，你们三个人刚才说的一个事情，是有一个概念没有弄清楚。人的声音不是一架小提琴或者是一架钢琴，谁都可以来play。人的声音绝不仅仅是可以听到的，外化的声音。如果我发现谁复刻我的声音，我就告谁，哈哈，我死了也不许你复刻。

刘兴宇

我们今天听到了一个对于自己的声音版权坚定的保护者。

李野墨

我不是在捍卫我的声音，我是在捍卫我这个人。因为你复刻了我的声音，熟悉它的人家就听，这是另外的事。但是你且不说品位问题，有些我肯定不可能去读的东西，你可以拿它来读，甚至你拿的那个反党反社会主义的，谁担这个罪名？

刘兴宇

是的。所以不要把声音跟诵读者之间割裂开来，人声不是乐器的声音，人声是跟这个人连在一起的，所以我觉得刚才郜总说我们很谨慎，因为没有这方面法律，所以李老师的意见是，希望政府尽快出台这样的法律，对吧？离开了这个主体，声音没有意义。我想我们三位都会同意，最终无论AI怎么发展，恐怕人都是不可或缺的。

李野墨

我不是针对AI，不持排斥和敌对态度。我觉得它大有可为。

一位听众现场朗诵了《面朝大海春暖花开》，声音采集后，AI技术生成了另一首诗歌《我爱这土地》。

刘兴宇

在技术发展过程中，我们一边在思考怎么来保持技术的理性，但对于有声阅读来说，永远不能放弃的，还有艺术的温度。就像李野墨老师作为演播者，为文字赋予的那种温度、那种魅力、那种情感。所以我想，我们怎么能够在技术的理性和艺术的温度之间，寻找到完美的平衡点？我想这是我们在座的各位，包括有声阅读领域的从业者们，要一直思考的问题。无论AI技术怎么发展，人性的温度恐怕永远都是我们要坚守的。