警惕那片「索拉里斯星的海」——AI 翻唱作品引发的合规省思
说明:本文涉及 AI 生成作品相关的法律问题,其中很多议题仍处于发现和讨论的早期阶段,尚无明确共识,相关法律法规亦在持续制定或修订中。因此,文中所述观点和信息仅供参考,不能替代专业人士的咨询意见,且可能随时间推移而有所滞后或遗漏,请读者知悉。
一、AIGC 带来的索拉里斯海问题
译林出版社在 2021 年对波兰科幻作家斯坦尼斯瓦夫·莱姆的作品做了再版,其中就包括他最有名的一部长篇小说《索拉里斯星》。这部诞生于二十世纪六十年代的作品,蕴含着对生命、哲学、社会的思考,而在今天 AI 盛行的时代,有了更多的意义。
全文的故事并不复杂,围绕着一个丧妻的宇航员凯文远赴索拉里斯星,到达空间站后发现那里异常如斯,他的妻子哈利(原译为海若,读完全书才发现原译饱含深意)竟然在那个星球复活,而且在因意外死去之后又不断莫名出现,如此反复。而且凯文还发现,妻子有着她不该有的记忆,这些记忆只有凯文才有。
最终凯文弄清楚了缘由,原来这个所谓的妻子是索拉里斯星上的这片海根据自己的记忆所创造出来的仿生人。反讽的是,凯文从不断排斥到最终爱上这个仿生人,而仿生人从强烈依恋凯文到执意自杀表明自我意识觉醒,如此的冲突表达出对人类中心主义的反思。
但《索拉里斯星》中对仿生人的描述,通过对人类记忆和思维的复制并不断地学习,逐渐与真实人类更加接近的过程,就像是当前极度热门的 AIGC 话题给人们带来的冲击和挑战。ChatGPT 出现时有网友戏谑称,「又怕它来,又怕它不来」;「不知道自己在害怕什么,也不知道自己在期待什么」。
在深度合成技术刚出现的一段时间里,人们用以区分 AI 生成的人物图像和真实照片区别的关键在于 AI 始终画不好人类的手指关节,但近阶段似乎这样的讨论减少了,这一 bug 好像已经被 AI 学习并修复了。随着技术进步和升级迭代不断,AI 学习的速度远超想象,由此带来的 AI 作品与真实人类作品越来越难以区分的情况也逐步显现,由此带来的问题和后果令人忧虑。
二、AI 翻唱作品与其他 AIGC 的差异
近期无论是 B 站还是抖音,用户都会刷到 AI 王心凌、AI 孙燕姿的音乐,无论是《套马杆》还是《七里香》还是《水星记》,普通听众几乎听不出区别,至少比鬼畜视频里合成的人声进化太多。
歌手的声音成为 AI 训练来源,让 AI 翻唱歌曲,似乎已经在 AIGC 领域已经不存在很高门槛。「《纽约时报》记者 Joe Coscarelli 称它们为『无害的百灵鸟』,AIGC 内容发布到互联网上,大家听来笑一笑,创作者收获流量,相安无事,皆大欢喜。」1
但是由此引发的忧虑已经逐步显现。Ghostwriter977 通过 AI 利用 Drake 和 The Weeknd 的声音翻唱了歌曲 Heart on My Sleeve 就引起了版权方环球音乐的注意,并引发了侵权诉讼。这不仅产生了对 AI 音乐的恐慌,更引发了从未经历的合规问题。
尽管 AI 图文已经引起了不小的争议,但 AI 音乐引发的问题可能更有甚之。
因为视觉上的「风格化」内容难以模仿,以及可能因为技术实现上的差异,人工智能生成的图片、文字细看似乎还是能存在一些非人类创作的「端倪」。例如,图片、文字作者对于其个人作品的表达,可能在其创作生涯并非是一成不变的,甚至发生过剧烈变化:格哈德·里希特(Gerhard Richter)的风格从浪漫主义、照相写实主义,到抽象主义、极简主义、构成主义,完全难以识别标志性的风格特征;又如齐白石,也是经历了工笔、小写意,比如《百鸟图》,到大写意的,比如《虾》的转变。
AI 音乐则可能不然。音乐作品的核心表达在于歌词和曲谱的构成。尽管歌曲动机、和弦走向、歌词风格可能会形成某一个音乐人的风格化特征,但对于有歌词的歌曲而言,普通听众识别歌曲还有一项很关键的因素,即歌手的声线。这是歌手的价值所在,而这一特征从歌手的艺术生涯开始就已经定型。
因此,对于 AI 音乐而言,可以使用的特定艺术家训练数据更一致也丰富,更容易使得 AI 音乐作品更「真实」。由此带来的结果是,如果说图文 AI 模型还追求一定的「求同存异」,那么 AI 翻唱作品可能更倾向于「趋同」。
三、AI 翻唱作品的可版权性
早在 2019 年,我国北京互联网法院就已经宣判「全国首例」涉及 AIGC 作品的争议——北京菲林律师事务所与北京百度网讯科技有限公司侵害署名权、保护作品完整权、信息网络传播权纠纷案。2 这个案件在国内首次对 AIGC 作品的著作权进行了司法认定,也首次对 AIGC 作品的属性和权益归属做出了回应。
本案一审判决指出:
- 关于 AI 能否成为著作权的主体:现行法律规定文字作品应由自然人创作完成。虽然随着科学技术的发展,计算机软件智能生成的此类「作品」在内容、形态,甚至表达方式上日趋接近自然人,但根据现实的科技及产业发展水平,若在现行法律的权利保护体系内可以对此类软件的智力、经济投入予以充分保护,则不宜对民法主体的基本规范予以突破。自然人创作完成仍应是著作权法上作品的必要条件。
- 关于自然人在 AI 创作中的地位:本案围绕的 AI 分析报告,生成过程有两个环节有自然人作为主体参与,一是软件开发环节,二是软件使用环节,但开发者和用户均不应成为该分析报告的作者:
- 软件开发者(所有者)没有根据其需求输入关键词进行检索,该分析报告并未传递软件研发者(所有者)的思想、感情的独创性表达,故不应认定该分析报告为软件研发者(所有者)创作完成。
- 软件用户仅提交了关键词进行搜索,应用「可视化」功能自动生成的分析报告亦非传递软件用户思想、感情的独创性表达,故该分析报告亦不宜认定为使用者创作完成。
- 关于数据库在 AI 创作中的地位:分析报告系威科先行库 [一个法律信息数据库] 利用输入的关键词与算法、规则和模板结合形成的,某种意义上讲可认定威科先行库「创作」了该分析报告。由于分析报告不是自然人创作的,因此,即使威科先行库「创作」的分析报告具有独创性,该分析报告仍不是著作权法意义上的作品,依然不能认定威科先行库是作者并享有著作权法规定的相关权利。
简单而言,法院的观点是:人工智能软件自动生成内容过程中,软件研发者(所有者)和使用者的行为并非法律意义上的创作行为,相关内容并未传递二者的独创性表达。因此,二者均不应成为人工智能软件自动生成内容的作者,该内容也不能构成作品,不具备著作权。3
但值得比较的另一个案件是「广东省首例人工智能著作权纠纷案」——深圳市腾讯计算机系统有限公司诉上海盈讯科技有限公司侵害著作权及不正当竞争纠纷案。
深圳南山区法院在判决中认为:涉案文章是否构成文字作品的关键在于判断涉案文章是否具有独创性,而判断步骤应当分为两步:
- 首先,应当从是否独立创作及外在表现上是否与已有作品存在一定程度的差异,或具备最低程度的创造性进行分析判断;
- 其次,应当从涉案文章的生成过程来分析是否体现了创作者的个性化选择、判断及技巧等因素。
法院进而认为:从以上角度分析,该文章的特定表现形式及其源于创作者个性化的选择与安排;同时,智能写作助手软件在技术上「生成」的创作过程,满足著作权法对文字作品的保护条件。因此,认定涉案文章属于我国著作权法所保护的文字作品。4
尽管两案的判决结果不同,但在判断是否构成作品并具备可版权性的关键因素的考量上,两家法院并无二致,即人类在相关作品的生成过程中所做出的贡献。
按照我国著作权法第二条规定,著作权人包括作者及其他依法享有著作权的自然人、法人或者非法人组织,显然在我国现行著作权法的框架下,作者被限定为自然人、法人及非法人组织,没有给 AI 的作者身份留有空间。因此,AIGC 的版权问题的关键仍然是围绕着「人类 + 独创性」的基本思路展开。
如何将这一框架应用到 AI 音乐作品?AI 翻唱作品本质上具有同质性:创作者通常是将大量目标歌手的声音数据「投喂」给 AI,目的是为尽可能将 AI 训练到生成的音乐作品声音与真实歌手声音尽可能相同;生成的 AI 翻唱作品从形式上而言,均是呈现出某一歌手演唱了一首未曾演唱过的歌曲。
从著作权法的角度而言,歌曲的表达系由歌词和曲谱构成,而 AI 翻唱的本质仅是 AI 将歌手声音与歌曲伴奏结合,并无新的歌词和曲谱产生,即对已有作品进行表演,未改表作品的表达,5因此难谓产生了新的作品;从权利类型上看,至多进入了邻接权中表演者权的范畴。
但问题在于,通过 AI 生成的翻唱作品,AI 是这一翻唱作品的表演者吗?目前而言,恐怕很难得出肯定的结论。
四、AI 翻唱作品的著作权侵权问题
基于 AIGC 的著作权侵权问题,理论和实务界开始探寻 AIGC 是否适用合理使用(fair use)的问题。我国《著作权法》在第二十四条对于合理使用采取的是有限列举的方式,并不包括涉及 AIGC 领域的使用。因此,AI 内容创作者不能直接援引合理使用作为其著作权侵权的例外条款,至少需要额外说理。
实际上,AI 翻唱作品所涉及的音乐版权领域,版权的具体类型比图文更加复杂,额外涉及表演者权、录制者权、广播组织权等邻接权。不仅如此,音乐作品涉及的主体也更多:除了词曲作者、演唱者,还涉及为歌曲发行提供录制环境和宣发服务的唱片公司。此过程中本就涉及多方权利的相互交织,在面对 AI 翻唱时,纠葛显得更为突出。
AI 翻唱作品的生成需要依托于海量声音数据,通过对歌手声音的学习、强化学习从而输出内容,显然这一生成过程及其生成结果均存在着著作权侵权风险。
一方面,AI 训练过程中,使用某一歌手的作品若未经权利人许可、支付相应许可使用费,则会陷入侵害音乐作品作者和其他相关权利方权利的困境之中。以 AI 孙燕姿唱《水星记》为例,AI 在训练过程中需要通过孙燕姿的大量音乐作品训练 AI 学习孙燕姿的声音模型,使用孙燕姿的音乐作品若没有取得相关版权方的许可则存在侵权风险,但和其他类型作品不同在于,AI 翻唱最终生成的作品一定程度上并不能体现原始训练数据的使用,这对于版权方的维权可能是一个技术层面需要解决的问题。
另一方面,更为隐蔽的问题是,若 AI 通过分析学习后生成的内容与原始作品过于相似,以至于可能会误导公众或混淆原始作品来源。如当前热门的 AI 孙燕姿唱《水星记》,但事实上孙燕姿并未演唱过《水星记》,不仅会引发公众的混淆,也可能使孙燕姿因未经许可翻唱他人作品招致他人的权利主张,这种情况下无论对于被 AI 的音乐人还是被演唱的作品作者而言,追究 AI 翻唱作品真正创作者的的维权门槛又高了一个台阶。
五、AI 翻唱作品的人格权侵权问题
从传统民法问题角度,AI 翻唱作品也可能涉及人格权侵权等问题。
如上所述,AI 翻唱作品走红的一大原因就在于它太像歌手本人所演唱,这也就意味着普通公众难以分辨 AI 模拟与真人之间的声音区别。除了版权问题,这也会引发深度伪造(Deepfakes)的风险——利用 AI 制作虚假的文本、音频、视频等内容,这若被恶意利用可能会被用于生成虚假信息、使用模型模拟个人语言或行为模式,引起公众混淆、扰乱社会秩序,也会给声音权人带来「背锅」侵权的风险。
对此,我国民法典 1023 条规定,「对自然人声音的保护,参照适用肖像权保护的有关规定」。参照民法典第 1018 条和 1019 条的规定,未经声音权人的同意,他人不得制作、使用、公开其声音。这一原则性的规定,使声音权人在面对 AI 翻唱作品的维权上具备除著作权侵权保护之外的第二条路径,并且更有利于从根源上杜绝内容创作者通过 AI 未经同意利用声音进行创作。
六、立法展望和结语
中国是最早就 AIGC 作品进行立法监管的国家之一。2022 年 11 月 25 日,国家互联网信息办公室、工业和信息化部以及公安部联合颁布了《互联网信息服务深度合成管理规定》,已于今年 1 月 10 日开始实施。该规范旨在对深度合成类 AIGC 进行监管,包括如虚拟偶像、AI 换脸、定制表情、声音复制、音乐合成、类人创作等,自然包括了 AI 翻唱作品。但是,该规定并未提出对 AI 翻唱作品和其他作品的区分。
而更近的《生成式人工智能服务管理办法(征求意见稿)》发布于 2023 年 4 月 11 日,针对热门话题的 ChatGPT 等生成类人工智能应用提出了一系列合规性的要求。《办法》将服务形态和规制的活动描述为「研发、利用生成式人工智能产品,面向中华人民共和国境内公众提供服务的」,而其中的「生成式人工智能」则指「基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术」;显然,AI 翻唱作品也将受其覆盖。
在当前立法背景下,AIGC 相关企业应当遵守《互联网信息服务算法推荐管理规定》以及《深度合成管理规定》等相关法律法规的规定,在不远的将来还会加入《生成式人工智能服务办法》中所规定的合规要求。
但法律总是滞后于社会发展的,AIGC 的广泛发展带来的是远超出立法者预设、制度有效供给的超前问题,无论是对于内容创作者,还是 AIGC 领域企业而言,在没有明确实施规则可以遵守的情况下,更加需要谨慎面对 AIGC 可能带来的法律风险,做好合规应对,警惕那片「索拉里斯星的海」,避免在技术爆炸中迷失发展方向、逾越合规红线。