AI模型训练使用作品的合理使用分析-中国知识产权杂志

AI模型训练使用作品的合理使用分析

刘维上海交通大学凯原法学院副教授

王书琪上海交通大学硕士研究生

摘要：本文通过回顾美国法院关于转换性使用理论的发展，在此情境中预测A I模型训练使用作品的侵权风险，并具体分析我国合理使用制度在A I模型训练场景中的适用困境及完善策略。

自2022年11月30日美国OpenAI公司发布ChatGPT人工智能对话系统以来，关于人工智能公司在没有付费的情况下使用他人数据训练模型是否构成侵权的讨论层出不穷。美国OpenAI和StabilityAI相继受到起诉，被指控未经权利人许可获取与利用版权作品训练AI。我国知名教育机构“学而思”也受到指控非法获取神笔作文服务器上的数据用于AI模型训练。

为规范生成式人工智能的发展，国家互联网信息办公室等七部门公布了《生成式人工智能服务管理暂行办法》（以下简称《办法》）。该《办法》第7条规定生成式人工智能服务提供者应当使用具有合法来源的数据和基础模型，不得侵害他人依法享有的知识产权。然而，生成式人工智能的发展依赖于对海量数据的获取、分析和学习，其中不可避免地包含大量受著作权法保护的作品，相关的著作权侵权风险值得业界关注。

AI模型训练使用作品之侵权风险及应对策略

AI模型训练使用作品之侵权风险

AI模型训练是指使用海量数据来训练人工智能，使其具备完成特定任务或解决问题的能力。在著作权视角中，AI模型训练可以被分解为三个环节：（1）作品获取环节；（2）作品输入及学习环节：包括预处理数据（将数据转化为机器能理解的语言）、数据转化（根据算法和具体问题对数据进行转化）、训练算法、测试算法、应用强化学习；（3）作品输出环节[1]

机器学习不同于人类学习。以自然语言学习为例，人类在掌握一门新语言的过程中，通常将相关信息（如学习该门语言的教科书）转化为电化学痕迹储存于大脑相关区域。而机器学习的过程需要制作多份原始文件的临时副本，这些副本由算法进行分析，并将不同类型算法的分析结果记录在模型当中。[2]

AI模型训练的三个阶段均存在著作权侵权风险。在作品获取环节中，使用网络爬虫抓取网络环境中数字作品的过程中，违反robots.txt文件抓取作品可能构成不正当竞争。AI企业未经著作权人同意，将纸质媒介上的作品数字化用于对AI模型进行训练以实现其商业目的，可能侵犯著作权人的复制权。

作品输入及学习环节通常涉及对作品的复制、翻译、改编、汇编等行为，也存在著作权侵权风险。本文讨论的“使用作品”，主要就集中在作品输入及学习环节。

作品输出环节中， AI模型最终输出的产品可能与原作品构成实质性相似，进而构成对原作品著作权人的侵权。

AI模型训练使用作品侵权困境之出路

我国《著作权法》规定的传统许可模式，不适用于AI模型训练使用作品的情形。一方面，AI模型训练以海量数据为基础，如果就每一个作品获取授权、支付费用，将会产生巨量的成本，不利于人工智能的研发与应用。另一方面，部分企业可能会选择在构成侵权的情况下依然使用他人作品，加之AI模型训练过程中使用的数据具有隐蔽性，权利人发现侵权的成本较高，从而使得法律保护形同虚设。[3]出于社会对知识和信息传播的需要，我国《著作权法》在赋予作者有限垄断权的同时，允许他人在特定条件下不经作者同意而使用作品，此即合理使用制度和法定许可制度。有观点认为，将合理使用制度用于机器学习违背了公共利益和平衡精神，而法定许可制度则可以同时实现正义和效率的价值追求。[4]也有观点认为，法定许可制度及其配套措施的落实存在难度，采用合理使用规则可能是实现利益最大化的最佳选择。[5]

笔者支持上述第二种观点。下文将首先回顾美国法院关于转换性使用理论的发展，在此情境中预测AI模型训练使用作品的侵权风险，并具体分析我国合理使用制度在AI模型训练场景中的适用困境及完善策略。

Campbell案以来美国转换性使用理论的发展

美国法院自Campbell v. Acuff-Rose Music案以来不断扩张转换性使用的适用范围。一方面，转换性使用理论在现代法院中愈来愈占据主导地位。1990-2017年，美国法院有90%的合理使用案件包含了转换性使用；在所有支持转换性使用的案件中，有94%最终得出了合理使用的结论。另一方面，转换性使极大地削弱了四要素检验法在合理使用中的作用，几乎成为合理使用的代名词。[6]与此同时，由于“转换性”的内涵具有高度抽象性，转换性使用理论的适用出现了“滑坡现象”（slippery slope phenomenon）：法官通过类比推理对转换性的定义进行延申，其判断标准也逐渐从创作作品本身具有转换性，扩张为只要求使用行为具有转换性。在Campbell案中，法官确认了“讽刺性模仿”（Parody）具有转换性[7]，随后下级法院扩大了该范围以涵盖针对原作主题、作者、社会环境等元素的讽刺或批评。而在Cariou v. Prince案中，法官则更进一步把将原作品作为创造新表达的原材料而不对其进行评论的行为，也认定为具有转换性。该案中，美国联邦第二巡回上诉法院认为，Prince的作品相较于Cariou的原作品更加“狂热和挑衅”，与Cariou的原作品描述自然美的风格展现出完全不同的审美，因而构成转换性使用。[8]

这种滑坡现象不仅出现在艺术领域，在“中间复制”（intermediate copying）中也屡见不鲜。中间复制是指制作一般公众无法获得的原始作品副本作为开发不同产品的中间步骤。如在Connectix案中，法院认为，为逆向工程而制作的中间副本具有转换性。[9]此后，法院又将“中间复制”行为的认定范围扩展到搜索引擎中。在Kelly诉Arriba Soft案和Perfect10诉Amazon案中，法院认为，被告擅自在搜索结果中展示原告照片缩略图的目的在于提高用户搜集信息的效率，相较于原图为人们带来的美学体验具有目的上的转换性。[10]在美国作家协会诉谷歌图书馆案中，法院认为，Google创建作品的完整数字副本和允许读者搜索作品片段的目的，是创建一个有益的搜索引擎和数字图书馆，相较于原作品具有高度转换性。[11]在甲骨文与谷歌案中，法院认为，谷歌采用并改造Java API的目的是扩展基于Android的智能手机的实用性，创建一个程序员可以轻松使用的新平台，属于转换性使用。[12]这一判决对甲骨文公司造成了经济上的损失，但正如多数学者所承认的那样，如果在计算机软件领域采用严格的转换性使用标准，软件重组几乎永远不会是转换性的。为了促进技术快速发展，法院应该在该领域对转换性使用采用灵活的解释。[13]

美国法院比以往任何时候都更多地适用转换性原则，这种扩张引起了美国学界的担忧。有观点指出，转换性使用使得利益天平向使用人过度倾斜。[14]也有观点认为，转换性使用理论总体上有利于合理使用制度的积极发展，但法院应当意识到在某些情景下（如现代艺术）不适合采纳转换性使用。[15]Cariou v. Prince案因在确定合理使用时过分重视转换性使用，受到了学术界和其他法院的批评。批评意见认为：其一，如果每一种转换性使用都构成合理使用，法律对衍生作品的保护将被架空；其二，转换性使用要求法官判断使用行为是否向原作品中注入了新的意义，但艺术本身具有极强的主观色彩，由法官扮演艺术批评家的角色做出审美判断，将会阻碍艺术的发展。[16]

在安迪·沃霍尔著作权侵权案中，法院认为并非所有在原作品中增加新的美感或新的表达的行为都属于转换性使用（如由小说改编的电影属于衍生作品）。二次使用如果与原作品的使用目的高度相似且具有商业性质的，不能构成合理使用。该案中，被告请求法院考虑谷歌诉甲骨文案对本案的影响。但法官认为，由于谷歌诉甲骨文案涉及计算机代码（一种主要的功能性书写形式），因此谷歌在该案中的主张不太容易适用于存在艺术表达问题的版权法其他领域。[17]

AI模型训练使用作品对我国著作权法的挑战及应对

我国合理使用制度的立法现状和司法实践

不同于美国的“开放式”规定，我国对合理使用制度采用“半封闭式”立法。《著作权法》第二十四条规定了三步检验法：第一步，限定合理使用制度的适用情形，即《著作权法》第二十四条规定的12种情形和其他法律、行政法规规定的合理使用情形；第二步，“不得影响该作品的正常使用”；第三步，“不得不合理地损害著作权人的合法权益”。后两步从正反两面进一步限定了合理使用的范围。这种“半封闭式”立法模式增强了法律的确定性，但也增加了将AI模型训练使用作品纳入合理使用范畴的难度。理论上，存在两种解决办法：一是援引美国的转换性使用理论，扩大解释合理使用的范围；二是创造一种新的合理使用情形。

我国司法实践中通常通过《著作权法》第二十四条中的“适当引用”条款来引入转换性使用，但该条款有两个限制条件：一是目的要件，即要求引用是为了“介绍、评论某一作品或者说明某一问题”；二是适当要件，即“适当引用他人已发表的作品”。

对此，有观点认为，我国《著作权法》不应照搬美国的转换性使用理论，而应通过“适当引用”的两个要件对其进行限制[18]。我国法院对于转换性使用理论的引入同样持保守态度，如在王莘诉谷翔、谷歌案中，法院仅认为谷翔公司向用户提供作品片段的行为构成合理使用，而其未经允许数字化他人作品全文的行为则侵犯了原作者的复制权。[19]这种保守态度不利于AI模型训练使用作品的合理化，“适当引用”也无法涵盖转换性使用的所有情形。应当将转换性使用理论和四要素检验法一起作为我国“三步检验法”的补强适用规则。[20]

转换性使用理论的本土化

由于转换性使用理论本身具有较大的不确定性，以此作为“三步检验法”的补强解释，将赋予法官极大的自由裁量权，动摇法律的稳定性。如在黑猫警长案中，法院认为，被告引用原告作品使其原有艺术价值和功能发生了转换，且转换程度较高，构成合理使用。[21]但在福禄篇侵权案中，法官严格区分了恶搞趣味创作与讽刺性模仿，认为原告以恶搞方式演绎《葫芦兄弟》构成侵权。[22]因此，有必要从美国司法实践中总结出转换性使用规则的一般适用规律，为我国法院在司法实践中引入转换性使用规则提供明确判断标准。

通过以上关于美国法院案例法的梳理，可以得出以下两点启示。

第一，区别艺术领域和科技领域。法院在艺术领域和科技领域对转换性使用规则的适用采取了不同立场。在艺术领域，法院在认定作品使用行为的性质时更倾向于保护作者利益；而在科技领域，法院则对创新利益赋予更高的权重。如果这一观察准确的话，则AI模型训练场景中使用作品的行为可能对使用者更为有利。

第二，区别目的转换和内容转换。Campbell案确立了转换性的经典定义，即要求目的转换和内容转换，具体判断标准为：“新作品是否只是取代了原创作的对象，还是增加了新的内容，有了新的目的或不同的特征，以新的表达方式、意义或信息改变了原作品。”理论界和实务界一直存在着“内容性转换”和“目的性转换”的区分，但对其定义并未达成共识。有观点认为，内容性转换是经典的转换性使用，指以批评、评论或再创造的方式改变原作品的内容，其典型代表是“挪用艺术”系列案件；目的性转换则更受争议，其指出于不同使用目的直接使用原作品而不对其内容进行改变，典型代表是“搜索引擎”系列案件。[23]也有观点认为，内容性转换不具有正当性，因为著作权法只保护“表达”而不保护“思想”；目的性转换则可以区分为改变内容的目的性转换和未改变内容的目的性转换，“挪用艺术”系列案件实质上是内容转换和目的转换的结合，即改变内容的目的性转换。[24]笔者赞同上述第二种观点，因为以不同表达方式阐述同一思想的行为，本就不在著作权法的规制范围内；只有当使用行为对表达方式（或内容）的改变较小或完全无改变而构成著作权侵权时，才需要通过目的性转换来抗辩。著作权最终服务于社会利益，因此公共利益是判断转换性程度的关键。[25]使用行为越有助于实现著作权法所保护的批评、评论、新闻报道、教学研究等公益

目的，就越具有转换性，越不可能减损原作品及其可能衍生品的市场价值。在AI模型训练使用作品场景下，AI企业的使用行为具有促进科技发展的公益价值，因此可能纳入合理使用范畴。

此外，对于我国而言，目前最为可行的方案可能是在制定《著作权法实施条例》的过程中创设一种新的合理使用情形，允许人工智能研发企业出于训练AI模型的目的，不经著作权人同意复制、翻译、改编、汇编其作品。

结论

随着数字化时代的到来，基于生成式人工智能技术，已经产生了智能对话、内容生产、语音合成等多种应用，对各行各业带来了巨大冲击。《办法》以“促进生成式人工智能健康发展和规范应用”为首要目标，回应了科技发展带来的法律问题。在我国，《办法》没有明确规定AI模型训练过程中合理使用作品的情形。司法实践中，可行的办法是引入美国的转换性使用理论对《著作权法》第二十四条进行扩张解释。但转换性使用理论具有不确定性，为避免“同案不同判”和“法官造法”现象频发，应当及时创设一种新的合理适用情形，以促进人工智能技术的发展。

注释：

[1]Khanna, Rahul, and Mariette Awad. Efficient Learning Machines: Theories, Concepts, and Applications For Engineers and System Designers. Berkeley, CA: Apress, 2015，p.1-4.

[2]Thomas Margoni, “Artificial Intelligence, Machine learning and EU copyright law: Who owns AI? ” Create Working Paper, 2018, p.2.

[3]焦和平.人工智能创作中数据获取与利用的著作权风险及化解路径[J].当代法学,2022,36(04):128-140.

[4]高阳,胡丹阳.机器学习对著作权合理使用制度的挑战与应对[J].电子知识产权,2020(10):13-25.

[5]焦和平.人工智能创作中数据获取与利用的著作权风险及化解路径[J].当代法学,2022,36(04):128-140.

[6] Jiarui Liu. An Empirical Study of Transformative Use in Copyright Law[J]. Stanford Technology Law Review, 2019(22):167.

[7] Campbell v. Acuff-Rose Music, Inc., 510 U.S. 569 (1994).

[8] Cariou v. Prince, 714 F.3d 694 (2d Cir. 2013).

[9] Sony Comput. Entm’t, Inc. v. Connectix Corp ., 203 F.3d 596 (9th Cir. 2000)

[10] Kelly v. Arriba Soft Corp., 336 F.3d 811 (9th Cir. 2003) ；Perfect 10, Inc. v. Amazon.com, Inc., 508 F.3d 1146 (9th Cir.2007).

[11] Authors Guild, Inc. v. Google Inc., 804 F.3d 202, (2d Cir. 2015).

[12] Google llc v. Oracle America,Inc., 593 U.S., 141 S. Ct. 1183 (2021).

[13] Margot Sheridan，OPYRIGHT LAW'S “TRANSFORMATIVE USE” DOCTRINE: CAUSING MORE HARM THAN GOOD? Summer, 2023，72 DePaul L. Rev. 867.

[14] PITINO J. Has the transformative use test swung the pendu‐lum too far in favor of Secondary Users?[J]. The Computer & Internet Lawyer, 2014, 31(3): 4-8.

[15] Clark D. Asaya1, Arielle Sloanaa1 ,Dean Sobczakaaa1,IS TRANSFORMATIVE USE EATING THE WORLD?, Boston College Law Review, March, 2020,61 B.C. L. Rev. 905.

[16] Adler, Amy. "Fair Use and the Future of Art." New York University Law Review (1950) 91.3 (2016): 559-626.

[17] Andy Warhol Foundation for the Visual Arts, Inc. v. Goldsmith, 598 U.S. (2023).

[18] 熊琦.著作权转换性使用的本土法释义[J].法学家,2019(02):124、134、195.

[19] 北京市第一中级人民法院（2011）一中民初字第1321号民事判决书；北京市高级人民法院（2013）高民终字第1221号民事判决书。

[20] 李杨.著作权侵权认定中的转换性使用理论适用阐释[J].北方法学,2023,17(03):42-56.

[21] 上海知识产权法院(2015)沪知民终字第730号民事判决书。

[22] 上海知识产权法院(2019)沪73民终391号民事判决书。

[23] 熊琦.著作权转换性使用的本土法释义[J].法学家,2019(02):124、134、195.

[24] 袁锋.元宇宙空间著作权合理使用制度的困境与出路——以转换性使用的界定与适用为视角[J].东方法学,2022(02):44-57.

[25] Woo J, Redefining the Transformative Use of Copyrighted Works: Toward a Fair Use Standard in the Digital Environment, Hastings Comm. & Ent. LJ, 2004, 27: 51.

免责声明：凡本网注明"来源：XXX（非中国知识产权杂志出品）"的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件，意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布，可与本网联系，本网视情况可立即将其撤除。新闻纠错：13621279650 13621252760，邮箱：chinaip@chinaipmagazine.com

2023年6月（总第196期）

文章排行

AI模型训练使用作品的合理使用分析

总第196期,刘维王书琪发表,[其他]文章

会员留言

全球知识产权服务机构
查询及评价系统

文章检索

专访

在线调查

据悉，正在修订中的《专利法》四修，拟将恶意侵权专利赔偿额度从原有的最高三倍上限调整到最高五倍，五倍赔偿已经是目前世界上最高的赔偿额度，对此，你有什么看法？