生成式人工智能的若干著作权问题与“善治”-中国知识产权杂志

生成式人工智能的若干著作权问题与“善治”

孙逸涵 China IP

生成式人工智能作为一种高级智能的科学技术，也难逃其两面性，已有多个国家和地区开始叫停该技术的使用。近日，我国《生成式人工智能服务管理暂行办法》出台，引发了广泛的讨论。其中，生成性人工智能所涉及的著作权问题与“善治”问题再次成为热点话题。

近年来，随着科技的发展，各行各业都进入了数字化时代，而人工智能又俨然成为了各行业数字化转型的重要工具，并被广泛应用。以ChatGPT为首，生成式人工智能在日常学习办公、平面设计、客户支持等方面都被采纳运用，并有着出色的表现。

然而，生成式人工智能即使作为一种高级智能的科学技术，也难逃其两面性。尽管生成式人工智能的应用率在全球飞速提高，但已有多个国家和地区开始叫停该技术的使用。近期，欧盟就将ChatGPT、Dall-E等内容生成式人工智能列入高风险人工智能范围清单，而意大利则宣布在全国范围内禁用ChatGPT。这些国家和地区对于生成式人工智能技术的警觉，显示出其对该技术可能带来的诸多影响的担忧。

近日，《生成式人工智能服务管理暂行办法》的出台，引发了广泛的讨论。其中，生成性人工智能所涉及的著作权问题与“善治”问题再次成为热点话题。

生成式人工智能生成之物是作品吗？

所谓生成式人工智能，是指基于算法、模型、规则等，在没有人为直接参与的情况下，自动生成文本、图片、视频等内容的技术。整个生成式人工智能的运行机制，就是以一定的数据库、语料库作为素材，通过训练模型来学习并预测数据的概率分布，并形成新的成果。

生成式人工智能作为一种新事物，其相关法律规定尚不十分明确，就立法而言，对生成式人工智能的相关概念进行法律定性，是保护或规制该技术的重要前提。然而，与生成式人工智能相关的诸多概念的理解，在学界内目前仍存在一定的争议。

第一个热点问题是生成式人工智能生成物的法律性质。生成式人工智能生成物能否被视为作品而享有著作权？放眼世界，相关案例已并不罕见。今年2月21日，美国版权局回应称，漫画作品《黎明的查莉娅》中使用生成式人工智能绘画工具Midjourney所生成的部分，将被剔除出版权保护范围。同年3月，美国版权局更是在《联邦公报》上发布了针对生成式人工智能生成材料的作品版权登记指南，再次重申了版权保护中的作者只能是人类这一基本立场。而在我国，也已出现多起相关案件。2020年，在北京某律师事务所与北京某科技有限公司著作权纠纷案中，北京互联网法院一审和北京知识产权法院二审均认为，作品应当由自然人直接创作完成，人工智能生成物不论多么接近作品，都不可能符合作品的构成要件，因而不受《著作权法》保护。而在另一起几乎同期发生的著作权纠纷案中，深圳市南山区人民法院则持相反态度，认为原告的文章虽非由自然人直接创作完成，但其工作人员在作品生成过程中参与了语料设定、数据类型输入、文章框架模版选择等工作，这些均体现了原告工作人员的创作，故涉案文章应作为作品得到著作权保护。从上述案件的处理结果可以推知，世界各国对于生成式人工智能生成物能否被视为作品而享有著作权的问题，尚未作出直接、明确的立法规定，各官方机构的理解也未能取得一致，甚至还出现了部分的冲突。

中国科学院大学知识产权学院副教授尹锋林对该问题进行了深度剖析并提出了自己的观点。尹锋林认为，该问题首先必须要讨论生成物在形式上是否存在独创性的问题。根据我国立法，著作权保护的必须是人类独立创作的作品，而在传统以自然人为创作主体的作品中，凡独立创作而成的，即使与在先作品具有相似性，仍可作为著作权保护的对象。但是，如今生成式人工智能的出现增加了这个问题的复杂性。对于生成式人工智能来说，其生成物是根据先前的语料形成映射后产生的。在这种情况下很难认为使用者是在独立于先前作品即语料的前提下进行的创作，因而需要比较生成物与在先作品是否存在不同以进行独创性判断。只有二者区别度到达一定程度，我们才认为具备独创性。然而，在确认具备形式上的独创性后，对于进一步确认相关生成物是否受到著作权保护这一问题，学界又存在一定的分歧——否定说认为，该生成物并非人类所创造，不能表达人类的情感、思想、判断，因而无法取得著作权；而肯定说认为，具备形式上独创性的生成式人工智能创作物，对于人类文化成果仍有贡献，应享有著作权。针对这一问题，尹锋林指出，目前的人工智能生成物虽然主要依赖算法生成，却也离不开人类的判断和选择。根据目前的技术条件，生成式人工智能并不具有独立的意识，不能独立进行创作，因此，这一类生成物的产生本质上源自于使用者操作、判断和选择，应受著作权保护。同时，对于人工智能的使用者（提示词输入人）也可以被认定为作者而享有著作权。当然，在某些特殊情况下，如腾讯机器人Dreamwriter案中，由于相关选择、判断及提示词、控制参数的设计和输入是由单位组织安排、并由多名员工完成，因此，人工智能生成物如果具有形式上的独创性，也可以被认定为单位作品或职务作品。不过，尹锋林也表示，随着技术的发展，并不能排除人工智能在将来也可能完全自主地形成智力成果，只是目前基于现实技术水平去讨论这个问题，为时尚早。

对外经贸大学法学院教授、博士生导师卢海君认为，如果人工智能的生成物可以通过原创性检验，就可以被认定为作品，与其他普通作品一样获得著作权保护。同时，卢海君也认为，目前，我国《著作权法》并没有否定人工智能生成物作为作品受到著作权保护的可能性。人工智能生成内容的过程中存在诸多人的因素，包括算法设计、数据训练等，将人工智能生成内容视为“人”的智力成果并不为过。世界范围内对人工智能及其生成物进行法律监管未来将成为趋势，而具体监管方法则有待探索。

生成式人工智能的训练、学习过程是否应当付费？

生成式人工智能的运行离不开训练、学习，这个过程常常需要从语料库、数据库中抓取大量数据作为素材，也会涉及他人的知识产权。那么，当语料库、数据库的著作权归属于他人时，生成式人工智能的学习、训练行为又是否应当支付相应的费用呢？

卢海君表示，在国际范围内，越来越多的国家和地区在法律中倾向于将非商用的文本数据挖掘（TDM）作为著作权合理使用的场景之一，但具体细节规定上尚未统一。比如，英国《版权法》29A条款规定了限定场景下文本与数据挖掘的合理使用。欧盟《数字化单一市场版权指令》规定，文本数据挖掘在非商业的科学研究中可以构成合理使用，同时著作权人可以对合理使用提出保留，即在著作权人反对的情况下，其作品不得被文本数据挖掘。浙江大学光华法学院教授张伟君则将人工智能学习的过程与自然人的个人学习过程之性质进行类比，认为虽然目前我国强调加强著作权的保护，但也不能因此完全排除对出于人工智能学习、训练目的的数据挖掘行为适用合理使用条款的可能性。

然而，人工智能学习与自然人个人学习的最大区别，在于人工智能的文本数据挖掘通常是商业性质的，且通常会直接产生新的利益、价值。此时，是否应当对于人工智能所使用素材的著作权人进行一定的补偿？卢海君指出，数据具有二元性，既是信息，又是信息的载体。数据之上的信息可以受到一定程度的法律保护，但作为载体的数据应与其承载的信息相区别。

在数据挖掘问题上，应关注数据本身而非其所承载之内容。企业在进行数据挖掘时，可根据数据的价值付费；如果想拥有更优质的数据，开发者可以购买各种数据包，以开发出更具有竞争力的人工智能产品。而在未来，或许可以打通平台之间的版权保护通道，利用一定的技术措施，投入至共有的版权池中，并通过一定的付费机制进行获取。

但是，在市场自发性特点的影响下，一些企业可能为了降低开发成本，通过特殊渠道免费获得他人的付费数据包。此时，这些数据包的权利人能否要求获得法律救济？张伟君认为，此类案件在实践过程中将面临可行性问题。首先，如何保证用于生成式人工智能产品的预训练、优化训练数据的信息透明和披露？如果数据信息是不透明的，权利人都无法知晓自己的作品已经被用于AI训练了。其次，AI训练中对数据的使用，是否实施了著作权法意义上的作品复制行为？而在一个具体的个案中，如果著作权人要向生成式人工智能产品的提供者主张权利，起码一要证明其训练中使用的数据包含了自己享有著作权的作品，二要证明这种使用方式构成了对其作品的复制或者说将其作品固定在某个载体上。而著作权人要提供这样的证据，目前来看起码在多数情况下会是非常困难的。随着生成式人工智能运用范围的不断扩大，立法在权利平衡、设置以及整个制度设计及落实等方面，还需全面衡量。

生成式人工智能涉嫌违法犯罪，责任谁来担？

生成式人工智能大受欢迎的原因在于其自动性，能够减少许多领域的人力成本。然而，生成式人工智能给社会秩序带来的最大挑战，也恰恰源于其自动性。在生成式人工智能生成物涉嫌侵权或违法犯罪时，生成式人工智能系统本身并不具备责任承担的基本资格和能力，这时就可能出现责任主体认定困难的问题。

卢海君认为，要对人工智能进行善治，防范其滥用导致的一系列侵权或违法犯罪问题，生成式人工智能服务提供者对于算法及算法生成物应该尽到善良管理人的责任。从版权角度来说，既然人工智能生成物并不是新类型作品，也需要与普通作品一样接受原创性检验，那么，对于人工智能生成物的版权侵权判定也应该遵循“接触+实质性相似”法则。机器学习的特点是大范围地涉猎作品并进行分析，因此，人工智能生成物对于在先作品的“接触”应原则上认为成立，除非人工智能服务商提供相反证据；而在实质性相似的判定上，对于公有领域的排除要格外审慎。对于侵权责任，卢海君指出，人工智能和用户间的责任分担可首先依据用户协议调节。此次出台的《办法》第9条就要求人工智能服务商与使用者签订协议以明确双方的权利义务边界，这可以作为约定之版权分配的先声。一般来说，按照责任权利相一致原则，如果发生版权侵权，谁据有内容权利并享受内容收益，谁就应承担内容侵权责任。另一方面，当人工智能生成违反法律法规和损害国家安全的相关内容时，生成式人工智能服务提供者应承担相应责任。《办法》对生成式算法服务提供者赋予了《网络信息内容生态治理规定》第六条、第七条中规定的网络信息内容生产者[1]的责任，同时要求其履行《网络安全法》第二十一条规定的网络信息安全义务；涉及个人信息的，依法应承担个人信息处理者责任[2]、履行个人信息保护义务。

张伟君则指出，生成式人工智能的整个分析、生成过程属于私域行为，并不具有涉他性，没有必要对其进行管理；所有的不良后果，不论是侵权或是违法犯罪，实则都发生在传播阶段。因此，当不良生成物被传播并造成一定的不良后果时，应当对传播者追究相应的法律责任。但在实践中，生成者与传播者往往具有同一性。张伟君同时表示，对于生成式人工智能自动生成的违法犯罪信息并不需要过度担心，因为基于目前我国高效且严格的网络执法模式，大多数涉及违法犯罪的不良信息都会在短时间内被屏蔽或取缔。

（对外经贸大学法学院博士研究生徐朗对本文亦有贡献）

注释：

《网络信息内容生态治理规定》第41条：“网络信息内容生产者，指制作、复制、发布网络信息内容的组织或者个人。”
《个人信息保护法》第73条：“个人信息处理者，是指在个人信息处理活动中自主决定处理目的、处理方式的组织、个人。”

免责声明：凡本网注明"来源：XXX（非中国知识产权杂志出品）"的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件，意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布，可与本网联系，本网视情况可立即将其撤除。新闻纠错：13621279650 13621252760，邮箱：chinaip@chinaipmagazine.com

2023年6月（总第196期）

文章排行

生成式人工智能的若干著作权问题与“善治”

总第196期,孙逸涵 China IP发表,[版权]文章

会员留言

全球知识产权服务机构
查询及评价系统

文章检索

专访

在线调查

据悉，正在修订中的《专利法》四修，拟将恶意侵权专利赔偿额度从原有的最高三倍上限调整到最高五倍，五倍赔偿已经是目前世界上最高的赔偿额度，对此，你有什么看法？