1. 引言
虽然学界和实务界对于人工智能生成物的作品认定以及权利归属这两个问题早已有了探讨,但是随着Chat GPT的爆火,生成式人工智能技术的进步,又为这两个问题的探讨赋予了新的时代意义。Open AI于2023年3月发布的最新人工智能模型——Chat GPT4,是继Chat GPT3之后人类在生成式人工智能领域的重大突破。Chat GPT4是一个多模态大型语言模型,在保留了Chat GPT3的文字创作的基础上,它还可以接受图像、音频等多种输入,并生成相应的输出。随着以Chat GPT为代表的生成式人工智能的应用领域的不断扩大,势必会对原有的著作权法体系造成新的冲击。那么,作为一类新生客体,其生成内容是否能构成作品,受到著作权法的保护?若能构成作品,其著作权应当归属于谁?
2. 生成式人工智能的运行原理
在探讨生成式人工智能生成内容能否构成作品及其权利归属这两个问题之前,首先要明白生成式人工智能的运行原理。以Chat GPT为例,Chat GPT底层是一款通用的自然语言生成模型,通过互联网海量的语料库训练,对语言文本进行概率建模来预测下一段输出内容的概率,从而实现根据用户输入的文字内容生成对应文字回答的功能。Chat GPT在生成内容是主要分为以下接几个阶段:第一是文本数据挖掘阶段。文本数据挖掘是处理大数据的一种技术手段,通过大量复制文本数据,从中抽取有价值的信息和知识。Chat GPT从互联网中收集到海量的自然语言文本,形成自己的语料数据库,为后续的统计、分析、学习提供素材。第二是Chat GPT学习训练阶段。Chat GPT的学习阶段主要是让AI在通用的、海量的数据上学习文字接龙,即掌握基于前文内容生成后续文本的能力。这样的训练不需要人类标注数据,只需要给一段话的上文同时把下文遮住,将AI的回答与语料中下文的内容做对比,就可以训练AI。采用大规模的文本数据集对模型进行训练,让模型逐步学习输入文本的规律。同时,通过人工标记,Chat GPT进一步训练出一个反馈模型,模拟人类的喜好对Chat GPT的输出结果进行打分,再由该反馈模型去训练Chat GPT,该过程就是基于人类反馈的强化学习。第三是创作阶段。该阶段首先是使用者将自己的意图输入,然后将训练好的模型部署到应用场景中,Chat GPT可根据训练的结果实现自然语言生成、问答等功能,并最后将结果输出。
3. 生成式人工智能生成内容构成作品的证成
生成式人工智能生成内容能否构成作品也是学界和实务界一直争论不休的问题,有观点认为生成式人工智能生成内容是人工智能创作的并不是人的创作结果,主体条件不适格,因而不构成作品[1]。也有观点当人工智能生成内容,从外观上看,它已经符合了作品的要求,并且还具有了一定的独创性,那么,它就应该被视为作品,受到著作权法的保护[2]。关于这个问题,笔者认为,由于我国是成文法国家,是否是作品,我们须回归到具体法律条文所规定的作品的构成要件上来,若是满足法定的构成要件,即为作品,否则不构成作品,也无法受到著作权法的保护。根据我国《著作权法》第三条的规定,我们可以归纳出法定的构成作品的要件有四条:属于文学、艺术和科学领域内;具有独创性;具备一定的表现形式以及属于智力成果。生成式人工智能可以根据使用人的要求生成诗歌、论文、简单的图片等多种形式,从外观形式上看是很容易满足构成要件中对形式和领域的要求,学界和实务界对作品认定的争议也主要集中在是否具有独创性和是否属于智力成果上,因此,下面主要从这两方面进行论证。
3.1. 生成式人工智能生成内容具有独创性
现有观点对人工智能生成内容的独创性的理解并不统一:有学者认为整个生成过程没有留给人工智能施展“聪明才智”的余地,缺乏个性化,因而不具备独创性的条件[3]。另一种观点则认为,评价独创性的客体是作品的已形成的表达,法律仅保护生成的结果,而不能延伸至作品的生成过程。这两种观点主要是判断的依据不同,第一种观点是依据主观标准进行判断,即源于“作者权体系”下的“作者中心主义”的独创性解读。其要求作者在思想、情感和个性层面的反映,聚焦于“智力创作”的创作过程。第二种观点则是依据客观标准进行判断,即“版权体系”下“作品中心主义”的独创性解读。其仅要求客观上的表达形式,即独立完成和不与先前作品相同。这两种判断标准主要的争议点不在创造性程度的高低,而在于创作主体是人还是人工智能。
实际上,现阶段人工智能仍处于弱人工智能时代,其仍充当着创作工具的角色,生成式人工智能也不例外。即使现阶段Chat GPT4运用了十分先进、强大的技术,但也改变不了它作为创作工具的性质。以人工智能创作工具说为基础,生成式人工智能的生成内容是否具有独创性便迎刃而解,因为从上述Chat GPT运行原理来看,其中蕴含着人本逻辑,即人在整个运行过程中发挥了决定性作用。首先是在文本数据挖掘阶段,并不是所有数据都需要被挖掘储存,也不是漫无目的的随机性选择,而是Chat GPT设计者有一定目的的选择性输入和挖掘,这也是人先前的智力投入,这对后期模型的生成起了决定的作用。其次是在学习阶段,人控制了Chat GPT学习的算法选择。在启动Chat GPT进行学习训练之前,需要事前人为设定学习的目标和基本的输出规则。在训练过程中,通过人为的反馈训练得到一个符合预定目标的模型。所以说,在整个学习阶段,人在其中发挥了重要的决定作用,得出的模型是符合人类审美取向与表达逻辑的,在一定程度上也反映了设计者的审美和价值取向。最后在创作阶段,使用者输入自己的问题,其问题这表明了他此次使用Chat GPT的意图,总的来说,我们不能孤立地去看最后输出的结果,而是需要将设计阶段和生成阶段当成一个整体来对待。在这个整体过程中,人发挥着主体作用,先前的智力投入对人工智能生成内容的和形式起着决定性的作用,在算法运行中蕴含着设计者的价值判断和选择。而人工智能没有意志自由的理性基础,更没有自己的创作意图,只能是处于一个创作工具的地位,接受人类指令被动的执行。所以说,Chat GPT输出的结果中蕴含了人格因素,主观上是符合独创性的要求的,只要其满足了客观上要求的形式问题,比如与现有作品在外观上存在明显的差异、符合大众的审美等,做到主客观相统一即可认为其具有独创性。
3.2. 生成式人工智能生成内容本质上属于人的智力成果
在认定生成内容具有独创性时,在人工智能工具说的基础上论述了人在整个过程中发挥的作用。首先,在弱人工智能时代,即使Chat GPT4已经发展的很先进了,但是无论运用了如何先进的智能生成系统,都很难否认人在其中的智力贡献和影响力,并且人的智力投入渗透到了整个过程的各个阶段。其次,人工智能是人类为了提高效率、减轻其自身的智力和体力劳动而发明出来的,在这一点上和其他劳动工具没有实质区别。人工智能内容是人将自己创作思想和意图通过人工智能这一工具进行具象化表达的一种特殊形式。所以逻辑上来说,先有人工智能,才有人工智能生成内容,Chat GPT也是如此。因此,Chat GPT生成内容看起来是由其自动生成的,但实质上都没有离开人的意志的控制,其本质上还是人利用这种特殊工具生成的人的智力成果。
3.3. 生成作品著作权法保护的例外
虽然生成式人工智能的生成内容能被认定为作品,但并不是任何满足具有独创性、可以复制等要求的生成内容都能构成著作法上的作品。著作权法第五条规定,“本法不适用于:(一) 法律、法规,国家机关的决议、决定、命令和其他具有立法、行政、司法性质的文件,及其官方正式译文;(二) 单纯事实消息;(三) 历法、通用数表、通用表格和公式。”1作为人的智力成果,Chat GPT的生成内容也要从上述列举中排除。此处要特别注意单纯事实消息,这是著作权法第三次修改时由“时事新闻”修改而来,如果生成的内容只是单纯的事实消息这并不受《著作权法》保护,但若是对事实进行整理、评论和加工则是新闻作品,能给予《著作权法》的保护。同时,人工智能的唯一表达不属于思想范畴,但它却不能被版权法保护,原因在于,如果对唯一表达给予了版权保护,那么这一领域的创作者都需要得到在先作者的授权,这将对特定领域作品的创作造成很大的限制[4]。
4. 人工智能不具有著作权法定主体资格的理论依据
即使生成式人工智能生成的内容符合要求时能构成作品,受到著作权法的保护,但是它作为人工智能并不是理所应当成为著作权法定主体。我国《著作权法》规定,著作权法定主体资格的取得有两种途径:一是通过投入智力劳动进行创作而成为主体的自然人作者;二是基于法律规定的拟制而被视为主体的法人作者[5]。下面就主要从这两个角度分析人工智能不能成为作者,即不能成为著作权法定主体。
4.1. 人工智能与自然人作者具有本质区别
人工智能与自然人最本质的区别就在于是否具有自主意识和自由意志[1]。首先,自主意识意味着能够意识到“自己”与“别人”的区别,二者是独立的个体。自然人独特的大脑拥有自主意识,能够轻而易举的明白自己与别人的差别,但是人工智能从出现就带有“人造物”的标签,即使现阶段Chat GPT4能够通过学习和理解人类语言来进行对话,但这只是经过设计者对其进行大量训练,形成模型的结果,并不是Chat GPT本身的自主意志。其次,自由意志是感性与理性的结合。人工智能只是人类创造出来的一项工具,其生成的内容都是经过精密计算之后得出的最优解,并无感性可言。同时,人工智能也无法像人类一样能够感受到快乐与痛苦等情感。因此,生成式人工智能作为人造机器是无法与自然人相比,天然地成为著作权法定主体。
4.2. 人工智能不能拟制为作者
法人人格作为一种团体人格,其在法律上得到确认经历了漫长的岁月,是法学家们通过持续的努力,将具备某些特征或要素的主体,利用法律技术设计拟制而得来。首先,在与自然人的联系上,法人比人工智能更为紧密。法人归根结底是人的集合,法人有其独立意志,并且其独立意志的表达与自然人有着紧密的联系。而人工智能并不具备独立意志,是由人类创造的独立的工具,与人的联系和法人相比不可同日而语。其次法人因为具备财产、存在时间长、且对社会有着不可替代的作用等特征而被赋予民事权利能力和民事行为能力。而人工智能不具备独立的财产,无法承担责任;存在时间短,且在现阶段无法对原有的社会关系产生翻天覆地的影响,这更无法与法人相比。Chat GPT也是如此,虽然能够快速学习、理解复杂的理念并能回答人类提出的相应问题,但目前不具备行为能力和责任能力,不能拟制为“人”,进而成为作者。
总之,在“人类中心主义”之下,“人”是社会的核心。人工智能不具备自然人的自主意识和自由意志,也不像法人一样拥有财产进而独立承担责任,不具有能赋予其主体资格的相关要素。
5. 生成作品的权利归属
当生成式人工智能的生成内容具备主客观要件且不属于《著作权法》明确列举的除外情形时便构成作品,受到《著作权法》的保护。我国《著作权法》第十一条规定,“著作权属于作者”,但生成式人工智能并不具备著作权法定主体资格,那么,该作品的著作权应该归属于谁呢?关于人工智能生成内容的著作权归属在学界一直存在争论,主要有设计者、投资者和使用者。有的学者认为不管是生成式人工智能对数据进行挖掘,还是在挖掘之后对其进行训练,都带有设计者的个人审美、价值判断等主观因素,因此应当将著作权赋予设计者;主张权利归属于投资者的学者则认为Chat GPT等生成式人工智能的投资者是人工智能开发的组织者,其投入了大量人力、物力、财力,研发失败所带来的风险也由其承担[6],因此,将著作权赋予投资者更为合理;此外,也有学者主张将权利赋予生成式人工智能的使用者,他们认为最后输出的结果与最初输入的问题有直接关系,体现了使用者的创作思想和意图,此时,生成式人工智能的输出内容与使用者的联系最密切,因此,使用者应该拥有相关作品的著作权。
关于生成式人工智能的生成内容的著作权的归属问题,笔者认为可以通过以下几个方面解决。
5.1. 重视投资者利益保护
生成式人工智能生成的作品与传统作品不同,传统作品无需大量资金持续不断地投入,对技术也没有依赖性。Chat GPT要生成作品,首先需要大量人力、物力、财力进行研发,然后通过研发而来的Chat GPT生成作品,并且,随着Chat GPT的更新换代,需要的数据将会更多,其需要的资金投入也会更多。因此,投资者在生成式人工智能领域占据着十分重要的位置,不能轻视甚至忽视对投资者利益的保护。但是,将著作权赋予投资者并不太妥当。通常情况下,使用者通过付费获得生成式人工智能的许可使用,这就在投资者和使用者之间构成了一种合同之债,在这种合同的基础上,投资者的利益可以得到一定程度的补偿,对于人工智能生成作品的版权归属,可以采用允许当事人约定等方式来解决,或者法律可以赋予投资者著作权以外的权利来填补其利益空缺。因此,在版权归属问题上,如果直接将著作权归属于投资者,则是不合理的。
5.2. 以实质贡献为标准
作品的著作权归自然人、法人或非法人组织所有。就Chat GPT而言,参与其创作过程的自然人主要有Chat GPT的设计者和使用者,如何在二者之间确定生成作品的著作权需要看在创作过程中,二者对于作品生成的实质贡献。
5.2.1. 实质贡献大小能合理区分
若设计者和使用者的实质贡献大小能明显区分,作品的著作权则归属于实质贡献大的一方。若用户只是简单输入问题或者简单限定搜索的条件,用户对于Chat GPT输出的内容的智力投入是很少的。相反,此时的输出结果是Chat GPT设计者在训练模型时所设定的结果,更多地体现的是设计者的偏好,所以著作权应当是属于Chat GPT设计者。
5.2.2. 实质贡献大小无法判断
与此同时,Chat GPT所生成的具体内容存在另外一种情况,即它并不一定只体现出设计者与投资者所欲表达的思想。当使用者触发程序,并通过反复的对话、调整,对此进行修改和完善,此时不仅有设计者的智力和劳动投入,也有使用者的智力投入,输出的结果不仅是含有设计者人格因素的结果,而且还蕴含着使用者的主观意志,那么此时应将著作权归属给谁呢,笔者认为应当给予使用者,理由是:第一,符合《著作权法》的立法目的。我国《著作权法》第1条规定了其立法目的就是为了鼓励作品创作和传播以及促进科学文化事业的发展。在上述情况下将著作权赋予使用者对其创作可以起到激励作用,使其具有进一步使用、传播作品的动力和预期,并以这种方式为人工智能产业及社会文化发展做出贡献。第二,可以促进人工智能产业的发展。Chat GPT不仅有免费版本,也存在收费的Plus版本。若是使用者付费之后利用Chat GPT这个工具创作出作品后,却无法拥有其著作权,那么,不仅会打消使用者购买的积极性,对投资者来说更是极大的打击。相反,若是将权利归属于使用者,使用者就会对其保持高度的热情,投资者也才会获得更高的利益,也才会有意愿加大投资,促进人工智能产业的发展。
6. 结语
2023年4月,国家互联网信息办公室起草的《生成式人工智能服务管理办法(征求意见稿)》向社会公开征求意见,由此可见国家对于生成式人工智能的发展更为重视。在对生成式人工智能生成内容进行法律保护时,应充分考虑其自身的特殊性。所以,在确定权属规则的时候,不仅要遵循著作权归属于作者的基本规则,同时也要实现著作权法的激励目标,对现有的法律规则进行合理运用,才能让生成式人工智能对我国文化产业的发展产生积极的促进作用。
NOTES
1参见《中华人民共和国著作权法》(1990年9月7日第七届全国人民代表大会常务委员会第15次会议通过)。