1. 问题的提出
2022年11月,美国人工智能研究实验室OpenAI研发的聊天机器人程序ChatGPT (Chat Generative Pretrained Transformer)一夜爆火。作为人工智能技术驱动下的自然语言处理工具,其是基于大型语言模型(Large Language Model, LLM)预训练的新型生成式人工智能(Generative AI),新技术背景下,其可以根据上下文实现近乎人类的对话,甚至可以完成剧本创作、学术论文写作等任务。此后,谷歌、百度等国内外科技互联网公司纷纷推出旗下的人工智能聊天机器人。以ChatGPT为代表的生成式人工智能突破了人们以往对人工智能发展的认知,近乎真人的对话与创作使得人们开始重新审视人工智能是否已经具有了独立意识与人格,其生成物是否具有可版权性即可以视为著作权法上的作品?如果可以视为作品,由于其创作过程中涉及人工智能本身、投资及开发者、使用者等诸多主体,其著作权归属又应如何分配?本文试图以ChatGPT为例,通过对其工作机理的探析,明晰该类预训练生成式人工智能的生成物1是否具有可版权性,并对其权属提出合理的分配路径。
2. 生成式人工智能的工作机制及其工具属性
探究当前阶段的生成式人工智能,以ChatGPT为例,根据其官网介绍 [1] ,其工作机制主要为四阶段:1) 数据学习,在文本数据集上对人工智能进行模型训练,使得人工智能通过大量数据学习掌握文字接龙的能力。2) 人工标注,由人类就一些问题给出答案,由人工智能对这些问题及答案进行学习,从而引导人工智能的回答接近人类喜好。3) 搭建奖励模型,对于同一问题人工智能给出的不同回答,由人类进行打分排序,根据这些回答及排序,训练出符合人类价值判断标准的奖励模型。4) 强化学习与优化,人工智能继续自我学习,并根据奖励模型不断调整自己的生成内容,实现自我优化。此类生成式人工智能的特征即使用“利用人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)”的训练方式,无论是在第一阶段的数据选择、第二阶段的人工标注,还是在第三阶段搭建奖励模型的排序等步骤中,人类的作用及价值判断仍旧占据主导地位。
由此可见,即使ChatGPT类生成式人工智能看似可以与人类自由对话,其创作已经具有外观上的自主性,但是在当前的技术背景下,人的作用依然是无法替代的,人工智能做出的创作与回答依旧是开发者的价值延续,其生成内容依然取决于开发者数据库的选定、对其价值的灌输等预训练,“人工智能只是开发者、训练者的自由意志和价值观的执行者” [2] ,当前技术阶段,此类人工智能只能充当人类的工具,无法达到“拟制人” [3] 的层面。在承认新技术背景下此类人工智能仍旧是工具的基础上,我们才能讨论此类人工智能生成物的著作权问题。
3. 生成式人工智能生成物的可版权性
著作权法上对于作品的认定也即判断是否具有可版权性需要满足四个要件,1) 文学、艺术、科学领域,2) 具有独创性,3) 以一定形式表现,4) 属于人类智力成果。其中1、3两个要件在人工智能生成物领域中已经没有争议,当前关于人工智能生成物是否具有可版权性的争议主要集中于是否具有独创性及是否属于人类智力成果。
3.1. 生成式人工智能生成物是否具有独创性
著作权法上的独创性包含独与创两个方面,前者指作品由作者自己独立完成,而非复制抄袭他人,后者指具有一定的智力创造性。
关于独创性现有观点分为“作者中心主义”与“读者中心主义” [4] 。从“作者中心主义”观点出发,作品的作者必须是人类,作品必须是人类精神和个性的延伸。人工智能生成物是应用算法、规则和模板的结果,其不具有个性特征,其内容不符合独创性要求 [5] 。而“读者中心主义”观点认为,独创性判断来自作者以外的社会评价 [6] 。从读者角度出发,人工智能生成物并非复制抄袭其他作品且满足最低限度的创作要求,就不要考虑其创作主体与创作过程。
从上文生成式人工智能的工作机制及工具属性出发,“作者中心主义”与“读者中心主义”其实并不冲突。“作者中心主义”认定人工智能无法成为著作权法上作品的创作主体,从而推断人工智能生成物不具有可版权性,其存在认定人工智能为作品主体的假设错误,如若将人工智能仅仅视为人类的工具,那么从“作者中心主义”出发,人类才是人工智能生成物的作者,如ChatGPT应用中,输出结果是人类数据库选择及价值标注、奖励模型构建下的产物,其内容体现了人类精神与个性,符合独创性要求。从“读者中心主义”出发,具有工具属性的生成式人工智能的生成物已然满足作品自身表达的独创性要求,其生成物于人类作者生成物已经没有外观上的区别。
综上,生成式人工智能生成物是否具有独创性的争议其实并非作品自身表达上的争议,毕竟将人工智能生成物与人类作者作品放在一起考虑时,已经是在客观上承认了人工智能生成物与人类作者的作品在外观上并无差异。其本质争议是创作主体与创作过程是否应该纳入独创性的考虑,“作者中心主义”认为人类才能成为作者,创造过程应该是人类情感的表达,而非模型与算法;“读者中心主义”只考虑读者的主观感受。所以将生成式人工智能仅仅视为是人类创作的工具,如上文分析,模型与算法中也体现了人类的精神与价值取向,从这一角度出发,无论在“作者中心主义”还是“读者中心主义”上,生成式人工智能的生成物都已经具有了独创性。
3.2. 生成式人工智能生成物是否属于人类智力成果
生成式人工智能其自身就是人类智力成果的产物,其运作逻辑始终无法脱离人类为其注入的算法与模型,即使当前生成式人工智能最先进的深度学习训练模式,也是基于人类算法并通过人类反馈搭建。在承认生成式人工智能依然是人类的工具并不具有独立意识与人格的前提下,生成式人工智能生成物也囊括在人类的智力成果中。另外,即使只考虑生成式人工智能生成物本身,以ChatGPT为例,其第一阶段是让人工智能在海量数据中学习文字接龙,其生成内容不管是表达逻辑还是语言形式上都与人类一致,第二、三阶段通过人工标注及奖励模型训练使其回答更趋近于人类的价值选择及喜好,在不断的数据输入、产出、反馈、再微调的过程中,ChatGPT的生成内容无论是内在价值选择上,还是外在的表达逻辑上,都已经和人类的输出没有区别,符合人类智力成果的要求。
综上,从生成式人工智能的工具属性出发,其生成物已经符合具有独创性及人类智力成果两个构成要件,该类生成式人工智能的生成物具有著作权法上的可版权性,可以构成作品。
4. 生成式人工智能生成物的著作权归属
4.1. 当前观点的评析
4.1.1. “拟制人”说
该观点的支持者认为,生成式人工智能生成物的著作权归属于人工智能所有 [7] ,其观点基础是人工智能能够成为著作权意义上的主体,本文在上文中已经驳斥了人工智能的主体性,在当前的技术发展阶段,人工智能依然是人类创作使用的工具,著作权不能归属于工具本身。一方面,著作权上的主体要具有行使权利与承担义务的能力,其首先应该是民事主体,显而易见,当前的生成式人工智能,不具有行使权利、承担义务的能力。另一方面,著作权制度构建的意义是鼓励人的创作,生成式人工智能并不具有被鼓励的情感能力。综上,在人工智能技术得到颠覆性改变前,人工智能还无法成为著作权的主体。
4.1.2. 公有领域说
该观点认为,人工智能生成物的著作权应该归属于整个社会,成为公共财产。该观点忽略了知识产权制度设立的目的,即保护个人创作成果从而促进文化科学繁荣。如若怠惰地将人工智能生成物的著作权归于公有领域,会降低针对人工智能生成物原创性的激励 [8] ,从而导致人工智能技术发展的放缓。另外,将人工智能生成物的著作权全然放置在公有领域,也会导致大规模的抄袭复制行为,严重损害著作权市场,造成司法混乱。对于当前的人工智能生成物,不论是投资者、开发者还是使用者,都存在享有其著作权的可能性,法律应该追求厘清关系,从而规范该著作权市场,而非偷懒地以公有财产概之。
4.1.3. 投资开发者说
该观点的支持者从鼓励创新创作的角度出发,认为将著作权赋予人工智能的投资者或开发者有利于鼓励投资及开发,从而能推动人工智能技术的发展。事实上,投资者并没有实际参与创作,将著作权完全归于投资者并不符合著作权法意义上的“创作即所有”原则 [9] ,忽视了开发者及使用者在内容生成过程所做的工作。如若全然归于开发者,也忽视了使用者在内容生成过程中的劳动。并且,从激励角度出发,投资者的正激励来源于投资人工智能获得的收益,而非人工智能后续的作品,开发者的正激励也已经由投资者满足,单独从激励角度出发分配著作权属,难以形成逻辑闭环。
4.1.4. 使用者说
该观点认为,人工智能生成作品的著作权属归于人工智能使用者,该学说在开发者与使用者为同一主体时具有一定合理性,不管是程序模型的开发还是人工标注,抑或最后的内容输入都是源于统一主体,那么生成作品的全流程都受同一主体价值观的影响,是同一主体思想的延伸,此时可视开发使用者为著作者权主体。当前诸多公司研发生成式人工智能并利用其进行内容创作,其不存在与外界的著作权纠纷,甚至其自身不透露的话,外界压根无法分辨某一作品的主体是人类作者还是生成式人工智能。但是,当开发者将生成式人工智能推向社会,社会大众成为使用者尤其是付费使用者时,著作权属归属于使用者就存在了争议。一方面,大众使用者并未参与基础模型的构建,其思想只影响了人工智能的部分表达,对生成作品的贡献度有限,并不能当然地占有作品的著作权。另一方面,大众使用者也在作品生成过程中起到了一定作用,尤其在需要详细输入内容引导内容产出的生成式人工智能中甚至发挥了主要作用,此时就不能将著作权全然归属于开发者等主体,需要考虑使用者的贡献。
4.2. 生成式人工智能生成作品的著作权归属分配
根据对当前存在的人工智能生成作品著作权归属观点的分析,当前“拟制人”说及公有领域说并不存在适用空间,而由于人工智能生成作品过程中涉及投资者、开发者、使用者多方主体,将著作权单一归属于某一主体的投资开发者说抑或使用者说都过于片面,且人工智能生成作品存在其特殊性,对于著作人身权及财产权的分配也存在其特殊性,所以具体情况具体分析,分类赋权才能实现权利的合理配置。
4.2.1. 人工智能开发者与使用者为同一主体
在诸多领域,人工智能生成物的开发者与使用者其实都为同一主体,开发者开发生成式人工智能替代人工,从而降低自身运用成本或提升工作效率,如著名的人工智能第一案“腾讯诉上海盈迅案”中,该案中生成式人工智能的开发者与使用者都为腾讯公司,所以整个作品所需要的劳动都来源于腾讯公司,其作品的价值延伸也来自于腾讯公司,故其人工智能作品的著作权当然归属于腾讯公司。进一步说,如若腾讯公司不公布该作品的“作者”为人工智能,而为某一员工,从“读者中心主义”出发,复制抄袭必然侵犯其作品著作权。在开发者主动公布人工智能的过程中,就更应保护其权利,才有利于推进人工智能进步,促进文化科学事业繁荣。
4.2.2. 人工智能开发者与使用者为不同主体
自ChatGPT出现并向公众开放以来,诸多科技互联网公司纷纷推出旗下的生成式人工智能,由社会公众利用这类生成式人工智能创作的作品大量出现,在此情况下,人工智能的开发者与使用者为不同主体。在此情况下,著作权的归属应该首先考虑事前约定,如OpenAI在GPT系列使用条款中明确用户对其创作的内容拥有完整的著作权,此时就应当将著作权归于使用者,涉及著作权纠纷时以约定条款为准。
其次,在事前并未约定的情况下,开发者与使用者都对作品的生成作出了贡献且比例难以划分,因此也难以按比例对著作权进行分配。在这种情况下,回归到著作权最初的设立目的即激励创作而言,开发者所受激励来源于投资者的投资或对人工智能本身享有的知识产权,其激励已经在初次分配中得到一定满足,不应“双重获利” [10] ,将著作权分配给大众使用者更能鼓励作品的创作,更有利于社会文化科学领域的整体进步。
4.2.3. 赋予人工智能以特殊“署名权”
前文已经分析过生成式人工智能的工具属性,所以此处所讲的署名权并非认为生成式人工智能能够成为著作权的主体,其只是将人工智能拟制为“机器作者”,赋予“署名权”并非保护该人工智能的权利,而是出于激励目的,赋予背后的投资者及开发者以著作人身权。虽然前文提及投资、开发者已经在初次分配中得到了一定满足,但是出于进一步促进生成式人工智能发展的目的,将“机器作者”署名于作品之上,能在不损害使用者著作财产权利及避免司法混乱的基础上,进一步促进人工智能事业发展,不失为当前阶段的合理制度设计。
5. 总结
综上,在当前的技术发展背景下,以ChatGPT为典型的生成式人工智能依然是人类的工具,其内容生成过程仍是人类创作的过程,根据著作权法上作品的认定,其生成内容已经具有可版权性,构成著作权法意义上的作品。在此基础上,与其相关的著作权归属仍然未有明确制度设计,当前阶段,针对生成式人工智能的不同使用情况,具体情况具体分析,分类保护与赋权已经是最优之道。
NOTES
1本文研究对象为预训练生成式人工智能,为方便行文,以下直接称生成式人工智能。