1. 引言
“智能时代是由大数据与人工智能等技术驱动发展的时代。”[1]人类进入了人工智能的智能时代,接踵而来的是ChatGPT类产品等新技术的出现。最近有关ChatGPT类产品的报道也是铺天盖地,备受学术界、科技界和商业界的高度关注,全球各大产业也纷纷加入ChatGPT类产品的行业队伍中,以期洞察和嗅觉出更大的商机,给公司带来巨额的经济利润。
时代嬗变,晷刻渐移,2022年被称为元宇宙之年。在人工智能和大数据爆炸时期,人类的创造使得社会运行变得愈发复杂,亟需更多的法律知识辅助人类对其进行管理。其中最为典型的ChatGPT聊天工具技术的问世,使得社会各行各业哗然一片,人们担心未来的强人工智能时代,一些岗位或许就不再需要人类自身的操作,继而会卷入一股失业潮流。目前处于人工智能前沿的大型语言模型ChatGPT-4.0模型,它有着更自然的对话生成能力和语言理解能力。它不仅有文字创作功能,而且还可以通过指令创造出各种的美术作品。ChatGPT类产品生成物在生成的过程中,需要经过大量的数据分析和语言训练。在这些海量的数据中,毋庸置疑,一些被提供的文本数据里面会包括受著作权保护的作品。客观上说,若对其进行严格的限制,人工智能时代将会离我们愈来愈远。显然,这与知识产权的设立初衷和基本原则是相违背的。基于此在著作权方面进而会引出两大难题:一方面,互联网背景下,网络的发展已经使著作权人遭受到了一次侵害。如今随着ChatGPT类产品的出现,许多著作权人千锤百炼创造的作品,他人通过所谓的“合理使用”免费获取创作的作品,不向其支付合理的对价,即是对著作权人权利的再次侵害,同时打击了创作人的积极性。另一方面,按照传统的著作权对作品加以全面保护,在万物互联的智能时代显然不利于整个社会的发展,权利人对作品享有权利容易形成垄断,进而降低产业的竞争力,导致优质的作品难以广泛传播,影响作品的市场交流和社会秩序。因此从诗歌创作到论文写作中来看,ChatGPT类产品生成物所带来的著作权问题可谓千奇百态,亟待通过法律规范解决。
2. ChatGPT类产品的概述
2.1. ChatGPT类产品是什么
ChatGPT类产品是指以ChatGPT为代表的具有相同功能的可以与人类进行自然流畅的对话,具有人类般的语言交互能力的聊天工具,ChatGPT (全称Chat Generative Pre-trained Transformer)是在2022年11月30日研发的一款全新智能聊天机器人,由人工智能研究实验室OpenAI发布的,是一种基于自然语言处理技术的神经语言模型,它能够通过学习和理解人类的语言进行谈话交流,ChatGPT的原理是基于自回归语言模型(Auto-Regressive Language Model),它使用一种叫做Transformer的模型,可以先训练一个模型来预测下一个词,从而生成文本、回答问题。自从OpenAI公司推出了基于人工智能和自然语言处理技术的聊天机器人ChatGPT以来,国内一些学者和企业也陆续开始重视这项技术,并在这一领域不断探索和创新。百度推出新项目“文心一言”、阿里巴巴的“通义千文”、科大讯飞的“星火认知大模型”皆属于ChatGPT类产品。ChatGPT类产品在自然语言处理能力方面能够迅速生成高质量的语言进行回答,因此ChatGPT类产品能够在智能应用领域,如客服、语言助手、智能问答等方面都具有出色的生成能力和广泛的应用前景。
2.2. 国内外ChatGPT类产品适用著作权限制制度的现状
2.2.1. 国外ChatGPT类产品适用合理使用制度的争议
ChatGPT类产品在“爆火”之后,用户仅在两月内以惊人的速度增长至上亿。国外的几大科技巨头更是争相角逐,微软公司迅速向OpenAI公司投入百亿美元,并且宣布将ChatGPT引入自家搜索引擎必应(Bing)。2023年,谷歌公司为应对这场挑战随后召开发布会,推出新一款的聊天机器人Bard,紧接着谷歌CEO桑达尔·皮查依向美国和英国公众开放人工智能机器人Bard的访问权限。使用中继而引发的问题暴露出:ChatGPT类产品在进行文本数据生成和训练分析的过程中,会大量抄袭由人类创作而成的文字作品[2]。那么OpenAI公司是否有权利未经著作权人的同意将一些受著作权保护的作品放在公司的数据库里进行使用是值得探讨的问题。
在比较法领域,美国、日本、欧盟等一些国家中,他们扩大了合理使用制度的适用范围,在某些情况下是允许ChatGPT类产品使用受著作权保护的作品内容来进行训练的,将人工智能下的行为视为是合理使用的情形。然而,ChatGPT类产品作为大规模的语言模型,所依靠的是庞大的海量数据,目前ChatGPT-4.0已使用了1.5万亿个参数,比GPT-3.5增加了10倍。在马克思主义的哲学范畴里,世界上的一切事物都包含着两个方面,这两个方面既对立又统一。结合目前情况来看,ChatGPT类产品在模型训练时需要大量数据和内容,在方便人类的同时,也因强大的智能带来一系列著作权问题,其中涉及作品大多是有版权归属,国外视为合理使用的做法并没有解决根本问题,此行为依然是属于侵犯他人的复制权。
2.2.2. 国内ChatGPT类产品适用合理使用制度、著作权集体管理组织的争议
国内针对ChatGPT类产品引发的著作权争议主要是生成内容是否受著作权保护、本身会不会侵犯著作权、是否能够成为“作者”出现是目前在知识产权学界热点话题。在对ChatGPT类产品使用著作权限制制度的问题上,吴汉东教授认为输入阶段的数据挖掘,意味着对已有作品自动化、批量化的“阅读”,是为著作权法中的合理使用[3]。有提出运用著作权集体管理组织应对当下的智能时代的,应在区分非营利性集体管理组织和营利性集体管理组织的基础上,着力构建适度竞争的著作权集体管理模式,优化非营利性著作权集体管理组织的内部治理,赋予非营利性集体管理组织调解仲裁权能和健全集体管理组织的反垄断法规制体系[4]。自1777年法国设立了世界上第一个著作权集体管理组织,欧洲各国以及日本和美国陆续设立了著作权集体管理组织。以美国为例,它在设立和运营上采用的自由经济运行模式,大部分的著作权人基本被著作权集体管理组织所覆盖,并且在许可使用费用的收取及管理等方面作了详尽的规定,同时要求通过司法和市场两个部门的严格检验。综上任务所使用的海量数据要经过著作权集体管理组织的批量许可,收取相应的报酬,向作品的著作权人和邻接权人进行分配。可想而知这项工作任务是多么庞杂,鉴于目前我国的著作权集体管理组织制度的设立并不完备、ChatGPT类产品迅猛发展,很难快速的解决现实中已经出现的知识产权问题。
3. ChatGPT类产品选择适用合理使用制度的局限性
事实上,ChatGPT类产品在使用未经许可的作品问题上,学术界适用合理使用制度是面临着很大困境的。我国新修订的著作权法赋予了著作权人一系列权利,规定了合理使用和法定许可两种著作权限制制度。两者立法目的和立法宗旨相同,即鼓励和保护具有独创性的作品,激发创作者的积极性以及满足公共政策的需要。针对此问题主要从合理使用制度设立的初衷和“三步检验标准”两方面切入,说明ChatGPT类产品适用合理使用制度有以下几点的局限性。
3.1. 不符合合理使用制度的“适用主体”
基于ChatGPT类产品对现有作品进行训练和使用的这一方式,它并不符合我国现行的著作权法中所列明的法定情形,只有《著作权法》第24条第一款“为个人学习、研究或者欣赏,使用他人已经发表的作品”和第六款“为学校课堂教学或者科学研究,翻译、改编、汇编、播放或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行”使用才会和ChatGPT类产品使用未经许可的作品有一定形式上的关联性。ChatGPT类产品在适用这两款规定时,适用主体我们都通常理解为是“自然人”我们法律上采用的“法人”是被《著作权法》排除在外的。基于此,对自然人的认定是至关重要的,因此有的人在讨论ChatGPT类产品所产生的内容会不会有著作权时,根据相关的判决,一个作品享不享有著作权的前提必须是个自然人。
根据国外《自然》杂志网站上相关报道,ChatGPT类产品已经作为“合著者”发表了论文,但有两项基本原则:一是任何使用大型语言模型(LLM)都不能被接受成为研究论文的署名作者;二是使用的研究人员应在方法或致谢部分等记录说明1。对此,在学术界引起了轩然大波,《科学》杂志严肃表明不会接受ChatGPT类产品所撰写的一切论文,自然也不允许其作为论文的合著者出现2。大多的学术期刊都已明确表态,禁止或者约束行为人利用ChatGPT类产品进行论文的撰写,否则判定为学术不端。杨立新教授认为具备法律上的人格或拟制成为法律上的人,须具备生理学要素、心理学要素以及社会学要素,智能机器人尽管有一定的意识能力和意志,能够充当一定的社会角色,但不具有法律上的人格[5]。综上所述,从适用的主体当中可以看出ChatGPT类产品很难在这里入围,但目前ChatGPT类产品出现的著作权问题越来越激烈,亟需寻求出合理的制度对受著作权保护的作品作出回应。
3.2. 不符合“三步检验标准”
合理使用制度是版权中非常重要的一项制度,根据法律规定,使用他人已发表的作品既无须经著作权人的同意,也无需向其支付报酬。我国《著作权法》第24条明确列出了“合理使用”的具体情形,还设立了兜底条款,并且我国也已经陆续加入了《伯尔尼公约》《世界知识产权组织版权条约》和TRIPs协定,应当遵守“三步检验标准”,即1) 只能在特殊情况下做出;2) 与作品的正常使用不相冲突;3) 以及没有不合理地损害权利人合法权益。只有符合这三个标准才可以适用合理使用制度模式[6]。李泳霖认为这一兜底条款的适用应当受到严格限制。其不仅要满足著作权法第二十四条规定的“三步检验法”的要求,而且需要在立法上被其他法律和行政法规加以明确规定[7]。譬如,在“商业性使用”上,国内学术界通常的理解,著作权合理使用是不包括“商业性使用”的,这一点虽然在使用“三步检验标准”时并未作明确说明,但假设ChatGPT类产品的研发者OpenAI公司是以商业为目的,在未经过权利人的许可使用受著作权保护的作品来训练ChatGPT类产品,以此获得高额的利润,是无法保障普通公众的权益。据称,在欧洲以及美国和日本等地,也规定了“合理使用”的条款,在特殊情形下允许个人或者公司在未经授权下合理使用他人受著作权保护的作品。许多AI公司也援引这一条款为自己申辩,但出版商则认为,大量使用受版权保护的内容训练AI,是对这一特许权利的滥用[8]。
3.3. 不符合合理使用制度的初衷
合理使用制度的初衷是指在一般情况下,未经著作权人许可也无需支付报酬,即可使用他人已经发表的作品,本意是为了实现资源的优化配置和实现公众的最大利益。但ChatGPT类产品的研发者在使用作品时,并没有考虑到这方面的因素。
何宝宏认为,ChatGPT的研发者在没有公开生成文本训练数据的来源时,ChatGPT在与用户进行问答的过程中,如果没有注明文本数据来源的出处,其所产生的生成物是会构成剽窃的。道琼斯公司的法律总顾问Jason Conti曾经声明,任何想使用《华尔街日报》记者的作品来训练人工智能的人,都应该从道琼斯获得适当的授权,但“道琼斯没有与OpenAI 达成相关的协议”。公开报道显示,目前已有国外新闻媒体指责OpenAI在不支付任何费用的情况下使用他们的文章来训练ChatGPT [9]。显然,深究合理使用制度的背后理论是带有倾斜性的保护,其并不能彰显出著作权法的基本理念,更不能体现出法的公平正义。
4. ChatGPT类产品选择适用法定许可制度的必要性及可行性
人工智能聊天机器人ChatGPT类产品的出现,其强大的信息搜索和文本生成能力让人类惊叹,在使用受著作权保护的作品,各个学者提出的意见主要是适用合理使用和法定许可。单就合理使用方面,其适用的局限性前面已进行过相应的阐述,它并不能够成为解决ChatGPT类产品大量使用受著作权保护的作品进行训练进而侵犯著作权人合法利益的问题。综合来看,在强人工智能下,适用法定许可制度在实践和理论上更为合理。
4.1. ChatGPT类产品适用法定许可制度的必要性
4.1.1. 实现最优利益配置,消除作品垄断
著作权限制是维护著作权人利益与公共利益平衡的制度设计。甚至在整个知识产权法领域,权利限制也是维系知识产权人利益与公共利益平衡价值构造的基本内核[10]。著作权法需要在著作权人、ChatGPT类产品用户、软件的研发者三方之间实现最优的利益配置。一方面,OpenAI公司希望能以极低的成本获取受著作权保护的作品,将其作为语料库喂给ChatGPT类产品,进而合法性的拥有复制权;同样,著作权人在创作完成每一部作品之后,自然希望他人使用时给自己带来相应的报酬。帕累托最优告诉我们:在资源分配的一种理想状态下,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。将它落实到ChatGPT类产品使用受著作权保护的作品进行训练的问题上,关键问题就是著作权人的授权许可问题。适用法定许可能够消除出现的作品垄断,法定许可制度因其和授权许可制度有很大的不同,在适用时不需要进行事先的协商谈判,因而不会出现因交易成本过高而导致的市场失灵,能够有效的提高许可的效率和作品的使用效率。
4.1.2. 促进文化发展,解决公私利益冲突
著作权法在保护权利人基于作品的专有性著作权的同时,通过一系列的专有权例外的公共领域保留机制,确保其促进文化科学事业发展与繁荣的制度目标得以实现[11]。著作权不仅是对创作者个人价值的实现,也是对文化事业积累与长远发展的鼓励。从利益平衡的价值的角度而言,ChatGPT类产品适用法定许可制度不仅能在一定程度上给予作品的作者经济上的鼓励,而且能够很好解决公私利益之间的冲突,因此ChatGPT类产品在选择适用法定许可制度上是十分有必要的。
4.2. ChatGPT类产品适用法定许可制度的可行性
在大数据、人工智能和互联网相互交融的背景下,针对此使用行为寻求一个合法的依据、平衡研发者和著作权人的利益迫在眉睫,一是要对OpenAI这样的研发者公司进行保护,避免高额的交易成本,使得公司处在进退两难的地步;二是兼顾考虑著作权人的合法权益,不能仅适用合理使用制度对所发生的侵权行为进行免责,让著作权人得不到相应的救济。
4.2.1. 符合法定许可制度立法的初衷
著作权法定许可的立法初衷,乃是为调和新传播技术带来的产业主体利益分歧,并在著作权市场尚未形成的阶段降低权利流转带来的交易成本[12]。ChatGPT类产品研发者在使用未经许可的作品将其作为语料库对其进行训练时,其中必定会产生主体利益的纠纷,伴随着ChatGPT类产品这一智能技术的出现和发展,针对此类问题的解决愈来愈紧张,而法定许可存在的意义就是为了缓和新兴技术发展给传统制度带来的矛盾问题。因此,通过适用法定许可制度是可以规范ChatGPT类产品的研发者未经许可使用作品的行为,也符合法定许可制度设立的初衷。
4.2.2. 能够兼顾ChatGPT类产品研发者和著作权人的利益
法定许可设立的优点就在于它能够更好的处理合理使用和侵权行为相矛盾的问题,基于维护ChatGPT类产品研发者和著作权人的合法权益以及满足公众利益的需求,它能够根据各方的需求寻求到平衡点,将ChatGPT类产品研发者的利益与著作权人获得报酬的权利综合起来,实现ChatGPT类产品研发者和著作权人的利益平衡。比如法定许可制度的设立不但可以简化使用行为之前的授权手续,节省ChatGPT类产品研发者的交易成本,而且还能够促进作品的及时传播和利用,满足广大公众文化生活的需要,通过要求ChatGPT类产品研发者向著作权人支付报酬,著作权人可以从中获取经济报酬。
4.2.3. 减少ChatGPT类产品研发者侵犯著作权的风险
ChatGPT类产品在使用受著作权保护的作品时,面对海量的文本数据难以取得全部的授权,从利益平衡及我国《著作权法》规定得出,目前对ChatGPT数据训练、分析行为并未明确定性,选择适用合理使用制度更是不可行的。“ChatGPT在生成信息过程中不当泄漏他人隐私或商业秘密、国家秘密的,则ChatGPT开发方、运营者、服务商等相关主体可能面临法律惩处。若ChatGPT照搬照抄资料库的作品或者原文本、代码等受法律特殊保护的、未经权利人授权的数据的,也可能面临法律惩处。”[13]但目前的情况而言ChatGPT类产品研发者会担负着巨大的侵犯著作权的风险。ChatGPT类产品选择适用法定许可的可行性就在于,一方面,在科技引领未来的局面下,越来越多的使用人会继续使用受著作权保护的作品,ChatGPT类产品的研发公司在追求利益和效率的情况下,如果让随意使用创作的作品,难以保护著作权人的利益。若适用法定许可制度,可以保证ChatGPT类产品研发者的侵权问题减少,也可以扩大ChatGPT类产品研发者使用作品的规模,在使用作品时相当购买一份“商业保险”。另一方面,ChatGPT类产品的研发者在使用受著作权保护的作品时,假如发生著作权侵权纠纷,在法官做判决时多了适用法律的余地,对ChatGPT类产品的研发者而言,在使用受著作权保护的作品时多了一项抗辩的理由。
5. 我国ChatGPT类产品选择适用法定许可制度的设计架构
相比之下,ChatGPT类产品选择适用法定许可制度更能满足当下人工智能时代的需求,关键也能够保证ChatGPT类产品的研发者及著作权人和使用人之间的利益平衡,维护公平正义。在选择适用法定许可制度时,为了充分发挥该制度的优势,可以从以下几点对该制度作出相应的安排。
5.1. 将ChatGPT类产品纳入法定许可制度
ChatGPT类产品适用法定许可制度对ChatGPT类产品研发者、权利人和社会公众都具有重要的现实意义。现阶段,ChatGPT类产品衍生出的“新作品”比比皆是,如不加快在著作权限制制度方面对ChatGPT类产品研发者未经许可随意使用受著作权保护的作品做出限制,只怕由此引发的著作权侵权纠纷案件越来越多,将ChatGPT类产品纳入法定许可制度的适用范围,可以很好的妥善处理ChatGPT类产品研发者和著作权人的合法权益,自然案件纠纷就会减少。根据法定许可制度一共规定了报刊转载法定许可、制作录音制品法定许可、播放作品法定许可、编写出版教科书法定许可、制作和提供课件法定许可、通过网络向农村提供特定作品的准法定许可。
将ChatGPT类产品纳入法定许可制度也是有相关的依据的。《WIPO版权条约》在第10条已作出声明:允许缔约各方将其国内法中依《伯尔尼公约》被认为可接受的限制与例外继续适用并适当地延伸到数字环境中。同样,这些规定应被理解为允许缔约方制定对数字网络环境适宜的新的例外与限制[14]。简而言之,《伯尔尼公约》在原有的技术基础上所作的限制和例外,可以将其延伸到数字环境中,增加新的客体种类,这将为ChatGPT类产品纳入法定许可制度的范围提供了优势。我国《著作权法》规定适用法定许可制度一般需要符合三种条件:1) 必须是已发表的作品;2) 必须符合其规定的情形;3) 不得侵犯著作权人的精神权利,不得影响作品的正常使用。除此之外,作者事先未作“声明保留”。对此,应当以开放包容的态度对法定许可制度的范围进行创新,将ChatGPT类产品作为新的种类吸纳进来,这样,ChatGPT类产品的研发者在使用海量的作品进行训练时,使用已发表的作品可以不经权利人同意,只要支付费用即可,同时也保护了普通公众的利益。
从宏观角度看,将ChatGPT类产品纳入法定许可制度还有利于经济社会的发展,可以有效防止专有许可,避免权利的滥用,维护市场竞争秩序,从而促进ChatGPT类产品等智能聊天工具的发展。
5.2. 制定合理的作品付酬机制
当前,我国著作权法定许可制度的付酬制度存在着不足,《著作权法》规定适用法定许可制度的情形中均说明了“……可以不经著作权人的许可,但应当支付报酬”。“应当支付报酬”的合理的范围,我国的著作权法和相关的法律并没有明确规定。
首先,我国在作品使用方面应当制定明确的付酬标准,目前,我国只对报刊转载和录音制品两个情形的付酬标准作了明确的规定,将ChatGPT类产品作为新的客体种类纳入法定许可制度后,应当根据ChatGPT类产品目前的发展状况制定一个标准的付酬标准。
其次,为了保证ChatGPT类产品的研发者尽快取得作品的使用权,著作权人能收到合理的作品报酬,ChatGPT类产品许可费的收取与管理上也应当做详细的规定,具体工作可交由著作权集体管理组织这个中间机构来做,但前文也对著作权集体管理组织的不足进行了阐释,不足之处可以根据我国国情借鉴美国或者法国等国家,对著作权集体管理组织进行完善。
5.3. 增设ChatGPT类产品法定许可使用者“逃单”的法律责任
我国《著作权法》中并没有明文规定在适用法定许可制度时不支付合理费用的法律责任,在适用此制度时如发生“逃单”等侵权的行为,应当如何更好的处理,其并未对相关的机构进行授权。若是ChatGPT类产品法定许可使用者不遵守法律的规定支付合理的报酬,即会使法律丧失权威,破坏法律的效力,严重侵犯著作权人的利益,很难达到利益平衡的效果,届时法定许可制度会沦为空口一谈,失去其本身所存在的价值。因此,基于ChatGPT类产品的发展和利益平衡的考虑,应增设对ChatGPT类产品法定许可使用者使用作品不支付报酬所应当承担的责任。可以参照《著作权》法中规定的民事责任,如出现违反规定不支付相应的报酬,除了消除影响、赔礼道歉等,应按照侵权人的违法所得和著作权人的损失承担1~5倍惩罚性赔偿金。
6. 结语
ChatGPT类产品技术的发展对传统的著作权适用制度造成了巨大的冲击,归根结底来说,不管是适用法定许可制度或是合理使用制度,最终的目标都是为了维持一种动态的平衡。当然,任何的一种法律制度在适用上都不可能一蹴而就的,ChatGPT类产品在使用受著作权保护的作品时所面临的著作权保护问题,在今天的强人工智能环境下,考虑到当事人之间的利益平衡如何构建一个行之有效的著作权许可制度,成为了当下法学理论界、法学实务界和商业界共同关注,亟待解决的紧迫问题。
NOTES
1Tools such as ChatGPT threaten transparent science; here are our ground rules for their use, https://www.nature.com/articles/d41586-023-00191-1.
2ChatGPT is fun, but not an author, https://www.science.org/doi/10.1126/science.adg7879.