1. 引言
1956年,约翰·麦卡锡(John McCarthy)在达特茅斯会议上首次提出“人工智能”(Artificial Intelligence, AI)这一术语,并将其定义为“让机器行为看起来像人类智能行为一样” [1] 。如今,人工智能已经历经了近70年的发展历程,正在进入以深度学习为标志的第三次发展高潮。在新闻报道领域,人工智能技术被广泛使用。基于先进的计算技术,人工智能可以自主抓取有价值的数据和信息,进而从中提取关键要素,自动生成深度且完善的新闻稿件。此外,人工智能系统通过对实时数据流的深入分析,能够迅速生成实时新闻报道。这种实时性报道对于紧急事件和迅速变化的情境尤为重要,保障了公众能够及时获知最新信息。人工智能在新闻报道生成领域的广泛应用不仅在提高生产效率方面取得显著成果,同时也催生了新的报道范式和形式,推动着新闻业不断适应数字化时代的挑战。
然而,人工智能技术在新闻领域的广泛应用也引发了一系列伦理和法律问题。自动化生成新闻可能导致虚假信息的传播,因为算法可能无法始终正确地评估和验证信息的真实性。其次,在自动化新闻生产中,大量个人数据可能被用于个性化内容推荐,这将引发隐私问题。而引发大量关注的“Dreamwriter”案提醒众人人工智能生成新闻时涉及到的著作权问题。根据著作权法,创作权属于作者。然而,在人工智能情境下,“作者”的身份变得模糊不清,是算法的开发者、运营者,还是训练数据的提供者,或者是人工智能系统本身,目前还没有一个定论。如果人工智能系统生成的新闻稿件侵犯了他人的著作权,相关法律责任应该由谁承担又是一个重大问题。因此,在人工智能技术飞速发展的背景下,建立能够有效解决权利纠纷、平衡各方利益、保障相关法益且逻辑自洽的规范制度,是立法和司法迫切需要解决的问题。
2. 人工智能新闻概念及著作权
2.1. 人工智能新闻的概念
广义的人工智能认为任何具有智能特征或表现的人造物都应属于人工智能范围 [2] 。狭义的人工智能指的是计算机科学的一个分支,其重点是模拟人类智能,特别关注机器学习这一子领域,侧重于训练机器从数据中学习、识别和做出后续判断,过程中减少或无需人工干预 [3] 。人工智能新闻的研究正是在狭义人工智能范畴内展开的。虽然人工智能新闻在学界仍是一个具有争议的概念,部分学者会将其称为“机器新闻” [4] 、“机器人写作” [5] 或“智能化新闻”等。但通过总结和分析这些不同的定义,就会发现学者们普遍认同人工智能“作为智能化的机器程序”和“表现出与人类智能相近的功能”这两大特点 [6] 。因此,归纳下来,人工智能新闻就是依托于大数据、算法算力等人工智能技术,通过人工激发或自我激发,自主完成选题、策划及撰写等各环节,生成符合特定要求的新闻作品的高度智能化新闻生产模式。
2.2. 人工智能新闻的生成逻辑
人工智能新闻的生成路径高度依托于算法与大数据等新兴技术,大致分为数据采集、数据分析、文本生成和智能分发四个步骤。首先,人工智能会在广泛的渠道中主动抓取数据;其次,通过算法技术对数据进行筛选、计算、分析与处理,提炼出有价值的信息内容作为新闻报道的素材;接着,在确定好新闻选题和撰稿素材后,撰稿机器人会开始具体文本的撰写;最后,依托不同受众的用户画像和标签,将生成的新闻精准地推送给目标读者 [7] 。以本研究的案例Dreamwriter生成新闻的过程为例,首先,Dreamwriter会通过数据处理系统广泛收集不同数据,而后利用机器学习算法分析数据,筛选出有价值的数据并归入待检测数据库;接着,提前设定好的规则引擎和触发条件会推动Dreamwriter在满足新闻生成条件时进入写作引擎模块撰写文章;最后,Dreamwriter会对新闻进行审核校对并分发到相关平台上进行发表。
2.3. 人工智能新闻的著作权认定现状
著作权是作者对其创作的文学、艺术和科学作品依法享有的专有权利 [8] 。学界通常将著作权的主体限定为自然人、法人或非法人组织,在大多数学者看来,根据现行的著作权规范,“作者”通常被定义为法律意义上的自然人,并不能将其外延扩展到人工智能 [9] 。然而,很明显,人工智能的创造物在逻辑结构上已经颠覆了著作权法规范中原本互为证成的“作者–作品”这一概念,著作权法应当回应人工智能是否具备或等效于自然人的权利主体资格。此外,根据著作权法的规定,“作品”需要满足“独创性”的实质要件和“可复制性”的形式要件 [10] 。显然,人工智能新闻是具备“可复制性”的,并且在生成过程中涉及到对于数据的自主处理和文本内容的策划,因此呈现出的新闻并不会局限于简单的事实陈述,而是表现出一定的“独创”色彩。因此,探讨具备独创性的人工智能新闻的著作权问题是必要的。
2.4. 人工智能新闻的著作权问题类型
基于著作权法规定与人工智能生成新闻特点,可以将人工智能新闻的著作权问题分为三类:软件本身的著作权保护、辅助创作的著作权侵害、自主创作的著作权认定 [11] 。第一,人工智能编辑软件通常由多个智能计算机软件组成,涵盖算法设计、数据整合、语音识别、图像处理等功能,具有自主编辑文字、图片、音频、视频等素材的综合性特点,这种复合性结构导致著作权保护需要考虑不同类型的智能计算机软件是否具备获得著作权保护的可能性。第二,虽然人工智能辅助创作的主体仍然是人类,但是算法驱动的人工智能软件可能会引发“洗稿”、“算法黑箱”与“算法作恶”等超越现行著作权标准的权益侵害问题。第三,人工智能自主创作的著作权认定困境源于人工智能主体资格的缺失。传统著作权理论以人类独创性作品为基础,而人工智能作为创造物,生成的内容是客体生成之客体。这对传统主、客体框架构成挑战。本研究所选取的“Dreamwriter案”涉及到人工智能自主生成稿件的著作权认定是否能根据《著作权法》的具体条款来裁定,因此接下来的研究将围绕第三个问题类型展开。
3. 人工智能新闻著作权保护面临的困境
3.1. “Dreamwriter案”
2015年,腾讯财经开发了一款名为Dreamwriter的自动写作新闻软件,其主要功能是在第一时间自动生成新闻稿件,并迅速输出分析与研判结果。该系统采用先进的自然语言处理和机器学习技术,能够理解大量的数据,并以高效的方式将信息转化为清晰、准确的新闻报道。2018年8月20日,腾讯证券网站登出了一篇由Dreamwriter自动完成的财经报道文章,并在文章末尾注明“本文由腾讯机器人Dreamwriter自动撰写”。同日,上海盈讯科技在其运营的“网贷之家”网站发布了一篇完全相同的文章。腾讯认为,盈讯科技侵犯了自身的著作权,并指控其使用涉案文章来获取网络流量的行为构成了不正当竞争。腾讯遂将盈讯科技诉至深圳市南山区法院,请求法院判令盈讯立即停止通过信息网络对外传播该文章,并要求其在官方网站“网贷之家”的首页显著位置连续一个月刊登改正其侵权行为的声明。
2019年12月24日,深圳市南山区法院就该案件作出判决,认定写作机器人Dreamwriter生成的文章具有一定的独创性。首先,涉案文章发布于腾讯网证券频道上,且注明“本文由腾讯机器人Dreamwriter自动撰写”,明确了涉案文章由腾讯公司对外承担责任。涉案文章由腾讯主创团队运用Dreamwriter软件完成,属于腾讯主持创作的法人作品,其著作权由腾讯享有。法院认定盈讯科技未经许可向公众提供被诉侵权文章内容,属于侵害了腾讯享有的著作权中的信息网络传播权。鉴于以上,法院判决盈讯科技赔偿腾讯公司经济损失及合理的维权费用人民币1500元。至于腾讯要求盈讯在其公司网站首页刊登声明以消除影响的诉讼请求,因缺乏证据证明盈讯的侵权行为对腾讯的商誉或腾讯就涉案作品所享有的著作人身权造成损害,故法院未予支持。此外,由于法院已经根据《著作权法》的具体条款对腾讯予以救济,不再符合《反不正当竞争法》的适用条件,因此法院的最终判决未支持腾讯主张的盈讯构成不正当竞争行为的诉讼主张。Dreamwriter案系法院首次肯定人工智能生成稿件的“作品”属性,因此被认定为人工智能新闻著作权第一案 [12] 。
3.2. 人工智能新闻的著作权存在与否
虽然“Dreamwriter案”的判决结果在法律层面上认定了涉案文章的著作权,但学界对于人工智能生成的新闻作品是否拥有著作权仍然充满了争议。有学者认为,虽然人工智能生成物的内容在表现形式上与自然人创作的作品类似,但“都是应用算法、规则和模板的结果,不能体现创作者独特的个性” [13] ,也有学者认为这些人工智能生成物“不具有财产的稀缺性” [14] ,因而不能认定为作品,不具备“可版权性”。也有不少学者持相反的意见,认为将人工智能生成物视为“非作品”的观点“与社会现实不符、与发展人工智能产业精神相悖、与法的价值矛盾” [15] 。人工智能所生成的新闻虽然生产主体存在特殊性,但它作为作品的客观性并不能被否认,因此在判定著作权时也不能将其划分出作品的范畴。
此外,还有一种观点认为虽然现行的著作权法不能完全保护人工智能生成的内容,但这应该是实然状态,而不是应然状态,未来应当通过对著作权制度的修正将人工智能生成的内容纳入保护范围 [16] 。如提出“如何对现有知识产权理论和法律体系进行调整,为AI文本或其他AI作品,包括AI美术作品、音乐作品等,提供合理且必要的权利保护体系,已经是目前较为迫切的命题。” [17] “在《著作权法》体系下寻求对人工智能生成物的法律保护,能最大程度弱化法律修正可能带来的冲击和不适,符合时代和法律发展的双重规律。” [18]
3.3. 人工智能新闻的主体性困境
随着生成式人工智能的崛起,学术界开始关注人工智能是否能在法律意义上被赋予独立的主体地位,由此著作权法中关于作者身份的界定也变得模糊不清。首先,确定作者主体身份的重要标准之一在于该主体是否具备自主进行创作活动的能力。换句话说,只有作品属于作者自身的智力创作成果时才能受到著作权法的保护。创作活动不同于一般的民事法律行为,作者的身份在完成作品的创作那一刻起就能够确定 [19] 。其次,能否完整享受权利并负担义务是确认作者主体地位的重要标准。德国法学家拉伦茨主张,法律关系是基于一个共同目标而结合在一起的各种权利、义务和其他约束的总和 [20] 。在著作权法律关系中,作者是法律主体,其身份认定应以是否具备权利能力、是否能够完整享受权利并负担义务为判断依据。
伴随着人工智能技术的嵌入,作者主体呈现出更为复杂化、细致化、分类化。一种观点认为人工智能生成作品的主体是算法使用者。支持这个观点的学者强调著作权法体系对于作品“智力性”特征的重点关注,因此只有符合“智力性”要求的对象才能成为著作权保护的客体。而智力成果是人特有的独创性劳动产物,因此算法技术的使用者才是人工智能生成物真正的作者。其次支持者较多的是算法设计者论。鉴于机器依赖于人类预设的控制、指示、操作和监控程序,其生成的内容本质上反映了人的思维与行为模式。因此,机器的创造者或设计者应当被视为版权所有人 [21] 。第三种观点是将主体确定为人工智能的实质投资者。著作权法最初根据洛克的财产权理论,将作品权利归属于创作作品的作者,体现了“谁创作,谁拥有”的底层逻辑;其次,基于价值增殖理论,当投资作用远大于智力因素时,对权利归属的认定就首要考虑内容产生过程中的实质性投资主体 [22] 。
3.4. 人工智能新闻的权责归属纷争
我国《著作权法》(2020年修正)第九条规定,著作权人包括作者和其他依法享有著作权的自然人、法人或非法人组织。在“Dreamwriter案”中,法院认定涉案文章是由腾讯主持的多团队、多人分工形成的整体智力创作,且文章末尾注明“本文由腾讯机器人Dreamwriter自动撰写”,因此将其认定为权责归属腾讯的法人作品1。虽然这一判决结果推动了人工智能生成作品的著作权归属的司法探索,但并没有在学术界达成共识。在“Dreamwriter案”中,虽然法院赋予人工智能生成文本著作权,但并没有将新闻机器人判定为作者,而是将作者的角色安排给软件背后的人类团队,这一解释体现出人工智能新闻创作主体与法律认定主体不一致的矛盾。因此,对于人工智能新闻的权利归属问题仍然存在争议。
有观点认为人工智能新闻著作权责划分应坚持“操作人优先”原则 [23] ,即“Dreamwriter案”涉案文本的著作权相关权责应归属于Dreamwriter的软件开发者或使用者。因为该软件的内容生成逻辑设定是由开发者设计的,开发者就有成为著作权人的可能。但是这一权责划分存在几个问题;首先,软件开发者已经获得了该软件的版权和专利认真,再次获得著作权就涉及到权利重复;其次,软件开发者的工作以算法代码为核心,与形成的文本结果是存在差异的;最后,从鼓励创作和传播的初衷来看,将权利赋予软件开发者或无法有效激励创作 [24] 。此外,还有观点认为可以直接赋予新闻机器人完整或有限的人格。随着未来科技的进步,人类社会将进入“强人工智能时代”,人工智能将具备深度学习、自主决策和适应环境的能力,未来可能独立于发明者形成自主的意愿和表达能力 [25] 。
4. 人工智能新闻著作权保护的应然路径选择
4.1. 发挥技术优势,加强作品质量与保护
目前,人工智能新闻的生产逻辑和路径已经实现了全智能化,然而自动化的流程忽略了传统的“把关”,给人工智能新闻产品的质量带来了较大的不确定性。因此,将传统的“把关”环节融入生产流程显得尤为重要。但是,在人工智能新闻的“把关”中,由于事实数据与其他数据的体量巨大,仅靠“把关人”进行著作权风险排查难度较大,也不切实际。因此,要充分发挥技术在防范人工智能新闻侵权方面的优势。一方面,可开发和完善基于大数据和人工智能识别技术的自动纠错式防范侵权软件和程序;另一方面,可利用区块链防篡改、可溯源等技术,通过自动标注机器人所抓取内容的出处,表示引用而非抄袭,切实体现技术向善的原则 [7] 。
区块链技术还可以运用到其他层面,进一步完善人工智能作品的管理和保护。一种可能的举措是设立人工智能作品的标注制度,通过数字登记对智能作品进行管理。对于享有著作权的非事实性智能新闻作品,可以进行分类登记,并归入不同的数据库。在这一过程中,还可以标注哪些作品是供机器学习使用的数据库资料,以便通过比对数据库作品来判断是否构成著作权侵权。在技术层面上,遵循算法透明性原则是至关重要的。这意味着软件编程者在算法设定中应该融入著作权法中有关作品独创性、复制、合理使用等原则。通过增强算法的公开性和可解释性,可以使人工智能在创作中明确行为的边界,从根本上减少侵权行为的发生。
此外,为了更全面地管理智能新闻作品,可以考虑建立包含详细信息的元数据,包括作者、生成时间、用途等。这些元数据可以在区块链上进行记录,形成可追溯、不可篡改的数据链,为权利归属和合法使用提供更多的依据。通过这些措施,可以更好地平衡人工智能创作的便利性和著作权保护的需要,推动技术与法律的有机结合。
4.2. 完善相关法律法规,明确权责主体
现行法律法规对人工智能生成文本著作权侵权行为的认定面临诸多困难,从外部原因来看,人工智能生成文本是否构成作品,以及人工智能生成文本的著作权主体仍然存在较大差异;从内部原因来看,2020年第三次修正的《著作权法》仍然存在一定的局限性,其中与人工智能生成文本相关的著作权法条相对空白,缺乏统一的司法判定标准。因此,与时俱进地完善与革新相关法律法规是十分必要的。
首先,可以将“避风港原则”运用于人工智能新闻著作权的保护中。“避风港原则”,亦称“通知删除原则”,是指互联网服务提供商在提供网络空间服务中发现著作权侵权时,如在合理时间内采取及时删除侵权内容或链接等措施,就不视为侵权的原则 [26] 。“避风港原则”在国际上已经得到了广泛应用,我国的《信息网络传播权保护条例》《互联网著作权行政保护办法》等相关条款对这一原则也进行了确认。当涉及到人工智能新闻侵犯他人著作权,或是他人侵犯人工智能新闻的著作权时,可以通过联系其背后的新闻单位法人在合理时间内删除相关的链接和新闻报道。这样既保护了著作权主体的合法权益,又为当前我国在弱人工智能时代下机器人拟人化、人格化的发展不足提供了一定的包容空间 [7] 。
此外,邻接权保护也是推动人工智能新闻著作权保护制度更为完善的一个思路。著作权主要是为了保护创作者的权益,而邻接权则是为了保护传播者的权益 [27] ,通常适用于传播者在作品产出后进行大众传播时付出的创造性劳动。邻接权的使用旨在保护传播者对人工智能系统的投资,以及新闻从业人员对生成稿的再创造劳动。在邻接权的模式下,人工智能只是一种技术手段,权利归属于调整生成内容并进行大众传播的新闻机构 [28] 。
4.3. 强化传媒伦理观,提生产者责任感
归根到底,技术只是工具,创造和使用技术的人才是问题关键所在,因此解决人工智能新闻的侵权问题仍然要从“人”的角度出发。“弱人工智能时代”的传媒伦理观不应只强调显性的技术伦理和职业伦理,还要关注到隐性的责任伦理和信念伦理,树立以人为本的媒介技术伦理观 [29] 。
责任伦理观对于引导行为主体在任何决策和行动中更为谨慎考虑有重大作用。当将责任伦理观纳入新闻传播生产过程,特别是人工智能新闻的制作与传播中时,其价值进一步显现。首先,责任伦理观有助于培养传媒从业人员的责任感,让其时刻关注到自身行为对社会、受众和整体媒体环境可能带来的影响。其次,引入责任伦理观可强化版权保护意识。从业人员在考虑创作、使用和传播人工智能新闻时,会更加注重尊重他人的知识产权,减少潜在的侵权行为。此外,强调责任伦理观对技术制造者也有着规范作用,能积极敦促他们更加谨慎地设计、使用和维护技术。这不仅有助于降低技术中的潜在偏见,还能减少因算法不公正而引发的社会争议。
信念伦理注重于行为主体内在的信仰、价值观和道德标准,对于塑造行为主体的决策和行为具有深远影响。引入信念伦理有助于引导生产者在创作过程中明确自身的价值取向,建立以尊重创作者权益、促进创新为核心的价值体系。与此同时,信念伦理对于激发人工智能新闻生产者的社会责任感有重要作用,能使其在创作过程中考虑社会公正和公平,这有助于构建公平的著作权生态。
5. 结束语
法律的功能不仅在于定纷止争,更在于对人的行为产生指引作用。当面对人工智能生成内容的立法时,不仅需要依靠事实和逻辑判断,还需要进行价值选择。当未来进入“强人工智能时代”时,人工智能会形成产业化的发展,立法必须回归初衷,在考察生产机制的前提下充分考量法律所要保护的价值。在这个过程中,比较各种路径的优劣势成为至关重要的一环。采纳最能够有效保护各种价值、平衡各相关主体利益、最有利于立法目的实现且逻辑自洽的路径是制定法律的关键。这需要深入研究并综合考虑法律、伦理和社会经济等多个领域的专业知识。
围绕“Dreamwriter”案的讨论不仅对解决人工智能生成稿件的权利纠纷有所启发,同时对解决人工智能生成专利、商标等其他人类智力成果的权利争议以及应对人工智能发展给现行立法提出的问题和挑战也具有参考价值。在新的法律框架下,需要考虑如何保护创作者权益、平衡技术创新和社会公益,以确保法律的灵活性和适应性。因此,对人工智能相关法规的发展应该是一个不断演进的过程,以适应科技进步和社会变革。
NOTES
1深圳市南山区人民法院(2019)粤0305民初14004~14007号民事判决书。