1. 问题的提出
我国已经进入互联网时代,数字技术正在飞速发展。数字技术在全社会各个领域迅速发展,推动社会变革。现如今,在我们的政治、经济、文化和社会生活领域,数字技术已经不可或缺。而数据,则日益成为社会各界重视的生产要素,是经济增长和价值创造的重要源泉。因此,有学者称其为“新石油(newoil)”[1]。在探讨数据的知识产权保护问题之前,我们需要明晰数据的含义。“数据指对信息一种形式化表现,其背后的含义可被再次展现,且该体现适于沟通、展示含义或处理。”1我国《数据安全法》第3条第1款:“本法所称数据,是指任何以电子或者其他方式对信息的记录。”因此我国关于法律上“数据”的范围实际上已经限定,且该范围十分宽泛。
有学者将数据与知识产权联系起来,就是因为数据具有与知识产权保护客体的相似性[2]。其相似性可以总结为三点。第一是无形体,即数据没有实体;其二是价值性;其三是非损耗性。兼之数据产品需要经过一定劳动投入,使之形成具有较高价值的智力成果,与知识产权制度目标有一定重合。但原先的知识产权保护制度毕竟不是针对数据而创立的,在具有诸多相似性的同时又具有其自身不同于知识产权保护客体的独特特征。这也是在学界引发激烈争论的源头。数据的独特特征可以总结为三点。其一是数量庞大;其二是种类多样;其三是具有时效性。因为数据与知识产权保护客体的相似性,学界和司法实务界首先想起知识产权保护制度对数据权益进行保护。正如有学者指出,总体状况是将数据权益融入知识产权保护[3]。这也需要我们对数据与知识产权客体的属性进行一一对比,找出合适的法律制度进行保护。但是,数据市场从出现到引起人们重视也不过数十年,数据因其独有的属性,引起了不断的争议。
2. 研究现状
(一) 国内研究现状
目前国内学者对于数据的知识产权保护的问题主要有两类,其一是支持者,支持将蓬勃发展的数据资源纳入知识产权制度保护之中。其二是反正者,认为数据确权会导致“反公地悲剧”,导致数据垄断等诸多严重后果。支持者又进一步细分为两类,一类认为应当适用现有的知识产权保护制度保护数据权益。如崔国斌教授主张的适用公开传播权[4]。如单晓光教授认为,应当将数据融入现有的知识产权保护路径[5]。另一类认为应当创设新的数据知识产权保护制度。如冯晓青教授认为,“应当建立新的商业数据法律保护模式”[6]。而反对者们则认为,数据不应当强行确立为知识产权客体,而应该运用其他方法进行财产性权益保护。如申卫星教授认为,“应当设立数据用益物权”[7]。龙卫球教授主张,“在个人层面配置人格权益与财产权益;在企业层面配置数据经营权与数据资产权”[8]。在2022年,我国颁布《关于构建数据基础制度更好发挥数据要素作用的意见》(后面简称为“数据二十条”)。其立场已经十分明显。即数据“三权分置”的产权体系。但我们仍然需要注意,“数据二十条”对许多具体问题仍然规定较为空泛,有待进一步的市场和司法实践。
(二) 域外研究现状
欧盟的相关经验较为丰富,其数据知识产权保护制度对于我国具有较强的参考价值[9]。欧盟的保护模式是由合同、事实控制、知识产权、商业秘密和数据保护法确定的模式,已经形成了强有力的数据保护机制[10]。美国对于数据的保护则具有积极促进流通的鲜明特点。以“HiQlabs诉领英(LinkedIn)案”2为例,经过二审、再审,法院均是维持原判,禁止LinkedIn干扰HiQLabs获取其网站的公开数据。国际上对数据确权问题也一直争论不休,但美国在2018年3月颁布了《澄清境外数据的合法使用法案》,自行赋予美国自身巨大的权力。配合“长臂管辖”,任何与美国有最小联系的厂商的内部数据都要受该法案管辖[11]。其对于数据流通的规制以及重视程度非常值得我们借鉴。
3. 数据流动过程问题探析
(一) 数据产生阶段
以数据产生的源头来看,我们可以将数据分为产生于自然界的数据和产生于人类社会的数据。在不违背相关法律的基础上,当然允许所有社会公众自由采集自然界数据,这是人类所共有的天然财富。产生于自然界的数据一样可以为数据产业的发展作出重要贡献。但产生于人类社会的数据,则种类繁多。简单来看,按照信息性质又可以分为公共数据、企业数据和个人数据[12]。这种分类较为粗浅,我们需要进一步的深入探究。以公共数据为例,因为我们的目标是平衡公共与个人、企业之间的利益冲突,国家安全和公共利益为重中之重,所以我们可以将公共数据分为涉及公共安全的数据和不涉及公共安全的数据。涉及公共利益的数据当然由《数据安全法》及其相关法律调整,此领域禁止知识产权制度触及。但公共数据并不是全部都不可公开,以政务数据为例,相当一部分政务数据是可以公开的,不仅保障了公民知情权,也为无法获取大量数据的社会主体提供了一个完全免费的数据库。一定程度上允许了更多的社会主体参与进高速发展的数据产业。更多的参与主体意味着更强的发展动力。个人数据是个人社会活动过程中产生的数据,往往涉及大量敏感的个人信息,一旦泄露容易引起不利的后果,如近年来电信诈骗类犯罪发案率的快速上升等。但个人数据又是数字经济中最有价值的数据。人工智能需要更多的数据灌溉,数据市场也需要更多的数据供给。但促进数据流动并不是无限制的,其应当让位于国家安全和个人安全。
(二) 数据收集阶段
以收集持有的主体为标准,可以将数据收集者分为公共收集者、个人收集者和企业收集者。公共收集者收集数据应当依法进行,否则便可能日益侵害个人隐私权和人格尊严。个人收集者无法自身生产大量数据,因此常见的情形是利用互联网爬取技术。爬取技术会对目标数据所在的服务器造成负担,一定程度上损害了被爬取者的利益,同时有着较大的法律风险,除了损害他人财产权益外,严重者还可能涉及刑事责任。而互联网时代,能大量采取数据的收集者主要是大型互联网企业。具有庞大用户基础的互联网企业收集数据并不完全公平。以微软更新系统为例,通知用户数据将会在所在地区或国家以外的地方处理,企业履行了法律规定的告知义务。但用户并没有选择权,要么点击同意,要么点击关闭。用户看似拥有对自身数据的决定权,实则没有。微软的垄断地位来源于庞大的用户基础,但其庞大的用户基础也反过来绑架用户其本身。“棱镜门”曝光后,数据安全惊醒各国[13]。如果无法保证基础的安全需求,数据的知识产权永远无法得到真正的发展。数据的合法获取是数据知识产权发展永恒的基石。
(三) 数据加工阶段
数据加工是数据价值飞跃的关键阶段。不同的主体对待同样的数据,能分析并提取的有用信息是不一样的。不同主体对大数据潜在价值的挖掘能力和挖掘层次也不一样。甚至以不同视角对数据价值进行挖掘,都能得出种类繁多的有价值之数据。因此数据市场需要更多的市场主体参与进来,这与现代数据天然的流动需求相一致,亦与“数据二十条”的激励目标相契合。数据的知识产权保护也是为了以法律制度保障利益,以合法利益激励数据资源市场的繁荣昌盛。数据大国能否向数据强国转变,也在于这一阶段的充分创新发展。数据加工阶段是数据流动的重要阶段,但数据加工者在数据的流动过程中并不是一个完全独立的主体。其过程涉及到数据来源者、收集、加工等一系列不同市场主体的合力行为。对市场不同主体所投入的劳动价值进行衡量,是解决不同主体利益冲突的最好方向。
(四) 数据经营阶段
“数据二十条”明确提出要设立数据产品经营权,推动数据市场的快速发展[14]。而在数据的经营阶段,我国已经有一些市场和司法实践。以贵阳大数据交易所为例,通过试点实践,为国家提供了较为丰富的实践经验。可惜的是,更多的相关交易所发展不尽如人意,显示出流通难、技术难和市场难[15]。
其原因主要有两个方面。其一在于数据交易可能带来大量安全隐患。交易所也因之陷入“数据安全”和“数据流通”难以两全的困境[16]。用实践经验给数据自由交易泼了一盘冷水。其二在于互联网平台本身天然具有收集数据、加工数据、经营数据等角色属性,无需将数据资源投入交易市场。其可以通过自身垄断地位将数据进行垄断经营,从市场主体中摄取“最大利益”。以“淘宝诉景美案”3为例,虽然法院并未支持淘宝方的大数据产品的专有财产权益主张,但却肯定了淘宝的竞争性财产权益。淘宝以其垄断优势排除了数据市场其他同行业竞争主体的竞争能力以及数据经营合法性。在此情况下,淘宝商家们不得不花费高昂代价购买淘宝利用平台收集数据制作的“数据产品”辅助自身经营,这无疑增加了中小微企业运行成本。
4. 数据产权问题完善
(一) 数据产生阶段之权利客体界定
综上所述,将数据纳入知识产权保护需要明确数据权利客体所应有的范围。数据的知识产权保护并不是要求任何数据均符合知识产权客体的构成要件。只有具有高度价值且付出了劳动的数据集合才有保护的意义。第一是合法性。数据来源可能是不同主体,如天气数据、个人数据、自动记录的机械数据等。司法人员在适用法律处理纠纷时,也会首先判断数据来源的合法性。没有数据来源的合法性,其后的一应程序都缺乏合法性基础。第二是能判断为数据库。单个数据的经济效益有限,且行政资源和司法资源有限。如果勉强全面保护单个数据,反而得不偿失,使得制度失能失灵。数据的知识产权保护也需要注重效率价值。数据库作为一个数据集合能更大程度体现现代数据作为生产要素的重要价值。
(二) 数据收集阶段之抓取方式合规
数据获取的方式大致可分为两种:一是通过对外提供API接口的方式获取数据;二是通过数据爬虫技术获取数据[17]。实践中,主要是数据爬取行为的不正当引起了纠纷。爬虫技术是互联网数据抓取最有效率的手段之一,因此也容易引起纠纷。在“百度诉奇虎案”4中,法院认为百度公司与Robots协议的初衷相违背,属于不正当竞争行为。从行业实践出发,也更贴近实际情况。因此我们可以更进一步明确抓取数据的法律性质,将Robots协议纳入行业规范,以保证数据安全与合法使用。相应的,个人抓取互联网上予以公开的数据,应当确立一个数据抓取合法与非法的界限。例如可以限定抓取数据的频次,以平衡数据流动与互联网平台基于自身服务器稳定之间的利益冲突。
(三) 数据加工阶段之权利主体明确
数据从产生到集合,需要经过数据的来源者、采集者、处理者,处理者包括经营者。因此,确定权利主体是数据知识产权保护的基础难题。本文认为应该基于各主体的劳动投入,依次赋予相应权利。
对于数据来源者而言,对于不涉及个人信息的数据则归属于合法的采集者所有。采集者对此付出了劳动,当然具有相关权利。
对于数据收集者而言,首先要确定的是数据的收集合法,因此不同的收集主体对于收集的同样数据,各自收集各自赋权。
对于数据处理者而言,对其进行处理后的数据产品享有权利。如果既是数据收集者又是数据处理者,那么当然具有两阶段的相关权利。
(四) 数据经营阶段之权利行使限制
在数据权利之上也应当设定更多的限制,以保证数据产权确立后能促进其在市场上的充分、公平且安全的流通。数据权利界定的目标就是促进数据产业的发展,就需要尽可能促进数据的流通。那么该权利就不可以任凭数据权利所有者滥用权利。第一就是数据持有权时间的限制,同一数据库不应该在同一主体手中沉没太久。第二是限缩商业秘密的保护范围。数据产业仍然在高速发展期,而商业秘密保护制度对于企业的便利性会极大降低数据流通的效率。进而延缓数据产业的发展。避免“公地悲剧”的第二步就是避免“反公地悲剧”,这是数据权益知识产权保护格外注意的重点。想要知识产权制度走的更远,就需要基于现实发展的需要,不断推动法律制度适应新的现实。最后,基于安全考虑,涉及国家安全、公共利益的数据,应当在市场流通中严格受限。除此之外的其他数据以制度合力促进数据在市场上充分流通,最大化数据这一生产要素的核心价值。
5. 结论
从国家数字经济的发展战略来看,数字财产权数据作为新型生产要素,具有无形性、非消耗性等特点,可以接近零成本无限复制,对传统产权、流通、分配、治理等制度提出新挑战,亟需构建与数字生产力发展相适应的生产关系,不断解放和发展数字生产力。从数据持有者的利益诉求来看,数据市场化流通需要构建一个明确且便于执行的数据财产权益制度。数据与知识产权客体具有一定的相似性。学界研究和司法实践也逐渐倾向于知识产权保护路径。然而现有知识产权保护制度和商业秘密保护制度面对数据产业的蓬勃发展,均力有未逮。因此需要将数据产权作为一种新型智力成果纳入知识产权制度的保护之中,明确数据产权客体、主体,合法合规地抓取、加工、经营。以制度合力最大化促进数据在市场上的公平流通,充分发挥中国海量数据规模和丰富应用场景优势,激活数据要素潜能,做强做优做大数字经济,增强经济发展新动能。
NOTES
1ISO/IEC2382:2015 Informationtechnology-Vocabulary, https://www.iso.org/obp/ui/#iso:std:iso-iec:2382:ed-1:v1:en
2参见https://www.westlaw.com/Document/I7061ba40d32e11e9a803cc27e5772c47/View/FullText.html?transitionType=Default&contextData=(sc.Default)&VR=3.0&RS=cblt1.0
3参见杭州铁路运输法院(2017)浙8601民初4034号民事判决书。
4参见北京市高级人民法院(2017)京民终487号民事判决书。