1. 引言
计算机技术、信息技术、通信技术的巨大进步对人类科研工作起到了重要的助推作用,及深远的影响,使其科学研究数据越来越具有密集性与协作性。科学数据是世界各国科技创新的基础性战略资源,故促进科研数据全球化的有序开放共享,以最大限度利用科研数据价值已成为全球发展趋势。对有效提升加强数据的资源利用率、加快数据流动性和高效共享对人类科技进步发展有着至关重要的意义。
科学数据管理在世界范围内已经开展了60余年。近年来,利用计算机与互联网技术实现长期数据保全、流通的数据管理体系正逐步在全球的所有学术领域范围内展开。英国皇家学会于2012年发表《科学:开放的事业》研究报告一文中提倡:开放共享各类“智能型数据”,并提出了数据的可获取性、可理解性、可重用性和可评估性 [1]。
科学数据全生命周期管理具有主体多元性与参与性等特点。数据共享这一庞大的系统工程在正常运作时,需要相关各方参与者共同建立科学数据开放共享活动的一系列运行规则。对数据的质量、数据标准和隐私保护、数据安全、共享数据的道德规范和使用合规性、激励方式等问题达成相应的共识。多元性的数据管理主体不仅包括各级政府,还包括了各类研究资助机构、学术团体、研究机构、高等院校、出版商、数据中心存储库管理等相关方,形成多元化的主体共治体系才有可能理顺其多样化且复杂化的数据开放的共享关系。其中充当主要协调角色的主体是政府,其他各相关方则共同参与,包括参与探讨涉及数据共享政策、保护政策、标准与规范、平台建设、管理机制、共享技术、约束机制与激励措施等方面的实施细则制定。
科研人员作为数据共享的数据提供者与使用者,其参与意愿直接影响科学研究数据共享的成效,其中政策、环境、资源和个体意愿是影响科学数据共享行为的最根本因素。本文在通过对科研人员数据共享外因和内因分析的基础上,提出高校科学数据共享激励措施的建议。
2. 数据共享的外因与内因
2.1. 数据管理与共享政策的外部因素
在我国自2001年起,启动第一个科学数据共享工程“气象科学数据共享试点”以来,科研数据的管理与共享在我国多个学科领域逐步展开。在促进科学数据共享方面,我国在国家层面逐步制定相关的政策及举措。2008年4月,颁布了《国家重点基础研究发展计划资源环境领域项目数据汇交暂行办法》,2018年4月,国务院正式印发《科学数据管理办法》,办法围绕科学数据全生命周期规范管理,并明确要求政府预算资金资助的各级科技计划(专项、基金等)项目产生的数据向科学数据中心汇交,为我国科学数据管理与共享政策的制定提供了宏观指导 [2]。
2021年12月24日(第十三届全国人民代表大会常务委员会第三十二次会议第二次修订) 《中华人民共和国科学技术进步法》,对利用财政性资金设立的科学技术研究开发机构,应建立健全科学技术资源开放共享机制,促进科学技术资源的有效利用。国家鼓励社会力量设立的科学技术研究开发机构,在合理范围内实行科学技术资源开放共享 [3]。2018年12月科技部《国家重点研发计划项目综合绩效评价工作规范(试行)》,其中明确要求政府预算资金资助的各级科技计划(专项、基金等)项目所形成的科学数据,汇交到相关科学数据中心。科学数据的汇交、整理和保存作为国家科学数据中心重点任务之一。
国务院下属部门及地方政府陆续出台了科研数据管理与共享的相关政策,例如2001年11月中国气象局发布《气象资料共享管理办法》、2003年12月中国地震局发布《地震科学数据共享管理办法》。安徽省、甘肃省、宁夏回族自治区、山东省、广西、海南省、黑龙江省、吉林省、江苏省、陕西省、湖北省、四川省、云南省、内蒙古自治区相继出台了科学数据管理办法。管理办法明确了管理职责、科学数据中心建设、汇存、科学数据采集、共享和利用、安全与保密等方面的具体要求。
2019年2月中国科学院印发《中国科学院科学数据管理与开放共享办法(试行)》;2019年7月,中国农业科学院印发《中国农业科学院农业科学数据管理与开放共享办法》;2020年7月15日,国家计量科学数据中心印发《国家计量科学数据中心管理办法(试行)》;2018年10月国家林业和草原科学数据中心发布《国家林业和草原科学数据中心数据共享政策》。印发制定这些相关科学数据共享政策,为开放获取、规范管理和使用提供了相应的制度规范与政策保障。在我国,各高校陆续建成并投入使用的科研数据管理共享平台,主要有清华大学、北京大学、上海交通大学、复旦大学、中国人民大学、中山大学、武汉大学等相关科学数据共享平台。并通过各服务平台创建的数据库,进行长期有效数据的保存及适时对外发布,以实现数据共享。其主要涵盖:数据的使用说明、数据的使用规则、会员管理制度、数据存放、元数据标准、使用协议、科学数据管理规范以及隐私保护政策等 [4]。
在国际上各国科技部长们于2004年呼吁经合组织根据共同商定的原则制定一套指导方针,以求提高促进最具成本效益的研究方式。国际经济合作组织(OECD)签发《公共资助的研究数据开放获取宣言》,以支持积极促进全球开放获取(OA)运动的展开。共享开放获取的研究数据可以促进科学文明的进步,且最大限度地获得公共投资的价值 [5]。2007年OECD发布了《关于公共资助的研究数据获取的原则与指南》,为研究数据的开放共享确定了13条原则 [6]。
2012年,UNESCO发布《发展和促进开放获取的政策指南》,并提出了对科学数据共享开放的观点及建议。2012年7月欧盟委员会(EC)发布《EC对访问与保存科学信息的建议》 [7],要求成员制定明确的公共资助研究数据开放获取和传播的相关性政策。2013年12月EC发布《地平线2020对科学出版和研究数据的开放获取指南》。2003年12月国际图联(IFLA)发布《IFLA对学术文献与研究资料开放获取的声明》,其声明中建议对研究资料和学术文献的获取采用开放的原则。
基于一些国际组织制定的相关科学数据开放共享政策,其主要体现在数据的互操作性与高质量性,知识产权及其保护,开放共享科学数据的科技价值以及科研人员的责任与担当。制定这些政策对于全球范围内,有效的促进开放共享科学数据,以及为消除科学数据开放共享中会出现的各类外部障碍,对实现开放研究、开放创新起到至关重要的作用 [8]。
除了政府的共享政策外,其它利益相关各方政策和激励措施也对科研人员共享研究数据的意愿有重要的促进作用,也是科研人员外部影响的因素。
2.2. 科研人员数据共享的内因
科学研究数据共享的外部政策对公共财政资助的研究项目的数据开放共享提出了明确的政策性指引,对社会和企业资助的研究项目,采取鼓励开放共享,而对科研人员自由选择的研究项目,科学研究数据倡导开放共享。拥有大量科研人员在外部约束性要求之外的数据,开放共享主要由研究者个人共享意愿所决定。
已有的研究表明:科研人员共享研究数据的重要动机是:1) 当数据共享是研究过程的重要组成部分;2) 通过提高个人工作的可预见性、互惠数据交换以及被他人认可自己的数据价值,且数据共享后所带来的直接职业利益转化;3) 科研人员在其研究学科对数据的要求与规范;4) 外部的资助者和出版商要求等驱动因素 [9]。
科研人员愿意参与共享主要因素有:其一,科研人员共享意愿受直接利益驱动。对某些科研人员而言数据共享对研究至关重要,数据共享是研究过程中不可或缺的一部分,或者研究完全依赖于数据的共享。这类科研人员共享意愿最为强烈。其二是科研人员希望通过共享数据进行更好的研究,将有助于提升他们自己的职业生涯。其三,是通过出版物、社区或公共存储库的共享研究数据,和通过与受信任的科研人员合作的共享研究数据的发布,从而增加业内关注度。这将有助于科研人员吸引更多的研究资金,增加更多职业机会,同时也是在该领域建立学术声誉获得同行认可的有效途径。其四,是曾从他人共享的数据中受益,故有强烈的共享意愿,并以互惠共享的方式回报数据贡献者。其五,是科研人员所处的研究环境对其数据共享态度的影响,组织内数据共享已趋于成熟,共享数据被认为是必要的基本资源,已成为标准研究实践不可或缺的一部分。其六,是增加自身知识储备量,并有助于提升工作效能和经验 [10] [11]。其七,是研究资助者和出版商的政策和期望。
不愿意共享的主要原因:其一是提供符合标准的数据需要投入大量时间和劳力成本,且无经费资助也无奖励措施;其二是担心敏感数据泄露、数据误用或误解;其三是害怕成果被抢先发表从而减少出版机会;其四是存在负面被发现可能性。
3. 激励与约束措施
对大多科研人员而言,科学数据共享活动主要包括共享科学数据及使用科学数据两方面,因此在制定与之相关的激励与约束措施时,也包括两个方面,既须对科学数据共享活动采取激励措施也须对共享行为进行约束。
3.1. 高校科学数据共享激励措施
高等学校的科研人员既有公共资金资助的研究项目也有企业资助和自主选题的科学研究。科研人员拥有大量个人保存的研究数据,鼓励和倡导个人保存的科学数据共享,需要学校相关部门制定数据共享政策和激励措施。合理、有效的政策措施以利于推动科学数据有效利用,提高数据使用效率,促进科学研究的快速发展。为此,对高校的科学数据共享的激励政策与措施提出如下建议:
建议1,通过资助开放科研数据所需的成本。科研人员可将数据共享的成本列支在资助申请及预算清单中,包括人力、智力和储存的成本。
建议2,科学研究数据贡献者的合理认可。外在的激励不仅包括直接物质资助,也包括酬金、职称和晋升等相应配套政策,以满足科研人员的自我成就感与提升自我价值的需要。并将科研数据共享纳入个人年度考核、职称评定、相关工作晋升之中,完善职业评价体系,也改进了科研评价机制,以及通过同行间评议给予相关科研人员奖励与认可。
建议3,给予数据中心基础设施持续资金支持。为数据可靠保存提供必要的资金保障,为数据管理人员提供职业发展通道,在薪酬待遇、职称职务评聘等方面提供保障。
建议4,通过同行评议将数据出版作为正式的科研成果。数据的公开和发布是共享发展的基础之一,是科研人员分享科研成果智慧不可或缺的机制。将共享的科学数据作为课题申报有效凭据给予认可,对有重要学术价值的共享数据与学术论文同等对待。承认科研人员数据共享贡献,这将有效激励数据提供者的积极性。
建议5,制定明确的数据共享和保存政策。学校相关部门定期为科研人员有效管理数据提供培训和支持,开展数据安全教育。
建议6,给予相关科研人员政策制定的自主权、参与权,如参与共享政策与流程规范、学科数据标准的制定。
建议7,设立“开放数据贡献奖”对开放科学数据工作作出重要贡献的科研人员给予表彰和奖励。
3.2. 科学数据共享约束机制
为确保数据共享质量和规范使用,必需对数据共享、数据使用进行约束性机制来规范化管理,具体措施有以下几个主要方面:
首先是确保数据质量。数据提供者应当保证数据是真实有效的原始数据,提交科学、公正、理性、准确的共享原始数据,必须规范发布,确保数据质量。
第二是确保共享数据安全。一要加强隐私保护,对涉及个人隐私数据做好匿名化或去标识化处理。二要加强科学数据共享平台中的技术保障,严格平台管理人员的工作规范,消除科学数据共享平台安全风险,以降低用户信息泄露风险,同时也要确保数据的可访问性。
第三是明确数据引用与互惠规范。制定科学数据共享互惠细则,规范科研人员数据使用行为约束,明确数据引用和致谢要求。数据使用者标注引用他人数据、致谢或者合作研究,不仅对数据提供者扩大知名度、声誉、学术地位的提升有利,也对数据共享起到推动作用。科研人员既是数据的使用者也是数据的生产者,高校应构建良好的互惠互利氛围,形成一种可持续性的互惠互利规范。
第四是符合数据标识与可理解性。提供的数据必须用适当的元数据标记数据,包括数据来源、数据说明、数据生成过程、数据审核信息、机密性等以确保科研人员共享到的科学数据是准确可信且可理解的。
第五是满足数据规范可读。提供的数据符合存储库的元数据标准,数据格式符合机读要求确保数据的可读性。
4. 结束语
通过对科学数据共享外部促成因素和科研人员的共享动机、障碍、意愿的内在进行分析,建立合理奖励机制基础。共享需求是前提,互惠合作是生态,教育培训是保障。物质奖励和精神激励相结合,满足各类科研人员的不同诉求,促进科学数据共享有序开放。营造真实可信、安全便捷、规范可用、引用致谢的共享文化氛围。以制度建设为抓手,完善开放科学数据共享机制,采取激励措施为手段,围绕科学数据全生命周期管理,持续推进共享数据集平台建设,逐步实现数据互联互通,形成开放数据联盟和学科共同体,形成“以开放为新常态,不开放为例外”的科学数据开放共享的新格局。
加强科研人员的宣传教育与技术培训,从认识上消除疑虑和误解。在实践上提供支持与指导,减少技术障碍。在安全上严格把关,防止数据泄密、侵犯个人隐私和危害国家安全。数据使用和发布上既有激励也要健全约束机制,营造开放、可重用、安全可靠的开放科研数据生态环境。
有学者认为物质激励措施对共享意愿影响与预期不明显、不一致。笔者认为在引导共享初期需要以物质激励为基底,而当共享数据已成为科研人员司空见惯的科研协同方式时,所获得的成果激励自然而然被物质激励所替代。
本文未涉及共享技术的深入探讨。如数据信任、结果跟踪、数据透明度、数据引用支持和沿袭服务等对数据共享的影响。而多维度、多层次、多视野的研究能够更加全面把握推动数据共享发展的全局,这将是我们后续研究的一个重要方向。
基金项目
本文系浙江省教育厅一般项目“科研数据开放共享激励机制构建的研究”(项目编号:Y202145926)研究成果。