1. 引言
随着大数据和区块链等数字化技术的不断发展,极大地丰富了数据要素的构成。2019年党的十九届四中全会中首次明确了数据的生产要素地位,并强调其对完善再分配机制的重要性;2022年中共中央、国务院发布的《关于构建数据基础制度更好发挥数据要素作用的意见》,进一步在加快数据基础制度建设的基础上,充分激活数据要素潜能,以数据要素活力赋能实体经济,促进全社会共享数字经济发展红利。在此数据建设的背景下,数据的资产化已成为必然趋势。
然而,目前国内外数据资产化的相关发展仍处于发展阶段,对数据资产的概念及管理等研究问题尚未形成共识。因此,本文结合现有国内外的文献研究,利用可视化文献计量软件,探究国内外数据资产的研究热点问题和前沿发展方向,并对现有的国内外数据资产研究结果进行比较分析,意在为未来数据资产的相关发展提供理论依据和方法支撑,以此推动未来国内外数据资产实践工作的开展。
2. 数据资产内涵与特征
关于“数据”概念的初步认识,最早是来自信息领域。随着时代的发展,在“数据”概念的框架上逐渐加入数据的资产属性,进行数据资产的概念探索。“数据资产”的概念是来源于“数据”的概念演变,正式的概念由Richard Peterson于1974年首次提出;随后在演变发展的过程中结合信息资源和数据资源,将数据作为生产要素参与社会生产分配和价值测度,因此数据资产的概念逐渐丰富。
3. 研究方法与研究创新
3.1. 数据来源与研究方法
本文通过对相关文献的梳理和筛选,总结了现有数据资产的研究进展。具体研究方法遵循以下几个步骤。首先,本文以2006~2023近15年间的文献数据作为研究所用的参考文献,对中国知网(CNKI)中的CSSCI、北京大学中文核心期刊和Web of Science数据库中发表的文章分别以“数据资产”、“数据资产价值评估”、“数据资源定价”、“数据资产管理”、“数据治理”、“数据安全”、“大数据”、“数字经济”及对应英文“data asset”“data asset value evaluation”“data asset pricing”“data asset management”“data governance”“data security”“big data”和“digital economy”为主要关键词对国内外的文献进行主题检索;其次,对不符合研究主题的文献进行手动筛选和剔除,并对遗漏的文章进行补充,因此本文共获得2006~2023年近15年间的有效中文文献389份,外文文献613份,作为本文的研究分析对象,再利用CiteSpace可视化软件对与本文主题强相关的文献进行图谱分析,总结对比国内外数据资产研究特征差异。
3.2. 研究创新
本文的研究创新点主要在于:在研究主题上,数据资产相对于传统资产更加新颖,具有一定的研究意义;在研究内容上,以国内外近15年的相关核心文献作为文本分析对象,肯定了研究内容与研究主题的关联性,拓展了数据资产的研究范围;在研究方法上,以文献综述法和对比分析法进行主题研究,以发展特征为对比视角,剖析国内外数据资产发展的差异,并针对存在差异提出未来研究展望。
4. 国内外数据资产研究可视化图谱分析
4.1. 国外文献研究
4.1.1. 关键词共现分析
本文运用CiteSpace可视化软件对上述已检索到的613份有效英文文献进行梳理和统计分析,总结了现有国外文献中对数据资产相关理论及方法的研究进展,以关键词作为文本检索对象。在此选择了出现频率最高的十个关键词,以出现年份和中心性进行关联分析,有关国外文献的高频关键词分布见表1。根据表中的关键词统计结果显示,共有578个关键词节点,945条节点连线,中心性都较为显著。其中“data management”出现频次最多,次数为432,中心性为0.73,位列高频关键词分布之首,结果表明2020年是国外数据资产相关研究产出的高峰年份,研究大多聚集于数据资产管理。在十个关键词的时间分布中,2016年和2021年的时间节点均出现两次。其中2016年的研究主题聚焦于大数据的运用,以深度学习的机器语言方式应用于数据资产的管理研究;2021年更加注重对数据资产的价值测度,将数据置于数据市场中,以定价的方式体现数据资产的应用价值。
Table 1. Foreign high-frequency keyword distribution
表1. 国外高频关键词分布
4.1.2. 关键词聚类分析
关键词聚类是对主要关键词的聚集分类,可将多个紧密相关的词划分为几个聚类主题,用图谱的形式显示各聚类间的关联程度,从此更深层次地挖掘数据资产的研究热点。聚类中包含的关键词越少,该聚类序号的数字越大。反之,聚类数字越小。根据聚类主题,CiteSpace可视化软件根据社会网络中关键词出现的频率及中心性,提供了模块值Q值和平均轮廓值S值,其中此研究的Q值为0.4908,S值为0.7614,表示聚类结果显著。通过对相关有效英文文献的聚类分析,共得出8个聚类主题,各关键词聚类的结果见图1。结合聚类情况,将国外文献研究主要分为三个层次,主要从宏观、中观和微观三个层次进行国外文献的分类研究。
从宏观层面来看,将数据纳入生产要素中,成为区别于传统资产的新型资产,需发挥这一新型生产要素在社会经济发展中的作用。该层面包含的聚类有#6 data elements。数据要素是蕴含重要资产信息的关键要素,内涵包括数据要素的具体价值体现。Gold Finger (1997)是最早将图片音像等信息数据作为无形资产进行研究的学者 [1] ,后来Chirs (2010)将信息作为被资产价值化的资产,以无形资产的概念定义对其进行研究 [2] 。
从中观层面来看,主要强调借助先进的数字化互联网技术和模型进行数据资产的相关研究。该层面包含的聚类有#0 internet of things、#2 machine learning和#3 ecosystem services。通过工业互联网的概念,利用物联网实现数据的共享状态,最终实现数据资产的协作。Younan Mina等人(2021)利用物联网进行数据挖掘 [3] ,Attar-Khorasani Sima和Chalmeta Ricardo (2022)利用物联网进行数据的可视化分析 [4] ,可见物联网在数据资产前期的数据挖掘和后期的数据分析都有广泛的应用。
从微观层面来看,数据资产的研究采用具体方法和模型对其进行管理相关的研究,主要体现在对其价值实现。包含聚类有#1 asset pricing、#4 capital asset pricing model、#5 data model和#7 data management。主要集中于构建具体模型,对相应数据资产的进行定价和计量。
Figure 1. Cluster graph of foreign literature keywords
图1. 国外文献关键词聚类图谱
4.2. 国内文献研究
4.2.1. 关键词共现分析
本文运用CiteSpace软件对上述已检索到的389份有效中文文献进行主要关键词的共现分析,共得到276个关键词节点,637条节点连线,以“数据资产”为中心的连线密集且复杂,与其他节点交织连接,说明数据资产的相关研究以“数据资产”为研究核心,聚焦于数据的运用,应用场景广泛。以关键词图谱总结出国内高频关键词分布表,详情见表2。结合频次和中心性可以初步判断,在2022年是国内数据资产相关研究的产出高峰年份,“数据资产”是该研究领域中的核心,频次出现为183次,中心性为0.68,说明以“数据资产”为中心的相关数据要素发展连接密切,国内需求理论和应用场景发展逐渐繁荣。根据国内数据资产的高频关键词和共现分析结果,可将国内数据资产的研究视角分为三个方面:第一,以数据资产的理论探究为研究视角;第二,以数据资产的产生为研究视角;第三,以数据资产的应用为研究视角。通过国内高频词的指引,以共现分析中不同的研究视角为基础,为聚类分析的主题分类提供了参考。
Table 2. Domestic high-frequency keyword distribution
表2. 国内高频关键词分布
4.2.2. 关键词聚类分析
数据资产热点内容一直被国内相关数据研究学者广泛讨论,且国内数据资产正处于发展阶段,资产类型分类众多。因此,如何进行数据资产的主题分类研究对相关数据资产的发展具有重要作用。借助关键词聚类分析图谱,详情见图2。其中此研究的Q值为0.6164,S值为0.8808,聚类结果显著。根据分类的8个聚类主题,将整体聚类主题分为两大研究主题,即数据资产构成和数据资产管理。
数据资产构成该主题中包含的聚类有#0数据资产、#2数据要素、#3大数据和#7数据资源。数据资产构成要素众多,根据现有参考文献进行分类,大致可分成三种类型的数据资产,即个人数据资产、社会数据资产、经济数据资产和企业数据资产。由于数字科技的不断发展,个人作为社会发展中的独立个体,以个人或群体活动为中心的活动与社会生产密不可分,所以相关个人数据资产的挖掘和应用逐渐成为新的热点话题。许宪春等人结合互联网平台的个人数据资产评估实例,对个人数据资产价值链进行整体剖析,重点发挥个人数据资产作为关键生产要素对经济社会发展的作用 [5] 。社会经济数据资产涵盖种类众多,涉及社会生活的方方面面,在此主要研究政府数据。在充分挖掘政府数据资产价值的基础上,夏义堃和管茜对政府数据资产的内涵进行深入探究,构建以“四位一体”的具体要素框架 [6] 。金融数据资产是经济数据资产的重要体现。随着国内数字经济与实体经济的深度融合,金融数据资产的应用逐渐广泛,有效提升金融数据资产的治理能力也成为经济持续健康发展的核心议题 [7] 。企业是数据资产的承载主体,在大数据发展的影响下,传统企业数据资产进行数字化转型升级,如林杰、刘志杰借助大数据,探索出版业新的价值与运营途径 [8] ;王柯元等人创新传统的电力数据交易系统,以区块链技术实现电力系统的交易设计和数据资产化 [9] 。各类数据要素丰富了数据资产的构成,在充分挖掘数据要素潜力的前提下,发挥数据资产的价值建设属性。
Figure 2. Cluster graph of domestic literature keywords
图2. 国内文献关键词聚类图谱
数据资产管理该主题中包含的聚类有#1数据治理、#4价值评估和#6数据管理。数据资产具有潜在价值已经成为普遍共识,而如何进行数据资产的测度已成为众多学者关注的问题。通过总结近几年各学者的研究成果,从已筛选的国内文献中选择具有代表性的文献,按照属性和方法,大致将数据资产的管理形式分为以下几个方面。多属性数据资产管理的形式见表3,主要分类依据是根据数据资产从概念范围确定到价值实现的整体流程,表明国内各学者对数据资产的不同研究方向。从理论基础层面来看,确权理论构成了数据资产管理的研究理论基础,为进一步进行数据资产的价值探索提供了统计与核算依据;从内容方法层面来看,多以传统的评估方法和综合评价方法来拓展数据资产管理的实施路径。
Table 3. Multiple attribute data assets management
表3. 多属性数据资产管理
4.2.3. 时间线图谱分析
通过CiteSpace的时间线图谱可以更加直观的了解研究文献的高频词分布情况,其中图中圆圈的大小代表关键词的发文量和影响力,弧线代表关键词的研究时间跨度。可以将圆圈和弧线作为预测变化趋势的参照点之一,比如在现阶段数据资产及有关数据资产管理相关的概念是学界研究的重点;从时间段中关键词出现的种类和密度,也可以看出相关数据资产的不同研究阶段。
从图3的时间线图谱中,可将国内数据资产相关研究的时间跨度分为“兴起期”(2006~2012)、“探索期”(2013~2015)和“发展期”(2016~2023)三个阶段。“兴起期”关于数据资产相关的发文量较少,主要集中于“数据资产”和“数据安全”的理论研究,在此阶段学者们逐渐关注到数据资产的发展潜力;在“探索期”有关数据资产的相关发文量大幅增大,研究主题也愈加丰富,“大数据”和“数据治理”成为该阶段学者研究的重点;“发展期”关于数据资产的研究相对集中,“数据交易”等数据资产的价值实现成为研究重点,目前国内数据资产研究正处于蓬勃发展的阶段。随着数字化技术的提升,数据资产的相关内涵提升及价值实现将会成为未来发展的重点。
Figure 3. Domestic literature keyword clustering timeline graph
图3. 国内文献关键词聚类时间线图谱
5. 国内外数据资产研究前沿方向对比分析
5.1. 研究热点问题对比分析
本文通过对上述国内外数据资产的关键词共现和聚类分析结果进行梳理,可以直观地看出:数据资产管理是国内外学者关注的热点话题,数据治理和数据价值实现是研究的核心主题,近期大数据、机器学习、定价估值等研究热点得到学者们的广泛关注。国内外研究的不同之处在于:国外学者们更注重借助模型和算法对数据资产的价值进行计量研究,而国内学者更侧重于数据管理和治理,特别是数据安全的相关研究;并且对于相同的研究主题,国外学者们开始关注的时间都比国内学者早。这些热点研究发现都为国内外未来数据资产的研究和实践提供了新思路。
5.2. 研究前沿方向对比分析
一个新兴热点的出现可能预示未来的主题发展方向。突现词分析可以识别出主题在时间上的变化趋势,从而把握好研究领域的前沿性问题进行预判分析。在关键词共现分析的基础上,通过运用Citation Burst功能对国内外文献研究的突现词进行分析。在CNKI数据库和Web of Science中各得出15个研究前沿方向,从中筛选出突现强度排名前五的突现词,得到的结果如表4所示。其中国内文献中突现强度排名前五的突现词是“数据要素”、“数据治理”、“数字经济”、“大数据”和“数据开放”,表明通过丰富数据资产的要素构成,以数字经济背景下大数据发展的支持,推动数据治理和数据开放共享是国内研究的前沿方向。国外文献中突现强度排名前五的突现词是“data management”“data valuation”“machine learning”“pricing model”和“big data”,表明处于数据资产管理的情境下,借助大数据和机器学习等互联网技术,对于数据资产的价值评估和定价是国外研究的前沿方向。
综合上述研究对比来看,国内外研究前沿性的侧重点不同。表明国内外的数据资产虽都处于发展阶段,但由于国内数据资产相关研究对比国外发展相对较晚,在明确数据资产相应概念范围的基础上,顺应数字经济时代大数据发展带来的数据红利,以开放共享的数据形态进行数据治理领域的探索研究,并由数据治理为基础进行数据资产的其他计量研究;而对于相同的研究主题,国外的数据资产研究更成熟,且更加注重发挥机器学习等先进互联网技术在数据资产研究中的作用,以此促成了前沿性问题的话题的时间差。因此,由国内外突现词分析的前沿性分析对比,可以总结国内外研究前沿差距,并借鉴其研究前沿性话题,结合国内实际数据资产发展现状,加快国内数据资产的相关研究进程。
Table 4. Analysis and comparison of burst words at home and abroad
表4. 国内外突现词分析对比表
6. 主要结论
本文利用CiteSpace软件,全面整理2006~2023年国内外相关数据资产研究成果,进行可视化分析,得出的主要研究结论如下:
首先数据资产的相关研究一直是国内外学者研究的热点话题,但是针对数据资产研究的侧重点不同。根据国内外文献的关键词结果分析可知,国外关于数据资产的研究主要集中于数据资产管理,借助物联网等互联网技术手段进行数据资产的相关领域探索,并且发展具有一定的层次性;国内的数据资产研究主要从数据资产的理论本身出发,借助一系列计量方法进行数据资产应用场景的拓展研究。
其次数据资产研究热点处于不断演变的过程,可以通过时间变化趋势抓取数据资产话题的前沿研究方向。根据现有文献的突现词分析可知,在阶段内国内外的数据资产研究方向具有一定差异。“大数据”是国内外数据资产研究的重要背景,在未来数据资产发展阶段,国内的前沿性研究更注重数据要素特征范围界定和数据的开放共享,而国外的前沿性研究更注重数据资产的管理,并对数据资产的价值评估和测定进行深入探究。
最后有关数据资产的研究都逐步推动国内外形成各具特色的数据资产发展体系,在不同区域和行业之间充分协同联动数据资产资源,积极推动数据资产相关研究发展。
7. 建议与展望
结合本文的上述研究,为促进未来数据资产的相关研究和实践,提出几点建议。第一,需充分借鉴国外先进的研究成果,结合我国数据资产研究实际,进行相应的数据资产研究创新;第二,注重数据资产的多重应用场景探究,丰富数据资产的实现方式,充分挖掘出数据资产的内在价值;第三,善于运用大数据、物联网等先进数字技术的支持作用,顺应时代的发展要求,充分进行数据资产相关管理的探索。
目前来看,数据资产作为新兴资产,具有挖掘和探索的价值。在这个机遇与挑战并存的数字经济时代,需充分发挥数据资产创新驱动的主观能动性,充分将我国海量的数据资产应用于丰富的应用场景,激活数据资产要素的发展潜能,积极加快数据资产的相关产业部署和发展,从而以数据资产推动我国数字经济的新动能发展,构筑国家新的数据资产竞争新优势。
基金项目
内蒙古师范大学基本科研业务费专项资金(2022JBTD016);内蒙古社会科学基金项目(2022FY04)“国家文化数字化战略背景下内蒙古非物质文化遗产创新性发展研究”;江苏省社会科学基金项目(22TQB007)“数字人文视域下地方历史文献知识服务体系构建研究”。