1. 引言
1.1. 研究回顾
1956年,“人工智能”这一术语在达特茅斯学院人工智能研讨会上被首次正式使用,其后相当长一段时间因受制于计算机算力、算法、存储、相关硬件设备等,人工智能发展缓慢。历经反思发展期、应用发展期、平稳发展期,人工智能现在步入蓬勃发展期,图像分类、知识问答、无人驾驶等AI技术不断实现重大突破。技术发展的同时,人工智能也深刻影响并赋能工业、金融、医疗、教育等诸多行业领域,图书馆学界也密切关注AI技术动态,进行了一系列融合研究。2017年图书馆版《新媒体联盟地平线报告》[1]将人工智能列为图书馆界的六大技术发展之一。2019年,以“AI在图情:人工智能赋能图情服务”为主题的图书馆前沿技术论坛在上海图书馆举办,会议聚焦图书馆与人工智能,围绕人工智能重构知识服务基础设施、丰富知识服务方法手段和升级知识服务形式等议题展开了系列讨论。沈玲[2]、凡庆涛[3]、王璇[4]等学者分别于2019年和2020年就人工智能技术在图情领域中的应用进行了综述性研究。
2022年11月30日,人工智能技术进一步发展的代表性产品ChatGPT正式发布,次年3月,新一代4.0大语言模型推出。凭借强大技术优势,ChatGPT引发全球瞩目,迅速掀起新一轮研究浪潮。同年8月15日,《生成式人工智能服务管理暂行办法》正式生效。12月28日,“生成式人工智能与知识组织和服务的变革”被推选为2023年度中国信息资源管理学界十大学术热点之一。2024年3月5日,李强总理在《政府工作报告》中强调“深化大数据、人工智能等研发应用,开展‘人工智能+’行动”。这意味着国家层面将加强顶层设计,加快形成以人工智能为引擎的新质生产力。随着人工智能技术的进一步发展,学术界普遍关注人工智能在图书馆领域的应用前景,开展了诸多理论及实践研究并取得了一系列相关学术研究成果,有必要在已有文献计量研究成果的基础上,补充最新研究成果,梳理学科领域的新进展,并进行深入分析,从而更好地把握研究新趋势,以期为学界提供有益参考,不断推进知识创新、理论创新和实践创新,助力新时代图书馆事业高质量发展。
1.2. 研究目的
本文旨在运用文献计量分析方法,系统梳理人工智能在国内图书馆领域的融合研究发展脉络和特征,进而为深入推进该领域研究寻找可借鉴的宝贵经验。本文的研究贡献主要体现在以下几个方面:第一,基于“中国知网”学术期刊文献检索结果,较为全面地回顾和分析近十年来人工智能技术在国内图书馆领域的融合研究现状与进展。目前虽有吕文晶[5]、袁毅[6]、郑烨[7]等学者利用文献计量方法分析了人工智能在图情领域的应用,但是上述研究的样本数据集年份均在2018年以前,而国内该领域的研究自2017年迅速崛起。随着2022年底现象级应用ChatGPT的发布,生成式人工智能迅速掀起新一轮研究浪潮,现有研究文献未能全面体现领域研究发展的全貌。第二,通过从纷乱复杂的研究网络中分析凝练研究主题和热点领域,归纳总结人工智能技术在图书馆领域已有的研究重点问题,并根据主题的演变路径推测值得深入挖掘的研究方向,可为后续相关研究的深入开展及应用实践探索提供参考。
1.3. 样本文献
本文选择CNKI期刊库为数据源,检索时间为2024年1月10日,检索策略为“SU = 人工智能AND图书馆”,在未限定检索年限的前提下,共获得1396篇文献。将上述文献进行筛选、去重,得到有效文献1339篇,以此作为本文分析的样本数据,并以Refworks格式导入CiteSpace、Vosviewer等软件。
1.4. 研究方法
文献计量法是针对某一学科的文献进行定量分析以揭示其发展规律的研究方法。本研究利用文献计量法常用的可视化工具CiteSpace、VOSviewer对样本集文献的发文年代分布、主要发文作者、热点共现、关键词聚类、主题演进、突现词等方面进行共现分析,绘制知识图谱,以全面、直观的方式展现人工智能技术在图书馆领域的研究热点、演化进程及发展趋势。
2. 研究分析
2.1. 文献总体情况/发文时间分布
图1展示了相关研究的论文发表情况,通过研读相关文献,可将迄今为止人工智能在图书馆领域的融合研究发展历程分为三个主要阶段:
(1) 萌芽及基础研究阶段(1987~2010年)。该阶段年度发文量保持较低水平,总量不及总体发文量的5%,研究主要集中在概念引入和应用场景展望方面。国内图情领域有关人工智能的研究文献最早发表于1987年,内容涉及国外人工智能研究与图书馆情报业务的理念引进,学者基于人工智能作为认知科学的特性,提出利用人工智能原理将图书馆情报学理论方法在实践领域进行拓展和延伸的设想。早期关于人工智能在图书馆领域的研究主要集中在理论研究和应用场景设定方面,例如文献加工自动化系统[8]、智能信息组织[9]、图书馆智能化管理与决策支持[10]等。该阶段虽然发表文献量较少,但经过长期的酝酿,构建了适用于数据图书馆发展的系统理论体系,并产生了我国图情学界第一代人工智能研究者,为后期该技术在中国图情领域的快速发展奠定了良好基础。
(2) 发展及繁荣阶段(2011~2021年)。该阶段中国图书馆事业步入智慧图书馆建设阶段,学界就人工智能技术在图书馆应用的广阔前景达成普遍共识,研究成果数量迅猛增长,并均呈现快速上升态势。期间相关文献发文量达到总体发文量的70%以上,其中核心期刊文献约占同期总发文量的30%,应用领域不再局限于传统文献服务及自动化管理系统,数据挖掘、机器学习、智能定位、虚拟现实等人工智能技术综合应用于图书馆领域,涌现出图书馆智能咨询系统[11]、基于卷积神经网络的文献自动分类研究[12]、人脸识别技术在图书馆的应用研究[13]、基于人工智能的图书馆空间再造与服务[14]等典型应用案例。这一阶段,人工智能已经成为推动图书馆智慧化转型发展的重要技术手段,在图书馆空间、服务和管理方面均发挥着巨大作用。
(3) 平稳过度及异军突起阶段(2022~2023年)。经历了十余年的快速发展,人工智能技术在图书馆领域的研究及应用逐步过度到平稳阶段。2023年迅速崛起的ChatGPT (聊天生成预训练转换器)占据了新阶段领域研究的半壁江山,其凭借特有的启发性内容生成能力、对话情景理解能力、序列任务执行能力以及程序语言解析能力,为图书馆创新服务场景快速嬗变提供技术支撑和可行依据[15]。
Figure 1. Distribution of issuance time
图1. 发文时间分布
2.2. 研究机构
发文机构方面,发文量排名居于前列的研究机构主要集中于武汉、上海、北京、南京四个城市,并以武汉大学、上海图书馆、中国科学院文献情报中心、南京大学图书馆为地域中心向外形成辐射状的机构合作网络(见图2)。发生合作的机构涉及图书馆、信息管理学院、计算机科学与技术系、数据智能与交叉创新实验室等多种类型,呈现出学科交叉融合的特性,同时也显示了领域研究从基础理论到实践应用再到学科建设的合作发展研究范式。此外,各个地域中心机构之间也存在合作联系,例如:武汉大学信息管理学院与南京大学信息管理学院,上海图书馆与中科院文献情报中心,均存在合作开展研究的情况。
Figure 2. Collaboration with research institutes
图2. 机构合作网络
2.3. 发文作者
国内学者在国内期刊发表了一系列关于人工智能技术在图书馆领域应用的相关文献,其中发文数量超过5篇的作者有:邵波(南京大学图书馆)、刘炜(上海图书馆)、马秀峰(曲阜师范大学继续教育学院)、杨文建(重庆第二师范学院图书馆)、董同强(天津大学教育学院)、陆康(南京晓庄学院图书馆)、任贝贝(上海市网络技术综合应用研究所)、郭亚军(郑州航空工业管理学院信息管理学院)、邓李君(四川外国语大学图书馆)、王世伟(上海社会科学院信息研究所)、沈奎林(南京大学图书馆)、夏翠娟(上海图书馆)、茆意宏(南京农业大学信息科学技术学院)等。
高水平的学术研究需要团队协作以保证科研项目的研究能力和研究水平,利用Vosviewer可较为直观地展现领域学者的合作网络(见图3)。目前以刘炜、张磊、郭利敏、夏翠娟、蔡迎春、张智雄等作者为代表,形成了具有一定数量和规模的作者合作网络。深入研读作者合作网络的依托课题情况,可以发现刘炜团队开展的关于机器学习、智慧图书馆建设研究及夏翠娟团队开展的AIGC信息资源管理研究,均得到了国家社会科学基金、国家自然科学基金及国家重点研发计划等重大项目的资助,彰显了国家层面对人工智能技术在图书馆领域应用发展的高度重视和大力支持。
Figure 3. Cooperation with authors of publications
图3. 作者合作网络
2.4. 研究热点分布
关键词聚类分析是一种探索性数据挖掘技术,利用Citespace对数据集中2011~2023年的1280篇文献的回执关键词共现图谱(见图4),发现研究热点领域包括人工智能、图书馆、智慧图书馆、高校图书馆、智慧服务、大数据、公共图书馆、人工智能技术、数字图书馆、ChatGPT等,尤其是对应用场景的研究比较充分;关注人工智能技术在数字图书馆领域、智慧图书馆服务领域,以及高校图书馆、公共图书馆等实体馆舍空间的建设前景分析和应用探索实践。
总体而言,国内人工智能技术在图书馆应用领域的研究层次逐渐深入。由数字图书馆过度到智能化程度更高、个性化更强的智慧化图书馆;所涉及的人工智能技术更加细分化,例如:将机器学习的模型和算法应用于古文信息处理[16]、自动编目业务[17],将自动感知技术应用于图书情报收集[18]、资源服务[19],将人机交互技术应用于信息检索推荐[20]、学习空间转型升级[21]等;研究范畴呈现更加广泛且专深的特点,研究层次也实现了从理论层面向应用层面的过度。
Figure 4. Research hotspots co-occur in the knowledge graph
图4. 研究热点共现知识图谱
2.5. 主题演进
在关键词共现分析的基础上,通过LLR算法聚类以时间线图方式展现人工智能技术在图书馆领域发展演进情况(见图5)。虽然样本数据限定2011~2023年,通过回执时间线图发现研究主题聚类主要形成于2018年至今,热点关键词聚类(见图6)可分为大数据、数字图书馆、图书馆、元宇宙、智慧图书馆等15个主题。从研究主题演变来看,前期大数据、云计算、物联网、移动互联网的技术发展为人工智能技术在图书馆领域的应用奠定了良好的基础。学者们最初将人工智能技术的引入聚焦于推动数字图书馆的发展,提出了基于分布式人工智能的知识组织方法,建立了基于语义网格等智能技术的数字图书馆知识管理平台,有力地提升了数字图书馆的智能化水平,为图书馆向更高层次的发展转型提供了技术支撑。随着研究的深入,智慧图书馆作为图书馆发展的更高阶目标在业内达成共识并演化出虚拟图书馆服务体系、实体学习空间建设、智慧化服务等多个代表性的发展方向。元宇宙、机器学习、互联网+、自动分类等人工智能领域常见的概念及模型被系统引入图书馆领域,并能够做到面向不同的场景设定、业务需求、层次人群,开展针对性实用性研究、应用性实践。在算法、大数据和算力的综合推动下,以ChaGPT为代表的生成式人工智能在2023年迅速崛起,对于新兴技术为图书馆发展带来的机遇挑战以及潜藏的不利因素,业界学者展开大量探讨。在期待通过ChatGPT技术为图书馆赋能、实现学科跨越式发展的同时,也坚持包容审慎的原则,从加强产业规划、完善制度体系等方面提出了风险防控的具体措施。对比关键词聚类图谱发现,虽然生成式人工智能及ChatGPT的聚类出现较晚,但在聚类规模方面已呈现优势,且与前期产生的数字图书馆、学习空间、智慧化服务交叉明显,预示着在上述领域潜藏很大发展空间。
Figure 5. Timeline clustering
图5. 时间线聚类
Figure 6. Keyword co-occurrence clustering
图6. 关键词共现聚类
3. 研究前沿
突现词是指在CiteSpace中以关键词在某一时段内出现频次的变化频率为观测对象,是突现强度高的关键词[22]。根据关键词的突现率可以发现主题的演变情况,并推测研究前沿未来趋势。通过对研究领域内关键词做突发性检测,共获取14个突现词(见图7)。通过观察可以得出,人工智能在图书馆领域应用研究层次逐渐深入,即由最初数字图书馆向智能图书馆、信息素养、网络安全和智能化服务等具体应用领域发展。
Figure 7. Emerging words in the research literature on artificial intelligence in libraries, 2011~2023
图7. 2011~2023年人工智能在图书馆领域研究文献的突现词
在CiteSpace突现词图谱基础上,笔者利用NoteExpress软件,对数据集全部文献及近三年发表文献关键词进行统计分析,提取前20个高频关键词(见表1)从词频角度观察分析研究热点的发展趋势。
Table 1. Keyword frequency statistics
表1. 人工智能技术在图书馆领域研究文献的关键词词频统计
序号 |
关键词 |
词频 |
中心度 |
年份 |
近三年频次 |
1 |
人工智能 |
611 |
0.33 |
2011 |
271 |
2 |
智慧图书馆 |
281 |
0.16 |
2015 |
159 |
3 |
图书馆 |
303 |
0.21 |
2015 |
133 |
4 |
高校图书馆 |
136 |
0.13 |
2011 |
78 |
5 |
智慧服务 |
98 |
0.04 |
2018 |
51 |
6 |
公共图书馆 |
69 |
0.13 |
2018 |
40 |
7 |
ChatGPT |
36 |
0.04 |
2023 |
36 |
8 |
大数据 |
83 |
0.25 |
2014 |
31 |
9 |
元宇宙 |
19 |
0.07 |
2022 |
19 |
10 |
人工智能技术 |
50 |
0.06 |
2015 |
17 |
11 |
5G |
32 |
0.26 |
2019 |
16 |
12 |
知识服务 |
33 |
0.02 |
2018 |
15 |
13 |
信息服务 |
27 |
0.09 |
2016 |
13 |
14 |
图书馆服务 |
31 |
0.06 |
2017 |
11 |
15 |
机器人 |
22 |
0.05 |
2012 |
11 |
16 |
区块链 |
16 |
0.01 |
2020 |
10 |
17 |
AIGC |
10 |
0.01 |
2023 |
10 |
18 |
应用 |
33 |
0.09 |
2016 |
9 |
19 |
深度学习 |
24 |
0.22 |
2017 |
9 |
20 |
服务创新 |
18 |
0.08 |
2018 |
9 |
21 |
数字人文 |
16 |
0.04 |
2020 |
9 |
结合关键词出现的总词频、近三年词频、中心度数值同时合并统计表中相似的关键词可发现,“人工智能”在近三年出现的频次占总词频的40%以上,在业内仍维持较高的关注度;其次“智慧图书馆”位居词频第二位,继续引领图书馆学界的未来发展方向;而基于智慧图书馆的智慧化信息服务,以及为创新服务提供技术支撑的元宇宙、5G、机器交互、区块链、AIGC等技术在当前及今后一段时间内仍将继续受到关注。
4. 研究结论与展望
4.1. 人工智能将继续维持研究热点地位
近些年,接踵而至的新技术使人类社会切身感受着科技进步带来的“推背感”,蓬勃发展的人工智能技术被应用到诸多行业领域,展现着巨大的发展潜力和应用价值,不断突破着人们的思维惯性。虽然人工智能取得了可喜的发展成果,但可以肯定的是人工智能远未臻至技术顶峰,未来人工智能的发展对人类社会的影响还将持续下去。无论是实践基础上的学术研究还是基于技术前沿的理论探讨,无不昭示着未来相当长一段时间内人工智能在学术研究领域的热点地位。图情领域亦是如此,随着人工智能技术的不断突破,图情学界围绕人工智能的讨论将继续如火如荼地进行下去。
4.2. 积极关注人工智能生成内容技术落地实践
2023年,国内学界聚焦ChatGPT并开展大量专题研究,每个月都有诸多研究成果发表。图情领域的相关研究包括但不限于ChatGPT在智慧图书馆的应用场景和领域、原理和机制、模式和路径、困境和挑战、对策和机遇以及启示和展望[23]-[34]。ChatGPT自发布以来,OpenAI未对我国大陆地区提供访问服务,上述系列研究亦多以理论研究为主,目前尚未见我国大陆地区图书馆具体应用ChatGPT的实践,亦未见“文心一言”等同类AIGC技术产品应用的案例。因此,图情学界需要密切关注ChatGPT类人工智能生成内容技术在国内外图书馆的落地实践,及时总结技术应用经验,以期实现通过实践促进新技术完善,新技术成果赋能图书馆高质量发展的有益效果。
4.3. 密切跟踪最新科技发展成果
但令图书情报界自足的是,无论什么新技术,都与图书情报工作严丝合缝般地对路、适用,毫无违和之感[35]。2021年是元宇宙元年,其后的三年间,图情学界开展了大量研究,积极探讨元宇宙如何赋能图书馆高质量发展。元宇宙研究方兴未艾,ChatGPT又横空出世,凭借强大技术优势,各行业领域竞相开展融合研究,以期利用新技术助推行业发展。回顾近些年的科技发展成果,无论是大数据、云计算、5G还是物联网、元宇宙和ChatGPT,图情学界都积极拥抱技术发展成果,回应时代之变,开展一系列专题研究。新技术变革应接不暇地同时,如果赶不上技术迭代的节奏,难免掉落时代发展的队伍。作为新时代图书馆事业建设者和参与者,我们需要密切跟踪最新科技发展成果,结合图书馆工作实际加强理论研究的同时,全面总结实践经验,努力守好新时代新征程上的图书馆事业阵地。
4.4. 着力加强馆员队伍建设
在“互联网+”时代背景下,传统图书馆实现了数字化转型,人工智能与大数据、物联网、5G、云计算等新信息技术一道不断赋能新时代图书馆建设。智慧图书馆时代,图书馆事业高质量发展对馆员队伍结构提出了新要求,复合型人才队伍建设迫在眉睫,资源建设馆员、参考咨询馆员、读者服务馆员、古籍修复馆员、信息技术馆员、信息素养教育馆员等共同构成图书馆人才队伍体系。根据“木桶理论”,馆员招聘时需要着眼现有人才队伍构成实际,结合图书馆发展方向,针对性补足队伍短板。同时,还需要加强馆员综合能力建设,业务能力和学术素养需要齐抓共管。良好的业务能力是做好图书馆工作的根本要求,图书馆需要着眼学校人才培养需求,立足角色定位,结合图书馆工作实际,丰富培训方式方法,注重培训实际效果,建立一套行之有效的培训体系。良好的学术素养是做好图书馆工作的有效抓手。图书馆学科发展前沿和行业领域有益实践经验往往通过发表期刊论文进行交流、总结,具备良好学术素养的馆员可以敏锐捕捉学科动态,掌握业界发展态势,为图书馆未来发展建设提供有益参考。
基金项目
2024年度CALIS全国农学文献信息中心研究项目“文献计量视域下人工智能在国内图书馆的融合研究”(2024071)研究成果。
NOTES
*通讯作者。