1. 引言
2017年《国务院关于印发新一代人工智能发展规划的通知》明确指出了人工智能发展进入新阶段,成为国际竞争的新焦点,成为经济发展的新引擎,同时带来社会建设的新机遇与不确定的新挑战。将人工智能上升到国家战略层面。2022年科技部等六部门印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》的通知,该文件明确了场景创新成为人工智能技术升级、产业增长的新路径,场景创新成果持续涌现,推动新一代人工智能发展上水平。
近年来,人工智能(AI)技术的飞速发展已经带来了巨大的影响和变革。ChatGPT作为其中的一个重要里程碑,引起了广泛的关注和研究。ChatGPT是一种基于人工智能的语言模型,由OpenAI开发。它建立在GPT (Generative Pre-trained Transformer)架构之上,这是一种强大的自然语言处理模型。ChatGPT的目标是实现高度准确、连贯且具有上下文感知的对话生成。ChatGPT通过使用海量的文本数据进行训练,能够模拟人类对话的能力。它可以回答问题、提供信息、进行闲聊,以及参与对话交互。该模型在生成回复时,能够考虑前文的语境,从而更好地理解并回应用户的问题或指令。通过预训练和微调的方式,ChatGPT能够学习和推断出多种语言任务,包括自动问答、翻译、摘要生成等。它的灵活性和适应性使得它成为各种领域中的有用工具,包括客户服务、社交媒体、教育和专业领域等。
ChatGPT正值兴起之际,对于它的研究各个领域百家争鸣、遍地开花。孔德臣、姜迎春(2023)认为ChatGPT等新一代人工智能利于推动技术升级、产业转型,但也带来失业、数字异化和算法意识形态等问题。因此,应积极推动社会主义应用,促进协同发展,确保技术惠及人民,构建社会主义导向的通用大模型[1]。李仪、王蒙(2023)对ChatGPT的知识产权问题进行了研究,认为未来应该从版权、专利、数据产品权属方面完善保护规则,行业自律、行政监管、用户管理三方面也要做好保障政策措施[2]。尼古拉·利贝拉蒂,陈小夏(2023)对ChatGPT进行了哲学解读[3]。Sifat, RI (2023)研究了ChatGPT能在多大程度上影响全球卫生政策分析[4]。为了更好地探索ChatGPT在诸多领域应用的可能性和可行性,本文通过CiteSpace对ChatGPT进行可视化分析,了解其当下热点,预测其发展趋势,以应对ChatGPT带来的人工智能挑战。
2. 数据来源和研究方法
2.1. 数据来源
本文的数据源自“中国知网”和“Web of Science”。在知网中搜索“ChatGPT”,手动筛选无关或无作者的期刊后获得491篇有关“ChatGPT”的文献。同样,在Web of Science中搜索“ChatGPT”,手动筛选无关或无作者的期刊后获得866篇文献,以“作者、标题、来源出版物、摘要”、纯文本形式导出。以上数据截至时间至2023年6月15日。
2.2. 研究方法
CiteSpace通过对学术文献进行分析和可视化,提供了一种直观和交互式的方式来探索学术领域的研究动态和关系网络,帮助研究人员获得洞察和发现新的研究方向。本文利用该软件对ChatGPT的国内外文献进行分析。将数据导入CiteSpace后,设置时间切片(Years Per Slice)选择为1年,时间跨度为2022~2023。节点类型分别选择机构、作者、关键词、国家、被引文献进行共现分析。
3. 研究结果
3.1. 国内外作者分析
表1是国内关于ChatGPT发文量前八的作者,可以看到发文量较平均,尚无突出作者。从图1我们可以看到,国内学者对研究ChatGPT具有较强的积极性,参与人数众多,但是学者之间的联系普遍不强,与表1相吻合,产生这种现象的原因可能是该领域正处于研究的初始阶段、百家争鸣时期,但从图1可以看到显现多个合作集群的雏形。总特而言国内关于ChatGPT的研究尚未形成核心作者群,国内学者需要加强彼此之间的合作与交流。
图2表明国外学者间的联系也如国内一般并不强,甚至更疏远一些,也没有成型的核心作者群。但从表2中可见Gupta,Rohun出现了0.02的中心性,开始展现影响力。他们主要研究ChatGPT在整形外科的应用,例如通过评估ChatGPT在PSITE (整形外科在职培训考试)上的准确性来分析其是否可以作为住院医师教学的工具[5]。我国还没有出现中心性大于0的学者。总而言之国内外作者研究ChatGPT的格局大致相同,没有出现核心作者,没有形成核心作者群,学者间联系不强。
Table 1. High-yield authors in China
表1. 国内高产作者
Freq |
Centrality |
Author |
Year |
5 |
0 |
易宪容 |
2023 |
5 |
0 |
喻国明 |
2023 |
5 |
0 |
张夏恒 |
2023 |
4 |
0 |
Wang, Fei-Yue |
2023 |
4 |
0 |
方兴东 |
2023 |
4 |
0 |
钟祥铭 |
2023 |
4 |
0 |
张爱军 |
2023 |
Figure 1. Knowledge map of domestic authors
图1. 国内作者知识图谱
Table 2. Foreign high-yield authors
表2. 国外高产作者
Freq |
Centrality |
Author |
Year |
4 |
0 |
Ali, Mohammad Javed |
2023 |
3 |
0 |
Botchu, Rajesh |
2023 |
3 |
0 |
Haman, Michael |
2023 |
3 |
0.02 |
Gupta, Rohun |
2023 |
Figure 2. Author knowledge map published abroad
图2. 在国外发表的作者知识图谱
3.2. 国内外机构分析
Figure 3. Institutional knowledge map published in China
图3. 在国内发表的机构知识图谱
Table 3. High-yield institutions in China
表3. 国内高产机构
Freq |
Centrality |
Institution |
Year |
9 |
0 |
北京师范大学新闻传播学院 |
2023 |
6 |
0.01 |
浙江大学传媒与国际文化学院 |
2023 |
5 |
0 |
复旦大学新闻学院 |
2023 |
5 |
0 |
西北政法大学管理学院 |
2023 |
4 |
0.03 |
中国社会科学院新闻与传播研究所 |
2023 |
4 |
0 |
中国人民大学公共管理学院 |
2023 |
4 |
0 |
陕西师范大学教育学部 |
2023 |
4 |
0 |
西北政法大学涉外法治研究中心 |
2023 |
4 |
0 |
清华大学新闻与传播学院 |
2023 |
4 |
0 |
西北政法大学新闻传播学院 |
2023 |
4 |
0 |
南京农业大学信息管理学院 |
2023 |
4 |
0 |
上海大学马克思主义学院 |
2023 |
3 |
0.02 |
北京大学教育学院 |
2023 |
表3可见ChatGPT国内主要的发文机构有北京师范大学新闻传播学院(9篇)、复旦大学新闻学院(5篇)、浙江大学传媒与国际文化学院(6篇)等,机构知识图谱如图3所示,节点数量虽多,但连线数量和网络密度都较小,各机构间的合作不密切,尚未出现核心机构,与表3各机构的低中心性吻合。
图4是在国外发表的研究机构合作图谱,与国内形成鲜明对比,其节点与连线都更加密集。若中心性超过0.1的节点,则说明该节点为中心节点,在研究中较为重要且具有较大的影响力[6]。在国外发表的有如表4的六个机构中心性都大于0.1,远超国内。国内外的机构知识图谱形成鲜明对比,表明我国各研究机构间的联系薄弱、交流甚少,这可能有新冠疫情影响、欧美国家抢占先机的原因,但也说明我国各机构、高校间的合作交流亟需增强。
Table 4. High-yield institutions published abroad
表4. 在国外发表的高产机构
Freq |
Centrality |
Author |
Year |
9 |
0.23 |
University of California System |
2023 |
3 |
0.14 |
Peking University |
2023 |
7 |
0.13 |
Harvard University |
2023 |
5 |
0.12 |
University of North California |
2023 |
4 |
0.12 |
University of North California, Chapel Hill |
2023 |
3 |
0.12 |
McGill University |
2023 |
Figure 4. Institutional knowledge maps published abroad
图4. 在国外发表的机构知识图谱
3.3. 关键词分析
表5与表6是国内外关于ChatGPT的研究关键词,对比看到,有关“人工智能”即“Artificial Intelligence”的发文量和中心性都是最高的,然而除此之外,国外还有10个关键词的中心性大于0.1,国内却仅有“风险”一个关键词。国内外的研究重点也有差异,国内多专注于“知识产权”“风险”“关系”等偏于理论的研究,而国外更注重应用,ChatGPT在“decision Making”“machine Learning”“dental Nurse”等领域实现应用或探索应用的可能性。
Table 5. Research keywords of ChatGPT in China
表5. 国内ChatGPT研究关键词
Freq |
Centrality |
Label |
Year |
120 |
1.34 |
人工智能 |
2023 |
4 |
0.11 |
风险 |
2023 |
3 |
0.09 |
安全风险 |
2023 |
3 |
0.08 |
智能传播 |
2023 |
6 |
0.07 |
新闻传播 |
2023 |
3 |
0.06 |
数字经济 |
2023 |
6 |
0.06 |
语言模型 |
2023 |
2 |
0.05 |
人机关系 |
2023 |
4 |
0.05 |
技术伦理 |
2023 |
Table 6. Keywords of ChatGPT research abroad
表6. 国外ChatGPT研究关键词
Freq |
Centrality |
Keyword |
Year |
61 |
0.81 |
Artificial intelligence |
2023 |
3 |
0.36 |
Decision-Making |
2023 |
3 |
0.23 |
Reinforcement Learning |
2023 |
18 |
0.21 |
Machine Learning |
2023 |
14 |
0.19 |
Large Language Models |
2023 |
2 |
0.16 |
Context |
2023 |
3 |
0.16 |
Health |
2023 |
2 |
0.14 |
Dental Nurse |
2023 |
3 |
0.13 |
Energy |
2023 |
4 |
0.12 |
Model |
2023 |
2 |
0.11 |
Teledentistry |
2023 |
3.4. 国家分析
Table 7. High-producing countries
表7. 高产国家
Freq |
Centrality |
Country |
Year |
578 |
0.49 |
USA |
2023 |
110 |
0.12 |
CHINA |
2023 |
62 |
0.09 |
ITALY |
2023 |
103 |
0.07 |
POLAND |
2023 |
31 |
0.06 |
CANADA |
2023 |
57 |
0.05 |
INDIA |
2023 |
6 |
0.05 |
BRAZIL |
2023 |
70 |
0.05 |
GERMANY |
2023 |
28 |
0.04 |
ENGLAND |
2023 |
42 |
0.03 |
SOUTH KOREA |
2023 |
Figure 5. National knowledge map
图5. 国家知识图谱
图5是不同国家对ChatGPT的研究知识图谱,从中可以看到,两百多个国家、地区对ChatGPT进行了研究,其中只有美国、中国、意大利、波兰、加拿大五个国家的中心性大于0.05,其中只有中美两国超过0.1,是ChatGPT研究的主力军,为ChatGPT的研究做出重要贡献。如表7所示,美国作为ChatGPT的发源地,理所应当地在发文量(578)和中心性(0.49)上都一骑绝尘,而且美国与其他国家在研究上交流也是最紧密的。我国在ChatGPT的研究上紧跟美国,位于世界前列,这可能与中国人口众多、信息丰富,从而使算法迭代进程加快有关。我国ChatGPT的研究在国际上名列前茅,但整体是一超多强的局势。
3.5. 国外被引文献分析
Figure 6. Keyword clustering diagram of foreign cited literature
图6. 国外被引文献关键词聚类图谱
将国外关于ChatGPT的被引文献进行聚类,得到图6,共有medicine、artificial intelligence and writing、intelligent vehicles、scientific writing、authorship、gpt-4、bibliometric analysis七个明显聚类。这七个聚类这也与关键词分析中国外更注重应用研究的结论相符。
4. 比较与分析
4.1. ChatGPT与元宇宙、区块链、5G检索频次的比较
本文选取近几年有关热点、新兴的主题词的年度发文量与ChatGPT相比较。在知网中搜索ChatGPT,选取“学术期刊”,“主要主题”选择“ChatGPT”,进行可视化分析并导出得到图7;在知网中搜索“元宇宙”,选取“学术期刊”,“主要主题”选择“元宇宙”,进行可视化分析并导出得到图8;在知网中搜索“区块链”,选取“学术期刊”,“主要主题”选择“区块链”,进行可视化分析并导出得到图9;在知网中搜索“5G”,选取“学术期刊”,“主要主题”选择“5G技术”,进行可视化分析并导出得到图10。
Figure 7. Time trend of the number of ChatGPT publication volume
图7. “ChatGPT”发文量时间趋势图
Figure 8. Time trend chart of publication volume of “meta-universe”
图8. “元宇宙”发文量时间趋势图
Figure 9. Time trend chart of “blockchain” publication volume
图9. “区块链”发文量时间趋势图
Figure 10. Time trend chart of “5G” publication volume
图10. “5G”发文量时间趋势图
对比后发现,2023年才过一半,有关ChatGPT的文献实际已达580多篇,远超爆发期的“区块链”(2017~2018)和“5G”(2018~2019)的发文量,目前ChatGPT文献产出趋势也将大概率超过同期的“元宇宙”(2022)。虽然还有许多复杂因素的影响,但我们也可以窥见ChatGPT的革命性和创新型是斐然的,社会对ChatGPT的好奇与探索热情之高涨,侧面反映人工智能是未来社会发展中至关重要、不可或缺的一环。
4.2. 风险与挑战
4.2.1. ChatGPT的潜在风险
1) 数据隐私风险
ChatGPT凭借其强大的深度学习、云计算、大数据等功能,能够满足开发者和用户等相关群体的需求,与此同时ChatGPT可能未在被授权的前提下搜集、存储和输出私人信息,进而导致个人隐私泄露的风险,为违法犯罪创造环境。
2) 社会失业风险
ChatGPT可能引发人们对人工智能的进一步依赖,挑战人类的创造力,压缩创新空间,带来社会失业风险。一些简单的脑力劳动,如教育机构、文案策划、医疗记录和病历的整理和管理以及一些简单的医疗咨询等工作、法律文件处理等等都有被取代的风险,导致大量人员下岗,如若没有新行业新工作的出现,那么将对社会的稳定性产生负面的影响。
3) 算法偏见风险
由于ChatGPT是基于海量预训练数据的产物,它的数据输入和输出必然携带开发者的价值选择和判断。ChatGPT通过深度学习的数据隐藏着片面化、极端化的价值观念,输入至预训练数据库,而输出结果也自然带有开发者的偏见。在不断循环往复的人机互动中,ChatGPT不间断地复制开发者输入的“偏见”,从而制造出更多的新“偏见”。如此反复,ChatGPT可能会衍化成为有心者输出性别歧视、种族歧视言论的“传声筒”[7]。
4.2.2. 以ChatGPT为代表的人工智能在法律方面的挑战
目前中国尚未建立起专门针对人工智能技术的法律框架,但近年来先后颁布了《网络信息内容生态治理规定》《互联网信息服务深度合成管理规定》《互联网信息服务算法推荐管理规定》等对算法推荐技术、深度合成技术等进行规范监管[8]。
此外,版权也是焦灼的一个问题。ChatGPT生成内容不具有可版权性,其生成物不能满足“作品的作者是自然人”这一基本前提,而且归根到底ChatGPT生成的内容是在人工辅助下才产生的。着ChatGPT的传播也确实为现行著作权法带来一些现实挑战[9]。社会不断进步,法律也随之修改以顺应时代发展,未来人工智能必将对人类法律框架造成不小的冲击。
4.3. 总结
中国对ChatGPT的研究处于世界前列,中国学者不约而同地搭建起包括法律、风险在内的一系列理论框架,为ChatGPT的实际应用构建着稳固的地基。然而相比美国为首的发达国家而言,我们在ChatGPT的研究上仍是弱势的一方,甚至都无法建立与其相媲美的智能语言模型。此外,国外学者注重实际应用研究,在这方面我们大大地落后着,这一现状要求我们搭建理论框架的同时也要拉上实际应用的进度。