基于文本挖掘的社会公众对人工智能的认知情感分析
Cognitive Sentiment Analysis of Artificial In-telligence by the Public Based on Text Mining
DOI: 10.12677/AAM.2022.119682, PDF, HTML, XML, 下载: 290  浏览: 726 
作者: 刘梦馨, 李跃文*:上海工程技术大学管理学院,上海
关键词: 人工智能微博认知情感文本挖掘Artificial Intelligence Weibo Cognitive-Emotional Text Mining
摘要: 随着数字时代的到来和元宇宙的兴起,人工智能愈发地融入教育、医疗、公共交通、金融等各大领域,给商业方面带来变革性发展的同时,也对社会公众产生了潜移默化的影响。本文通过八爪鱼采集器爬取并挖掘一定期间内微博平台有关人工智能的相关话题,运用集搜客和ROST-CM6分析软件对话题发文内容等进行语义剖析和研究等相关的质性分析,进一步凸显公众对人工智能的认知和情感,由此得出结论:社会公众对于人工智能技术保持中立态度的居多,但呈现出负面态度的公众是远少于正向态度的。针对此本文从人工智能技术的应用、风险治理和舆情走向三个方面给出了针对性的建议措施,从而为专业人士对人工智能更好地发展升级和融入社会应用提供动态反馈数据。
Abstract: With the advent of the digital age and the rise of the metaverse, artificial intelligence is increasingly integrated into major fields, such as education, medical care, public transportation, and finance, bringing transformative development to business, but also having a subtle impact on the public. This paper crawls the relevant topics about artificial intelligence on the Weibo platform within a certain period of time, adopts the method of combining text mining and qualitative analysis, con-ducts semantic analysis and research on the content of topic posts, further analyzes the public’s cognition and emotion of artificial intelligence, and gives targeted suggestions and measures, so as to provide dynamic feedback data for professionals to better develop and upgrade artificial intelli-gence and integrate into social applications.
文章引用:刘梦馨, 李跃文. 基于文本挖掘的社会公众对人工智能的认知情感分析[J]. 应用数学进展, 2022, 11(9): 6446-6453. https://doi.org/10.12677/AAM.2022.119682

1. 引言

在移动互联网、云计算等新兴理论和技术共同驱动下,人工智能跨越应用红线,与实体经济深度融合,对社会经济发展和产业转型升级产生深刻影响 [1]。在近两年的抗击疫情期间,人工智能技术更是在快速诊断、医疗援助、药物研究等方面发挥重要作用,也让社会公众感受到了该项新兴技术的威力。但与此同时,人工智能还处于不确定的发展阶段,引发的伦理风险、规模失业、法律治理等问题仍存在很多争议,以往的研究大部分基于行业视角进行某一行业的影响分析,鲜有学者关注社交平台中社会公众对人工智能的舆论走向。因此,本文的创新点在于通过文本挖掘与质性分析相结合,了解当前社会公众对于人工智能的讨论热点和方向,可以凸显网民对于人工智能的需求和立场,对政府、企业等进一步对人工智能技术的正确和充分利用提供思考和借鉴。

2. 相关文献综述

在人工智能技术的发展和对各行各业及社会的影响方面,国内外学者已经进行了广泛的研究。20世纪80年代,就有美国学者开始较为全面地讨论人工智能伦理问题,包括建构人工智能是否合乎伦理,人工智能是否拥有权利、情感,是否可以进行道德判断等问题等等 [2]。在许修泽、柴静、刘荣等人对基层医生面对人工智能技术应用的情感态度调查中表明,明确赞成人工智能在临床诊疗活动中、在慢性病管理中以及在医学影像中应用的分别占70.9%、76.6%和75.2%,期待未来人工智能技术在这些医学活动中应用的分别占75.9%、78.3%和79.9% [3]。在人工智能提供服务消费方面,有学者发现相对于替代者形象,消费者对协助者形象的人工智能产品或服务的感知身份认同威胁较小,因而评价更高,并且这一效应受到消费者既有的人工智能风险观念和自我肯定的调节 [4]。在新闻主播行业中,王忆希、王峥、吴福仲通过新技术特质和行动者特质两个层面对新闻AI主播的态度和接受度进行分析,为理解新闻AI主播的社会扩散过程提供了更为情景化的视角 [5]。另外,在吕容杰、李颖探讨人工智能对员工自主学习的产生机理时,通过实证调查发现在人工智能不断对工作进行替代、创造和重塑的背景下,性别优势和专业优势已经不复存在,并提出知识型员工要认识到自主学习和终身学习的重要性 [6]。

总体而言,大多数前人研究通过调查分析呈现不同行业用户对于人工智能技术的态度和认知情感,虽受多种因素影响,但大体表现为积极态度。本文主要运用文本挖掘和质性分析相结合的方法,而不是实证调查,对与之相关的社会公众而不是某一具体行业的人工智能技术的认知情感进行分析,进一步丰富和支持前人在这一方面的理论研究。

3. 数据获取

微博目前已经成为用户增长最快、公众民意表达的新平台,而人工智能技术发展迅速,也会是公众在平台讨论的热点话题,因此对文本进行简单搜索和筛选后,本研究选取了2022年4月22日至5月22日近期一个月的样本,以“人工智能”、“机器人”等作为搜索关键词,共找到6303条内容。从图1可以看出该时间段微博发文量的分布态势,即2022年4月25日起人工智能话题讨论量在攀升,并在28日、29日两天达到了顶峰,之后又呈现消减和小幅度上升等波动趋势。总的来看,短短一个月内社会公众对人工智能的关注度还是很高的。

Figure 1. Time series graph of Weibo post volume distribution of artificial intelligence topics

图1. 人工智能话题的微博发文量分布时间序列图

4. 研究过程与方法

本文采用文本挖掘与质性分析相结合的方法对微博文本内容进行分析,并了解社会公众对人工智能的认知水平和态度立场。具体研究路线为,首先通过八爪鱼采集器对微博有关人工智能的发文进行爬取获取数据,其次,对搜集到的原始数据进行清洗和处理,然后运用集搜客分析软件对提取的关键词进行词频分析,呈现社会公众关注的焦点问题所在;运用ROST-CM6软件进行网络语义分析,呈现有关人工智能话题不同节点之间的信息交流关联度;并对文本内容进行情感分析,呈现社会公众对人工智能技术的情感态度倾向。最后针对呈现结果分析社会公众讨论话题的影响因素以及给出一定的针对措施。

4.1. 词频分析

运用质性分析软件集搜客对过滤后的5963条微博内容进行词频统计,并选取了词频最高的前100个关键词,比如“人工智能、机器人、科技、智能、警惕、科幻、数字、创新”等词(如图2)。对主要关键词进行聚类,可以发现公众讨论话题聚焦于人工智能技术的特征和应用,关注的特征主要有高级、感知、智慧、模仿、智能化,集中关注的人工智能应用有科技、机器人、互联网、算法、教育、医疗。

Figure 2. Artificial intelligence topic discussion word cloud diagram

图2. 人工智能话题讨论词云图

具体来说,可以从图2中了解到社会公众对人工智能的话题讨论呈现以下三个特征。第一,进行主题聚类发现对人工智能机器人科技应用的关注度最高。外媒指出随着“工业4.0”数字时代的到来,在接下来的十年里,人类在日常活动中与机器人互动的频率将会发生爆炸式增长。同时智能机器人的高关注得益于国家经济增长、消费升级、产业政策和资本助力 [7]。智能机器人的应用尤其体现在消费品加工制造、智慧医疗、智慧清洁,近几年在教育领域方面也逐渐兴起,随着80、90后成为新生家庭父母的新一代,更愿意接受新兴事物,比如智能教育机器人。

第二,从关键字大小和多少可以看出人工智能在各领域的应用已经趋于普遍化和深入化。人工智能主要应用于语言和文字、图像和视觉、大数据分析及预测三大方面,且随着时代变革、企业转型,其应用已经与时代发展深度融合,比如机器翻译、智能新闻稿写作、自动驾驶、生物特征识别、金融风控等具体技术已为社会公众所知。同时,疫情背景下,健康检测、复工复产、物流传送的需求也为人工智能的发展提供了契机。

第三,关于人工智能的伦理风险和隐私安全问题逐渐受到大众的关注,但当前仍需要深入讨论和解决。算法歧视即设计者、开发者可能将自己所怀有的偏见嵌入算法系统,隐私忧虑和对责任与安全缺乏考虑即伦理困境等是人们日益关注的突出问题。警方查处的多起低价出售个人信息事件在微博引发热议,不仅是被查处事件本身,公众个人数据的来源、使用权、删除权以及社会的发展也引起了一定的讨论 [8]。因此,人工智能治理问题应引起政府的高度关注。

4.2. 语义网络分析

语义网络分析在人工智能领域应用广泛,具有强大和直观的表示能力。本研究对爬取的微博文本进行数据清洗,并运用ROST-CM6软件对清洗过滤后的数据进行分析,得到的分析结果如图3所示。

图3,该图中的线条均为有向线条,起始处节点表示主动方,末端从动方,微博发文以人工智能为大的节点进行网络外拓,带动了其他节点的联系和位置变化,图中包括有人工智能、技术、科技、智能、学习、机器人、平台、应用、警惕、创新等一系列节点。从内容要素上看,社会公众对人工智能主要关注的是技术研发、机器学习和科技应用等方面的发展,同时可以看到图中构成了三个小型网络结构图,表明它们的语义网络相对集中,联系相对密切,比如智能、平台、科技、应用、技术的关系紧密,说明微博用户多将这些词语融合使用或者相联系,可以进一步看出用户的具体关注点所在;警惕、困境、合理等联系起来体现了社会公众对于人工智能技术的安全警惕和产生的伦理困境话题一起讨论的频度还是居高的。

Figure 3. Semantic network diagram of Weibo artificial intelligence posts

图3. 微博人工智能发文的语义网络图

4.3. 情感分析

针对每条微博的文本内容,集搜客根据其分类算法对微博的情感态度进行赋值,正面词(如创新)权值为1,负面词(如困境)权值为−1,程度词(如极度)权值为2,否定词(如不可能)权值为−1,情感得分越高,越倾向于正面态度,反之倾向于负面态度,以此来计算得出每条文本的情感总分和判断整体的情感倾向(见表1)。

Table 1. Examples of Microblog text and emotional attitude judgments

表1. 微博文本与情感态度判断示例

如表中实例所分析的那样,本文经过筛选和清洗后对剩余的5963条文本进行类似分析,结果发现社会公众会有相当一部分是转发的微博文本,并持中立态度,不发表太多言论,而呈现正向情感的文本主要是聚焦于人工智能技术的速度和创造力以及其自动化的完美特性,同时对于疫情背景下兴起的智慧检测服务和智慧物流,微博用户在话题中也大多给予好评。可见相当部分的公众感知和认可了人工智能技术的应用有效性和准确性。同时呈现负向情感的文本大多是关注人工智能所带来的困境危险和安全问题以及对于该技术的神速发展而引起的部分恐慌心理和现实价值差距感。总而言之,对文本的情感分析可以看出社会公众对人工智能技术的发展和应用保持中立态度的居多,占比54.43%,可能是由于数据清洗不完全导致中性词偏高,但就正面态度和负面态度两个层面来看,公众对于人工智能呈现出负向态度的微博是远少于正向态度的。如图4所示,正向词汇文本占比37.53%,负向词汇文本占比8.04%。

Figure 4. The emotional situation distribution of all Weibo texts based on the collection of search corpus

图4. 基于集搜客语料库的全部微博文本情感态势分布

5. 结论与启示

据上文分析数据发现,54.43%的网民目前对于人工智能技术还没有清晰的认知从而保持中立态度,而37.53%的公众是偏好于认可人工智能技术在各方面的应用以及发展,只有8.04%的公众对人工智能的应用风险还持有一定的怀疑态度,所以针对这种现象就需政府以及专业机构通过不断改进和优化人工智能,从而最大程度降低公众的担忧以及提高其认知水平,引导社会公众和技术融合健康发展。

5.1. 人工智能技术在抗击疫情方面满足新需求,为公众对其进一步的了解提供有利契机

从上述文本分析不难看出,近期人们对智慧物流和医疗检测的话题热度有所上升,这确实在现实生活中有所体现。首先,在迫切的医疗援助中,人工智能机器人可负责在线回答无需专业医学知识的问题,采取保护措施并可监测疑似病例的症状,这提高了处理紧急突发事件的效率和效果。其次,在日常的防疫工作中,公众有关注到人工智能机器人在公共场合分发口罩和酒精吸收液,以及采取机器人进行风险区域物资运送的情况,节省了人力资源,同时对公众的安全需求和医疗需求起到了辅助作用。最后,健康云、智能防控管理平台和人脸识别等在维持生活秩序和加快复工复产等方面的作用都引起了公众的关注。以上人工智能的现实应用让人们有了直接的感触和体验,加速了人工智能技术融入公共生活的步伐和公众的进一步了解。

5.2. 人工智能技术的治理风险成为焦点,需倡导多元参与完善伦理设计和安全措施

从公众对于人工智能的话题讨论中可以了解到虽然技术风险和安全等词语出现不频繁,但对于发文中出现的技术应用的安全性和伦理性问题多部分是持怀疑态度的,警惕、可怕、隐私等关键词也层出不穷。大数据推荐、社交媒体的精准推送等算法应用在很多公众看来是一种对自己的变向操纵,久而久之被这个封闭的“信息蚕房”所困扰,甚至对个人信息、地理信息安全性等保持了怀疑态度,而未来“元宇宙”的情景应用更是会让人们感受到被动和不安。因此,人工智能治理领域的意识形态风险的防范需尽早提上议程。

研究机构应当积极寻求扩大参与讨论的利益相关者和领域专家的范围,包括公众以及民间社会、企业、安全专家、研究人员和伦理学家 [9]。与此同时要更加强调AI治理的国际合作和政产学研合作,对于人工智能治理的问题需要全人类共同面对,相关标准规范的制定需要多方参与、共商共议、交流互鉴 [10]。针对算法歧视、认知风险、恶意使用等一系列伦理风险应确立相应的人工智能伦理道德标准,不断完善伦理设计,努力解决社会公众的后顾之忧。

5.3. 以公众关注的话题为切入点,引导公众正确认识人工智能

以搜集到的一个月微博发文数据为例,公众对于人工智能技术的情感态度还是有凸显性的,正面情感发文量远大于负面,而判断为中性情感的发文据分析大多都是对该技术相关领域应用的转发和表述,还有一部分是对人工智能的认知不清晰,从而不带有丰富的感情色彩。基于呈现的分析情况,本文认为社会公众的舆论对社会发展的影响力不可忽视,时刻关注舆情的动态走向,并以公众聚焦的话题为切入点,打破“人工智能就是机器人”此类传统认知,正确引导公众对人工智能的深层认知和体验。尤其注意引导对医疗应用的正确认知,虽然智慧医疗在疫情期间凸显作用,相关人员对人工智能认知薄弱的风险依旧存在。正如研究中所提到人工智能的应用需要接受医疗服务的患方及其家属、社会公众对医疗人工智能及其影响有所认识,我们应避免公众的盲目抵制或贸然接受 [11]。

总而言之,未来人工智能的发展应当融入多要素,逐步强化价值发现中人的能动性干预和控制。产生正确的认知是第一步,下一步就是努力构建人工智能服务和人类命运共同体,统筹发展与安全,趋利避害才能推动技术的可持续发展。

5.4. 研究局限性

本文的数据采样时间过短,能反映近期的结果特点,但对社会公众未来情感趋势走向分析缺乏说服力,且研究内容定性分析太多,具有一定局限性。未来研究可以考虑采用复杂的定量分析结合相关定义公式,选取更丰富的样本进行文本内容分析,此外,对文本信息进行更深度处理的具体方法也有待进一步改善和研究。

NOTES

*通讯作者。

参考文献

[1] 郭凯明. 人工智能发展、产业结构转型升级与劳动收入份额变动[J]. 管理世界, 2019, 35(7): 60-77+202-203.
[2] 杜严勇. 人工智能伦理风险防范研究中的若干基础性问题探析[J]. 云南社会科学, 2022(3): 12-19.
[3] 许修泽, 孔西焰, 沈兴蓉, 柴静, 刘荣, 王德斌, 邵东华. 安徽省部分地区基层医生对人工智能技术应用的态度及需求调查[J]. 医学与社会, 2022, 35(4): 27-30+35.
[4] 王欣, 朱虹, 姜帝, 夏少昂, 肖春曲. 人工智能产品“协助者”与“替代者”形象对消费者评价的影响[J]. 南开管理评论, 2021, 24(6): 39-49+139+50-51.
[5] 王忆希, 吴福仲, 王峥. 人工智能新闻主播何以被接受?: 新技术与社会行动者的双重视角[J]. 全球传媒学刊, 2021, 8(4): 86-102.
[6] 吕荣杰, 李颖. 人工智能背景下知识型员工自主学习行为的产生机理——基于京津冀地区的实证调查[J]. 河南师范大学学报(哲学社会科学版), 2020, 47(6): 63-71.
[7] 胡安俊. 人工智能、综合赋能与经济循环[J]. 当代经济管理, 2022, 44(5): 58-64.
[8] 黄楠, 肖俊, 张增一. 新冠肺炎疫情期间公众对人工智能的认知与态度——基于新浪微博内容的文本挖掘[J]. 科普研究, 2021, 16(5): 33-41+100-101.
[9] (2019) Artificial Intelligence: Public Per-ception, Attitude and Trust. https://www.lexology.com/library/detail.aspx?g=e5859863-566b-4e1d-8f22-ba506e71fbe2
[10] 人民智库与旷视AI治理研究院. 近年人工智能治理热点及趋势前瞻[J]. 青年记者, 2022(4): 5.
[11] 李鸿浩, 段伟文, 陈蕾, 等. 医疗人工智能技术研发与应用的伦理挑战和对策——以我国大型公立医院为例的思考[J]. 人工智能, 2019(4): 70-78.