1. 引言
新冠疫情发生以来,公众出行意愿和行为深受其影响 [1] [2] [3]。2020年,全年国内旅游人数28.79亿人次,比上年同期下降52.1%,国内旅游收入2.23万亿元,同比下降61.1% [4]。新冠疫情对公众出行行为的影响引起国内外学者的广泛关注。Jiao [5]、Mostafa [6] 等学者从不同时间尺度探讨不同疫情时期旅行目的地形象和未来旅游行为的变化,以及疫情不同阶段影响旅游者行为的主要因素;保继刚 [7]、陈丹 [8]、戴景文等 [9] 等学者从不同空间尺度探讨新冠疫情对公众出行和旅游业的影响;Zhang [10]、Habib [11]、Hemanth [12] 等学者从旅行者类型入手,分别从航空旅客、城市旅客、长途旅客等视角探讨疫情对游客出行行为影响;王庆生 [13]、刘雷 [14] 等学者借助问卷调查、模型构建等手段,探讨疫情防控常态化背景下旅游消费者的行为异常。总体而言,目前国内针对新冠疫情对公众出行行为和情感影响的研究需进一步深入。
在疫情反复的大背景下,聚焦于微博数据反映的新冠疫情作用下公众行为的时空分异特征,以新浪微博平台作为数据来源,以“#疫情#旅游”为关键词爬取全国范围内的相关微博文本信息,采用Snow NLP情感分析模型对微博文本的情感极性进行判断,并计算公众出行情感倾向值;利用ROST CM 6软件建立语义网络,分析新冠疫情背景下公众出行关注主题的变化,探讨不同疫情时期、全国不同地区公众出行情感的时空分异特征,为揭示不同阶段下新冠疫情对公众行为影响的时空特征和演化机制提供理论参考。
2. 数据来源和研究方法
2.1. 数据获取与预处理
通过新浪微博API,以“#疫情#旅游”为关键词爬取新浪微博2020年1月23日至2021年1月23日的相关博文数据,其中包括用户ID、博文内容、发文时间、发文所在地等信息,并将上述时间段定义为本文的研究时段。
按以下步骤对数据进行清洗:1) 筛选用户,确保所使用文本数据为公众所发。2) 筛选定位,数据通过对博文发表所在地进行筛选,剔除港澳台地区及海外其他国家的微博文本。3) 筛选广告及无用信息,只保留与研究主题有关的文本数据。清洗后共获微博文本数122,438条。
2.2. 研究方法
2.2.1. 地理统计分析
地理统计是分析含有地理数学数据的统计方法。本文采用Arc GIS 10.8的多属性分级将各地区在不同时空尺度的文本情感倾向值与新增确诊人数可视化,对我国新冠疫情期间不同时空尺度公众出行情感特征的空间分布和变化规律进行分析。
2.2.2. Snow NLP情感分析模型
Snow NLP是一个基于Python的库,能够处理中文文本内容。利用Snow NLP库对文本数据进行情感分析的过程如下:首先阅读对否定语料库中的neg.text与pos.text进行分类,通过贝叶斯模型计算正极性和负极性的先验概率,然后对情感尺度文本数据计算每个词的正极性和负极性的后验概率,最终选择概率较大的为词汇的正负极性类别。Snow NLP中也提供了训练方法可以调用sentiment下的train来分别训练消极文本与积极文本,然后将训练好的方法保存在sentiment.marshal中。本文通过调用Snow NLP情感分析模型,得到研究时段公共出行情感特征。
2.2.3. 语义网络分析
使用ROST CM6社会网络与语义网络分析功能,提取2020年1月至2021年1月疫情发展不同阶段公众出行的高频共现词,构建高频词共现矩阵,展示疫情期间公众出行的关注点,并进一步根据共现矩阵结果将高频词分为聚类子群。通过高频词的数量和子群节点之间的变化得到在疫情期间公众出行关注点的变化特征。
2.2.4. 情感倾向分析
依托于各地区公众所发微博积极文本数和消极文本数,计算公众出行情感倾向值,计算公式如下:
(1)
其中,N表示公众出行情感倾向值,npos表示某一时段内公众所发积极文本数,nneg表示某一时段内公众所发消极文本数。N值越大则表现为公众出行越积极;反之,越消极 [15]。
3. 研究结果
3.1. 公众出行情感倾向的变化特征
经计算得到全国疫情期间公众出行情感倾向值,通过与全国疫情每月新增确诊人数进行对比,将疫情期间全国公众出行情感倾向变化分为四个阶段(图1)。
第一阶段(U1):2020年1月~2020年3月,疫情暴发初期,公众出行情感倾向值与新增确诊人数同步变化,全国新增确诊人数的激增,公众出行的积极看法也随之激增。2020年2月新增确诊人数达到最高值,公众出行情感倾向值也上升到较高水平,表现出面对突如其来的疫情,公众对疫后外出的积极向往。
第二阶段(D1):2020年4月~2020年7月,虽然新增确诊人数逐渐降低、疫情逐渐好转,但公众出行意愿持续降低,表现出长期的、严重的灾害对公众出行的滞后消极效应,由疫情初期的积极出行情感转为消极情感。灾情影响的累计效应作用下,公众出行意愿持续降低。
第三阶段(U2):2020年8月~2020年10月,新增确诊人数维持长期持续稳定状态,公众出行情感倾向值增加明显,表现出稳定的、轻微灾害对公众出行的积极效应。随着疫情的稳定好转,由疫情前期的消极出行情感转为积极情感,公众出行意愿持续升高。
第四阶段(D2):2020年11月~2021年1月,随着冬季新增确诊人数的上升,公众出行情感倾向值急剧下降,疫情变化敏感地影响公众出行意愿,疫情对公众出行呈现出强烈地制约作用。
综上,疫情变化与公众出行意愿变化紧密相关,疫情变化敏感地制约公众出行意愿。在疫情暴发初期,面对未知的、灾难性的疫情,公众出行情感积极,对疫后出行的意愿强烈;随着疫情持续好转,灾情对公众出行呈现滞后消极效应,公众出行情感较消极,出行意愿持续降低;随着灾情稳定好转,公众出行情感转为积极,出行意愿强烈;随着疫情的反复,公众出行情感转为消极,出行意愿降到最低。
![](//html.hanspub.org/file/5-2420455x9_hanspub.png?20220414090653232)
Figure 1. The emotional tendency of the public to travel and the development and change curve of the epidemic
图1. 全国公众出行情感倾向与疫情发展变化曲线
3.2. 基于微博文本的公众出行主题变化
使用ROST CM6提取上述四个阶段的高频主题词,反映公众出行关注的主题变化。剔除无意义主题词,以共现矩阵图展现分析结果(图2),连接线条粗细表示各高频词之间相关性的大小。
![](//html.hanspub.org/file/5-2420455x10_hanspub.png?20220414090653232)
Figure 2. Themes of public travel concerns at different stages of the pandemic
图2. 疫情各阶段公众出行的关注主题
四个阶段的语义分析网络的节点数量、种类存在着较大的差异,围绕“疫情”、“旅游”两个核心词,四个语义网络变化明显,呈现出由密集→稀疏→稀疏→密集的变化特征。第一阶段(U1):各节点联系较为密切,“疫情”、“旅游”作为2个主核心节点关联着“开放”、“景区”、“病毒”、“文化”、“有序”、“恢复”6个次核心节点。第二阶段(D1):主核心节点未变动,但关联着次核心节点数量仅为“景区”、“游客”、“五一”3个节点,并且出现较多出行目的地的节点。第三阶段(U2):主核心节点未变动,但“旅游”节点与其他节点之间的关联程度略低于“疫情”节点,并且次核心节点变为“地区”、“风险”、“确诊”3个节点。第四阶段(D2):相较第三阶段,次核心关联节点上升为“通知”、“做好”、“文化”、“肺炎”、“景区”、“病毒”、“假期”7个节点,并且各次核心节点之间联系密切,形成网络状。
四个阶段的语义分析网络表现出公众出行关注的主题变化明显。第一阶段(U1):公众关注的重点在于“疫情”事件的发展,对于出行,公众更关注于“文化”及景区是否开放;而公众所关注的出行目的地较少,并集中于我国中东部地区。第二阶段(D1):表现为公众偏向于在“五一”小长假出行,所关注的出行目的地明显增加,扩大到全国范围,且首次出现“国外”出行。第三阶段(U2):相较于第二阶段,公众认为“做好防护”前提下,开始关注风险地区的出行。第四阶段(D2):随着各地区疫情反复,公众再次关注各地防疫通知,意识到“文化旅游”的重要性,并且所关注的出行地减少明显。
3.3. 公众出行情感倾向的时空分异特征
在整个疫情期间,各地区公众出行情感倾向值与疫情受灾程度存在明显的空间分异特征。公众情感倾向值的分布呈现“口”字型分布(图3),即在新疆、宁夏、山西、河北、天津、山东、江苏、浙江、福建、广东、云南等地区公众情感倾向值与该地区疫情人数呈反比例,这些情感倾向值高的地区是疫情较轻的地区。在“口”字型分布的内部,湖南省、湖北省、河南省的公众情感倾向值与地区确诊人数也显出反向关系,这些情感倾向值低的地区是疫情较严重的地区。整体而言,在空间尺度上疫情对公众出行意愿存在消极效应,制约着公众出行。在疫情较轻的地区,公众出行情感较积极,出行意愿较高;反之,公众出行情感较消极,出行意愿较低。
注:基于自然资源部标准地图服务网站的标准地图制作(审图号:GS(2019)1822),底图无修改(下同)。
Figure 3. Spatial distribution of public travel sentimentality values and cumulative number of confirmed cases
图3. 公众出行情感倾向值与累计确诊人数空间分布
按情感倾向值的四个阶段对各省市不同疫情发展阶段的情感倾向值进行可视化(图4)。第一阶段(U1):在疫情最严重的湖北,公众出行意愿最为最低;在疫情严重程度次一级的河南、江苏、浙江、广东,正值春节期间,公众表现出较强的出行意愿;在其他疫情程度较弱的地区,公众出行意愿也较强烈。第二阶段(D1):由于长期严重的灾情对公众出行的滞后消极效应,各地区公众出行情感普遍较消极,除经济较发达的京津、华东、华南地区外,其他地区公众出行意愿较低。第三阶段(U2):由于疫情的稳定见好,公众出行情感较积极,特别是在京津、华东、西南地区的公众表现出较高的出行意愿。第四阶段(D2):随着疫情的反复,疫情对公众出行情感的消极效应明显,除京津、华东地区外,其余地区公众表现出较低的出行意愿。总体而言,经济较发达、疫情整体较轻的京津、华东地区的公众在疫情四个阶段都表现出较强的出行意愿;西北、东北、华中、华南地区的公众在疫情的前期、中期表现出较强的出行意愿,在疫情后期出行意愿较低;西南地区的公众除疫情的后期外都表现出较强的出行意愿。
![](//html.hanspub.org/file/5-2420455x12_hanspub.png?20220414090653232)
Figure 4. Spatial distribution of emotional tendency of public travel and cumulative number of confirmed cases at different stages of the pandemic
图4. 疫情各阶段公众出行情感倾向值与累计确诊人数空间分布
4. 结论
1) 按照公众出行情感倾向的变化特征将疫情划分为四个阶段,各阶段的语义网络变化明显,呈现出由密集→稀疏→稀疏→密集的变化特征。同时公众出行关注的主题变化明显,随着疫情的变化,公众出行目的地的变化较为突出。
2) 疫情变化与公众出行意愿变化紧密相关,疫情变化敏感地、较强地制约公众出行意愿。在时间尺度上:疫情暴发初期,公众对疫后出行的意愿强烈;疫情好转,灾情对公众出行呈现滞后消极效应,出行意愿持续降低;疫情稳定好转,出行意愿强烈;随着疫情的反复,出行意愿降到最低。在空间尺度上:疫情在整个研究时段对公众出行情感存在消极效应,制约着公众出行。在疫情较轻的地区,公众出行情感较积极,出行意愿较高;反之,公众出行情感较消极,出行意愿较低。
3) 新冠疫情作用下公众的出行情感呈现典型的时空分异特征,疫情由暴发→好转→稳定好转→反复变化,出行情感随之由积极→消极→积极→消极变化。该变化与地区经济发展、疫情强度大小关系较为密切,在经济较发达、疫情整体较轻的京津、华东地区,公众在疫情四个阶段都表现出较强的出行意愿;西北、东北、华中、华南地区的公众在疫情的前期、中期表现出较强的出行意愿。
基金项目
本文受宁夏自然科学基金项目(2021AAC03070)、宁夏大学自治区级大学生创新训练项目(S202110749053)资助。
NOTES
*通讯作者。