时空视角下突发事件网络舆情热度演变分析
Analysis on the Evolution of Online Public Opinion Popularity for Emergencies from Spatial-Temporal Perspective
DOI: 10.12677/AAM.2022.115320, PDF, HTML, XML, 下载: 432  浏览: 952 
作者: 许露萌:上海工程技术大学,上海
关键词: 突发事件舆情热度时间序列空间自相关Emergencies Public Opinion Popularity Time Series Spatial Autocorrelation
摘要: 舆情热度分析是突发事件舆情治理的重要环节,国内有很少学者有从时空视角下进行分析的。基于此,文章的网络舆情热度测量指标数据来源于百度搜索指数,选取的突发事件是新型冠状病毒感染肺炎,运用全局空间自相关分析、局部空间自相关分析和灰色关联分析等方法,分析2020-01-09~02-19中国网民对“新型冠状病毒”网络舆情热度的省域时空差异研究与影响机理研究。研究发现:全国各省网民对疫情随时间变化的网络舆情热度趋势趋于一致,广东省和山东省由于人口基数大,舆情热度排名靠前,随着封城和居家隔离政策实施,疫情的发展得到控制,疫情的舆情热度呈下降趋势;突发疫情的网络舆情热度整体上存在空间分异特征非常显著,舆情热度高低以人口密度线即胡焕庸线为界的空间分布格局,舆情热度高的主要分布在分界线以东的地区,舆情热度低的主要分布在分界线以西的地区;确诊人数、治愈人数、城市化率、互联网普及率等都与舆情热度相关,并且确诊人数是影响舆情热度的核心因素。
Abstract: As an important part of public opinion management of emergencies, the temporal and spatial dif-ferences and influencing factors of public attention are rarely discussed. Therefore, based on re-al-time data of Baidu index, this paper uses real-time epidemic monitoring data and spatial analysis, spatial-temporal visualization, GRA and other methods. Analyzing China’s Provincial Spatial and temporal differences in the popularity of New Coronavirus Internet public opinion and its influenc-ing mechanism from January 9th to February 19th, 2020. The results show that: The trend of In-ternet users’ popularity of the epidemic over time tends to be consistent across the country. Due to the large population base, Guangdong Province and Shandong Province rank high in public opinion popularity. With the implementation of the city closure and home isolation policies, the develop-ment of the epidemic has been controlled, and the popularity of the epidemic decline. Overall, the novel coronavirus pneumonia epidemic network public opinion fever has significant spatial differ-entiation characteristics. The cold hot spot is obviously spatial distribution pattern with “Hu Huan-yong” line as the boundary. The hot spots are mostly located in the east of the line, and the cold spots are located in the west of the line. The number of confirmed cases, cured cases, urbanization rate and Internet penetration rate are all related to the popularity of public opinion, and the num-ber of confirmed cases is the core factor affecting the popularity of public opinion.
文章引用:许露萌. 时空视角下突发事件网络舆情热度演变分析[J]. 应用数学进展, 2022, 11(5): 3009-3017. https://doi.org/10.12677/AAM.2022.115320

1. 引言

近年来,突发事件频发,对突发事件提前预警及时出动减少其影响和安抚民心对于政府的治理能力是一种考验。新冠肺炎在全球范围传播,我国快速响应,积极地采取措施防治疫情的蔓延,在非常短的时间内就控制了疫情的传播 [1] [2]。随后国内的疫情防控局面不断向好,多地实行“防止国内反弹和国外输入”的策略,复工复产在有序进行 [3] [4]。随着互联网普及率的不断提高,民众可以通过社交媒体和网络搜索引擎来表达自己的观点和搜索自己关注的话题,学者们通过这些重要媒介选取舆情热度指标 [5],央视新闻、人民日报和各省市卫建委以权威性、可靠性,成为网民接收实时疫情信息的主要渠道。这些搜索以及浏览数据形成数据库,体现公众对某个热点的关注力度 [6]。人们可以通过搜索平台搜索自己关心的话题,微博作为高时效性社交媒体,有大量的评论数据作为舆情信息基底,对舆情传播机理探索、驱动因素分析、演化态势预测、舆情监控以及突发事件预警等方面的研究进行有效的支撑 [7] [8],基于百度搜索引擎的舆情热度分析,有利于政府或者企业等决策机构对潜在的舆情危机提前预警,从而在事前管理、主动管理,预防舆情恶化时难以控制的局面 [9]。

自从新冠肺炎爆发以来,与疫情相关的确诊人数和新增病例数的新闻报道引起了公众的普遍关注。公众对突发事件或者自然灾害是否关注、关注程度如何以及公众对于突发事件过于关注导致舆情恶化等问题值得研究。孟天广等认为学者们可以根据网民的主动搜索行为进行分析从而揭示公众对某些议题的偏好程度 [10]。刘维斯等发现能够通过网民的搜索数据了解公众在疫情期间的物资需求或者认知心理需求 [11] [12] [13]。在公共卫生领域,Eysenbach指出公众关注度可以预测传染性疾病的暴发时间 [14],Ripberger认为公众关注度在追踪传染病扩散趋势上发挥着不可忽视的作用 [15];Brownstein等通过谷歌搜索数据实时追踪疾病的发展、蔓延到得以控制,这成为近年来流行病学数字化发展的一个趋势 [16] [17] [18]。但是仅仅考虑时间因素和搜索指数来分析预测疫情的进展情况,最终的准确性可能比较低。Chew等通过搜索引擎工具将跨时间跨和生态单元的数据与现有数据进行比较,发现加入空间维度使得结果更具有显著性 [19]。因此,探索舆情热度的演变必须考虑到空间维度 [20]。根据研究现状,本文拟使用ArcGis和SPSS等数据分析软件,实时抓取百度搜索指数、疫情确诊人数数据、各个省份经济发展水平、城市化率、人口密度和互联网普及率等公开性数据,利用关键词“新型关注病毒”的百度搜索数据作为疫情期间网络舆情热度数据,通过时间序列分析、全局空间自相关分析和局部空间自相关分析,探讨了疫情期间网络舆情热度的时空差异和演变以及影响机理分析,为政府借助民情民意数据和网络舆情热度数据及时把握疫情暴发时间和不同省份关注程度、实时把握疫情的发展状态,了解舆情在各个省份扩散情况和每个省份的舆情热度情况,对于精准的舆情监测、精准引导、避免民众恐慌大面积扩散提供有效的参考。

2. 数据来源与研究方法

2.1. 数据来源

文章研究的事件范围是2020-01-09~2-19,涵盖了疫情开始、经过拐点到被控制。由于港、澳、台地区的数据口径与其他省份有差异,空间上选择了中国的31个省级行政区。研究数据主要来源于以“新型冠状病毒”百度搜索指数六周数据、丁香园实时疫情数据、中商情报网和《中国互联网发展报告》。由于百度指数易于获取并且可以进行网页和新闻的搜索,文章使用百度搜索指数作为新冠疫情网络舆情热度数据。

2.2. 研究方法

2.2.1. 全局空间自相关

空间自相关性是指在同一个分布区域内不同变量的观测数据之间潜在的关联性。主要分为全域性和区域性两种。全域性是对全局空间自相关性分析,区域性是对局部空间自相关性分析。全局空间自相关分析主要方法是用Moran’s I值和Join Coun算法,本文通过计算Moran’s I值对疫情网络舆情热度的全局空间特征进行分析,空间权重矩阵利用Rook邻接准则,其公式为:

I = i = 1 n j = 1 n W i j ( x i x ¯ ) ( x j x ¯ ) S i = 1 n j = 1 n W i j (1)

Z = I E ( I ) V a r ( I ) (2)

S 2 = 1 n i = 1 n ( x i x ¯ ) 2 (3)

x ¯ = 1 n i n x i (4)

(1)式中,I是莫兰指数,它的取值范围为−1到1。Moran’s I > 0时,表示各个省份的舆情热度数据成空间正相关,越接近1表明舆情热度空间相关性越明显;Moran’s I < 0时,表明各个省份舆情数据成空间负相关,越接近−1表明舆情热度负相关性越强。Moran’s I等于0表明各个省份舆情热度差异性不明显。(2)式中,Z的值是标准差的倍数,标准差能够反映一组数据的离散程度。其中E(I)为数学期望,Var(I)为方差,若Z < −1.65或Z > 1.65时,表示通过显著性检验,空间分布具有相关性。(3)和(4)式中,n为变量的多少,Xi代表每一个变量值,Wij为i和j的之间的空间权重。

2.2.2. 局部空间自相关

在做全国舆情数据全局空间自相关性分析的时候难以发现存在相关性,这个时候可以考虑局部空间自相关性分析,这能够帮助寻找可能掩盖的局部空间自相关的位置,探讨是否存在空间异质性。文章选取Getis-Ord G i * 指数,通过地理要素空间高低聚类判断空间内高值和低值聚类存在的位置来判断舆情热度的冷热点分布。公式为:

G i * = j = 1 n W i j ( d ) X j j = 1 n X j (5)

该式中,n是研究的省份总数,Wij为i省份和j省份的之间的空间权重,Xj是省份j的搜索指数值。在通过显著性检验的前提下,若 G i * 为正且值越高,表示该省份为舆情热度高的省份;若 G i * 为负且值越低,表示该省份舆情热度值比较低。

3. 新冠肺炎疫情网络关注度的时空演变特征分析

3.1. 时序演变特征分析

图1中表明,从时间上来看各个省份对疫情的百度搜索指数来看,各个省份的舆情热度值的高低以及发展趋势基本上是一致的:从2020年1月18日开始,网络舆情热度随着时间急剧增加,急剧增加的原因可能是是该时间点正处于我国春节假期,网民平均每日的上网时间增加;舆情热度在1月25日达到最高峰,1月28日、2月6日、2月13日是舆情热度处于高峰的四个时期;封城和居家隔离等政策实施后,确诊人数增速减缓的同时舆情热度也开始下降。许小可等发现舆情热度高峰出现的周期与疫情3到7天的潜伏期基本上相吻合 [21]。在舆情热度4个高峰时期,广东省和山东省两个省份2020年人口总数分别为1.1346亿和1.0047亿,人口总数排名第一和第二,并且疫情蔓延比较严重,这两个省份的舆情热度是最高的。山东省在前三个舆情热度高峰中一直保持单日最高,下降后广东省舆情热度成为最高,在舆情热度演化中占据主导位置。此次疫情中山东省严格遵守隔离政策并且积极对疫情严重区进行援助,这激发了他们对疫情更多的搜索与讨论。广东省是我国外来人口最多的省份,疫情后期得以控制后各个地方开始复工复产,大规模的人口流动可能是广东省在后期舆情热度较高的原因。湖北省作为疫情初期最严重的省份,舆情热度却不是最高的,应该从经济发展水平、人口数量、互联网普及率等方面综合考虑,也可能是因为疫情期间,湖北省人民忙于抗疫情,上网时间比较短。

3.2. 空间演变特征分析

3.2.1. 全局空间相关性

表1是运用ArcGis软件计算新冠肺炎疫情网络舆情热度的全局Moran’s I值。在计算的时间范围内全局Moran’s I值均为正,这表明各个省份疫情网络舆情热度存在显著的空间正相关性;第二周的Moran’s I的值最大,并且Z值大于1.65,通过了显著性检验,第二周舆情热度在空间分布上呈集聚模式;其他时间段内舆情热度在空间呈随机态势,这可能由于全局空间自相关性的局限性导致的,也可能是由于疫情遍布多个省份,使得差异性不显著。从舆情热度演变趋势看,第一周和第二周全局Moran’s I值比较大,第二周后全局Moran’s I值不断减小,表明舆情热度各个省份的差异逐渐不明显。

Figure 1. Temporal distribution of provincial network public opinion popularity

图1. 各省网络舆情热度变化图

Table 1. Moran’s I value of network public opinion popularity degree of COVID-19 epidemic

表1. 新冠肺炎疫情网络舆情热度的Moran’s I值

3.2.2. 局部空间相关性

局部空间自相关能够揭示某一要素在空间上的集聚效应。集聚效应强的为热点区也就是舆情热度比较高,集聚效应弱的为冷点区,舆情热度相对比较低。文章运用ArcGis软件计算Gi*值,并利用Jenks自然断裂法将Gi*值由高到低划分为五类,将六周的数据可视化展示,分析舆情热度的演变趋势。从图2我们可以看出。

从整体上看,我国新冠肺炎疫情的网络舆情热度存在显著的空间分异特征,舆情冷热点区主要以人口密度线即胡焕庸线为界呈现出不同的空间布局结构,胡焕庸线以东舆情热度较高,以西舆情热度较低。舆情热度高和次高地区主要分布在全国比较繁忙的铁路干线经过的地方,主要有北京市、河北省、河南省、山东省、湖北省、上海市和广东省等地区;长江经济带周围省份江苏省、浙江省、安徽省、湖南省和四川省等地;而新疆、西藏、内蒙古以及东北三省等地区舆情热度比较低,这几个省份的人口基数相对较小。

从舆情热度的空间演变格局来看,第一周的舆情热度高的虽然分布比较广泛,但是整体热度值是最小的;第三周舆情热度分布最为广泛并且热度值较大,表明在第三周的舆情热度最高,是舆情治理的关键时期;第三周后到第六周舆情热度整体上变动幅度变小,空间演变趋势趋于稳定。这在六周时间里,舆情热度高和热度低的地方并没有明显的空间跃迁。

北京和上海作为我国的政治和经济中心,由开始的舆情热度较高慢慢在降低,空间集聚效应在减弱;主要因为这两个城市人口流动性较大,并且正值春节,人口流出比较多,使得新冠肺炎疫情搜索的网民数量减小,所以舆情热度减弱。

Figure 2. Evolution graph of cold and hot spots in spatial pattern of network public opinion popularity degree of COVID-19 epidemic

图2. 新冠肺炎疫情舆情热度的空间冷热点演变图

4. 新冠肺炎疫情舆情热度时空演变的影响机理

网络舆情是一个复杂的系统,网络舆情的大小从传播扩散到最后的衰退整个过程从根本上是由舆情事件本身决定的 [22]。不同省份疫情的严重程度不同会决定舆情热度的空间分布格局;疫情发生的过程中政府提出的政策或者干预措施也会影响舆情的热度 [23]。舆情事件发生后,媒体的报道尤其是没有证实的消息的报道可能会更吸引网民的眼球,导致不实消息的传播,对舆情热度值的变动有一定的影响 [24],严重甚至可以引发舆情危机。

除此之外,突发公共事件网络舆情热度的地区分布还会受到不同省份的经济发展水平、人口基数和受教育程度等的影响。滕文杰认为,在其他指标一定的情况下,经济发展水平不同会影响网络舆情热度值;刘国巍等人发现一个地区的人口数量、受教育程度和基础设施建设水平也会影响突发事件的网络舆情热度值;周妍发现网络舆情的空间分布会受到地区的健康水平的影响 [25]。

4.1. 指标体系构建

新冠肺炎疫情的特殊性让全国按上了暂停键,此次疫情影响范围广、时间长,文章参考已有的研究成果,构建疫情舆情热度影响机理的指标体系,指标选取了以下8个,由于湖北省是疫情中心,所以湖北省不计算在内:

各省的人均GDP和城市化率;经济水平和城市发展水平决定了的各个省份的不同发展水平和消费能力,经济水平高的地方网络的基础设施建设也相对完善,互联网普及率更高。

人口密度大的省份会使得信息蔓延速度加快,舆情传播速度更快。人口基数大的省份会直接影响搜索总量,提高舆情热度。距离武汉市较近的一般舆情热度要会更大。

网络普及率是指互联网用户数包括PC端和移动端占总常住人口的比重,网络普及率越高的地区,搜索量越大。

国家卫健委每日发布的确诊人数、治愈人数和死亡人数数据也会直接影响舆情热度。

4.2. 灰色关联分析

灰色关联分析(GRA)的基本思想是对各因素变化特性的时间序列进行几何比较,能够度量出各因素之间的关联程度的灰色关联。曲线越接近,相应的时间序列之间的关联度也就越大,反之也就越小。

灰色关联分析的计算步骤:

第一步:收集数据进行预处理,并记比较数列为 { x j ( t ) } , j = 1 , 2 , , l , t = 1 , 2 , , n ) ,参考数列为 { x i ( t ) } i = 1 , 2 , , m , t = 1 , 2 , , n

第二步:对各因素进行无量纲化处理。

第三步:计算关联度 R i i 以及关联度系数 ξ i j ( t ) ,计算公式如下:

(6)

(7)

ξ i j ( t ) 为因素 x j x i 在t时刻的关联系数; ρ 为介于[0, 1]区间的灰数,通常为0.5。 R i j 为两因素之间的关联度。

第四步:对关联度 R i j 排序。关联度越小,关系越不紧密;反之关联度越大,关系越紧密。

4.3. 影响机理分析结果

表2中的计算结果可知,影响新冠疫情舆情热度的关联度排序为:确诊人数 > 治愈人数 > 城市化率 > 互联网普及率、人均GDP > 人口密度 > 死亡人数 > 距离,且灰色关联度均大于0.6,这也证明了所选取指标与疫情舆情热度具有高关联度,同时还能够看出确诊人数是影响疫情传播的关键因素,广东省、河南省、湖南省由于人口总数大使得确诊人数排名靠前,其次便是治愈人数和城市化率。这表明此次新冠疫情舆情热度受到确诊治愈人数的影响较大,而死亡人数和距离影响相对较小。

Table 2. Ranking of influence mechanism of network public opinion popularity on COVID-19

表2. 新冠肺炎疫情网络舆情热度影响机理关联度排名

5. 结论与讨论

本文探究了2020-01-09~02-19全国除港澳台外的31个省、自治区和直辖市的新型冠状病毒网络舆情热度的时空分布与演变特征。以新型冠状病毒在百度指数上出现的时间作为起始点,分析各个省份在不同时间点的舆情热度,空间上从起始点后的六周数据来分析舆情热度的演化特征,最后指出不同地区舆情热度的影响机理,得出以下几点结论:

1) 疫情舆情热度整体上符合中国的人口分布规律,其时空差异性具体表现为:在空间上,胡焕庸线两侧呈现不同的舆情热度,西侧舆情热度较低,东侧舆情热度较高。在时间上,山东省和广东省舆情热度最高,与这两个省份人口基数大和经济发展水平高有很大的关系;春节期间舆情热度达到高峰后呈现波动式下降趋势。

2) 此次新冠疫情舆情热度受到确诊治愈人数的影响较大,而死亡人数和距离影响相对较小。

习近平总书记指出:“治理和管理一字之差,体现的是系统治理、依法治理、源头治理、综合施策”。在全球化背景下,推进舆情治理现代化是社会主义现代化建设必然要求。本文分析疫情期间不同阶段下不同地区的舆情热度以及演化,为政府舆情有效治理与舆情引导提供了方向。政府也应该督促媒体客观真实地进行报道,避免因不是消息造成的恐慌,加强对疫情防范的宣传,引导网民形成正确的价值观,避免网民对某群体和地域的歧视。同时,社会经济水平和互联网普及率对舆情热度的影响不可小觑,数字基础设施建设有助于舆情治理现代化的建设。

参考文献

[1] Chen, S., Yang, J., Yang, W., et al. (2020) COVID-19 Control in China during Mass Population Movements at New Year. The Lancet, 395, 764-766.
https://doi.org/10.1016/S0140-6736(20)30421-9
[2] 冯明翔, 方志祥, 路雄博, 等. 交通分析区尺度上的COVID-19时空扩散推估方法——以武汉市为例[J]. 武汉大 学学报•信息科学版, 2020, 45(5): 651-657, 681.
[3] Altmann, D.M., Douek, D.C. and Boyton, R.J. (2020) What Policy Makers Need to Know about COVID-19 Protective Immunity. The Lancet, 395, 1527-1529.
https://doi.org/10.1016/S0140-6736(20)30985-5
[4] Prem, K., Liu, Y., Russell, T.W., et al. (2020) The Effect of Control Strategies to Reduce Social Mixing on Outcomes of the COVID-19 Epidemic in Wuhan, China: A Modelling Study. The Lancet Public Health, 5, e261-e270.
https://doi.org/10.1016/S2468-2667(20)30073-6
[5] 王艳东, 李昊, 王腾, 等. 基于社交媒体的突发事件应急信息挖掘与分析[J]. 武汉大学学报•信息科学版, 2016, 41(3): 290-297.
[6] Garrett, L. (2020) COVID-19: The Medium Is the Message. The Lancet, 395, 942-943.
https://doi.org/10.1016/S0140-6736(20)30600-0
[7] 黄发良, 冯时, 王大玲, 等. 基于多特征融合的微博主题情感挖掘[J]. 计算机学报, 2017, 40(4): 872-888.
[8] 陈梓, 高涛, 罗年学, 等. 反映自然灾害时空分布的社交媒体有效性探讨[J]. 测绘科学, 2017, 42(8): 44-48, 129.
[9] 黄晓斌, 赵超. 文本挖掘在网络舆情信息分析中的应用[J]. 情报科学, 2009, 27(1): 94-99.
[10] 孟天广, 赵娟. 大数据时代网络搜索行为与公共关注度——基于2011-2017年百度指数的动态分析[J]. 学海, 2019(3): 41-48.
[11] 莫国芳, 吴瑛, 元兮. 云南流动人口与艾滋病扩散[J]. 人口与经济, 2004(2): 14-19.
[12] Olson, D.R., Konty, K.J., Paladini, M., Viboud, C. and Simonsen, L. (2013) Reassessing Google Flu Trends Data for Detection of Seasonal and Pandemic Influenza: A Comparative Epide-miological Study at Three Geographic Scales. PLoS Computational Biology, 9, e1003256.
https://doi.org/10.1371/journal.pcbi.1003256
[13] Polgreen, P.M., Chen, Y., Pennock, D.M., Nelson, F.D. and Weinstein, R.A. (2008) Using Internet Searches for Influenza Surveillance. Clinical Infectious Diseases, 47, 1443-1448.
https://doi.org/10.1086/593098
[14] 曲卫华, 颜志军. 环境污染, 经济增长与医疗卫生服务对公共健康的影响分析——基于中国省际面板数据的研究[J]. 中国管理科学, 2015, 23(7): 166-176.
[15] Qu, W.-H. and Yan, Z.-J. (2015) The Influence of Environmental Pollution, Economic Growth and Healthcare Services to Public Health Based on China’s Provincial Panel Data. Chinese Journal of Management Science, 23, 166-176.
[16] Ripberger, J.T. (2011) Cap-turing Curiosity: Using Internet Search Trends to Measure Public Attentiveness. Policy Studies Journal, 39, 239-259.
https://doi.org/10.1111/j.1541-0072.2011.00406.x
[17] Salathe, M., Bengtsson, L., Bodnar, T.J., Brewer, D.D., Brownstein, J.S., Buckee, C. and Vespignani, A. (2012) Digital Epidemiology. PLoS Computational Biology, 8, e1002616.
https://doi.org/10.1371/journal.pcbi.1002616
[18] Scharkow, M. and Vogelgesang, J. (2011) Measuring the Public Agenda Using Search Engine Queries. International Journal of Public Opinion Research, 23, 104-113.
https://doi.org/10.1093/ijpor/edq048
[19] Scheitle, C.P. (2011) Google’s Insights for Search: A Note Evaluating the Use of Search Engine Data in Social Research. Social Science Quarterly, 92, 285-295.
https://doi.org/10.1111/j.1540-6237.2011.00768.x
[20] Signorini, A., Segre, A.M. and Polgreen, P.M. (2011) The Use of Twitter to Track Levels of Disease Activity and Public Concern in the US during the Influenza A H1N1 Pandemic. PLoS ONE, 6, e19467.
https://doi.org/10.1371/journal.pone.0019467
[21] 许小可, 文成, 张光耀, 等. 新冠肺炎暴发前期武汉外流人口的地理去向分布及影响[J]. 电子科技大学学报, 2020, 49(1): 1-6.
[22] 张旭阳, 李丹珉, 谢耘耕. 媒介、网民、政府在舆情事件中的参与角色与作用研究——基于3600起舆情事件的实证分析[J]. 新闻界, 2018(6): 56-63.
[23] 李静, 谢耘耕. 网络舆情热度的影响因素研究——基于2010-2018年10,600起舆情事件的实证分析[J]. 新闻界, 2020(2): 37-45.
[24] 黄怡璇, 谢健民, 秦琴, 等. 影响网络舆情热度评价的主要因素识别研究[J]. 情报科学, 2017, 35(10): 49-54, 62.
[25] 滕文杰. 突发公共卫生事件网络舆情网民关注度区域分布研究[J]. 中国卫生事业管理, 2015, 32(5): 393-396.