1. 引言
改革开放以来,中国工业化进程迅速得到推进,在区域经济不断发展的同时,大气污染也不断增加,出现了一系列环境污染问题。近年来,以PM10 (可吸入颗粒物)和PM2.5 (可入肺颗粒物)为核心污染物的复合型雾霾肆虐我国大面积领土,虽然出台并实施了较多严格的污染控制措施,大气污染治理任务仍然任重道远 [1]。与PM10相比,PM2.5的粒径小、面积大、活性强,因此更易吸附有害物质,从而对人们的呼吸道、心血管等产生危害 [2]。
我国大多城市空气PM2.5浓度展现出“高浓度”、“长时间滞留”和“重污染区域性”特点 [3]。2016年,国内雾霾污染的影响范围达到188万平方公里,全国空气质量达到严重污染的城市一共有24个,其中19个位于京津冀及周边地区,石家庄市的PM2.5浓度更是突破1000 μg/m3;至2020年,PM2.5年均浓度排名前十名的城市有7个属于河北,3个属于山东 [4]。在中国东北部的省份中,辽宁作为传统的老工业基地,入冬后雾霾污染较重,2016年各个城市均未到达世卫组织制定的最低标准 [5]。山西作为我国重要的重化工和能源基地,PM2.5的污染较为严重 [6],且在西南风存在的情况下山西的大气污染物会远距离输送至北京等地区 [7]。山东省西部城市的PM2.5污染情况受河北省传播较为严重,由于冬季的盛行风向,各市受区域影响较大的城市也多数集中在西部或者北部 [8]。京津冀地区雾霾呈明显的空间自相关 [9],且在近20年进行了重拳治污,在工业和燃煤等领域产生了一些较为良好的治理效果,但是来自于周边区域的污染物的空间溢出效应以及交通污染会在某种程度上抵消了这些治理效果,这些因素使得京津冀的重拳治污效果一直以来都并不理想 [10]。
复杂网络是一种可以将复杂系统中对象及各对象之间的关联抽象为复杂网络中节点和连边的特殊网络结构,一般具有小世界特性、无标度特性和社团结构特性 [11]。自从Watts和Strogatz提出了小世界模型以及Barabasi和Albert提出了无标度网络模型,复杂网络理论产生并得到发展 [12] [13]。如今,复杂网络已经广泛应用于各个领域,包括建筑工程领域 [14]、金融风险研究领域 [15] [16] [17]、医学领域 [18] [19]。诸多学者对中国东北部地区(尤其是京津冀地区)的大气污染状况进行了网络构建,从时间上的演化与空间上的相关两个方面对网络进行了分析,并分别提出了相应的PM2.5治理对策。从时间维度,薛安等人使用2014年5月到2015年4月的数据构建了中国城市PM2.5加权网络,并采用GN算法对网络进行划分,得出不同季节的PM2.5污染的区域性程度顺序如下:冬季 > 秋季 > 春季 > 夏季 [20]。安海岗等人取京津冀及周边共31个城市从2015~2019年的日均AQI数据作为研究样本,构建京津冀及周边城市的空气污染关联网络,结果表明在不同季节城市空气污染关联紧密性存在较大差别,其中冬季网络的关联性最强,需要根据不同季节分别制定治理措施 [21]。从空间维度,肖琴等人选取了2017年华东、华西、华南、华中、华北五大区域的68个城市的PM2.5数据进行研究,用相关性大小构建了空气污染的复杂网络,并对网络性质进行分析,得到了13个度较大的地区,表示空气污染相对严重的区域,分别是北京、苏州、廊坊、长沙、天水、天津、唐山、张家口、石家庄、张家界、中山、西宁、兰州 [22]。安海岗等人选取2015年到2020年的京津冀及周边31个城市的日均PM2.5数据构建了空间关联网络,并分析了网络的整体特征,发现网络图比较紧密,且在中间城市带(石家庄、邢台等地) PM2.5污染较为严重,得到了中间城市带应重点监控的结果 [23]。崔丽珠用小世界网络,基于演化博弈理论,分析了各个地方政府在协同治理网络中进行个体博弈时,在考虑异质性的条件下的均衡点和稳定状态,研究发现,小规模的大气污染协同治理网络可以明显提高地方政府协同治理决策的演化速度,同时得出当收入异质性的比值区间在[0.6, 1]、偏好异质性的比值区间在[1.2, 1.4],分配异质性比值区间在[0.6, 1]时可以更好地实现大气污染协同治理合作涌现,并为改善区域异质性带来的大气污染协同治理困境提出建议 [24]。马宇博等人根据 PM2.5浓度数据建立无向网络模型研究京津冀各城市节点的重要性,得到重要性由高到低排名,分别是保定、唐山、廊坊、石家庄、天津、北京、沧州、衡水、邢台、秦皇岛、邯郸、承德,并提出3点防治建议 [25]。
现有的对于研究大气污染的复杂网络模型大多基于无向网络模型,而PM2.5等污染物在城市之间的传播往往具有不对称性,故本文选取有向网络中的转移熵对各个城市之间PM2.5传播过程进行分析。转移熵是分析多个时间序列因果关系的有效方法,可以测量两个随机过程之间有向信息传递量 [26]。转移熵是一种非线性方法,假设数据是平稳序列 [27],且通常在较低维的情况下更有效 [28]。它不仅可以描述两个随机序列之间是否有相互作用,还能描述两个序列之间的相关度 [29],所以适用于构建PM2.5污染传播网络。
本文通过转移熵计算各个城市之间的PM2.5影响程度,通过研究设定一个合理的阈值,确定网络中的连边情况,依据此规则建立中国东北部城市群的互相关网络和月份网络,之后通过对连边波动程度的分析和网络建立,并出一定的防治建议。文章其余结构如下。第二章为数据描述与方法,第三章为实验结果分析,第四章为结论。
2. 数据描述与方法
2.1. 数据描述
由于中国东北部地区PM2.5污染较严重且根据上述文献可知研究东北部城市群之间PM2.5传播的重要性,本文选取了京津冀及其周边省份(山东省、山西省和辽宁省)的54个城市作为研究对象,其中因为廊坊和临汾两个城市雾霾数据缺失值过多,故排除这两个城市,对其余52个城市进行研究。最终本文选取中国东北部地区的共52个城市作为研究对象,包括北京、天津、河北省、山东省、山西省、辽宁省的城市,依次为北京、天津、石家庄、唐山、秦皇岛、邯郸、保定、张家口、承德、沧州、衡水、邢台、太原、沈阳、大连、济南、青岛、营口、丹东、盘锦、葫芦岛、临沂、德州、淄博、枣庄、烟台、潍坊、济宁、泰安、日照、威海、菏泽、大同、长治、阳泉、鞍山、抚顺、本溪、锦州、晋城、朔州、晋中、运城、忻州、吕梁、阜新、辽阳、铁岭、朝阳、聊城、东营、滨州,数据来源于天气后报官方网站 (http://www.tianqihoubao.com)。对以上52个城市分别选取2021年1月1日0时至2021年12月18日23时8391个PM2.5浓度数据进行研究。如果有缺失数据,则采用诱导有序加权相对贴近度(IOWRCD)的方法进行补全 [30]。
通过计算PM2.5浓度均值,选取PM2.5平均浓度最小的威海以及PM2.5平均浓度最大的太原为例,绘制PM2.5浓度实时波动图(见图1(a)和图1(b)),横坐标为月份,纵坐标为PM2.5浓度,单位为(μg/m3)。威海和太原的实时PM2.5浓度均值分别为21.1 μg/m3、51.0 μg/m3。又绘制了威海和太原两个城市的PM2.5浓度增长率图(见图1(c)和图1(d))。可见太原总体PM2.5浓度较大,增长率较小;威海总体PM2.5浓度较小,增长率较大。
由于转移熵假设数据是平稳序列且符合马尔科夫性,本文对补全后的52个城市的实时PM2.5浓度数据取对数差分。即城市
经处理后的序列可见公式(1):
。 (1)
![](//html.hanspub.org/file/50-2622390x10_hanspub.png?20220623091242205)
Figure 1. Real-time fluctuations of PM2.5 concentration (μg/m3) in four cities
图1. 四个城市PM2.5浓度(μg/m3)实时波动图
2.2. 转移熵网络
计算转移熵矩阵,得到两个序列之间的相互作用。假设两个随机时间序列
和
,则两者之间的转移熵可见公式(2) [31]:
。 (2)
其中
表示时间序列
到
的转移熵,及y传递给x的信息量。转移熵数值越大,则传递的信息较多,及可视为
对
的影响越大。如果考虑到
和
之间可能存在的较长的延迟时间,可以将转移熵改写成公式(3):
。(3)
之后进一步确定有向网络连边方向。对计算出的
和
进行比较,如果
则说明y传递给x的信息量大于x传递给y的信息量,即确定连边方向时应从y指向x。最后确定阈值,决定是否连边。确定阈值使网络中没有孤立节点,并保留转移熵数值大于阈值的序列主体及进行连边。
3. 实验结果分析
3.1. 转移熵网络
本文以选取的中国东北部地区的共52个城市作为52个网络节点,将经过初步处理补全缺失数据后的实时PM2.5浓度数据取对数差分,并计算其转移熵矩阵作为网络中连边的权重建立网络。设
和
为城市(
),则转移熵矩阵见公式(4):
.(4)
通过对52个城市的转移熵矩阵的计算,将转移熵(矩阵元)从大到小排列并绘图如下(见图2(a)),该图以转移熵数值为纵坐标,以log(rank)为横坐标,共有52 × 51个数据。近似拟合出两条直线可得其交点的纵坐标为0.0163,即该网络中阈值定为0.0163。在该组数据中满足阈值的有17个数据,即网络中有17条有向边。
![](//html.hanspub.org/file/50-2622390x29_hanspub.png?20220623091242205)
Figure 2. Transfer entropy network. (a) Network threshold selection; (b) transfer entropy network
图2. 转移熵网络。(a) 网络阈值选取;(b) 转移熵网络
排除网络的孤立节点,转移熵网络剩21个节点,17条连边(见图2(b))。其中箭头代表PM2.5在城市间影响的方向,节点指出的箭头个数越多,代表越多城市受该城市影响,指向某节点的箭头个数越多,代表该城市受越多城市影响。例如指向聊城的箭头较多,说明影响聊城的周边城市较多,包括滨州、淄博;指向大同的只有来自张家口的一个箭头,说明影响张家口的城市数量较少。连边的粗细由转移熵代表的权重决定,连边越粗,表示转移熵值越大,即影响的程度越大,反之,代表转移熵值越小,即影响的程度越小。例如太原指向晋中的连边转移熵值为0.0283,相对于其他节点之间的连边较粗,较为明显。盘锦指向沈阳的连边转移熵值为0.0164,相对于其他节点之间的连边较细,较为不明显。
从图2(b)可以看出,综合考虑转移熵网络的出度、入度以及转移熵数值,聊城、晋中、济南、淄博、锦州、阜新6个城市在PM2.5污染传播的过程中和周边城市的关联性较强。其中聊城受滨州、淄博影响较大,对济南、菏泽影响较大,且来自外界的影响小于对外界传播的影响;晋中受太原影响较大;济南受淄博和聊城共同影响,影响较大;淄博对济南、聊城影响较大;锦州受朝阳和阜新共同影响,阜新对朝阳、锦州影响较大。
图2(b)中不同颜色的节点属于不同省份,由此可以看出,山东地区和辽宁地区在2021年度中国东北部地区属于PM2.5传播的重要省份。不仅重要城市节点个数更多,且图2(b)得出的度值最大的6个城市中,3个城市来自山东省(聊城、济南、淄博),2个城市来自辽宁省(锦州、阜新)。相比较,山西省重要城市节点较少,与周边城市的关联性也较弱。河北省总体PM2.5传播能力居中,但有部分节点受其他节点的影响较大,如晋中。
3.2. 时序网络
本文以选取的中国东北部地区的共52个城市作为52个网络节点,以经过初步处理补全缺失数据后的12个月的实时PM2.5浓度数据的转移熵矩阵作为网络中边权分别建立时序网络。建网规则与转移熵网络建网规则相同。
通过计算52个城市在2021年1月至12月每个月的转移熵矩阵,对矩阵中
的值和
的值比较之后可以获得12个52 × 52的矩阵,将矩阵中的数值按降序排列,绘图3如下。该图以转移熵为纵坐标,以log(rank)为横坐标,共52 × 51 × 12个数据。近似拟合出两条直线可得其交点的纵坐标为0.0439,即该网络中阈值定为0.0439。
分别将每个月的数据使用相同的阈值(0.0439)进行处理,然后绘制每个月的网络(见图4)。
由图4可知,1月菏泽、邯郸、德州、聊城与周边城市之间的PM2.5传播较为显著;2月石家庄、德州、晋中、太原与周边城市之间的PM2.5传播较为显著;3月邢台、聊城、北京、德州、锦州与周边城市之间的PM2.5传播较为显著;4月大连、大同、张家口、聊城与周边城市之间的PM2.5传播较为显著;5月邯郸、邢台、抚顺与周边城市之间的PM2.5传播较为显著;6月大同、德州、邢台与周边城市之间的PM2.5传播较为显著;7月盘锦对锦州的影响极为显著,且铁岭受威海与鞍山共同影响显著;8月晋城、邯郸、聊城与周边城市之间的PM2.5传播较为显著;9月晋城、聊城、长治与周边城市之间的影响较为显著;10月菏泽、济宁、济南、德州、菏泽、阜新与周边城市之间的PM2.5传播较为显著;11月运城、保定、石家庄、长治、菏泽、聊城、泰安、德州、锦州与周边城市之间的PM2.5传播较为显著;12月大多数城市与周边城市之间的PM2.5传播均较为显著。按省份来看,在以上所有省份中山东省和辽宁省PM2.5最为严重,其中淄博、滨州、济宁、潍坊、德州、锦州、抚顺、阜新、盘锦在多个月中均为PM2.5网络中重要性较大的节点。山西省的长治、大同、忻州,以及河北省的邯郸、衡水,以及北京,均为重要性较大的节点。
为了进一步发现各个月之间PM2.5的总体规律,每个月的节点数和连边数见表1。图5以折线图的方式展示出各月网络节点个数和连边条数。可见2021年1~3月和11~12月PM2.5浓度和传播程度处于全年较高水平,6~9月处于全年较低水平。PM2.5浓度在全年中呈现“U”型变化特征——夏季(6~9月)处于“U”的底端,较为低发,PM2.5浓度和传播程度均在一个较低的水平;冬季处于“U”的峰值,较为高发,尤其是12月,可见由于季节性原因导致的PM2.5浓度及传播程度的差异性较大。
![](Images/Table_Tmp.jpg)
Table 1. Number of network nodes and connected edges by month
表1. 各月网络节点个数和连边条数
![](//html.hanspub.org/file/50-2622390x34_hanspub.png?20220623091242205)
Figure 5. Line graph of nodes and number of connected edges by month
图5. 各月节点及连边个数折线图
3.3. 波动程度
为了进一步对城市间PM2.5传播特性进行分析,本文借助各个城市间的每个月的转移熵数据进行影响的波动程度分析,从而划分出城市间波动程度较小的影响和波动程度较大的影响。波动程度较大表示PM2.5传播影响随月份变化较大,波动程度较小表示PM2.5传播影响随月份变化较小。
首先将3.2建立月份网络中得到的12个月的转移熵矩阵进行处理,求取对应位置的平均值和标准差。
表示1月到12月的12个转移熵矩阵,
表示t月的转移熵矩阵中第 行第 列的
值,则对应位置的平均值矩阵可表示为公式(5):
(5)
表示对应位置的平均值矩阵mean中第i行第j列的数值,
表示对应位置的标准差矩阵std中第i行第j列的数值,则对应位置标准差矩阵可表示为公式(6):
(6)
其中
可表示为:
(7)
将平均值作为横坐标,标准差(std)/平均值(mean)作为纵坐标进行散点图的绘制(如图6(a)),同时根据
现有数据结构取
的部分的连边为波动程度较大连边,
的部分的连边为波动程度较小连边,并将这两条垂直于
坐标轴的直线绘制在散点图中(见图6(a))。由此可以将整个散点图划分
为三个区域,最上部分表示波动程度较大的联系,最下部分表示波动程度较小的联系。
![](//html.hanspub.org/file/50-2622390x46_hanspub.png?20220623091242205)
Figure 6. Fluctuation of the timing network. (a) std/mean-mean scatter plot; (b) fluctuation degree network
图6. 时序网络波动程度。(a) std/mean-mean散点图;(b) 连边波动程度网络
将波动较大的结构和波动较小结构提取出来,并绘制有向网络,其中波动较大的连边在网络图中由红色表示,波动较小的连边由蓝色表示,见图6(b)。由图可知,一般波动较小的结构传播范围较小,大多均在省内或在相邻省份之间传播;波动较大结构可能传播范围较大,大多跨省传播。波动较大结构的数量大于波动较小结构。同时可以得出2021年度全年波动较小的传播大多分布在辽宁省,辽阳、朔州、邯郸为波动较小结构中的重要节点;2021年度全年波动较大的传播主要存在于河北和山东两个省份之间,其中泰安、承德、衡水、滨州为波动较大结构中的重要节点。
4. 结论
PM2.5等污染物在城市之间的传播往往具有不对称性,故本文选取有向网络中的转移熵作为网络连边规则对各个城市之间PM2.5传播过程进行分析。转移熵是分析多个时间序列因果关系的有效方法,可以用来分析北京、天津、河北、山东、山西、辽宁52个城市的PM2.5传播情况。本文将PM2.5实时浓度取对数差分,通过转移熵计算各个城市之间的PM2.5影响程度,经研究设定一个合理的阈值,确定网络中的连边数量和方向,并依据此规则建立城市群的年PM2.5网络和月PM2.5网络。转移熵网络中,聊城、晋中、济南、淄博、锦州、阜新6个城市在PM2.5污染传播的过程中和周边城市的关联性较强。山东地区和辽宁地区在2021年度中国东北部地区属于PM2.5传播的重要省份;山西省重要城市节点较少,与周边城市的关联性也较弱;河北省总体PM2.5传播能力居中,但有部分节点受其他节点的影响较大(如晋中)。月份网络中可见2021年1~3月和11~12月PM2.5浓度和传播程度处于全年较高水平,6~9月处于全年较低水平。PM2.5浓度在全年中呈现“U”型变化特征——夏季(6~9月)处于“U”的底端,较为低发,PM2.5浓度和传播程度均在一个较低的水平;冬季处于“U”的峰值,较为高发,尤其是12月,可见由于季节性原因导致的PM2.5浓度及传播程度的差异性较大。之后对连边的波动程度进行分析发现,一般波动较小的结构传播范围较小,波动较大结构可能传播范围较大。2021年度全年波动较小的传播大多分布在辽宁省,辽阳、朔州、邯郸为波动较小结构中的重要节点;2021年度全年波动较大的传播主要存在于河北和山东两个省份之间,其中泰安、承德、衡水、滨州为波动较大结构中的重要节点。通过分析全年的转移熵网络和月份网络,可以得出共同的在传播过程中与周边城市关联度较强的节点,如锦州、晋中、菏泽、淄博、邯郸、阜新。通过分析年转移熵网络和波动程度网络,可得辽宁省在2021年度PM2.5传播中对周边城市影响较大,且该影响随月份变化程度较小、波动程度较小,应优先、重点治理。
为了有效降低这种区域性PM2.5污染,本文依据转移熵网络、月份网络和波动程度网络,基于网络内PM2.5污染防治一体化的理念,提出以下几点防治建议:
1) 根据年度PM2.5网络对度值较大的6个城市,即聊城、晋中、济南、淄博、锦州、阜新建立主体保护区,重点治理。同时应当设立区域监督防治联盟,交流经验、共同制定切实可行的防治方案,从而使得整个区域的PM2.5污染情况得到控制。
2) 根据季节PM2.5网络,因时制宜,制定不同月份、不同季节的防治方案。例如夏季PM2.5污染传播范围较小,即可在各个城市内部,或小范围内进行分点治理,冬季PM2.5污染传播范围较广,则需要联合多个城市,扩大分区治理范围,加强各地环境部门内部的沟通,进行联合防治。
3) 根据波动程度的分析,在联合防治策略的优先级上,需要优先进行PM2.5传播波动较小的地区的防治。例如优先在辽阳、朔州、邯郸这种地区进行防治PM2.5污染政策的制定。
NOTES
*通讯作者。