1. 引言
影响空气质量的因素有许多,如污染源的排放、气象因素的影响等,其中,当地污染物的排放造成的大气污染为主要长期因素。但随着越来越多人的关注以及国家关于生态文明建设政策的颁布,各项污染源的排放量得到了一定程度的控制,对空气质量的影响也趋于稳定。而气象因素处于不断的变化中,属于相对不稳定因素,故可认为气象因素为影响空气质量的主要短期因素,研究气象指标对空气质量的影响十分必要。
近年来,国内外学者已针对空气污染状况与气象因素的关系展开了大量研究,并结合了乌鲁木齐、哈尔滨、北京、广州等城市的数据,以AQI、API或是可吸入颗粒物为空气质量指标,从相关系数角度和污染发生频率角度分析了空气质量与气象指标的相关性 [1] - [10],也有学者利用典型相关分析建立空气质量和气象指标的综合典型变量进行相关性分析 [11] [12],均得出了空气质量与气象指标之间相关的结论。但这些研究通常是基于原始数据的相关系数得到的结论,虽然直观,但并不能表示出气象指标与空气质量的内部关联,也有学者利用小波分析对PM10等空气质量指标进行了特征分析 [13] [14] [15],但仅仅分析了污染物的特征,并未去与气象条件相联系。
对于两组变量间相关性的刻画有多种不同的方法,如相关系数、灰色相关系数、散点图比较、典型相关分析以及信号分解方法。其中信号分解有利于观察变量内部的特征,故利用谱分析的方法对数据各频段进行研究,讨论其潜在的相关关系。本文拟以PM2.5、PM10、SO2、CO、NO2以及O3为空气质量指标,以气温、气压、相对湿度、降雨/雪量、能见度、平均风速以及最大持续风速为气象指标,通过典型相关分析选取相关性最强的空气质量指标和气象指标,利用凝聚谱分析选出相关性较强的频段区间,并利用EMD分解选出相应频段的数据分量,从频域的角度分析空气质量与气象指标间的相关性。
2. 资料与方法
2.1. 数据来源
山东省青岛市2014年1月~2017年12月空气质量指标的日均数据来自于PM2.5历史数据网 (https://www.aqistudy.cn/historydata/),主要包括空气质量等级、AQI、PM2.5、PM10、SO2、CO、NO2、O3等指标。同期的气象数据来源于天气网(https://en.tutiempo.net/climate),数据包括平均气温、气压、相对湿度、降雨/降雪量、平均能见度、平均风速、最大持续风速等气象指标。
2.2. 青岛市空气质量基本情况
本根据《环境空气质量指数(AQI)技术规定(试行)》 [15],空气质量指数分为六级:优、良、轻度污染、中度污染、重度污染、严重污染。统计各空气质量等级在2014年至2017年出现的天数占比可知,良(65.85%)为青岛市最常见的空气质量情况,其次是轻度污染(17.39%)和优(10.75%),而中度污染(3.63%)、重度污染(2.19%)和严重污染(0.21%)出现的频率相对比较低。
逐月统计各空气质量等级出现的天数如图1,可知青岛市整体的空气质量较好,每月的空气质量以“良”居多,6~8月空气质量较好,“优”出现的天数显著增多,冬季的空气质量较差,“重度污染”和“严重污染”主要出现在12月和次年1月。这种现象一方面可归结为冬季采暖以及私家车出行增加带来的集中污染,另一方面,冬季气温较低,不利于污染物扩散,而夏季气温较高,混合层高度提高,有利于污染物的扩散,且雨水较为丰沛,有利于污染物溶入地表。
![](//html.hanspub.org/file/6-2320391x9_hanspub.png)
Figure 1. Air quality in Qingdao in every month
图1. 青岛市各月的空气质量情况
2.3. 研究方法
典型相关分析 [16] 是利用综合变量之间的相关关系来反映两组指标之间的整体相关性,分别对空气质量和气象指标内部变量进行线性组合构成综合变量,通过综合变量间的相关系数大小,选取若干具有代表性的综合变量,进而可用综合变量对空气质量和气象指标间的关系进行分析。
功率谱分析 [17] [18] 可以从频域角度揭示一个平稳时间序列的内部结构,凝聚谱在形式上类似于相关系数的计算,利用凝聚谱可对数据进行谱分解,并可计算空气质量和气象指标在各频段上的相关性,进而选出显著相关的频率,但无法输出数据在各频率上的分量。经验模态分解 [19] [20] (Empirical Mode Decomposition,简称EMD)是一种循环迭代算法,能够依据自身的时间尺度特征自适应地从时间序列中分解出一系列不同频率的本征模态函数(IMF)。利用EMD方法可以得到凝聚谱选出的频段上的数据分量,进而对空气质量和气象因子的IMF分量进行相关性分析。
3. 数据分析结果
3.1. 典型变量
由于青岛市2014年1月~2017年12月的气象指标数据存在少量缺失,故在数据分析前需要对于缺失数据进行补足,采取的方式为,取该日前后两天的均值作为当天数据的补值。在进行相关性分析前,对数据进行标准化处理,可去除数据的量纲影响。
青岛市的四季 [19] 可大致划分为:春季4~5月份、夏季6~9月份、秋季10~11月份、冬季12月至次年3月份。青岛市的供暖时间为11月中旬至次年3月中旬,故可将11月至次年3月作为供暖季数据,4月至10月作为非供暖季数据。
分别对青岛市的空气质量指标与气象指标的全段数据、四季数据以及供暖与否数据进行典型相关分析,观察其相关程度。由于第一对典型相关变量间的相关性最强,故取各段数据的第一对典型相关变量进行分析讨论,可得到表1。
![](Images/Table_Tmp.jpg)
Table 1. Results of canonical correlation analysis in different periods of Qingdao
表1. 青岛市不同时期的典型相关分析结果
注:T为平均温度(℃),SLP为气压(hPa),H为相对湿度,PP为降雨/降雪量(mm),VV为平均能见度(Km),V为平均风速(Km/h),VM为最大持续风度(Km/h)。
对于全段数据而言,臭氧受到温度的影响较大,且温度越高,臭氧浓度越高。不同时期,受到气象指标影响较大的空气质量指标并不相同,气象指标对于空气质量指标的影响程度也不相同,且在秋冬两季,空气质量与气象指标间的相关性更强。春夏两季相对湿度极大地影响了空气中PM2.5的含量,湿度越大会加剧春季PM2.5的污染,但却有利于降低夏季空气中PM2.5的浓度。秋季气温对SO2的影响较显著,且随着气温的降低,SO2的污染加剧。冬季与供暖季仅相差一个月,故结果相似,且与全段数据的结果相仿,均为温度与臭氧的浓度成正比。非供暖季时期,受气象指标影响较大的是PM10,而相对湿度为关键气象指标,且湿度的增大可以减轻PM10的污染。
综合考虑不同时期的典型相关结果,可知,PM2.5和O3受到气象指标的影响最为显著,其中,相对湿度对PM2.5的浓度有制约作用,气温与O3的浓度密切相关。
3.2. PM2.5与相对湿度的频域相关性分析
利用ADF检验对PM2.5和相对湿度进行平稳性检验如表2,显然两个序列均为平稳序列,可进行凝聚谱分析。
为便于计算,取自2013年1月1日起前1440行的数据进行凝聚谱分析,在50%重叠率下,依次选择段长为288、144和72,可得到各频段上的凝聚谱如图2,图中垂直于y轴的虚线为凝聚谱在该段长下的阈值 [21],凝聚谱超过阈值的频段为PM2.5与相对湿度相关性较强的频段。显然,选择不同段长,满足要求的频段数与频段位置不同,但也存在相近部分,频率在0~0.05、0.2左右的凝聚谱在三种段长下均超过了阈值,故可认为PM2.5和相对湿度在这三种频率上的数据分量相关性较强。
![](Images/Table_Tmp.jpg)
Table 2. Results of ADF test for PM2.5 and relative humidity
表2. PM2.5和相对湿度的ADF检验结果
注:L为数据分段的段长,α为数据重叠率。
Figure 2. The MSC of PM2.5 and relative humidity under different lengths of three segments
图2. PM2.5和相对湿度在三种段长下各频段的凝聚谱
利用EMD方法对PM2.5和相对湿度进行本征模态函数的分解,可得到各IMF分量的频率如表3,将凝聚谱超过阈值的频率与各模态的频率相互对应,可选出PM2.5和相对湿度的部分IMF分量如表4。
除了IMF2分量之外,其他分量间的相关系数与原始数据相比均有提高,且值得注意的是,仅有42天周期上两变量间的关系表示了PM2.5与相对湿度负相关,其他分量间均表示为两者正相关。这与典型相关分析时的结果相近,春夏季相对湿度对PM2.5的影响不一致,说明相对湿度对PM2.5的影响存在两面性,即相对湿度增大并不一定能降低的浓度,且从周期来看,较长或较短周期上的相对湿度的增大会导致污染加剧,在40天左右的周期上相对湿度的增大可以降低的PM2.5浓度。
![](Images/Table_Tmp.jpg)
Table 3. The frequency of each IMF component of PM2.5 and relative humidity
表3. PM2.5和相对湿度各IMF分量的频率f
![](Images/Table_Tmp.jpg)
Table 4. The correlation of IMF components with similar periodicity of PM2.5 and relative humidity
表4. PM2.5和相对湿度相近周期的IMF分量的相关系数
注:周期t = 1/f,且由于PM2.5和相对湿度的各IMF分量的频率存在一些偏差,故周期取的是两个频率相近分量的周期平均值。
3.3. O3与平均气温的频域相关性分析
对利用ADF检验对O3和平均气温进行平稳性检验如表5,臭氧序列平稳,但平均气温序列并不平稳,故对平均气温序列进行差分,即可得到气温增量序列,经过ADF检验,可知气温增量序列为平稳序列,故可对O3和气温增量进行凝聚谱分析。
![](Images/Table_Tmp.jpg)
Table 5. ADF test results of O3, mean temperature and air temperature increment
表5. O3、平均气温、气温增量的ADF检验结果
同2.3,为便于计算,在50%重叠率下,依次选择段长为288、144和72,可得到各频段上的凝聚谱如图3,图中垂直于y轴的虚线为凝聚谱在该段长下的阈值,凝聚谱超过阈值的频段即为O3与气温增量相关性较强的频段。当选择段长为72天时,几乎所有频段的凝聚谱均超过了阈值,随着段长的增大,频率的分割变细,发现尽管并不是所有的频段都满足要求,但O3和气温增量的凝聚谱超过阈值的频段涉及到了大部分频率区间。
利用EMD方法对O3和气温增量进行本征模态函数的分解,可得到各IMF分量的频率如表6,将O3和平均气温各模态的频率一一对应,并与凝聚谱超过阈值的频率进行对照,可选出O3和气温增量的部分IMF分量如表7。
![](//html.hanspub.org/file/6-2320391x11_hanspub.png)
Figure 3. The MSC of O3 and temperature increments under different lengths of three segments
图3. O3和气温增量在三种段长下各频段数据的凝聚谱
![](Images/Table_Tmp.jpg)
Table 6. Frequency of each IMF component of O3 and temperature increment
表6. O3和气温增量各IMF分量的频率f
![](Images/Table_Tmp.jpg)
Table 7. Correlation coefficient of IMF with similar period component of O3 and temperature increment
表7. O3和气温增量相近周期的IMF分量的相关系数
注:周期t = 1/f,且由于O3和气温增量的各IMF分量的频率存在一些偏差,故周期取的是两个频率相近分量的周期平均值。
已知大部分频段的凝聚谱超过了阈值,可知气温增量在各个频段上均对O3有较大的影响,但不同模态分量间的相关系数正负不一,且随着IMF分量周期的变长,相关系数由负变正。可推测,气温短时间的突发性升高会可能会导致O3浓度的降低,气温在长周期上的增长有利于O3浓度的升高。在一年左右的周期上,O3与气温增量的相关性达到最大且超过原始数据的相关性,可认为气温增长以年度增长的幅度对空气质量造成较大影响。
4. 结论
论文利用计算频数频率的方法分析了青岛市2014年至2017年的空气质量整体状况,得到了青岛市空气质量整体较好,“良”为主要空气质量等级,空气质量的变化存在周期性,且污染发生的高峰期出现在每年的12月、1月左右,推测这与冬季煤炭燃烧量增加有关,也可能冬季气温整体较低,不利于污染物扩散有关。
因空气质量和气象指标较多,故利用典型相关分析对青岛市不同时间段的空气质量和气象指标建立了综合变量,通过综合变量刻画两者间的相关关系。结果表明,尽管不同时间段上的空气质量和气象指标的相关模式不尽相同,但相关系数均可达到0.7以上,且均通过了相关性检验,即空气质量与气象指标间存在显著相关关系,且秋冬季相关性尤为显著。此外,不同季节受到气象指标显著影响的空气质量指标不完全相同,春夏两季以及非供暖季中,颗粒物污染与气象指标的关系密切,主要受到相对湿度的影响;秋冬两季与全年的结果相类似,臭氧受到气象因素的影响较大,且主要气象指标为气温。
为了对空气质量与气象指标的相关关系进行深入分析,利用凝聚谱和EMD方法选出PM2.5与相对湿度以及臭氧与气温间显著相关的频段,并分析相应的数据分量间的相关关系。结果表明,不同周期的相对湿度分量对PM2.5的影响不同,在42天的周期分量上,相对湿度有利于降低PM2.5的浓度,可认为湿度的月度变化对PM2.5的影响较大。秋冬两季与全年的结果相类似,均极大地受到了气温的影响,不同周期的气温分量对臭氧的影响也不相同,周期越长,正面影响越大,且气温的年度间变化对臭氧的影响十分显著。
基金项目
国家自然科学基金(U1706226)。
参考文献