1. 引言
一直以来,社会经济指数都是综合、定量地衡量社会经济发展状况的绝佳选择,它使得不同国家,不同区域、不同时间的社会经济发展状况具有了可比性,为宏观经济发展提供了重要参考。然而,社会经济指数的获得却有着偏差、时间延迟、不准确等不可避免的问题。
随着卫星技术的发展,遥感夜间灯光数据逐渐走向成熟,它有着及时、客观、系统的特点。从1992年开始,DMSP/OLS夜间灯光影像被数字化且可以免费从美国国家地球物理数据中心网站下载。夜间灯光数据有着相同的分辨率,多时相、以系统地方式覆盖着全球。这些特点使得关于它的研究社会经济方面有着特别的优势。
目前,国内外已经有很多学者将夜间灯光数据与社会经济指数之间进行关联研究[1] [2] [3],也有很多学者实现了在关联研究的基础上对社会经济指数进行预测[4] [5]。但中国国内各大城市的夜间灯光数据与社会经济指数的关联研究还较缺乏,之前的研究主要集中在国家或者区域这个尺度上,由于夜间灯光数据与社会经济指数关系和地区有关,不同的城市它们之间的关系并不相同,所以国家和区域层面的研究还远远不够,急需要系统、全面地进行夜间灯光数据与中国典型城市的关联研究。
本文以中国的一线城市为例,使用1994~2012年的DMSP/OLS 年度稳定灯光数据,从时间尺度和空间尺度两个方面进行夜间灯光数据国内生产总值GDP和人口的关联研究,建立它们之间的相关模型,提供模型的相关系数,并对模型的相关性和斜率进行了分析。为今后的中国的社会经济状况的评估与分析奠定了基础。
2. 研究区域和数据
2.1. 研究区域
自1978年改革开放以来,中国发生了翻天覆地的变化,社会财富急剧增加,人民生活水平也不断提高,国内生产总值从1978年的3624亿元增加到2014年的636,463亿元,增加了175.6倍,居民年平均消费水平从1991年的932元增加到2013年的15632.1元,增加了89倍。城镇人口从1991年的31,230人增加到2014年的74,916人,增加了2.4倍(数据来自中经网数据库)。同时,经济的快速发展也使得中国产生了大量的特大城市,从最初4座一线城市到2013底增加到19个一线城市(北京、上海、广州、深圳、成都、杭州、南京、武汉、天津、西安、重庆、青岛、沈阳、长沙、大连、厦门、无锡、福州、济南)。这些一线城市拥有雄厚的经济基础、深厚的文化积淀以及发达的交通。他们已经成为中国经济的领头军。
2.2. 数据
2.2.1. 社会经济数据
选取全国及一线城市的年度GDP与人口统计数据,包括:全国和一线城市1994~2012年的内生产总值;1994~2012年一线城市市辖区人口数,数据均来自中经网统计数据库 (http://db.cei.gov.cn/page/Default.aspx)。
2.2.2. DMSP/OLS夜间灯光数据
在20世纪70年代,美国发射了军事气象卫星DMSP (Defense Meteorological Satellite Program)携带着OLS (Operational Linescan System)传感器,该传感器拥有两个波段:可见光、近红外波段(VIS)和热红外波段(TIR),VIS经过光电倍增管进行信号增强,使得它可以探测到微弱的可见光与近红外光,包括:月光下的云层、城镇的灯光、工业基地的光、天然气燃烧的光以及一些短暂的灯光[6]。
美国国家地球物理数据中心(NGDC)为DMSP卫星数据建立了长期的存档,并发展了一系列流程处理得到DMSP年稳定灯光产品[6]。该DMSP/OLS无云数据的制作利用了全年DMSP/OLS可获得的所有数据,该数据产品目前已经横跨了21年(1992~2012),由6颗卫星获得,拥有33幅影像地面分辨率为0.008333 度,在赤道处分辨率接近1km。每幅影像几乎覆盖全球:经度−180至180度,纬度-65至75度。该高质量数据经过了很好的几何纠正,去除了噪声、云层、极光、太阳光以及月光的影响[6]。目前,该数据可在美国国家地球物理数据中心(http://ngdc.noaa.gov/eog/dmsp/downloadV4composites.html)免费下载,下载的数据为Geotiff格式,共有三种影像类型:无云数据、平均灯光数据、稳定灯光数据[6]。
本文使用的是稳定灯光数据:数据灰度值范围为0~63,其中0为背景和噪声,1~63为灯光。该数据保留了来自城镇以及天然气燃烧等持久的光,将一些短暂的灯光去除。使得该数据非常有利于进行经济、城镇化等等与人类生活息息相关的研究。为了给夜间灯光数据做预处理,另有三种辅助数据被使用:1)
行政边界线(http://www.gadm.org/),用来裁剪获取一线城市的夜灯影像;2) MODIS MOD44W水层模板,该数据为Geotiff格式,分辨率为250米,数据中以灰度值0表示陆地,以灰度值1表示水体(http://glcf.umd.edu/data/watermask/);3) 天然气燃烧区掩膜,天然气燃烧区是因为石油开采区域没有足够的基础设施使得天然气未充分利用而产生的,文中使用的天然气燃烧区域数据可从美国国家地球物理数据中心下载(http://ngdc.noaa.gov/eog/interest/gas_flares_countries_shapefiles.html)。
3. 方法
3.1. 数据预处理
3.1.1. 去除水体和天然气燃烧区
DMSP/OLS夜光数据利用MOD44W水层掩膜去除水体,可以减少沿海城市50%的灯光溢出现象,对内陆城市也有一定的减少灯光溢出造成的数据误差的作用[7]。天然气燃烧区域在DMSP/OLS夜间灯光影像上灰度值非常接近城区,会造成小城区的过度评估,我们的目标是研究与人类活动息息相关的城镇区域,所以天然气燃烧区域的灯光被去除用于提高夜间灯光数据的可靠性[7]。
3.1.2. 多时相夜间灯光影像校正
本文使用的夜间灯光影像横跨了19年,数据来源于6颗卫星,由于OLS传感器并未做星上校正,不同的卫星配着不同的传感器设置,使得它们的影像存在系统误差,导致不同年的影像不具有可比性。
本文采用了Elvidge的文章[8]的方法去减少不同夜光影像灯光灰度值的差异性。Elvidge文中的多时相校正方法主要有三步构成:
1) 选出样本区,参考样本区需满足:多年来基本没发展即灰度值变化小且灰度值分布范围要广,文章[8]发现意大利西西里岛完全符合这个要求,可作为参考样本区。
2) 统计样本区每幅影像的灯光积累值,选取该值最高的影像为参考影像。
3) 将参考影像与其他影像比较得到校正系数,建立二元一次回归方程对其他影像进行校正:
(1)
其中
(digital number)为需校正影像纠正前灰度值,
为纠正后需校正影像的DN值。C0、C1、C2为校正系数。
3.1.3. 年内互检校
经过多时相检校后,数据的一致性提高了很多,但是很多年里仍有两幅影像,对于进行与GDP和人口数的关联研究很不方便,所以我们需要合理的将某些年的两幅影像合成一幅影像,本文采取文[9]中的方法,首先将同年里两幅影像的不稳定灯光(即在两幅影像里不同时为灯光像素)移除,再将两幅影像同一像素上的灰度值求平均值作为新的影像该像素上的灰度值,这样便得到了一幅具有同年两幅影像信息的稳定夜间灯光数据。
3.2. 关联研究
对预处理完的影像进行行政边界切割,切割出19个一线典型城市影像(如图1)。收集各城市社会经济参数,选择灯光像素值总数(SOL)与社会经济参数(包括GDP和人口)进行一线城市的关联研究,此研究分为两部分:时间尺度上的关联研究(单个城市不同时间的夜间灯光值总数与社会经济参数的关系)、空间尺度上的关联研究(同一时间不同城市的夜间灯光值总数与社会经济参数的关系)。
4. 结果与分析
4.1. 夜灯与GDP关联研究
4.1.1. 时间尺度上的关联研究
收集中经网数据库所提供1994~2012年的各城市内的GDP值。针对各城市GDP和SOL随时间变化的散点图进行了线性拟合,表1为各城市拟合线相关性模型的具体参数,可以看出大部分城市的GDP与SOL直线相关,且具有较强的正相关性,SOL越高所对应的GDP越高。
4.1.2. 空间尺度上的关联研究
将1994~2012年每隔5年制作了一幅19个城市所对应的GDP与SOL的散点图,并拟合了直线(如图2)。年份分别为:1995年、2000年、2005年、2010年。表2为具体的相关模型参数。
![](Images/Table_Tmp.jpg)
Table 1. The correlation and coefficients of the fitting line between GDP and SOL at the temporal scale
表1. 时间尺度上一线城市GDP与SOL拟合线系数及相关性表
![](Images/Table_Tmp.jpg)
Table 2. The correlation and coefficients of the fitting line between GDP and SOL at the spatial scale
表2. 空间尺度上GDP与SOL拟合线系数及相关性表
![](//html.hanspub.org/file/2-2840118x18_hanspub.png)
![](//html.hanspub.org/file/2-2840118x19_hanspub.png)
Figure 2. The scatter plots of the first-tier cities between GDP and SOL at the spatial scale
图2. 空间尺度上的各城市GDP与SOL散点图
总体而言,GDP和SOL在空间尺度上也具有很强的相关性。从1995年到2010年各城市的在图2中的位置分布基本没有变化,处于散点图中最上面位置的城市为北京、上海、广州、深圳,这四个城市为老一线城市,其他的城市分布较为集中,为2013年加入的新一线城市。图2四个子图中散点图的相关性R2值在0.5左右(见表2),而时间尺度上分析的GDP与夜间灯光总值SOL的相关性R2为0.8左右(见表1),这说明空间尺度上的相关性远低于时间尺度上的,多时相的SOL与GDP的相关性分析在时间尺度上更为可靠。
另外图2中可以发现从1995年到2010年,上面四幅图直线斜率不断递增,从0.42一直上升到了2.89。说明单位灯光的增加所对应的GDP增长在不断增多。文中将单位灯光的增加对应的GDP增加的能力看成城市的灯光效率。可以看出图中大部分城市较为集中,他们灯光效率较为一致,图中最为突出的为上海,它单位灯光所对应的GDP的增长的能力最强,即它的灯光效率最强远超过其他城市,同时对比图2中的4幅子图可以看出,北京从低于拟合线到逐渐高于拟合线(拟合线可以看成一线城市的普遍灯光效率),说明北京的灯光效率在相对随时间不断上升。
4.1.3. 总体分析
因为空间尺度上分析得到的SOL与GDP的相关性远没有时间尺度上分析的相关性高,所以这里的总体分析只考虑时间尺度上得到的结果。
上面的分析中,我们得到了各城市时间尺度上SOL与GDP的线性关系以及它们的相关性R2。可以看出深圳的GDP与SOL的相关性极低,只有0.3左右,其他城市相关性都在0.8上下波动。图3可发现深圳的灯光均值也远大于其他城市,且深圳市夜间灯光影像存在严重的过饱和现象(即灰度值大于63的像素统一置为63),导致它的灯光像素总值(SOL)不可信,进而造成它的SOL与GDP的相关性极低。所以下面SOL与GDP线性关系的斜率讨论不考虑深圳。
图4为18个一线城市(排除深圳)时间尺度上分析的SOL与GDP拟合线的斜率分布,该拟合线斜率为该城市单位灯光增加所对应的GDP的增加,文中称为灯光的GDP效率。可以看出北京、广州、上海的斜率极高,即灯光的GDP效率极高。
![](//html.hanspub.org/file/2-2840118x20_hanspub.png)
Figure 3. The mean value of NTL for all cities in 2012
图3. 各城市2012年灯光均值图
![](//html.hanspub.org/file/2-2840118x21_hanspub.png)
Figure 4. The slope of the fitting line between GDP and SOL
图4. 各城市GDP与SOL拟合线斜率图
为了进一步分析灯光的GDP效率大小的规律,本文研究了城市发达程度的衡量方式,由于通常情况下可用GDP作为发达程度的衡量。文中选用2005年各一线城市的GDP作为发达程度的衡量。图5为斜率(即灯光的GDP效率)与2005年各城市GDP(即各城市发达程度)的散点图。可看出R2为0.733,说明单位灯光的增加对应的GDP的增加即灯光的GDP效率与城市的发达程度有着较强的正相关关系,城市越发达,灯光的GDP效率就越大。
4.2. 夜灯与人口关联研究
由中经网上提供的各城市的人口数只有1994年到2012年的市辖区人口,由于市辖区人口基本全为城镇人口,又因为可得到的数据的局限性,所以本文将市辖区人口看成城镇人口。因为市辖区的定义会随着时间而发生变化和其他原因,导致市辖区人口数会在某一年大幅上升或下降,本文将邻近年人口数变化大于50万人定义为异常,则发生异常的城市及年份统计如表3。
![](//html.hanspub.org/file/2-2840118x22_hanspub.png)
Figure 5. The scatter plots between the slope of the fitting line (between the GDP and SOL) and development level at the temporal scale
图5. 时间尺度上各城市GDP与SOL的拟合线斜率与各城市发达程度散点图
![](Images/Table_Tmp.jpg)
Table 3. The abnormal situation of population change of municipal district
表3. 市辖区人口数变化异常情况表
为了让各城市人口数据与夜间灯光数据的相关性更加可靠,综合考虑表3中的变化后,这部分相关性研究只研究2002~2012年的16个一线城市(排除青岛、武汉、重庆)的市辖区人口与夜间灯光数据的相关性。
4.2.1. 时间尺度上的关联研究
表4提供了16个一线城市(排除重庆、青岛、武汉)2002~2012年夜间灯光数据SOL值与市辖区人口的散点图的拟合线系数及相关性。可以从中看出,大部分城市的SOL与市辖区人口数也具有较强的正相关性,总体呈现出SOL越大,市辖区人口越多。
4.2.2. 空间尺度上的关联研究
为了表现出同年不同城市2002~2012年的市辖区人口数与夜间灯光数据SOL的关系,本文每隔5年制作了散点图(如图6),分别为:2002、2007、2012。对比表2和表5,可以看出在空间尺度上的关联研究中,人口与SOL的相关性普遍大于GDP与SOL的相关性,表明单时相研究人口与SOL关系的可靠性比GDP与SOL关系的可靠性要大。与GDP与SOL的空间尺度上研究相比,人口与SOL空间上研究整体而言,城市人口与灯光关系相对关系基本没有太大变化,即各城市跟拟合线的相对关系变化不大。从2002~2012年图像可看出整体斜率基本不变,即空间尺度上研究的一线城市整体灯光与人口数的关系随时间的变化不大。
![](Images/Table_Tmp.jpg)
Table 4. The correlation and coefficients of the fitting line between population and SOL at the temporal scale
表4. 时间上一线城市人口数与SOL拟合线系数及相关性表
![](//html.hanspub.org/file/2-2840118x23_hanspub.png)
![](//html.hanspub.org/file/2-2840118x24_hanspub.png)
Figure 6. The scatter plots of the first-tier cities between population and SOL at the spatial scale
图6. 空间尺度上的各城市人口与SOL散点图
![](Images/Table_Tmp.jpg)
Table 5. The correlation and coefficients of the fitting line between population and SOL at the spatial scale
表5. 空间尺度上人口数与SOL拟合线系数及相关性表
4.2.3. 总体分析
图7为16个城市时间上分析中得到的相关性R2分布。从图中可以看出深圳由于过饱和现象过于严重,导致它人口与SOL的相关性也异常的低。由于深圳的相关性不可靠,所以以下分析排除深圳,图8为时间上分析中各城市拟合线斜率的分布。该斜率表示单位灯光的增加所对应的人口的增加,图8中北京、广州、厦门斜率较高,而上海却不是很高。图9为斜率与发达程度的相关性,发现与灯光的GDP效率不同,单位灯光增加对应人口的增加与发达程度基本没有关系。
![](//html.hanspub.org/file/2-2840118x25_hanspub.png)
Figure 7. The correlation between population and SOL
图7. 各城市人口与SOL线性关系相关性图
![](//html.hanspub.org/file/2-2840118x26_hanspub.png)
Figure 8. The slope of the fitting line between population and SOL
图8. 各城市人口与SOL拟合线斜率图
![](//html.hanspub.org/file/2-2840118x27_hanspub.png)
Figure 9. The scatter plots between the slope of the fitting line (between the population and SOL) and development level at the temporal scale
图9. 时间上各城市人口与SOL拟合线斜率与各城市发达程度散点图
5. 结论
本文采用了与人类社会经济活动高度相关的DMSP/OLS多时间序列的稳定夜间灯光数据,使用matlab完成了一系列的数据纠正工作,充分考虑了多时相夜间灯光数据存在的各种问题,使得纠正后的数据更加合理可靠。在进行关联性研究时,结合常用的单时相空间上的相关性研究的同时,考虑到各个城市的差异,加入了单个城市多时相的研究,使研究结果更全面。研究发现人口和GDP与夜间灯光值总数有着很强的相关性,并提供了一线城市各自的拟合线及相关性,发现GDP与灯光拟合线的斜率(单位灯光的增加所对应的GDP增加)与发达程度呈现较强的正相关,而人口与灯光拟合线的斜率(单位灯光的增加所对应的人口增加)与发达程度却没有关系,文章还发现夜间灯光值总数由多种因素综合决定,但不同城市的偏重点不同,如:北京、广州、南京、上海、无锡等城市与GDP更加相关,而长沙、成都等城市却与人口更加相关。这些研究填补了中国在一块的空白,且对今后的进一步研究有着很重要的意义。
目前DMSP/OLS多时相夜间灯光影像与社会经济指数进行关联研究时存在几大问题:水体和天然气燃烧区域的影响;灯光溢出问题(夜间灯光影像有很多微弱的灯光区域实际并没有灯光,而是因为灯光散射等问题造成);灯光过饱和现象(灯光灰度值大于63的强制为63);DMSP/OLS影像未做星上校正,多时相影像之间存在系统误差;部分年有两幅卫星影像,不利于与社会经济指数进行关联。
本文已全面考虑了这些问题和目前这些问题的解决方法,但仍有部分问题还有待进一步研究,灯光溢出问题使用去除水体的方式降低了一部分,但是并不能完全解决,目前也并没有方法能完全解决这一问题。灯光的过饱和问题在深圳的研究中非常明显,深圳平均灯光灰度值在50左右,过饱和现象非常严重,所以在进行与人口、GDP的关联研究时,它的相关性非常差。想提高深圳区域的相关性需要很好的解决过饱和问题,不过现有的研究中这一问题的处理方式也并非特别理想。其他问题带来的误差本文已经较合理地剔除。
本文提供了时间尺度、空间尺度上关联研究的所有拟合线及相关性,今后可以进一步使用夜间灯光数据对社会经济指数进行评估。对有着时间延迟以及各种人工误差的统计数据是一个很好的补充。也可以进行多元回归分析,将夜间灯光指数与更多的其他经济指数进行关联研究。
致谢
感谢美国国家地球物理数据中心提供DMSP/OLS多时相夜间灯光数据及天然气燃烧区掩膜。感谢中经网数据库提供的社会经济统计数据。