衡量GDP,哪种夜间灯光数据更靠谱?
《新科学家》杂志报道,随着经济发展,一些国家通常会新修道路,扩展居民区,这两项措施都会使从太空中看到的灯光强度增加。不少学者利用夜间灯光数据与国内生产总值统计数据进行比较,发现从太空中看到的夜间灯光强度与一个国家的国内生产总值存在关联。美国国防气象卫星(DMSP)搭载的业务型线扫描传感器(OLS)已被用来研究区域和全球的GDP值。2013年初,苏奥米国家极轨合作伙伴(Suomi NPP)可见光红外成像辐射仪(VIIRS)夜间灯光数据发布,与DMSP/OLS相比,它们具有更高的空间分辨率和更广泛的辐射探测范围,本文旨在研究这两种夜间灯光数据对GDP估算的适用性。
这是社论前沿第S857期推送
引言
国内生产总值(GDP)是衡量一个国家或地区经济发展的基本指标之一,获取准确的和最新的GDP空间分布信息对于更好地了解一个国家的社会和经济状况是很重要的。现代卫星遥感技术可以为自然科学和社会经济研究的结合提供基础。如今,在原始数据丢失或存在误导的地区,遥感数据已成为经济指标的有效替代。夜间灯光数据反映了公共和商业灯光的使用情况,它与经济状况密切相关,可以反映城市化、人口和工业的发展状况,夜间灯光数据已用于模拟、动态监测,区域人口的估算、GDP以及其它关键社会经济指标。
以往的研究通常从单个空间尺度(或单一区域)、单一功能模型或单一夜间灯光图像的角度研究夜间灯光数据与GDP统计数据的相关性。总结以往的研究结果表明,可能是由于不同的空间尺度、数据来源、拟合模型、研究区域、经济水平和产业结构,关于GDP估算的结论仍存在很大差异,不能一概而论。本研究从数据源、拟合函数模型和空间尺度三个方面分析了夜间灯光数据对GDP估算的适用性。
数据与方法
(一)研究区域与数据源
在中国,行政区域划分主要有四个层次:省、市、县、乡四级。本研究包括除香港、澳门、台湾以外的所有省级行政区以及中国大陆的341个市级行政区。
美国国家海洋与大气管理局(NOAA)下属的美国国家地球物理数据中心(NGDC)发布了1992-2013年的DMSP/OLS夜间灯光时间序列数据。本研究采用2013年DMSP/OLS稳定灯光数据,数据空间分辨率为30弧秒,数据包含来自城镇以及其他类型的稳定灯光,而火灾、废弃燃烧等短暂性事件的瞬时亮光已被摒除。
本研究采用了2014年4-10月的Suomi NPP/VIIRS DNB数据。这些原始数据并没有经过过滤、背景噪声也没除去。此外,在最初的NPP/VIIRS数据中,有一些原始辐射值为负,必须在使用前进行纠正。数据的空间分辨率为15弧秒。
2014年省、地级GDP数据源于《中国统计年鉴》、《中国城市统计年鉴》和《2015年地方统计年鉴》。中国大陆的DEM数据来自航天飞机成像雷达地形测绘任务(SRTM)。此外,本研究还使用了地理科学和自然资源研究所提供的2013年的土地使用和土地覆盖数据。
(二)方法
1、NPP/VIIRS夜间灯光数据的预处理
原始NPP/VIIRS夜间灯光辐射数据并没有将火光、火山爆发、废弃燃烧及背景噪声等暂时性灯光值剔除掉,从而导致原始辐射值中有负值及异常值,这限制了GDP估算的准确性和可靠性。因此,必须消除与实际经济活动无关的混杂噪声。
基于DMSP/OLS数据,我们修正了NPP/VIIRS夜间灯光数据。我们首先假设2014年NPP/VIIRS数据和2013年DMSP/OLS稳定灯光数据的照明区域是相同的,采用DMSP/OLS夜间稳定灯光数据提取NPP/VIIRS的有效灯光数据。本研究选取中国经济最为发达的北京、上海和广州3个城市作为参考对象,求取这3个城市中NPP/VIIRS像元辐射值的最大值,并将这些城市中的最大值作为本研究的最大阈值。从理论上讲,其他地区的像元辐射值不应超过这三大城市。经过上述操作后,部分地区或城市内部的部分像元辐射值依然大于最大值,对于这些异常值,依据像元值大小的对比对这部分异常值进行剔除。其原理为:如果某个像元辐射值大于本研究最大阈值,观察其周围8个像元值的大小,利用这8个中的最大值代替;如果周围的8个像元值均大于最大阈值,先进行下一个栅格像元的处理,直到每个像元值均小于最大阈值为止。
2、研究模型
本研究采用线性回归模型(1)、幂函数模型(2)和多项式模型(3)来描述GDP与TNL(总夜间灯光)之间的关系。
R2表示TNL解释的GDP估算的百分比。相关系数R和判定系数R2的平方可用于衡量各行政区域的TNL与GDP之间的相关性。
所估算的GDP和每个行政区域的GDP统计数据得出的相对误差用RE表示。从RE推导出的RRMSE用于测量每个行政区域GDP估算的准确性。RRMSE越低,回归函数的拟合度越好。RE和RRMSE可以描述模型的拟合度。
研究结果
(一)夜间灯光图像
在DMSP/OLS数据和NPP/VIIRS数据中,高像元辐射值主要分布在中国东部,尤其是华北平原、长江三角洲和珠江三角洲,诸如武汉、长沙、成都、重庆、西安等省会城市都有一定程度的光集中。在中国西部,尤其是西藏、青海、新疆南部和内蒙古西部,夜间的像元辐射值非常低甚至为零。此外,NPP/VIIRS图像的整体亮度小于DMSP/OLS夜间灯光图像。
(二)夜间灯光数据的适用性
无论是在省级尺度还是在市级尺度,两种数据在R、R2、RE、RRMSE在不同尺度上近似相同,但NPP/VIIRS数据优于基于DMSP/OLS数据的相同指标。因此,NPP/VIIRS数据对GDP估算的有效性高于DMSP/OLS数据。
(三)空间规模的适用性
如Table 1所示,在DMSP/OLS夜间灯光数据中,无论拟合模型如何,当空间尺度从省级尺度向市级转移时,TNL与GDP的相关性明显降低。例如,R值从0.87下降到0.84;相对误差RE和RRMSE值显著增加。市级尺度模型中RRMSE的值是省级的3-6倍。
在NPP/VIIRS夜间灯光数据中,无论采用何种拟合模型,当空间尺度从省级尺度向市级转移时,TNL与GDP的相关性略有下降。例如,R值从0.93转移到0.93以下;RE和RRMSE值略有增加。市级的RRMSE值约为省级水平的1.2-1.5倍。与DMSP/OLS数据相比,基于NPP/VIIRS数据的GDP估算效果更一致、更好。
(四)拟合函数模型的适用性
如Table 1所示,在省级尺度上,三种回归模型都可以准确地模拟中国大陆的GDP。基于DMSP/OLS数据的R值为0.87,RRMSE值在55-80范围内。基于NPP/VIIRS数据的R值为0.93,RRMSE值在40-50范围内。一般来说,三种回归函数模型的拟合度在省级层面没有显著差异。
在市级层面上,基于DMSP/OLS数据的线性回归模型的RRMSE值为404.1。然而,在幂函数模型和多项式模型中RRMSE的大小没有显著变化,RRMSE值在180-187范围内。基于这两种模型的对GDP的估算优于线性回归模型。因此,对市级层面而言,无论使用DMSP/OLS数据还是NPP/VIIRS数据,幂函数模型和多项式模型更适合于GDP的估算。
(五)不同城市地区的适宜性
为了分析中国大陆不同城市夜间灯光数据对GDP估算的可靠性,本研究试图确定RE的空间分布(图a)。辽宁、吉林、内蒙古东部、江苏、浙江、福建、安徽一些城市、湖北、广西、海南、贵州、云南、重庆、四川以及甘肃南部,GDP预测值和实际值之间的差异小。在大多数城市,与实际的统计GDP值相比,基于DMSP/OLS夜间照明数据的GDP估算值被严重高估(以黄色和红色表示)或严重低估(图a中显示为浅蓝色和深蓝色)。
基于NPP/VIIRS数据,RE的空间分布是一个常规模式(图b)。GDP被严重高估的城市主要分布在新疆、山西、青海、宁夏、甘肃省东南部、陕西省北部和四川省西部的城市。GDP被高估的城市包括甘肃省的西北部、山西和贵州省的南部、云南省的东部和广东省的东部。GDP显著低估的地方主要包括西藏西南部的那曲、湖北、湖南以及吉林、四川和甘肃省的一些城市。城市的GDP被低估的地方主要分布在中国大陆的中部地区,尤其是在湖北、湖南、江西以及一些分布在吉林、内蒙古东部和西藏的城市。GDP估算准确的城市分布在中国东部的大部分地区,尤其是中国东部沿海地区,基于NPP/VIIRS数据的GDP估算精度较高。
结论与讨论
本研究为夜间灯光数据的合理应用提供了更清晰的认识。主要结论如下:
(1)DMSP/OLS夜间灯光数据可用于省级GDP估算,但可能不适用于市级。NPP/VIIRS夜间照明数据通常适用于省级和市级的GDP估算。
(2)对于省级GDP估算,基于不同模型的结果没有明显差异。然而,在市级层面上,使用幂函数模型和多项式模型的GDP估算精度比使用线性回归模型的GDP估算精度要好。
(3)根据DMSP/OLS数据,每个城市的GDP估算值显示没有明显的空间分布模式,但是根据NPP/VIIRS数据,在每个城市中RE显示的空间分布是一个规则模式。具体来说,GDP估算的绝对值逐渐从西向东下降,这意味着在中国东部地区使用NPP/VIIRS夜间光数据更适合GDP估算。
(4)GDP的估算精度受夜间灯光数据的辐射分辨率、空间尺度、地形地貌特征、景观特征以及研究区域的产业结构的影响。一般来说,夜间灯光数据的辐射分辨率越高,GDP估算的准确性就越高。中高海拔、低植被覆盖率的城市经常导致GDP高估。海拔极高、植被覆盖率高或水资源丰富的城市都容易导致GDP的低估。经济不发达或有大量的第二产业(特别是能源产业)的城市,其GDP会被高估。但在经济主要依赖第一产业的地区,GDP往往被低估。
在未来研究中,我们要认识NPP/VIIRS数据的潜在应用价值,并构建适合于县级经济和社会因素的回归模型。该项工作有利于提高夜间灯光数据对GDP估算的精度。
文献来源:
Zhaoxin Dai,Yunfeng Hu & Guanhua Zhao 2017, The Suitability of Different Nighttime Light Data for GDP Estimation at Different Spatial Scales and Regional Levels, Sustainability 9(2).
文献编译:齐玲云
哈尔滨工程大学人文社会科学学院在读硕士。关注领域:农民工、大数据网络心理学、留守儿童等。
衡量GDP,哪种夜间灯光数据更靠谱?的更多相关文章
- Google判断广告点击作弊的几种方式和数据
Google判断广告点击作弊的几种方式和数据. 作弊广告点击的CTR数据太高网上有研究说如果CTR值大于了10%的站被干掉的可能性很高,他们会被单独拿出来分析.一般来说低于6-7%的CTR是安全红线 ...
- sql有几种删除表数据的方式
有几种删除表数据的方式? truncate.delete和drop都可以删除数据. TRUNCATE TABLE删除表中的所有行,而不记录单个行删除操作. TRUNCATE TABLE 与没有 WHE ...
- JavaScript是如何工作的:事件循环和异步编程的崛起 + 5种使用 async/await 更好地编码方式!
摘要: 深度理解JS事件循环!!! 原文:JavaScript是如何工作的:事件循环和异步编程的崛起+ 5种使用 async/await 更好地编码方式! 作者:前端小智 Fundebug经授权转载, ...
- App6种常见的数据加载设计
App6种常见的数据加载设计 设计师在进行APP设计的设计时,往往会更加专注于界面长什么样,界面和界面之间怎么跳转,给予用户什么样的操作反馈,却偏偏特别容易忽略掉一个比较重要的环节,就是APP数据加载 ...
- 2.Hive的几种常见的数据导入方式
好久没写Hive的那些事了,今天开始写点吧.今天的话题是总结Hive的几种常见的数据导入方式,我总结为四种:(1).从本地文件系统中导入数据到Hive表:(2).从HDFS上导入数据到Hive表:(3 ...
- 一种可以避免数据迁移的分库分表scale-out扩容模式
转自: http://jm.taobao.org/ 一种可以避免数据迁移的分库分表scale-out扩容方式 目前绝大多数应用采取的两种分库分表规则 mod方式 dayofweek系列日期方式(所有星 ...
- Android一个ListView列表之中插入两种不同的数据
http://www.cnblogs.com/roucheng/ Android一个ListView列表之中插入两种不同的数据 代码如下: public class ViewHolder{ Butto ...
- iOS五种本地缓存数据方式
iOS五种本地缓存数据方式 iOS本地缓存数据方式有五种:前言 1.直接写文件方式:可以存储的对象有NSString.NSArray.NSDictionary.NSData.NSNumber,数据 ...
- 一种从JSON数据创建Java类的高效办法
<一种从JSON数据创建Java类的高效办法> 作者:chszs,转载需注明.博客主页:http://blog.csdn.net/chszs JSON格式的数据经常会遇到,比如调用Web服 ...
随机推荐
- SpringBoot开发案例从0到1构建分布式秒杀系统
前言 最近,被推送了不少秒杀架构的文章,忙里偷闲自己也总结了一下互联网平台秒杀架构设计,当然也借鉴了不少同学的思路.俗话说,脱离案例讲架构都是耍流氓,最终使用SpringBoot模拟实现了部分秒杀场 ...
- JAVA学习资源分享
JAVA学习资源分享 最高端的JAVA架构师资源(来自龙果学院 价值¥1399元).JAVA互联网分布式架构(龙果学院 价值¥899元).Spring Boot(2017年最新 包括源码原理分析) + ...
- redis两种持久化方法对比分析
1.前言 最近在项目中使用到Redis做缓存,方便多个业务进程之间共享数据.由于Redis的数据都存放在内存中,如果没有配置持久化,redis重启后数据就全丢失了,于是需要开启redis的持久化功能, ...
- [OPEN CV] 常用视频操作方法
一.视频的定义 视频(Video)泛指将一系列静态影像以电信号的方式加以捕捉.纪录.处理.储存.传送与重现的各种技术.连续的图像变化每秒超过24帧(frame)画面以上时,根据视觉暂留原理,人眼无法辨 ...
- spring security oauth2
https://connect.qq.com/manage.html#/ http://wiki.connect.qq.com/%E7%BD%91%E7%AB%99%E5%BA%94%E7%94%A8 ...
- 你不知道的JavaScript--Item8 函数,方法,构造函数调用
1.函数调用 Function绝对是JavaScript中的重中之重.在JavaScript中,Function承担了procedures, methods, constructors甚至是class ...
- document_index_data.go
package types type DocumentIndexData struct { // 文档全文(必须是UTF-8格式),用于生成待索引的关键词 Content string ...
- .net core下使用Thrift
因网站组(.net)与游戏服务端(c++)原来使用REST API通讯效率稍显低下,准备下期重构时改用rpc方式,经比较Thrift和gRPC两者的优劣(参照网上的对比结果),最终决定使用Thrift ...
- BZOJ_4003_[JLOI2015]城池攻占_可并堆
BZOJ_4003_[JLOI2015]城池攻占_可并堆 Description 小铭铭最近获得了一副新的桌游,游戏中需要用 m 个骑士攻占 n 个城池. 这 n 个城池用 1 到 n 的整数表示.除 ...
- BZOJ_3524_[Poi2014]Couriers_主席树
BZOJ_3524_[Poi2014]Couriers_主席树 题意:给一个长度为n的序列a.1≤a[i]≤n. m组询问,每次询问一个区间[l,r],是否存在一个数在[l,r]中出现的次数大于(r- ...