关于夜间灯光数据在经济学应用的探讨
|
近年来,夜间灯光数据越来越广泛的被经济学者使用。无论是中文期刊还是国际期刊,都出现了大量基于DMSP夜间灯光数据的分析成果。研究成果鲜有讨论DMSP夜间灯光数据自身的问题和局限。本文分享Gibson et. al(2021)在Journal of Development Economics的文章,讨论夜间灯光数据库的选择、应用问题与局限性。 一、引言与背景 近年经济学中,大量基于夜间灯光数据的实证检验大多使用DMSP夜间灯光数据。关于DMSP(Defense Meteorological Satellite Program)的详细数据和介绍可以参见文末提供网址。DMSP数据被广泛使用主要有以下两个原因:一是Henderson et al. (2012)和Chen and Nordhaus (2011)的巨大学术影响。两篇文献指出,尽管夜间灯光数据有很多噪音,夜间灯光数据仍可以作为传统经济统计数据的补充。二是DMSP提供了较长时间序列(1992-2013)的年度数据。 最新的部分使用夜间灯光数据的研究开始使用另一个数据来源——VIIRS(Visible Infrared Imaging Radiometer Suite)。DMSP数据不提供2013年以后的数据,而通过VIIRS则可以得到仅稍有时滞的月度数据。遥感科学的几篇文献指出VIIRS数据相对DMSP数据的优点,但这些文献很少被经济学者注意和引用。 目前,虽然VIIRS月度数据可从2012年4月获得,但经过人工校准的年度VIIRS数据仅有2015年和2016年两年。而月度VIIRS数据中由于存在诸如极光等干扰,因此需要人工校准调整而不能简单加总与DMSP数据进行比较。 DMSP数据的缺点主要在于其数据模糊、分辨率粗糙、无人工校准、低动态范围、顶层编码设计问题和时空不可比等问题。Nordhaus and Chen(2015)指出,使用照明时间序列数据估计的GDP相较传统的截面GDP数据有更大的不确定性。由于技术观测等原因,DMSP数据缺乏空间准确性,这导致了DMSP数据中照明面积的估计存在巨大的高估——大城市的平均误差大约在77%,小城市的平均误差则会高达500%。由于月球反光和云量等技术原因,DMSP数据缺乏时间一致性,而这会导致基于DMSP数据估计的GDP时间序列数据出现偏误。由于不同观测卫星得到的灯光数据存在差异,不同卫星之间无人工校准导致了DMSP数据中部分地区数据存在前后矛盾现象。其他DMSP数据缺陷还体现在其卫星传感器缺陷导致了DMSP无法同时捕获明亮区域和昏暗区域的光,而这个问题在VIIRS数据中不存在。因此Bluhm and Krause (2018)提出,假设灯光数据服从帕累托分布,从而校准DMSP数据。 此外,夜间灯光数据另一个主要问题在于不太适合研究人口密度低的地区,其中就包括了广大农村地区。虽然VIIRS相对DMSP可以更好地检测光线暗淡的区域,但是承载VIIRS的卫星观测地球的时候的穿越时间大约是凌晨1:30,那时农村地区的家庭(或农场)照明不太可能被打开,而城市的路灯则往往都是整夜打开。Chen和Nordhaus(2015)发现,在DMSP数据中几乎有一半的单元记录为零光,而在VIIRS数据中所有单元都记录了光。实际上,即使对于人口在10,000至100,000之间的单元,在DMSP数据中也有51%被记录为零光。来自非洲,亚洲和太平洋地区的低密度区域的其他示例是:即使在这些区域中有一半以上的家庭使用电灯的情况下,DMSP或VIIRS也无法检测到高达70%的人口。 二、基于印度尼西亚的实证分析 文章选用印度尼西亚作为主要实证对象的原因是印度尼西亚是为数不多的拥有可靠的省/市GDP数据的发展中国家之一,可以将其作为基准(关于中国的问题作者在后文讨论)。 文章分析代表印度尼西亚农村城镇的Kabupaten(几乎没有城市化)和高度城市化的Kota。两类行政区域内都拥有众多人口。如果灯光数据中无法识别这两类地区或解释这两个地区的人均GDP,那么可以推断灯光数据在人口更少的地方表现会同样差。Table1是两类行政区域基础信息和灯光数据的描述性统计。
文章的基准回归方程是:
其中,被解释变量是各个地区的真实GDP的自然对数,核心解释变量是该地区灯光亮度年加总的自然对数,回归方程中还加入了时间虚拟变量以分析两年的混合截面。同时,类似于时间固定效应,任何其他时间上GDP的干扰因素也将被时间虚拟变量吸收。回归方程不旨在阐述经济上的因果关系,而是讨论两种夜间灯光数据作为衡量当地经济活动的指标对地方的GDP的替代程度如何。 基准回归结果如Table2所示,表格上半部分是混合截面回归结果,下半部分是逐年回归结果。基于印尼全国样本,使用DMSP数据,回归发现夜间灯光亮度与实际GDP没有显著相关关系,回归方程中R方最大也仅为0.01;使用VIIRS数据的混合截面回归R方值提高到了0.05,这主要由组间R方决定,回归的组内R方为0.00。 分别对Kabupaten和Kota两类区域进行回归估计。使用DMSP数据,研究发现,Kabupaten(农村地区)夜间灯光亮度与地方人均GDP关系显著为负;Kota(城市地区)夜间灯光亮度与地方人均GDP关系显著为正。使用VIIRS数据,Kabupaten(农村地区)夜间灯光亮度与地方人均GDP相关关系不再显著,Kota(城市地区)夜间灯光亮度与地方人均GDP关系仍然显著为正,并且R方为0.68。从R方差异中可以看出,夜间灯光数据更适合应用于城市化程度较高地区。夜间灯光数据并非印尼等国非城市地区GDP数据的一个合适替代。同样,还可以看出,VIIRS数据的预测能力要高于DMSP数据的预测能力。此外,作者基于2015年VIIRS校准结果,将2012-2013年VIIRS月度数据汇总处理,发现VIIRS数据仍然比DMSP数据有更高的预测能力。
众多实证研究使用了更加精细的区域,甚至使用像素级的DMSP数据进行实证研究。将夜灯数据用于如此小的空间单位,有必要评估DMSP数据和VIIRS数据在预测不同空间聚集水平的GDP方面的表现。由于印尼数据限制,下文作者将使用中国数据对此进行检验。 |











