【摘 要】文章针对空间权重矩阵的传统设定方式,指出了其存在的一些不足。提出了改进的空间权重矩阵设定方法:(1)利用夜间灯光数据提取城市聚集点位置;(2)对不同类型的道路设定不同的速度,得到基于时间距离的网络数据集;(3)以负指数时间距离作为空间权重矩阵中的元素。接着以京津冀区域经济空间差异为例进行了探索性空间数据分析,发现改进的空间权重矩阵相比于传统方式更加合理和准确;京津冀区域经济存在着显著的空间自相关,且2000—2010年间自相关程度在增大,“高-高”区域由北京周边向沿海区域转移,“低- 低”区域由河北省的西北部向中部和东南部转移。
【关键词】空间权重矩阵;改进方法;探索性空间数据;京津冀
【中图分类号】F061.5 【文献标识码】A 【文章编号】1002-6487(2016)11-0109-05
0 引言
自改革开放以来,京津冀地区的经济得到了飞速发展,与长三角、珠三角地区一起成为我国经济增长的三大引擎。但相对而言,京津冀区域经济的发展水平和后两者相比,还存在着明显的差距,并且自身也存在着不少亟需解决的问题。京津冀处于我国北方经济版图的核心区域,在国家区域发展规划中占有无可替代的重要地位。在2014 年2 月26 日举行的京津冀协同发展工作座谈会上,习近平总书记明确提出,实现京津冀协同发展,是一个重要的国家战略。因此,用更为精细化的研究方法,深入理解和把握京津冀区域经济的空间差异,有着十分重要的理论和现实意义。
本文首先提出传统空间权重矩阵设定方法在实际研究中存在的问题,然后针对不足之处给出改进方法,最后以京津冀区域经济空间差异为例进行了实证研究,并对结果进行了评价和分析。
1 问题的提出
传统的空间权重矩阵设定方法能否准确地反映区域在现实世界的空间关系?本文主要从三个角度考虑这个问题。第一,简单用区域多边形质心代替区域聚集点是否准确?第二,地理学第一定律中的距离用区域间的直线距离代替是否合适?第三,空间邻近的单元一定比不邻近的距离更近吗?
1.1 简单用区域多边形质心代替区域聚集点是否准确?
如果仅仅用区域的多边形质心来代表这个区域的话,会出现较大偏差。以北京市城六区、怀柔区和延庆县为例,怀柔区的行政区划质心和人口经济聚集点位置偏差很大,这种情况在全国范围内并不少见。这样,如果只看质心位置,延庆县相比于怀柔区距离北京中心城区更近。使用第二类空间权重矩阵的话,延庆县的权重更大;使用第三类空间权重矩阵的话,延庆县比怀柔区更有可能进入计算范围内,而这是与现实情况不符合的。我们可以利用夜间灯光数据来表示人类活动[1-3],这在很多的相关研究中已经得到证实。以区域内灯光亮度最高值的点来代替人类活动的聚集点,用此位置来代替多边形质心的位置。由此可以发现,其实怀柔区距离北京中心城区更近,而这种情况在传统的空间权重矩阵的设定中往往是被忽略的。
1.2 地理学第一定律中的距离用区域间的直线距离代替是否合适?
以保定市及其下辖的阜平和涞源两县为例,如果只算地图上的直线距离,涞源县相比于阜平县,离保定市辖区更近。而现实中的道路距离却是阜平县比涞源县距离保定市辖区更近,并且所需要的时间也更短。
这样在使用第二类基于负指数距离的空间权重矩阵时,会使涞源县的权重大于阜平县,造成与实际情况不符的偏差。在使用第三类基于K 近邻空间权重矩阵时,可能道路距离更近的区域无法进入K 个最近邻,而直线距离更近的区域则会进入K近邻中。
1.3 空间邻近的单元一定比不邻近的距离更近吗?
以任丘市、肃宁县和大城县为例,在第一类基于邻接关系的空间权重矩阵中,有些真实距离更近的区域却不是邻接区域,这样使用时也会造成误用。大城县和任丘市相邻,但肃宁县和任丘市却不相邻。但采用第一类基于邻接关系的空间权重矩阵时,大城县会参与空间自相关的计算,而距离更近的肃宁县却不会进入,这也是被忽略的问题之一。
2 数据来源与研究区域
2.1 数据来源
本文所用的GDP 数据和GDP 平减指数来自《北京统计年鉴》、《天津统计年鉴》、《河北统计年鉴》、《中国区域经济统计年鉴》、《中国城市统计年鉴》等。由于不同的相关年鉴中人口数据相差较大,本文的重点是做方法研究,为保证研究的准确性,人口数据以第五、六次人口普查数据为准,因此研究时间为2000年和2010年两个年份。用于构建网络数据集的交通数据来源于GEOFABRIK,数据中初步将道路分为铁路、高速公路、一般公路等。
夜间灯光数据是指DMSP-OLS 数据,来自于美国大气海洋局(NOAA)下属的国家地理数据中心(NGDC)。本文选用辐射定标的无饱和数据用于提取城市的聚集点位置。
2.2 研究区域
本文研究范围包括北京、天津、河北三省市,因在研究时段内涉及行政区划调整,为研究方便,以2010 年的京津冀行政区划为准。对于河北省的地级市,将其市辖区和下辖各县级行政区作为独立的研究单元;对于北京和天津两个直辖市,将中心的城六区作为一个研究单元,其他各区单独作为一个单元。这样,本研究一共包括169个单元。
3 研究方法
探索性空间数据分析(ESDA)主要是通过对事物或现象空间分布格局的描述与可视化,发现空间离群值和空间聚集模式,为地理视角下揭示区域经济差异提供了技术保障[4]。自上世纪90 年代起,该方法被广泛地用于区域经济差异的分析[5, 6]。本文主要以京津冀区域经济空间差异为例,用ESDA 方法进行研究。
3.1 数据预处理
首先,将夜间灯光数据的亮度值视作高程值,进行山顶点提取,找出区域内的极大值点,并将其作为该区域的人口经济聚集点,取代以往研究中的质心。然后,修改道路网络数据的拓扑错误,并对道路分为铁路、高速公路、一般公路三级,其中铁路速度设为120km/h,高速公路90km/h,一般公路60km/h。根据道路长度和速度,计算得到各段道路的时间距离。最后建立时间网络数据集,通过网络分析得到任意两个研究单元间的时间距离。
3.2 设定空间权重矩阵
根据上步中得出的结果,构建空间权重矩阵。如式(1)所示。
其中,n 为空间单元的个数,wij为区域i 与j 的空间关系,其数值用负指数时间距离来度量,如1/dm,其中衰减指数m 取任意正数,本文中m 值取2。此外,w11、w22...wnn的取值为零。
本文对空间权重矩阵的设定,仍然是基于空间形态的描述。除此之外,还有包括经济和社会因素的更加复杂的权值矩阵设定方法。比如,根据区域间交通运输流、通讯量、GDP 总额、贸易流动、资本流动、人口迁移、劳动力流等确定空间关系权重。基于经济、社会因素的权值计算方法更加接近区域经济的现实,在研究社会经济问题时,应是一种比较科学和理想的指标。但在实际应用中,这种方法实行起来比较困难,主要是因为社会经济距离的实际统计数据难以获得,尤其是针对较小的研究区域时。综合来看,目前这种设定方式还是比较现实和准确的。
3.3 全局空间自相关
全局空间自相关描述区域单元某种属性值的整体分布状况,判断该属性值在空间上集聚的特点,反映研究区内相似属性的平均集聚程度。本文中选择最常用的Moran's I 指数进行全局空间自相关分析,其计算公式为:
其中,wij是要素i 和j 之间的空间权重,n 等于要素总和,So是所有空间权重的总和。如下式:
Moran's I 是一个介于-1 到1 之间的值,在给定显著性水平时,如Moran's I值显著为正,则表示区域经济的总体相关性为正,说明经济发展水平较高或较低的区域在空间上显著集聚,值越接近于1,总体空间差异越小;同样,若Moran's I 值显著为负,表示区域经济的总体相关性为负,说明区域与周边地区的经济发展水平具有显著的空间差异,值越接近于-1,总体空间差异越大。当且仅当Moran's I值接近期望值-1(/ n-1)时,观测值之间才相互独立,在空间上表现出随机分布。
对Moran's I 值的统计推断可采用z 检验:
其中,当|z|>1.96时认为是显著的[7]。