针对地理加权回归(GWR)模型不能有效处理样本数据空间自相关性这一问题,构造局部时空窗口统计量,尝试改进时空加权回归(GTWR)模型。定义多时空窗口的概念,给出其选取、计算和验证方法;计算时空窗口包含的各样本点的被解释变量平均值,与样本拟合点的被解释变量值的比值,作为新的解释变量,构建改进的时空加权回归(IGTWR)模型。以土地稀缺、多中心、资源型城市——湖北省黄石市为例,收集2007~2012年商品住宅成交价格1.93万个数据和398个楼栋样本点,选取小区等级、绿化率、楼栋总层数、容积率、距区域中心距离和销售年份6个解释变量,分别利用常规线性回归(OLS)、GWR、GTWR和IGTWR方法进行回归分析。模型结果表明:计算Moran's I指数和分析时间序列的自相关性,能确定时空窗口的大小和数量的选取;IGTWR模型和各变量的回归统计均通过0.05的显著性水平检验,有关解释变量的系数估计值在空间分布上能合理解释;GWR拟合结果优于OLS,GTWR优于GWR,而IGTWR拟合精度最好。与GTWR模型分析相比, IGTWR模型R2从0.877提升到0.919,而AICc、残差方(RSS)和均方差(MSE)分别从6 226、49 996 201和354.427下降到6 206、32 327 472和284.969。案例研究表明:IGTWR能够表达一定时空范围的时空自相关特征,减小了估计误差,提高了回归拟合精度。

关键词: 时空窗口 ; 时空加权回归(GTWR) ; 住房价格 ; 黄石市


Geographically weighted regression (GWR) is a useful technique for exploring spatial nonstationarity by calibrating a regression model which allows different relationships to exist at different points in space. However, spatial autocorrelation can invalidate the model assumption and sometimes may result in residual dependency. This article aims to improve the spatiotemporal weighted regression (GTWR) by introducing additional variables based on spatiotemporal windows. The size parameters for defining spatiotemporal windows are estimated by spatial and temporal statistics of all the sample data. The new window variables are calculated by averaging the explained variables which are located in its spatio-temporal window. The new variables are added in GTWR as an improved regression (IGTWR) model. Huangshi City, a resource-dependent, land-scarce and multi-center city in Hubei Province, is selected as the study area. 19 300 commercial housing units and 398 buildings in 2007-2012 are collected as sample data. Based on general and spatial statistics, the number of building floors, the plot ratio, the greening ratio, the level of property management, the distance to region center, and the year of sale are selected as explanatory variables. The sample data are analyzed by four regression models respectively: ordinary linear regression (OLS), GWR, GTWR and IGTWR. The optimum size and number of spatiotemporal window are estimated by the Moran's I index and the correlation coefficients between temporal sequences. Modeling results indicate that both the IGTWR model and its variables pass the statistical test at the significant level 0.05. The spatial distribution of the variable coefficients can be explained reasonably. The comparison of all modeling results shows that GWR is better than OLS, GTWR is better than GWR, and IGTWR is better than GTWR, in terms of the measure of goodness of fit (R2), the Akaike information criterion (AICc) , the residual sum of squares (RSS) and the mean squared error(MSE). In the case study, compared with GTWR, the R2, AICc, RSS and MSE from IGTWR are improved from 0.877 to 0.919, 6 226 to 6 206, 49 996 201 to 32 327 472 and 354.427 to 284.969 respectively. The case study indicates that the IGTWR model is effective for temporal and spatial analysis of urban housing price. By introducing window based indicators in GTWR model as new variables, the IGTWR model may estimate the impact of spatial and temporal autocorrelation between geographic data, and thus is able to reduce the model error and increase the model accuracy.

Keywords: spatio-temporal windows ; spatiotemporally weighted regression (GTWR) ; housing price ; Huangshi City


城市住房价格一直是社会关注度最高的热点问题之一。分析和预测住房价格的空间分布和变化趋势是居民、投资者、开发商以及政府管理部门关注的重要问题,也是学者研究的热点问题。城市住房价格与空间区位密切相关,且具有空间自相关特征,因此常采用空间自回归(SAR)或地理加权回归(GWR)模型分析住房价格各影响要素的空间分布规律[1~4] 。受房地产市场趋势和国家宏观政策影响,时间也是影响城市住房价格的重要因素之一[5~7]。考虑时间因素影响,有学者建立时空自回归模型或时空加权回归(GTWR)模型[8~12]。然而,在时空回归模型中,时间因素未作为解释变量。同时,为了研究局部时空的影响,本文引入时空窗口,根据时空的自相关性分析,建立改进的时空加权回归(IGTWR)模型,从局部时空的角度,分析、估计和解释住房价格的变化规律。

1 研究方法

1.1 时空窗口

在XYT时空坐标系中,通常定义点I(xi,yi,ti)的时空窗口(STW)为距离(xi,yi)小于r、距离ti小于t的圆柱区域[13]。给定空间距离r和时间间隔t,本文定义点I的多个时空窗口 SmTnW(m=1,2…;n=1,2…),即为距离(xi,yi)大于(m-1)r且小于mr、距离ti大于(n-1)t且小于nt的时空区域;mn的取值的大小表示窗口SmTnW与点I的邻近程度。


地理时空回归分析中,距离r和间隔t的选择要能够反映地理时空变异的尺度特征。可通过计算Moran’s I指数估计r[13]。同样,时间间隔t,其设定先验值[14]或可根据时间序列相关性进行估计。

为了兼顾考虑空间和时间的相关性,有学者提出时空权重矩阵 [10]。针对某样本点的STW而言,为简便计算,可将其包含的各样本点的变量值取平均值,分析本样本点与其STW的局部时空相关性。

1.2 GTWR模型改进

GWR作为局部回归拟合方法,将地理位置坐标引入模型,处理空间异质性,探测相关变量空间变化规律 [3]。GWR利用空间变化的回归系数进行拟合估测,并未直接考虑空间依赖性[15],模型残差ε具有不确定性,可能包含部分能够建模的时空相关性。GTWR是在GWR模型的基础上,将空间位置坐标和时间序列坐标构成三维坐标,同时考虑空间和时间对各解释变量的回归系数的影响[10]。时空坐标系中,时空位置i的坐标为(ui,vi,ti),GTWR模型为:


式中,Yi为样本点i的被解释变量值 (i = 1,2,…,n),n为样本点的数目,m为解释变量的数目;ti为第i个样本点的时间坐标;α0(ui,vi,ti)表示样本点i的时空截距项;Xij表示样本点i的第j个解释变量值;αj(ui,vi,ti)表示样本点i处第j个变量的回归系数,是时空坐标的函数;εi表示残差。时空权重函数wi(ui,vi,ti)=wi(ui,vi)􀱋wi(ti),其中wi(ui,vi)是空间权重,wi(ti)为时间权重。计算时空距离时,可乘以参数λ作为时空权重的平衡因子。





2 研究区域及数据


图1   研究区及住房分布

Fig.1   The study area and housing distribution

选择2007~2012年商品住宅成交价格数据1.93万个。为便于作整体分析,按楼栋计算平均住房单价,共获得398个楼栋样本点。研究区域样本住房呈非均匀分布(图1),针对样本数据进行相关分析,发现价格与销售年份、楼栋总层数、小区容积率、小区等级、绿化率呈现或强或弱的线性相关关系。运用探索性空间数据分析,住房价格的Moran’s I为0.196,具有较强的空间正自相关性;聚类和异常值分析,表明住房价格具有局部空间异质性;住房所在区域和区位对价格影响显著。


3 模型分析与解释


表1   OLS和GWR回归系数的估计结果

Table 1   The estimation results of OLS and GWR regression parameters

变量OLS 模型GWR 模型


进行住房价格的Moran’s I空间自相关分析(图2a),当距离为500 m时,Moran’s I指数值为最大,所以可取500 m作为时空窗口的单位空间距离r。对住房价格以年份进行时间序列的自相关分析(图2b),当时间间隔为1 a时,时间自相关的系数值为最大,因此可取1 a作为时空窗口的单位时间间隔t

根据时空窗口STW的r(500 m)和t(1a),在空间距离小于500 m时,取5个时空窗口S1T1WS1T2WS1T3WS1T4WS1T5W,其时间距离分别为小于1 a、1~2 a、2~3 a、3~4 a和4~5 a;考虑到计算量,在空间距离为500~1 000 m时,仅取2个时空窗口S2T1W、S2T2W,其时间距离分别为小于1 a、1~2 a。计算各样本点的时空窗口,产生相应的7个窗口新变量。


GTWR和IGTWR模型计算时,可以根据回归拟合度R2确认获取最佳的时空权重平衡参数λ[7]。GTWR模型参数λ选择的细节如图3a所示,当λ=0.1时,回归拟合度R2有最大值0.877 3,所以选取0.1为最佳的λ。IGTWR模型参数λ选择的细节如图3b,当λ=0.2时,回归拟合度R2有最大值0.919 3,所以选取0.2为最佳的λ




相比GTWR,IGTWR模型拟合度R2从87.7%提高到91.9%,AICc从6 226降低到6 206,F统计从3.046提升到4.104,残差平方和RSS从49 996 201降低到32 327 472,均方误差MSE从354.427降低到284.969。分析表明,IGTWR比GTWR能较好改进回归拟合的精度,减少了估计的误差。

图2   时空窗口单位距离和单位时间的最优值

Fig.2   The appropriate units of distance and time lag in the spatiotemporal windows

图3   GTWR及IGTWR模型参数λ选择
a.GTWR模型 b.IGTWR模型

Fig.3   The parameters λ selection for the GTWR model and the IGTWR model

表2   GTWR和IGTWR回归系数的估计结果

Table 2   The estimation results of GTWR and IGTWR regression parameters

变量GTWR 模型IGTWR 模型(r=0.5 km,t=1 a)
S1T1W----- --859.132-18.015738.148-26.7123.2530.010
S1T2W----- --1298.57549.7561568.713152.1562.6340.020
S1T3W----- --1088.636345.2661268.425410.0373.2780.000
S1T4W----- --792.299746.3871229.202561.2354.1660.030
S1T5W----- --1274.415-494.6551523.185-201.4152.8950.000
S2T1W----- --437.276-294.443355.759-381.8262.3630.020
S2T2W----- --745.934-343.3541026.043-238.0033.1620.030
模型检验 R2=0.877,AICc=6 226,F=3.046, P=0.000R2=0.919,AICc=6206,F=4.104, P=0.000
RSS=49 996 201, MSE=354.427RSS=32 327 472, MSE=284.969



图4   小区容积率(a)、小区等级(b)及距区域中心距离(c)回归系数的分布

Fig.4   The distribution of regression coefficients on cell plot ratio, cell level and distance from the regional centre

IGTWR模型7个时空窗口变量的回归系数和为:-26.712+152.156+410.037+561.235+(-201.415) +(-381.826)+(-238.003)=275.476,反映出每年的时空窗口的回归系数,即给定空间距离小于1 000 m范围内年度住房价格变化为275.476。时空窗口S1T1W的回归系数为负值,在空间上显著的变化(图5a),反映出住房价格的波动呈空间差异性,对偏远位置住房价格影响较大,而靠近区域中心影响较小,原因可能在于国家对房地产市场宏观调控及经济和金融等政策的影响;S1T3WS1T4W的回归系数为较大的正值,在不同区域呈现显著的空间差异性(图5b),在下陆片区、团城山的偏远位置及黄石港片区的工矿区,其对住房价格影响较小,原因估计在于这些位置住房发展不充分,速度缓慢,表明住房开发周期对住房价格具有较强正相关性影响;S2T1WS1T2W的回归系数为绝对值较大的负值,在空间上呈明显变化(图5c),偏离区域中心位置,对住房价格影响较大,说明空间距离500 m~1 000 m范围内,随空间距离的增加,住房价格显著降低。


图5   S1T1W(a)、S1T4W(b)、S2T1W(c)回归系数的分布

Fig.5   The distribution of regression coefficients on S1T1W, S1T4W and S2T1W

表3   GWR、GTWR和IGTWR的模型诊断及回归系数估计

Table 3   The statistical diagnosis and regression parameters estimation of GWR, GTWR and IGTWR models

GWR82.4%6 2622.92571 638 362210.80214.61323.204294.105-172.682137.728
GTWR87.7%6 2263.04649 996 201276.85411.83232.096175.272-303.758-
IGTWR91.9%6 2064.10432 327 472145.24510.31521.035168.225-104.683275.475



4 结 论


The authors have declared that no competing interests exist.


