目前,空间计量经济学研究包括以下四个感兴趣的领域:
计量经济模型中空间效应的确定; 合并了空间影响的模型的估计;空间效应存在的说明、检验和诊断;空间预测。
空间计量经济学模型有多种类型(Anselin,et al. 2004)。 首先介绍纳入了空间效应(空间相关和空间差异)、适用于截面数据的空间常系数回归模型,包括空间滞后模型(Spatial Lag Model,SLM)与空间误差模型(Spatial Error Model,SEM)两种,以及空间变系数回归模型——地理加权回归模型(Geographical Weighted Regression,GWR)。适用于时间序列和截面数据合成的空间面板数据计量经济学模型将在以后予以介绍。
空间滞后模型(Spatial Lag Model,SLM)主要是探讨各变量在一地区是否有扩散现象(溢出效应)。其模型表达式为:参数 反映了自变量对因变量的影响,空间滞后因变量 是一内生变量,反映了空间距离对区域行为的作用。区域行为受到文化环境及与空间距离有关的迁移成本的影响,具有很强的地域性(Anselin et al.,1996)。由于SLM模型与时间序列中自回归模型相类似,因此SLM也被称作空间自回归模型(Spatial Autoregressive Model,SAR)。
空间误差模型(Spatial Error Model,SEM)存在于扰动误差项之中的空间依赖作用,度量了邻近地区关于因变量的误差冲击对本地区观察值的影响程度。由于SEM模型与时间序列中的序列相关问题类似,也被称为空间自相关模型(Spatial Autocorrelation Model,SAC)。
估计技术:鉴于空间回归模型由于自变量的内生性,对于上述两种模型的估计如果仍采用OLS,系数估计值会有偏或者无效,需要通过IV、ML或GLS、GMM等其他方法来进行估计。Anselin(1988)建议采用极大似然法估计空间滞后模型(SLM)和空间误差模型(SEM)的参数。
空间自相关检验与SLM、SEM的选择:判断地区间创新产出行为的空间相关性是否存在,以及SLM和SEM那个模型更恰当,一般可通过包括Moran’s I检验、两个拉格朗日乘数(Lagrange Multiplier)形式LMERR、LMLAG及其稳健(Robust)的R-LMERR、R-LMLAG)等形式来实现。由于事先无法根据先验经验推断在SLM和SEM模型中是否存在空间依赖性,有必要构建一种判别准则,以决定哪种空间模型更加符合客观实际。Anselin和Florax(1995)提出了如下判别准则:如果在空间依赖性的检验中发现LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间滞后模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型是恰当的模型。
除了拟合优度R2检验以外,常用的检验准则还有:自然对数似然函数值(Log likelihood,LogL)、似然比率(Likelihood Ratio,LR)、赤池信息准则(Akaike information criterion,AIC)、施瓦茨准则(Schwartz criterion,SC)。对数似然值越大,AIC和SC值越小,模型拟合效果越好。这几个指标也用来比较OLS估计的经典线性回归模型和SLM、SEM,似然值的自然对数最大的模型最好。
空间变系数回归模型及估计:就目前国内外的研究来看,大多直接假定横截面单元是同质的,即地区或企业之间没有差异。传统的OLS只是对参数进行“平均”或“全域”估计,不能反映参数在不同空间的空间非稳定性(吴玉鸣,李建霞,2006;苏方林,2007)。 当用横截面数据建立计量经济学模型时,由于这种数据在空间上表现出的复杂性、自相关性和变异性,使得解释变量对被解释变量的影响在不同区域之间可能是不同的,假定区域之间的经济行为在空间上具有异质性的差异可能更加符合现实。空间变系数回归模型(Spatial Varying-Coefficient Regression Model)中的地理加权回归模型(Geographical Weighted Regression,GWR)是一种解决这种问题的有效方法。 、空间计量主要命令
spmat 生成空间权重矩阵
spatwmat 用于定义空间权重矩阵
spatgsa 用于全局空间自相关检验
gsa表示global spatial autocorrelation
spatlsa 进行局部空间自相关检验
lsa表示local spatial autocorrelation
spatcorr 考察空间自相关指标对距离临界值d的依赖性
spatdiag 针对ols回归结果,考察是否存在空间效应
spatreg 估计空间滞后与空间误差模型
空间面板主要命令为:help xsmle
Spatial Autoregressive (SAR) model
xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) model(sar) [SAR_options]
Spatial Durbin (SDM) model
xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) model(sdm) [SDM_options]
Spatial Autocorrelation (SAC) model
xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) emat(name) model(sac) [SAC_options]
Spatial Error (SEM) model
xsmle depvar [indepvars] [if] [in] [weight] , emat(name) model(sem) [SEM_options]
Generalized Spatial Panel Random Effects (GSPRE) model
xsmle depvar [indepvars] [if] [in] [weight] , wmat(name) model(gspre) [emat(name) GSPRE_options]
结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说,这些潜变量是连续的。这里需要注意的是:1. 潜变量(latent variables)是与观察变量(Observed variables)相对的,可通过数据分析观察;2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts),或者是这些类别的组合形式。
SEM有两个部分:一个测量模型(measurement model)和一个结构模型(structural model)。
测量模型 相当于一个多元回归模型(multivariate regression model),用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此,这一组可观察的因变量被称为因子指标(factor indicators),这一组连续潜变量被称为因子(factors)。
如何描述它们之间的关系?可以通过以下方式:
1. 若因子指标是连续的,用线性回归方程(linear regression equations);
2. 若因子指标是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);
3. 若因子指标是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);
4. 若因子指标是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);
5. 若因子指标是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。
结构模型 则在一个多元回归方程中描述了三种变量关系:
1. 因子之间的关系;
2. 观察变量之间的关系;
3. 因子和不作为因子指标的观察变量之间的关系。
同样,这些变量有不同的种类,所以要根据它们的类别来选择合适的方程进行分析:
1. 若因子为因变量,及可观察的因变量是连续的,用线性回归方程(linear regression equations);
2. 若可观察的因变量是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);
3. 若可观察的因变量是二进制的或者是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);
4. 若可观察的因变量是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);
5. 若可观察的因变量是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。
在回归中,有序的类别变量可通过建立比例优势(proportional odds)模型进行说明;最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。
以下特殊功能也可以通过SEM实现:
1. 单个或多组分析(Single or multiple group analysis);
2. 缺失值(Missing data);
3. 复杂的调查数据(Complex survey data);
4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood);
5. 随机斜率(Random slopes);
6. 限制线性和非线性参数(Linear and non-linear parameter constraints);
7. 包括特定路径的间接作用(Indirect effects including specific paths);
8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types);
9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals);
10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。
以上功能也适用于CFA和MIMIC。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)