(2) 测量误差。对于一个变量X,我们仅能观测到其中能够观测到的部分,比如X1,而对于X无法观测到的部分X2(X=X1+X2,这里的意思是X由可观测的X1和不可观测的X2两部分组成),就被自然地放到了误差项。那么X2是否与其他解释变量相关就不确定了,如果相关,就造成解释变量与误差项相关,也就是内生性问题。
(3) 反向因果。当至少一个解释变量倍确定为被解释变量的函数,反向因果就出现了。如果解释变量X被部分地确定为被解释变量Y的函数,这意味着X与Y相关,而Y与误差项相关,因此,X与误差项相关,回到内生性的定义。举个例子,公司的某项投资会影响公司绩效,但反过来,公司的绩效也会影响公司的该项投资,因为绩效好意味着公司有更多的钱来进行这种投资。
(4) 动态面板偏差。动态面板是指面板数据模型中被解释变量的滞后项作为解释变量。由于被解释变量与误差项有关,被解释变量的滞后项当然也与误差项有关,也就是说该解释变量(被解释变量的滞后项与误差项相关)。
(5) 样本选择偏差。包括自选择偏差与样本选择偏差。自选择偏差是指解释变量不是随机的,而是经过选择的。样本不是随机的,而是经过选择的。举个例子,你要研究人们对某个问题的看法,于是你在大学发放问卷,填问卷的人往往是在校大学生,无法代表整个人群的看法。那么那些没有填写问卷的群里的看法就划到了误差项。而在校大学生对某个问题的看法与非在校大学生的看法极有可能是相关的,因此造成解释变量与误差项相关,也就是内生性的定义。从这个角度来看,选择性偏差造成遗漏变量,进而造成内生性问题。
SEM简单介绍,以下资料来源
因果关系:SEM一般用于建立因果关系模型,但是本身却并不能阐明模型的因果关系。
一般应用于:测量错误、错漏的数据、中介模型(mediation model)、差异分析。
历史:SEM 包括了 回归分析,路径分析(wright, 1921),验证性因子分析(confirmatory factor analysis)(Joreskog, 1969).
SEM也被称为 协方差结构模型(covariance structure modelling),协方差结构分析和因果模型。
因果关系:
究竟哪一个是“真的”? 在被假设的因果变量中其实有一个完整的因果链。
举一个简单的例子: 吃糖果导致蛀牙。这里涉及2个变量,“吃糖果”和“蛀牙”,前者是因,后者是果。 如果上一个因果关系成立,那将会形成一个因果机制,也许会出现这样的结构:
3. 这时还有可能出现更多的潜在变量:
这里我又举另外一个例子,回归模型
在这里,回归模型并不能很好的描述出因果次序,而且也不能轻易的识别因果次序或者未测量的因子。这也是为什么在国外学术界SEM如此流行的原因。
我们在举另外一个例子“路径分析”
路径分析能让我们用于条件模型(conditional relationships),上图中的模型是一种调解型模型或者中介模型,在这里Z 是作为一个中介调节者同时调节X和Y这两个变量的关系。
在这里我们总结一下:
回归分析简单的说就是:X真的影响Y 吗?
路径分析:为什么/如何 X 会影响Y? 是通过其他潜在变量Z 来达到的吗?例子:刷牙(X)减少蛀牙(Y)通过减少细菌的方法(Z)。------测量和测试中介变量(例如上图中的Z变量)可以帮助评估因果假设。
在这里要提一下因素模型(factor model)
在这个模型当中,各个变量有可能由于受到未被观察到的变量所影响,变得相互有内在的联系,一般来说那些变量都很复杂、混乱,而且很多变量是不能直接被观察到的。
举个例子:“保龄球俱乐部的会员卡”和“本地报纸阅读”,是被观察到的变量,而“社会资产”则是未被观察到的变量。另一个例子:“房屋立法”和“异族通婚”是被观察到的变量,而“种族偏见”是未被观察到的变量。
相互关系并不完全由被观察到的变量的因果关系所导致,而是由于那些潜在的变量而导致。
这些被观察到变量(y1--y4)也有可能由一个潜在的变量(F)所影响。
先滞后。面板数据,解释变量是财政压力,被解释变量是地方ZF的教育支出,先用双向固定效应模型做了回归,结果表明存在显著的负向关系,可以用先滞后的方法,排除反向因果关系,简单的方法就是先滞后,构造IV的话可以考虑采用周边地区的平均财政压力。反向因果关系是指与常见假设相反的因果方向或循环中的双向因果关系。欢迎分享,转载请注明来源:夏雨云
评论列表(0条)