变量
我们用矩形代表显变量,用椭圆代表潜变量(潜变量又分为两种,下面介绍)。
变量之间的关系
变量之间的关系用线段表示,如果两个变量之间没有线,则表明两者之间没有直接关系。线段上的箭头指向的变量表明该变量受到另一变量的影响。此时,如果线段连结的是显变量和潜变量之间的效应,线段上的数字或符号代表的是因子载荷;如果线段连结的是潜变量之间的关系,线段上的数字或符号代表的是路径系数。双向箭头则说明两者具有相关关系,此时线段上的数字或符号代表相关系数。图 1 给出了路径图的一个示例。
图 1
内生潜变量和外生潜变量
这时候会发现,虽然都是显变量,但是有的用x来表示,有的则用y。同样,测量误差和路径系数的符号也会有所不同。这是因为我们进一步区分了两种不同的潜变量:内生潜变量和外生潜变量(图中已经标出)。
外生潜变量是只那些模型外部因素影响的潜变量,简单的说就是没有箭头指向它的潜变量(不考虑相关)。
那么其他会被箭头指向的潜变量则是内生潜变量。
正是因为区分了上述两种不同的潜变量,所以与他们向匹配的符号会有所不同,但含义是相同的。最后再解释一下线段上符号的下标,例如r12,前面的1代表的是该线段指向的变量,后面的2代表线段出发的变量。
在上一篇中说到,一个结构方程模型分为测量模型和结构模型。测量模型是显变量与这些显变量测量的潜变量构成的,结构模型则是潜变量之间的关系。
1.2.1 测量模型
测量模型的意义主要是衡量显变量(也就是测量工具)对潜变量的测量的好坏,例如在心理学中的大五人格测验是不是能很好的测出OCEAN这五个特质。这一部分我们采用验证性因子分析(confirm factor analysis,CFA)来衡量,它的目的是获得显变量和潜变量之间的关系。验证问卷是不是如设计的那样测量了我们相要的因子结构。
那么在图1的例子中的测量模型一共有三个,见图 2。
图 2
其中(a)图存在两个潜变量,因为两者之间的关系是相关而非指向性或因果的关系,所以属于一个测量模型。如果两者之间没有相关,那么各自分别是一个测量模型。
(b)图则是一个具有三个显变量,一个潜变量的测量模型,此时属于饱和模型。此时无法获得模型拟合指标(这个以后)的结果,也就是不能衡量模型拟合的好坏。之所以成为饱和模型,是因为此时自由度为0。这个图中因为有三个显变量,我们可以获得这三个变量的方差和它们两两之间的3个协方差(3+3=6)。而要估计的参数分别是1个潜变量、3个测量误差,和2个因子载荷(其中一个在估计是会固定为1,所以只有2个要估计),也就是要估计1+3+2=6个参数。6-6=0,这就获得了自由度。想要估计出模型拟合的好坏,需要自由度大于0。也就需要更多个显变量。
(c)图中一个显变量对应一个潜变量,此时两者相等,此时成为完美测量,因子载荷就是1,测量误差就是0。
1.2.2 结构模型
结构模型则是前变量之间的关系。估计是采用路径分析,获得路径系数,图1中的结构部分见图3。如果在结构方程模型中的所有变量都是显变量,这就是传统的路径分析了。
在一个SEM中,测量部分和结构部分是同时估计的。
图 3
1.2.3 用公式构建模型。
通过画出路径图,我们就可以清晰的表达出我们感兴趣的SEM,随偶可以根据路径图来写出我们的结构方程模型的数学公式。
对于图1中的例子,我们可以用1个线性方程表达结构部分,2个线性方程分别表达内生和外生潜变量的测量部分,三个公式联立就是这个图的完整的结构方程模型的公式。
因为知乎这个输入希腊符号麻烦(也可能是我不会用),另外现在我们只需要通过专业软件指定就可以了,所以也不需要了解数学公式(尤其是大家更多的可能做社会科学,也不想去理解数学公式),这里就略掉了。如果某位同学看到想了解的话可以私信我,我看到会给大家回复的。前置知识需要了解线性代数的基本知识,不过不需要太深入
SEM简单介绍,以下资料来源
因果关系:SEM一般用于建立因果关系模型,但是本身却并不能阐明模型的因果关系。
一般应用于:测量错误、错漏的数据、中介模型(mediation model)、差异分析。
历史:SEM 包括了 回归分析,路径分析(wright, 1921),验证性因子分析(confirmatory factor analysis)(Joreskog, 1969).
SEM也被称为 协方差结构模型(covariance structure modelling),协方差结构分析和因果模型。
因果关系:
究竟哪一个是“真的”? 在被假设的因果变量中其实有一个完整的因果链。
举一个简单的例子: 吃糖果导致蛀牙。这里涉及2个变量,“吃糖果”和“蛀牙”,前者是因,后者是果。 如果上一个因果关系成立,那将会形成一个因果机制,也许会出现这样的结构:
3. 这时还有可能出现更多的潜在变量:
这里我又举另外一个例子,回归模型
在这里,回归模型并不能很好的描述出因果次序,而且也不能轻易的识别因果次序或者未测量的因子。这也是为什么在国外学术界SEM如此流行的原因。
我们在举另外一个例子“路径分析”
路径分析能让我们用于条件模型(conditional relationships),上图中的模型是一种调解型模型或者中介模型,在这里Z 是作为一个中介调节者同时调节X和Y这两个变量的关系。
在这里我们总结一下:
回归分析简单的说就是:X真的影响Y 吗?
路径分析:为什么/如何 X 会影响Y? 是通过其他潜在变量Z 来达到的吗?例子:刷牙(X)减少蛀牙(Y)通过减少细菌的方法(Z)。------测量和测试中介变量(例如上图中的Z变量)可以帮助评估因果假设。
在这里要提一下因素模型(factor model)
在这个模型当中,各个变量有可能由于受到未被观察到的变量所影响,变得相互有内在的联系,一般来说那些变量都很复杂、混乱,而且很多变量是不能直接被观察到的。
举个例子:“保龄球俱乐部的会员卡”和“本地报纸阅读”,是被观察到的变量,而“社会资产”则是未被观察到的变量。另一个例子:“房屋立法”和“异族通婚”是被观察到的变量,而“种族偏见”是未被观察到的变量。
相互关系并不完全由被观察到的变量的因果关系所导致,而是由于那些潜在的变量而导致。
这些被观察到变量(y1--y4)也有可能由一个潜在的变量(F)所影响。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)