变量
我们用矩形代表显变量,用椭圆代表潜变量(潜变量又分为两种,下面介绍)。
变量之间的关系
变量之间的关系用线段表示,如果两个变量之间没有线,则表明两者之间没有直接关系。线段上的箭头指向的变量表明该变量受到另一变量的影响。此时,如果线段连结的是显变量和潜变量之间的效应,线段上的数字或符号代表的是因子载荷;如果线段连结的是潜变量之间的关系,线段上的数字或符号代表的是路径系数。双向箭头则说明两者具有相关关系,此时线段上的数字或符号代表相关系数。图 1 给出了路径图的一个示例。
图 1
内生潜变量和外生潜变量
这时候会发现,虽然都是显变量,但是有的用x来表示,有的则用y。同样,测量误差和路径系数的符号也会有所不同。这是因为我们进一步区分了两种不同的潜变量:内生潜变量和外生潜变量(图中已经标出)。
外生潜变量是只那些模型外部因素影响的潜变量,简单的说就是没有箭头指向它的潜变量(不考虑相关)。
那么其他会被箭头指向的潜变量则是内生潜变量。
正是因为区分了上述两种不同的潜变量,所以与他们向匹配的符号会有所不同,但含义是相同的。最后再解释一下线段上符号的下标,例如r12,前面的1代表的是该线段指向的变量,后面的2代表线段出发的变量。
在上一篇中说到,一个结构方程模型分为测量模型和结构模型。测量模型是显变量与这些显变量测量的潜变量构成的,结构模型则是潜变量之间的关系。
1.2.1 测量模型
测量模型的意义主要是衡量显变量(也就是测量工具)对潜变量的测量的好坏,例如在心理学中的大五人格测验是不是能很好的测出OCEAN这五个特质。这一部分我们采用验证性因子分析(confirm factor analysis,CFA)来衡量,它的目的是获得显变量和潜变量之间的关系。验证问卷是不是如设计的那样测量了我们相要的因子结构。
那么在图1的例子中的测量模型一共有三个,见图 2。
图 2
其中(a)图存在两个潜变量,因为两者之间的关系是相关而非指向性或因果的关系,所以属于一个测量模型。如果两者之间没有相关,那么各自分别是一个测量模型。
(b)图则是一个具有三个显变量,一个潜变量的测量模型,此时属于饱和模型。此时无法获得模型拟合指标(这个以后)的结果,也就是不能衡量模型拟合的好坏。之所以成为饱和模型,是因为此时自由度为0。这个图中因为有三个显变量,我们可以获得这三个变量的方差和它们两两之间的3个协方差(3+3=6)。而要估计的参数分别是1个潜变量、3个测量误差,和2个因子载荷(其中一个在估计是会固定为1,所以只有2个要估计),也就是要估计1+3+2=6个参数。6-6=0,这就获得了自由度。想要估计出模型拟合的好坏,需要自由度大于0。也就需要更多个显变量。
(c)图中一个显变量对应一个潜变量,此时两者相等,此时成为完美测量,因子载荷就是1,测量误差就是0。
1.2.2 结构模型
结构模型则是前变量之间的关系。估计是采用路径分析,获得路径系数,图1中的结构部分见图3。如果在结构方程模型中的所有变量都是显变量,这就是传统的路径分析了。
在一个SEM中,测量部分和结构部分是同时估计的。
图 3
1.2.3 用公式构建模型。
通过画出路径图,我们就可以清晰的表达出我们感兴趣的SEM,随偶可以根据路径图来写出我们的结构方程模型的数学公式。
对于图1中的例子,我们可以用1个线性方程表达结构部分,2个线性方程分别表达内生和外生潜变量的测量部分,三个公式联立就是这个图的完整的结构方程模型的公式。
因为知乎这个输入希腊符号麻烦(也可能是我不会用),另外现在我们只需要通过专业软件指定就可以了,所以也不需要了解数学公式(尤其是大家更多的可能做社会科学,也不想去理解数学公式),这里就略掉了。如果某位同学看到想了解的话可以私信我,我看到会给大家回复的。前置知识需要了解线性代数的基本知识,不过不需要太深入
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)