如何理解结构方程模型

如何理解结构方程模型,第1张

结构方程模型(SEM, Structural Equation Modeling)是建立在回归模型(Regression Models)的基础上,针对潜变量(Latent Variables)的统计方法。

&ltimg src="https://pic1.zhimg.com/v2-9097acc14cb5f4a901d4e2d1cf883030_b.png" data-rawwidth="308" data-rawheight="260" class="content_image" width="308"&gtf为latent variable, 例如智力、自尊等,在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量,在该SEM模型中为indicators。λ1-3为factor loadings,ε为residual error。

f为latent variable, 例如智力、自尊等,在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量,在该SEM模型中为indicators。λ1-3为factor loadings,ε为residual error。

先前提到SEM是建立在regression model基础上的,该模型可写为如下方程:

y1 = λ1*f + ε1

y2 = λ2*f + ε2

y3 = λ3*f + ε3

即可看到与regression model的联系。

SEM较为广泛应用的是方差/协方差估计法。即可由上述方程写出关于y1,y2,y3的方差/协方差矩阵:(σ为f的variance)

&ltimg src="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_b.png" data-rawwidth="453" data-rawheight="93" class="origin_image zh-lightbox-thumb" width="453" data-original="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_r.png"&gt而后计算机根据实际矩阵,对factor loadings等parameters进行估计并输出估计矩阵,与实际矩阵差异最小(最理想)时,即输出结果,得到各估计参数和拟合指数。

而后计算机根据实际矩阵,对factor loadings等parameters进行估计并输出估计矩阵,与实际矩阵差异最小(最理想)时,即输出结果,得到各估计参数和拟合指数。

应用较多的模型/方法:MIMIC, multiple group models(比较组间差异), latent growth modeling(比较纵向差异)等。

应用广泛的软件:

1、Mplus。优点:编程简单,结果全面。缺点:收费,贵。学生版是300$。

2、Amos。优点:傻瓜,画图拖数据即可。缺点:模型稍一复杂就很费时。

3、R。下个package即可。优点:兼容性、专业性强。缺点:用的人少,不利于伸手党。

4、LISREL。优点:易入门。缺点:需输入各矩阵,略过时。

其他还有一些软件,不了解。

SEM入门不久,以上为个人理解,求探讨求轻喷。么么哒

方法如下

1、方法辨别

结构方程模型SEM包括测量关系和影响关系;既可以测量各因素内部结构及相关之间的关系情况,也可以测量多个自变量与多个因变量之间的影响关系。

结构方程模型与路径分析主要区别就在于完整的结构方程模型包含了测量关系,如果仅包括影响关系,此时称作路径分析。如此以外,还有一些容易混淆的方法,

2、分析思路

SPSSAU

从整体分析角度看,完整分析可以包括以下几个步骤:模型构建→探索性因子分析/验证性因子分析→设置模型→评估模型→模型调整。

3、SPSSAU操作

结构方程模型是结合了多种统计分析方法,可同时检验因子、分析项、误差项间的关系。

在构建一个结构方程模型时,比较常见的方式是使用路径图。路径图的作用就是表达出这个模型中存在的变量(无论是显变量还是潜变量)以及变量之间的关系。这种方式比较直观,下面简单介绍一下路径图以及图中各个不同符号的含义。

变量

我们用矩形代表显变量,用椭圆代表潜变量(潜变量又分为两种,下面介绍)。

变量之间的关系

变量之间的关系用线段表示,如果两个变量之间没有线,则表明两者之间没有直接关系。线段上的箭头指向的变量表明该变量受到另一变量的影响。此时,如果线段连结的是显变量和潜变量之间的效应,线段上的数字或符号代表的是因子载荷;如果线段连结的是潜变量之间的关系,线段上的数字或符号代表的是路径系数。双向箭头则说明两者具有相关关系,此时线段上的数字或符号代表相关系数。图 1 给出了路径图的一个示例。

图 1

内生潜变量和外生潜变量

这时候会发现,虽然都是显变量,但是有的用x来表示,有的则用y。同样,测量误差和路径系数的符号也会有所不同。这是因为我们进一步区分了两种不同的潜变量:内生潜变量和外生潜变量(图中已经标出)。

外生潜变量是只那些模型外部因素影响的潜变量,简单的说就是没有箭头指向它的潜变量(不考虑相关)。

那么其他会被箭头指向的潜变量则是内生潜变量。

正是因为区分了上述两种不同的潜变量,所以与他们向匹配的符号会有所不同,但含义是相同的。最后再解释一下线段上符号的下标,例如r12,前面的1代表的是该线段指向的变量,后面的2代表线段出发的变量。

在上一篇中说到,一个结构方程模型分为测量模型和结构模型。测量模型是显变量与这些显变量测量的潜变量构成的,结构模型则是潜变量之间的关系。

1.2.1 测量模型

测量模型的意义主要是衡量显变量(也就是测量工具)对潜变量的测量的好坏,例如在心理学中的大五人格测验是不是能很好的测出OCEAN这五个特质。这一部分我们采用验证性因子分析(confirm factor analysis,CFA)来衡量,它的目的是获得显变量和潜变量之间的关系。验证问卷是不是如设计的那样测量了我们相要的因子结构。

那么在图1的例子中的测量模型一共有三个,见图 2。

图 2

其中(a)图存在两个潜变量,因为两者之间的关系是相关而非指向性或因果的关系,所以属于一个测量模型。如果两者之间没有相关,那么各自分别是一个测量模型。

(b)图则是一个具有三个显变量,一个潜变量的测量模型,此时属于饱和模型。此时无法获得模型拟合指标(这个以后)的结果,也就是不能衡量模型拟合的好坏。之所以成为饱和模型,是因为此时自由度为0。这个图中因为有三个显变量,我们可以获得这三个变量的方差和它们两两之间的3个协方差(3+3=6)。而要估计的参数分别是1个潜变量、3个测量误差,和2个因子载荷(其中一个在估计是会固定为1,所以只有2个要估计),也就是要估计1+3+2=6个参数。6-6=0,这就获得了自由度。想要估计出模型拟合的好坏,需要自由度大于0。也就需要更多个显变量。

(c)图中一个显变量对应一个潜变量,此时两者相等,此时成为完美测量,因子载荷就是1,测量误差就是0。

1.2.2 结构模型

结构模型则是前变量之间的关系。估计是采用路径分析,获得路径系数,图1中的结构部分见图3。如果在结构方程模型中的所有变量都是显变量,这就是传统的路径分析了。

在一个SEM中,测量部分和结构部分是同时估计的。

图 3

1.2.3 用公式构建模型。

通过画出路径图,我们就可以清晰的表达出我们感兴趣的SEM,随偶可以根据路径图来写出我们的结构方程模型的数学公式。

对于图1中的例子,我们可以用1个线性方程表达结构部分,2个线性方程分别表达内生和外生潜变量的测量部分,三个公式联立就是这个图的完整的结构方程模型的公式。

因为知乎这个输入希腊符号麻烦(也可能是我不会用),另外现在我们只需要通过专业软件指定就可以了,所以也不需要了解数学公式(尤其是大家更多的可能做社会科学,也不想去理解数学公式),这里就略掉了。如果某位同学看到想了解的话可以私信我,我看到会给大家回复的。前置知识需要了解线性代数的基本知识,不过不需要太深入


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/437632.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-29
下一篇2023-05-29

发表评论

登录后才能评论

评论列表(0条)

    保存