SEM简单介绍,以下资料来源
因果关系:SEM一般用于建立因果关系模型,但是本身却并不能阐明模型的因果关系。
一般应用于:测量错误、错漏的数据、中介模型(mediation model)、差异分析。
历史:SEM 包括了 回归分析,路径分析(wright, 1921),验证性因子分析(confirmatory factor analysis)(Joreskog, 1969).
SEM也被称为 协方差结构模型(covariance structure modelling),协方差结构分析和因果模型。
因果关系:
究竟哪一个是“真的”? 在被假设的因果变量中其实有一个完整的因果链。
举一个简单的例子: 吃糖果导致蛀牙。这里涉及2个变量,“吃糖果”和“蛀牙”,前者是因,后者是果。 如果上一个因果关系成立,那将会形成一个因果机制,也许会出现这样的结构:
3. 这时还有可能出现更多的潜在变量:
这里我又举另外一个例子,回归模型
在这里,回归模型并不能很好的描述出因果次序,而且也不能轻易的识别因果次序或者未测量的因子。这也是为什么在国外学术界SEM如此流行的原因。
我们在举另外一个例子“路径分析”
路径分析能让我们用于条件模型(conditional relationships),上图中的模型是一种调解型模型或者中介模型,在这里Z 是作为一个中介调节者同时调节X和Y这两个变量的关系。
在这里我们总结一下:
回归分析简单的说就是:X真的影响Y 吗?
路径分析:为什么/如何 X 会影响Y? 是通过其他潜在变量Z 来达到的吗?例子:刷牙(X)减少蛀牙(Y)通过减少细菌的方法(Z)。------测量和测试中介变量(例如上图中的Z变量)可以帮助评估因果假设。
在这里要提一下因素模型(factor model)
在这个模型当中,各个变量有可能由于受到未被观察到的变量所影响,变得相互有内在的联系,一般来说那些变量都很复杂、混乱,而且很多变量是不能直接被观察到的。
举个例子:“保龄球俱乐部的会员卡”和“本地报纸阅读”,是被观察到的变量,而“社会资产”则是未被观察到的变量。另一个例子:“房屋立法”和“异族通婚”是被观察到的变量,而“种族偏见”是未被观察到的变量。
相互关系并不完全由被观察到的变量的因果关系所导致,而是由于那些潜在的变量而导致。
这些被观察到变量(y1--y4)也有可能由一个潜在的变量(F)所影响。
结构方程模型(SEM, Structural Equation Modeling)是建立在回归模型(Regression Models)的基础上,针对潜变量(Latent Variables)的统计方法。&ltimg src="https://pic1.zhimg.com/v2-9097acc14cb5f4a901d4e2d1cf883030_b.png" data-rawwidth="308" data-rawheight="260" class="content_image" width="308"&gtf为latent variable, 例如智力、自尊等,在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量,在该SEM模型中为indicators。λ1-3为factor loadings,ε为residual error。
f为latent variable, 例如智力、自尊等,在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量,在该SEM模型中为indicators。λ1-3为factor loadings,ε为residual error。
先前提到SEM是建立在regression model基础上的,该模型可写为如下方程:
y1 = λ1*f + ε1
y2 = λ2*f + ε2
y3 = λ3*f + ε3
即可看到与regression model的联系。
SEM较为广泛应用的是方差/协方差估计法。即可由上述方程写出关于y1,y2,y3的方差/协方差矩阵:(σ为f的variance)
&ltimg src="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_b.png" data-rawwidth="453" data-rawheight="93" class="origin_image zh-lightbox-thumb" width="453" data-original="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_r.png"&gt而后计算机根据实际矩阵,对factor loadings等parameters进行估计并输出估计矩阵,与实际矩阵差异最小(最理想)时,即输出结果,得到各估计参数和拟合指数。
而后计算机根据实际矩阵,对factor loadings等parameters进行估计并输出估计矩阵,与实际矩阵差异最小(最理想)时,即输出结果,得到各估计参数和拟合指数。
应用较多的模型/方法:MIMIC, multiple group models(比较组间差异), latent growth modeling(比较纵向差异)等。
应用广泛的软件:
1、Mplus。优点:编程简单,结果全面。缺点:收费,贵。学生版是300$。
2、Amos。优点:傻瓜,画图拖数据即可。缺点:模型稍一复杂就很费时。
3、R。下个package即可。优点:兼容性、专业性强。缺点:用的人少,不利于伸手党。
4、LISREL。优点:易入门。缺点:需输入各矩阵,略过时。
其他还有一些软件,不了解。
SEM入门不久,以上为个人理解,求探讨求轻喷。么么哒
一般我们论文分析有很多个题项时,也就是多变量时,建立SEM结构化方程时 ,如果没有坚实的理论基础支撑,不清楚那些变量分为一个组时,题项对应哪个因子。一般可以先用EFA再在此基础上用 CFA。 (探索性因素分析用spss软件做,验证性因素分析用amos软件。) 探索性因子分析可以实现用少量因子反映大量问卷题目的信息,从而实现降低维度,便于分析的目的,并对因子命名用于后续分析。前面的SPSS分析方法-因子分析中,也提到因子分析的前提条件 : KMO检验和巴特利特检验: 用于检查变量间的偏相关性,取值在0-1之间。KMO值越接近于1,因子分析效果就好。一般KMO值0.9以上极适合做因子分析,0.8以上适合做因子分析,0.7以上尚可,0.6以上勉强度可以,0.5以上不适合,0.5以下非常不适合。实际运用中,在0.7以上,效果比较好;在0.5以下时,不适合应用因子分析。
Bartlett 球形检验: P<0.05,不服从球形检验,应拒绝各权变量独立的假设,即变量间有较强相关;P>0.05时,服从球形检验,各变量相互独立,不能做因子分析。
接下来我们建立SEM模型。
一、画好路径图
打开AMOS,按照我们做EFA分好的题项或者根据理论分好的题项设计路径图。
二、读取数据文件
因为SPSS14.0版本以后已经将AMOS整合到SPSS内,所以一般我们数据以SPSS存储来分析比较兼容,不容易出问题。当然,在读取数据之前,我们要对数据的完整性问题做处理。
步骤:1、在工具箱中选择“Select data file(s)”图示,或者点菜单栏File-Data Files
2、勾选【Files Name】,然后选择分析的后缀名.sav数据文件读入
3、可以看到读入文件成功,数据样本145个
4、点击OK,结束数据读入,也可点击View Data阅览数据
二、命名变量名称
前面我们建立了路径图,但其中的潜在变量和观察变量以及相关误差都还没命名,和关联数据。
步骤:
[if !supportLists]1. [endif]命名观察变量。点击工具箱中”List Variablles in data set”,按住鼠标左键把观察变量拖入方形框中。
2.命名潜在变量。双击椭圆框框,打开Object Properties,在Variables Name窗口中输入潜在变量名。
3.命名误差变量。自动命名:点击菜单Plugins-Name Unobserved Variables。手动命名,可以双击打开Object Properties,保持视窗开启,逐个命名。
4.我们可以点击,调整一下观察变量的方框,美化路径图
5.最后我们就得出一个完整模型了。
三、在路径中显示重要的参数。
步骤:1、点击Title图示,在绘图区点一下,输入参数的宏函数
2、常见的参数宏函数命令如下
四、存档,点击,保存文件
五、估算分析,输出结果
步骤:
[if !supportLists]1. [endif]点击Analysis properties图示,选择Output,勾选需要分析的系数、输入的模型拟合度和需报告的相关值。
2、点击Calculate estimates图示,产生估计值。
六、分析验证输出结果
1.点击工具箱View Test图示,浏览输出估计值,输出报表内容。
2.报表解读
3.模型的总体
4.非标准化回归系数
5.标准化回归系数
6.相关系数
7.方差 :检查是否有违反估计
原文来自https://mp.weixin.qq.com/s/ORu4ez12YoB036tuN5KuuQ
想要学习更多知识,欢迎关注wx公z号程式科技。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)