SEM简单介绍,以下资料来源
因果关系:SEM一般用于建立因果关系模型,但是本身却并不能阐明模型的因果关系。
一般应用于:测量错误、错漏的数据、中介模型(mediation model)、差异分析。
历史:SEM 包括了 回归分析,路径分析(wright, 1921),验证性因子分析(confirmatory factor analysis)(Joreskog, 1969).
SEM也被称为 协方差结构模型(covariance structure modelling),协方差结构分析和因果模型。
因果关系:
究竟哪一个是“真的”? 在被假设的因果变量中其实有一个完整的因果链。
举一个简单的例子: 吃糖果导致蛀牙。这里涉及2个变量,“吃糖果”和“蛀牙”,前者是因,后者是果。 如果上一个因果关系成立,那将会形成一个因果机制,也许会出现这样的结构:
3. 这时还有可能出现更多的潜在变量:
这里我又举另外一个例子,回归模型
在这里,回归模型并不能很好的描述出因果次序,而且也不能轻易的识别因果次序或者未测量的因子。这也是为什么在国外学术界SEM如此流行的原因。
我们在举另外一个例子“路径分析”
路径分析能让我们用于条件模型(conditional relationships),上图中的模型是一种调解型模型或者中介模型,在这里Z 是作为一个中介调节者同时调节X和Y这两个变量的关系。
在这里我们总结一下:
回归分析简单的说就是:X真的影响Y 吗?
路径分析:为什么/如何 X 会影响Y? 是通过其他潜在变量Z 来达到的吗?例子:刷牙(X)减少蛀牙(Y)通过减少细菌的方法(Z)。------测量和测试中介变量(例如上图中的Z变量)可以帮助评估因果假设。
在这里要提一下因素模型(factor model)
在这个模型当中,各个变量有可能由于受到未被观察到的变量所影响,变得相互有内在的联系,一般来说那些变量都很复杂、混乱,而且很多变量是不能直接被观察到的。
举个例子:“保龄球俱乐部的会员卡”和“本地报纸阅读”,是被观察到的变量,而“社会资产”则是未被观察到的变量。另一个例子:“房屋立法”和“异族通婚”是被观察到的变量,而“种族偏见”是未被观察到的变量。
相互关系并不完全由被观察到的变量的因果关系所导致,而是由于那些潜在的变量而导致。
这些被观察到变量(y1--y4)也有可能由一个潜在的变量(F)所影响。
sem 结构方程模型是社会科学研究中的一个非常好的方法。该方法在20世纪80年代就已经成熟,可惜国内了解的人并不多。“在社会科学以及经济、市场、管理等研究领域,有时需处理多个原因、多个结果的关系,或者会碰到不可直接观测的变量(即潜变量),这些都是传统的统计方法不能很好解决的问题。20世纪80年代以来,结构方程模型迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具。 结构方程模型分析:结构方程模型是一种建立、估计和检验因果关系模型的方法。模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量。结构方程模型可以替代多重回归、通径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系。验证性因子分析,是用于测量因子与测量项(量表题项)之间的对应关系是否与研究者预测保持一致的一种研究方法。尽管因子分析适合任何学科使用,但以社会科学居多。
目前有很多软件都可以非常便利地实现验证性因子分析,本文将基于SPSSAU系统进行说明。
因子分析可分为两种类型:探索性因子分析(EFA)和验证性因子分析(CFA)。
探索性因子分析,主要用于浓缩测量项,将所有题项浓缩提取成几个概括性因子,达到减少分析次数,减少重复信息的目的。
验证性因子分析与探索性因子分析相似,两者区别只在于探索性因子分析(EFA)用于探索因子与测量项之间的对应关系,验证性因子分析(CFA)用于验证结果与理论预期是否一致。
在实际研究中,验证性因子分析常会与结构方程模型、路径分析等方法联系到一起,对于不熟悉概念的研究人员容易搞混这些方法,下表对这几种方法进行简单说明:
探索性因子分析: 验证因子与分析项的对应关系,检验量表效度,非经典量表通常用探索性因子分析。
验证性因子分析: 验证因子与分析项的对应关系,检验量表效度,成熟量表通常用验证性因子分析。确认测量关系后,后续可进行路径分析/线性回归分析研究具体的影响关系。
路径分析: 用于研究多个自变量与多个因变量影响关系;如果因变量只有一个,可以使用线性回归分析。
结构方程模型SEM : 包括测量关系和影响关系。如果仅包括影响关系,此时称作路径分析(Path analysis,有时也称通径分析)。通常需要进行探索性因子分析和验证性因子分析,均保证测量关系无误之后,再进行结构方程模型构建。
从分析思路上看,建议先用探索性因子分析EFA构建模型,确定存在几个因子及各分析项与因子的对应关系,再用验证性因子分析CFA加以检验。
(1)模型设定
首先需要确定因子数及对应分析题项,顺序放入分析框内。
(2)模型拟合
通过因子载荷系数表格可以展示因子(潜变量)与分析项(显变量)之间的关系情况。如果因子与测量项间的对应关系出现严重偏差,或者因子载荷系数值过低,则需要删除掉该测量项。
分析时主要关注P值及标准载荷系数,建议结合SPSSAU给出的“分析建议”进行分析。
模型拟合指标用于整体模型拟合效度情况分析。
常用的拟合值及其判断标准,都展示在上表中,实际输出值在标准范围内及说明模型拟合程度较好。模型拟合指标非常多,通常下很难保证所有指标均达标,只要多数指标达标或接近标准值即可。
*常用指标包括卡方自由度比,GFI,RMSEA,RMR,CFI,NFI和NNFI。
(3)模型修正
根据模型拟合指标情况,评价模型的优劣,如果模型拟合情况不佳,则需要进一步修正模型。
MI指标越大说明该项与其他因子的相关性越强,MI过大时会干扰模型需要进行修正或剔除该项。
模型构建过程需要重复多次,以找到最优模型。同时SPSSAU会自动生成模型结果图。
(4)模型分析
在完成模型构建后,即可使用模型进行分析。验证性因子分析主要有三个方面的功能,分别是聚合效度、区分效度、共同方法偏差。
聚合效度
聚合效度,也叫做收敛效度。AVE和CR是用于判断聚合效度的常用指标,AVE>0.5,并且CR>0.7,则说明具有良好的聚合效度。如果AVE或CR值较低,可考虑移除某因子后重新分析聚合效度。
上图为SPSSAU输出的AVE、CR值指标表格,可以根据此表格进行查看。
区分效度
区分效度,常用的做法是将AVE根号值与‘相关系数值’进行对比,SPSSAU也会输出相应结果。
如果每个因子的AVE根号值均大于“该因子与其它因子的相关系数最大值”,说明具有良好的区分效度。
共同方法偏差
共同方法偏差,SPSSAU提供两种方法检验,一种是探索性因子分析(也称作Harman单因子检验方法),做法是将所有变量进行探索性因子分析,如果只得出一个因子或者第一个因子的解释力(方差解释率)特别大,则判定存在共同方法偏差。
另一种是验证性因子分析,所有变量全部放在一个因子里面进行分析,如果测量出来显示模型的拟合指标无法达标,模型拟合不佳,说明所有的测量项并不应该同属于一个因子,也就说明数据无共同方法偏差问题。
验证性因子分析需要较大的样本量,通常建议样本量至少为测量项(量表题)的5倍以上,最好10倍以上,且一般情况下至少需要200个样本。
一个因子对应的测量项最好在5~8个之间,便于后续删除掉不合理测量项。
绝大多数情况下均为一阶验证性因子分析。如果说验证性因子分析时为二阶模型,此时参数处选中‘二阶’即可。
一般来说,使用验证性因子分析需要有一定的理论基础支持,如果拟合指标不能达标,最好按照分析思路:探索性因子分析→验证性因子分析,进行分析。
以及对于不熟悉的步骤,建议大家阅读SPSSAU帮助手册的相关说明以及SPSSAU的教学视频。
验证性因子分析视频教学: https://www.bilibili.com/video/av69372013
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)