SEM结构方程模型是什么?

SEM结构方程模型是什么?,第1张

sem 结构方程模型是社会科学研究中的一个非常好的方法。该方法在20世纪80年代就已经成熟,可惜国内了解的人并不多。“在社会科学以及经济、市场、管理等研究领域,有时需处理多个原因、多个结果的关系,或者会碰到不可直接观测的变量(即潜变量),这些都是传统的统计方法不能很好解决的问题。20世纪80年代以来,结构方程模型迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具。 结构方程模型分析:结构方程模型是一种建立、估计和检验因果关系模型的方法。模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量。结构方程模型可以替代多重回归、通径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系。

结构方程模型SEM是一种多元数据分析方法,其包括 测量模型 结构模型 ,类似如下图:

上图中红框即为测量模型,Factor1是A1~A4共4项表示;类似还有Factor2,Factor3和Factor4。而结构模型是指影响关系情况,比如模型中Factor1和Factor2影响Factor3;Factor3影响Factor4。

如果说只研究测量模型,那么通常是指验证性因子分析CFA;如果说只研究结构模型,则称作路径分析path analysis。验证性因子分析和路径分析均是结构方程模型的特殊形式。

结构方程模型由测量模型和结构模型构成,如果进行结构方程模型构建时想达到良好的模型效果。那么就需要保证测量模型和结构模型均有着良好的拟合性,否则最终结构方程模型拟合效果都不会太好。

同时,结构方程模型有着非常多的拟合指标,比如卡方自由度比,RMSEA,CFA,RMR等几十种,但在实际研究中会发现基本上很难所有指标均达标,而且很多指标都不达标。那怎么办呢?

接下来针对结构方程模型的拟合指标、拟合效果不好时的3种解决办法等分别进行说明,期许得到最佳模型。

结构方程模型拟合时,会有非常多的指标。SPSSAU默认提供常用的15类指标,说明如下:

在已有文献中,还会出现各类拟合指标,但基本上都是上述拟合指标的一种变型而已。一般来说,模型拟合效果越好,各类指标越容易达标,但即使模型已经拟合非常好,也不能保证所有的参数均在标准范围内。

为什么会出现这种情况呢,比如卡方自由度值使用较多,但是该指标容易受到样本量的影响,样本量越大时,该指标越可能更小,有的指标在标准范围内,那么对应有的指标就可能不在标准范围内,没有一个指标可以完全性地确定模型的好或坏。也就是说不同的拟合指标并不能完全的测量模型的拟合效果,而应该综合着分析模型效果水平。

SPSSAU提供了各类常用的拟合指标共计15个,但现在研究中,使用最为常见的指标RMSEA, CFI, NNFI, AGFI,RMR,TLI,卡方自由度比等。如果研究时发现最常用的几个指标在标准范围内(或者多数指标基本均接近或明显在标准范围内),而有其它一些指标并不在标准范围内,相信模型拟合也是较好的,因此不用完全考虑所有的拟合指标均达标,几乎也不可能所有的指标均达标。

特别说明一点即:卡方自由度比值是卡方值除以自由度值,卡方值容易受到样本量的影响,样本越大时该值越可能更小,所以小样本时卡方自由度比值容易偏大。另外,如果是饱和模型则自由度为0,此时模型无法得到卡方自由度值,这是正常现象,如果自由度值为0,SPSSAU默认会以“-”标识出卡方自由度值。除此之外,很多时候还会出现拟合指标数值为1.000的现象,这也是正常现象。

如果说模型拟合出现大面积的不达标,而且明显偏离标准范围内,那么这种模型需要进行调整才行。接下来从3个方面进行说明,第1点是梳理建模流程,用于解决掉测量模型不好的问题;第2点是调整模型,可用于降低卡方自由度值,并同时对其它拟合指标有一定帮助;第3点是换用模型,如果说无论如何模型均不达标,那么此时可换用模型,比如改为路径分析Path analysis,线性回归等。

如果出现模型拟合大面积不达标时,首先应该从模型本身找原因。结构方程模型包括测量模型和结构模型,而我们正常情况下只会关注于结构模型即影响关系等,而完全忽略掉还有测量模型。如果说测量模型不好,那拟合指标肯定不会好。但是测量模型是我们容易忽视的地方。因而第一点是查看测量模型是否有问题。

如何查看呢,一是查看载荷系数值,是否有出现标准化载荷系数值较低(比如小于0.7),也或者出现共线性问题(此时标准化载荷系数值会大于1)。如果有出现此类问题,那么就会影响到最终的拟合效果。

出现此种问题时如何解决呢,SPSSAU建议从头开始,按照测量模型的规范进行。先进行探索性因子分析(SPSSAU->进阶方法),然后再做验证性因子分析(SPSSAU->问卷研究里面的验证性因子分析)。探索性因子分析做了再做验证性因子分析,保证删除掉不合理的项,保证最终的测量模型良好。也只有这样才能保证模型拟合达到预期。如果在结构方程模型分析前已经进行了探索性因子分析和验证性因子分析等,也可以直接查看标准化载荷系数,并且对不合理的项进行删除处理等。

特别提示在于,通常不是直接开始就进行结构方程模型,而是在之前做很多的准备工作,即包括探索性因子和验证性因子分析等。

还有一种情况即,一个变量仅由一项表示,此种情况相当于直接没有测量模型,建议此种情况可考虑进行路径分析,即结构方程模型的特殊形式(不带测量关系)的模型。

如果出现模型大面积不达标,相信通过梳理建模流程,删除不合理项之后,可以让很多指标均正常。本小节说明第二种调整模型的方式,即调整模型。调整模型包括两种,一是 MI指数调整 手工模型调整

MI指数调整一般是为了解决卡方自由度比值而存在,根据MI指标调整是指建立各类协方差关系,以减少模型的卡方值,同时也会减少自由度值,MI调整一般会对卡方自由度值指标有着明显的影响,但对于其它指标的影响相对会较小。实际研究中,可能需要手工的调整,SPSSAU默认提供自动调整方式,可以按照MI大于20,MI大于10,或者MI>5这三种方式进行批量调整,比如批量将MI值大于5时,建立协方差关系(即相关关系)。但特别提示一点,此种方式非常便捷,但并不精细,很可能一次性建立了很多协方差关系。

除了让SPSSAU进行批量式的模型调整(使用MI指标值建立协方差关系)外,还可以手工模型调整。

手工模型调整是指结合自身专业知识情况对模型进行调整,包括2种情况。分别是模型的拆分和模型的优化。一般来说,模型越简单,此时模型越容易达标。那么是否可以把模型拆分成几个呢,把一个复杂的结构方程模型拆分成几个,分别进行建模。如果是这样相信拟合效果会明显更好。以及模型是否可以进行删减呢,复杂的模型关系中,是否有个别关系可以进行删减,也或者尝试性地进行删减,以拟合出更优的模型。手工模型调整是一个多次尝试对比的过程,非绝对模式化的调整方式,但此种调整方式在很大程度上均能解决掉模型拟合不好的效果。

如果说经过上述的处理后,依旧无法让模型达标。说明模型确实拟合效果不好,也或者基于当前样本下时模型拟合不佳。那么建议换用模型方法,包括使用路径分析和线性回归模型。

路径分析是结构方程模型的特殊形式,它完全不涉及测量模型,因此模型变得非常简洁,而且完全不考虑测量模型。因此在实际研究中,它很容易比结构方程模型拟合的更好。

如果路径分析显示拟合效果依旧不好,说明当前设定的模型很可能有问题,也或者样本量太少(比如小于100),这种情况时,最好使用稳健性更好且最为经典的线性回归模型,SPSSAU通用方法里面直接使用即可。如果说研究的因变量Y有很多个,此时重复进行多次线性回归模型即可。

以上就是本次分享的内容,登录spssau了解更多。

    结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说,这些潜变量是连续的。这里需要注意的是:1. 潜变量(latent variables)是与观察变量(Observed variables)相对的,可通过数据分析观察;2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts),或者是这些类别的组合形式。

    SEM有两个部分:一个测量模型(measurement model)和一个结构模型(structural model)。

     测量模型 相当于一个多元回归模型(multivariate regression model),用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此,这一组可观察的因变量被称为因子指标(factor indicators),这一组连续潜变量被称为因子(factors)。

    如何描述它们之间的关系?可以通过以下方式:

1. 若因子指标是连续的,用线性回归方程(linear regression equations);

2. 若因子指标是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若因子指标是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若因子指标是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若因子指标是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

     结构模型 则在一个多元回归方程中描述了三种变量关系:

1. 因子之间的关系;

2. 观察变量之间的关系;

3. 因子和不作为因子指标的观察变量之间的关系。

    同样,这些变量有不同的种类,所以要根据它们的类别来选择合适的方程进行分析:

1. 若因子为因变量,及可观察的因变量是连续的,用线性回归方程(linear regression equations);

2. 若可观察的因变量是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若可观察的因变量是二进制的或者是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若可观察的因变量是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若可观察的因变量是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

    在回归中,有序的类别变量可通过建立比例优势(proportional odds)模型进行说明;最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。

    以下特殊功能也可以通过SEM实现:

1. 单个或多组分析(Single or multiple group analysis);

2. 缺失值(Missing data);

3. 复杂的调查数据(Complex survey data);

4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood);

5. 随机斜率(Random slopes);

6. 限制线性和非线性参数(Linear and non-linear parameter constraints);

7. 包括特定路径的间接作用(Indirect effects including specific paths);

8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types);

9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals);

10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。

    以上功能也适用于CFA和MIMIC。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/189116.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-30
下一篇2023-03-30

发表评论

登录后才能评论

评论列表(0条)

    保存