Mplus中关于SEM的介绍

Mplus中关于SEM的介绍,第1张

    结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说,这些潜变量是连续的。这里需要注意的是:1. 潜变量(latent variables)是与观察变量(Observed variables)相对的,可通过数据分析观察;2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts),或者是这些类别的组合形式。

    SEM有两个部分:一个测量模型(measurement model)和一个结构模型(structural model)。

     测量模型 相当于一个多元回归模型(multivariate regression model),用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此,这一组可观察的因变量被称为因子指标(factor indicators),这一组连续潜变量被称为因子(factors)。

    如何描述它们之间的关系?可以通过以下方式:

1. 若因子指标是连续的,用线性回归方程(linear regression equations);

2. 若因子指标是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若因子指标是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若因子指标是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若因子指标是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

     结构模型 则在一个多元回归方程中描述了三种变量关系:

1. 因子之间的关系;

2. 观察变量之间的关系;

3. 因子和不作为因子指标的观察变量之间的关系。

    同样,这些变量有不同的种类,所以要根据它们的类别来选择合适的方程进行分析:

1. 若因子为因变量,及可观察的因变量是连续的,用线性回归方程(linear regression equations);

2. 若可观察的因变量是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若可观察的因变量是二进制的或者是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若可观察的因变量是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若可观察的因变量是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

    在回归中,有序的类别变量可通过建立比例优势(proportional odds)模型进行说明;最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。

    以下特殊功能也可以通过SEM实现:

1. 单个或多组分析(Single or multiple group analysis);

2. 缺失值(Missing data);

3. 复杂的调查数据(Complex survey data);

4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood);

5. 随机斜率(Random slopes);

6. 限制线性和非线性参数(Linear and non-linear parameter constraints);

7. 包括特定路径的间接作用(Indirect effects including specific paths);

8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types);

9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals);

10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。

    以上功能也适用于CFA和MIMIC。

结构方程模型(Structural Equation Mode血g, SEM) 可用于多种实用的场景,如多因变量分析、潜变量分析、中介变量分析等。它可以看作路径分析( Path Analysis)和验证性因子分析(Confrrmatory Factor Analysis) 的组合。

(1)潜变量和显变量

在传统的广义线性模型中,各自变量或因变量都是通过“直接”测量或调查而获得的,但有些变量却是难以直接测得的,如学习能力、幸福指数、抑郁状态等。这种无法直接测得的变量称为潜变量(Latent Variables), 与此对应,可以直接测得的变量称为显变量(Observed Variables)。

(2)潜变量虽然无法直接获得,但却是存在的,而且在背后支配着显变量。例如,一名学生的考试成绩是可以直接观测的显变量,它可能是由学习能力这一潜变量决定的;再如,一个人的抑郁状态是潜变量,可能决定着他的“能否很快入睡""感到沮丧”等可直接回答的问题。

(1)潜变量与显变量之间是有一定关系的,如"焦虑”这一潜变量是如何支配“我睡不着觉”和"我心里觉得烦乱”这两个显变量的?

(2)在验证性因子分析中,通过以下模型将潜变量和显变量联系起来:

其中, X1,X2, …是显变量, F1,F2,··,Fm 是潜变量。各潜变量通过系数a11 、a21 等支配显变

量X1 、X2 等,而ε等则是无法解释的误差。

(3)如潜变量“焦虑"与显变量“我睡不着觉”和"我心里觉得烦乱”之间的关系可以表达为

(1)上述公式与线性模型的公式很相似。其实a1、a2等作为系数,其含义也与线性模型中差不多,如a1表示焦虑每增加1个单位,“我睡不着觉”的预期改变量; a2表示焦虑每增加1个单位,“我心里觉得烦乱"的预期改变量。

(2)不过与线性模型不同的是,在验证性因子分析中,该系数不叫回归系数,而被称为因子载荷(Factor Loading), 它反映了潜变量与显变量之间的关系。因子载荷越大,表明潜变量与显变量的关系越密切。

(3)在验证性因子分析中, 一个很关键的问题是确定潜变量,这一点是由专业知识来决定的。

例如:

路径分析可以探索(显)变量之间的直接和间接关系,验证性因子分析可以分析潜变量与显变量之间的(直接)关系,结构方程模型则将二者结合,可以同时分析带有潜变量的直接和间接关系。

下表是调查了100人的5个变量的协方差结构,目的是了解家庭状况对学生抑郁是否会有影响。

(1)假定家庭状况(潜变摄)用父母学历评分和家庭氛围评分(显变量)来体现,学生抑郁(潜变量)用学生情绪评分、学生认知评分和学生动机评分(显变量)来体现。并且假定路径为:家庭状况会影响学生的抑郁状态。

(2)最终我们得到的结构方程模型如下图所示。图中, f1表示潜变量家庭状况,f2表示潜变量学生抑郁。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/261485.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-16
下一篇2023-04-16

发表评论

登录后才能评论

评论列表(0条)

    保存