Mplus中关于SEM的介绍_服务器知识

结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说，这些潜变量是连续的。这里需要注意的是：1. 潜变量(latent variables)是与观察变量(Observed variables)相对的，可通过数据分析观察；2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts)，或者是这些类别的组合形式。

SEM有两个部分：一个测量模型(measurement model)和一个结构模型(structural model)。

测量模型相当于一个多元回归模型(multivariate regression model)，用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此，这一组可观察的因变量被称为因子指标(factor indicators)，这一组连续潜变量被称为因子(factors)。

如何描述它们之间的关系？可以通过以下方式：

1. 若因子指标是连续的，用线性回归方程(linear regression equations)；

2. 若因子指标是删失的，用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations)；

3. 若因子指标是有序的类别变量，用profit或logistic回归方程(probit or logistic regression equations)；

4. 若因子指标是无序的类别变量，用多元logistic回归方程(multinomial logistic regression equations)；

5. 若因子指标是计数的，用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

结构模型则在一个多元回归方程中描述了三种变量关系：

1. 因子之间的关系；

2. 观察变量之间的关系；

3. 因子和不作为因子指标的观察变量之间的关系。

同样，这些变量有不同的种类，所以要根据它们的类别来选择合适的方程进行分析：

1. 若因子为因变量，及可观察的因变量是连续的，用线性回归方程(linear regression equations)；

2. 若可观察的因变量是删失的，用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations)；

3. 若可观察的因变量是二进制的或者是有序的类别变量，用profit或logistic回归方程(probit or logistic regression equations)；

4. 若可观察的因变量是无序的类别变量，用多元logistic回归方程(multinomial logistic regression equations)；

5. 若可观察的因变量是计数的，用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

在回归中，有序的类别变量可通过建立比例优势(proportional odds)模型进行说明；最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。

以下特殊功能也可以通过SEM实现：

1. 单个或多组分析(Single or multiple group analysis)；

2. 缺失值(Missing data)；

3. 复杂的调查数据(Complex survey data)；

4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood)；

5. 随机斜率(Random slopes)；

6. 限制线性和非线性参数(Linear and non-linear parameter constraints)；

7. 包括特定路径的间接作用(Indirect effects including specific paths)；

8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types)；

9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals)；

10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。

以上功能也适用于CFA和MIMIC。

结构方程模型（Structural Equation Mode血g, SEM) 可用于多种实用的场景，如多因变量分析、潜变量分析、中介变量分析等。它可以看作路径分析( Path Analysis)和验证性因子分析(Confrrmatory Factor Analysis) 的组合。

（1）潜变量和显变量

在传统的广义线性模型中，各自变量或因变量都是通过“直接”测量或调查而获得的，但有些变量却是难以直接测得的，如学习能力、幸福指数、抑郁状态等。这种无法直接测得的变量称为潜变量(Latent Variables), 与此对应，可以直接测得的变量称为显变量(Observed Variables)。

（2）潜变量虽然无法直接获得，但却是存在的，而且在背后支配着显变量。例如，一名学生的考试成绩是可以直接观测的显变量，它可能是由学习能力这一潜变量决定的；再如，一个人的抑郁状态是潜变量，可能决定着他的“能否很快入睡""感到沮丧”等可直接回答的问题。

（1）潜变量与显变量之间是有一定关系的，如＂焦虑”这一潜变量是如何支配“我睡不着觉”和＂我心里觉得烦乱”这两个显变量的？

（2）在验证性因子分析中，通过以下模型将潜变量和显变量联系起来：

其中， X1,X2, …是显变量， F1,F2,··,Fm 是潜变量。各潜变量通过系数a11 、a21 等支配显变

量X1 、X2 等，而ε等则是无法解释的误差。

（3）如潜变量“焦虑＂与显变量“我睡不着觉”和＂我心里觉得烦乱”之间的关系可以表达为

（1）上述公式与线性模型的公式很相似。其实a1、a2等作为系数，其含义也与线性模型中差不多，如a1表示焦虑每增加1个单位，“我睡不着觉”的预期改变量； a2表示焦虑每增加1个单位，“我心里觉得烦乱＂的预期改变量。

（2）不过与线性模型不同的是，在验证性因子分析中，该系数不叫回归系数，而被称为因子载荷(Factor Loading), 它反映了潜变量与显变量之间的关系。因子载荷越大，表明潜变量与显变量的关系越密切。

（3）在验证性因子分析中，一个很关键的问题是确定潜变量，这一点是由专业知识来决定的。

例如：

路径分析可以探索（显）变量之间的直接和间接关系，验证性因子分析可以分析潜变量与显变量之间的（直接）关系，结构方程模型则将二者结合，可以同时分析带有潜变量的直接和间接关系。

下表是调查了100人的5个变量的协方差结构，目的是了解家庭状况对学生抑郁是否会有影响。

（1）假定家庭状况（潜变摄）用父母学历评分和家庭氛围评分（显变量）来体现，学生抑郁（潜变量）用学生情绪评分、学生认知评分和学生动机评分（显变量）来体现。并且假定路径为：家庭状况会影响学生的抑郁状态。

（2）最终我们得到的结构方程模型如下图所示。图中， f1表示潜变量家庭状况，f2表示潜变量学生抑郁。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/261485.html

Mplus中关于SEM的介绍

发表评论

评论列表（0条）