Mplus中关于SEM的介绍_服务器知识

结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说，这些潜变量是连续的。这里需要注意的是：1. 潜变量(latent variables)是与观察变量(Observed variables)相对的，可通过数据分析观察；2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts)，或者是这些类别的组合形式。

SEM有两个部分：一个测量模型(measurement model)和一个结构模型(structural model)。

测量模型相当于一个多元回归模型(multivariate regression model)，用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此，这一组可观察的因变量被称为因子指标(factor indicators)，这一组连续潜变量被称为因子(factors)。

如何描述它们之间的关系？可以通过以下方式：

1. 若因子指标是连续的，用线性回归方程(linear regression equations)；

2. 若因子指标是删失的，用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations)；

3. 若因子指标是有序的类别变量，用profit或logistic回归方程(probit or logistic regression equations)；

4. 若因子指标是无序的类别变量，用多元logistic回归方程(multinomial logistic regression equations)；

5. 若因子指标是计数的，用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

结构模型则在一个多元回归方程中描述了三种变量关系：

1. 因子之间的关系；

2. 观察变量之间的关系；

3. 因子和不作为因子指标的观察变量之间的关系。

同样，这些变量有不同的种类，所以要根据它们的类别来选择合适的方程进行分析：

1. 若因子为因变量，及可观察的因变量是连续的，用线性回归方程(linear regression equations)；

2. 若可观察的因变量是删失的，用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations)；

3. 若可观察的因变量是二进制的或者是有序的类别变量，用profit或logistic回归方程(probit or logistic regression equations)；

4. 若可观察的因变量是无序的类别变量，用多元logistic回归方程(multinomial logistic regression equations)；

5. 若可观察的因变量是计数的，用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

在回归中，有序的类别变量可通过建立比例优势(proportional odds)模型进行说明；最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。

以下特殊功能也可以通过SEM实现：

1. 单个或多组分析(Single or multiple group analysis)；

2. 缺失值(Missing data)；

3. 复杂的调查数据(Complex survey data)；

4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood)；

5. 随机斜率(Random slopes)；

6. 限制线性和非线性参数(Linear and non-linear parameter constraints)；

7. 包括特定路径的间接作用(Indirect effects including specific paths)；

8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types)；

9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals)；

10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。

以上功能也适用于CFA和MIMIC。

结构方程模型是：一般线性模型的扩展，并非单指某一种特定的统计方法，而是一套用以分析共变结构的技术整合。

结构方程模型组成及应用：

结构方程模型由两部分组成，即测量模型（Measurement Model）和结构模型（Structural Model）。本文将主要介绍以上两个模型的概念及其应用。

1、测量模型

在实际研究中，并非所有的概念都是可以被直接观察和测量的。

比如我们在调研爱采购卖家的体验时，这里的卖家体验其实就是一个抽象的概念，是卖家对平台所有可观测量化指标的综合反映，这些指标可能会包括卖家通过平台获得的询盘量、订单量、主要权益的满意度、接收到服务速度和质量等等。

在SEM中，如用户体验这些抽象且无法直接测量的概念，被称作“潜变量（Latent Variable）”，而那些能被直接观测的变量，如询盘量，则称为“观察变量（Observed Variable）”或“外显变量（Manifest Variable）”。

我们了解越多卖家对平台有效观察变量的反馈，对卖家体验的刻画就越真实可靠。

基于对测量模型的验证，我们发现卖家对平台的综合体验，可以在一定程度解释为卖家对平台的效果体验，权益体验和服务体验（满意度）的集合。

需要注意的是，观测变量并非能完全解释潜变量，在整体测量模型中同时存在无法解释的误差（也称残差），误差大小及分布的影响是实际施测中同样需要考虑的部分。

2、结构模型

与检验观测变量和潜变量之间关系的测量模型不同，结构模型主要用于检验潜变量间的关系。如果单独看待结构模型，就是传统的路径分析（Path Analysis），旨在解释变量间的因果或预测关系。

随着研究的深入，我们发现过去研究中常用的相关分析或一元/多元回归分析方法很难解释变量间的因果关系，比如在研究爱采购卖家续费意愿时，仅通过相关分析，很难判断是体验影响续费意愿，还是续费意愿影响体验。

而单纯的使用多元回归分析，我们只能发现各体验维度指标对续费意愿的独立影响，而忽视了各体验指标间的相互作用。

结构方程模型有以下几点需要注意：

1、SEM更多用于验证性的分析。

因此在实际研究中，需要我们先结合业务分析、定性研究、理论总结等方法设定初始的理论模型，再加以验证。

简而言之，假设先行，可以先把概念之间的影响路径画出来，再转变为统计模型进行修正；

2、SEM一般要求比较大的样本量。

由于SEM所处理的变量数目较多，变量间的关系较为复杂，样本

规模的大小会影响整体分析的稳定性和适用性。

一般而言样本量需要超过200，当涉及潜变量较多时，可根据题目量的10倍设置样本量；

3、分析数据时直接使用原始数据。

由于SEM的数学及统计学基础建立在方差和协方差分析中，使用SEM时应直接使用原始数据或样本的协方差矩阵，而非标准化数据或相关矩阵，以避免产生错误的参数估计或误差。

多元线性回归分析通过标准的统计方法可以计算出唯一的结果。多元线性回归分析的作用：

1、在回归分析中，如果有两个或两个以上的自变量，就称为多元回归。事实上，一种现象常常是与多个因素相联系的，由多个自变量的最优组合共同来预测或估计因变量，比只用一个自变量进行预测或估计更有效，更符合实际。因此多元线性回归比一元线性回归的实用意义更大。

2、在多元线性回归分析是多元回归分析中最基础、最简单的一种。

3、运用回归模型，只要采用的模型和数据相同，通过标准的统计方法可以计算出唯一的结果。

多元线性回归分析自变量的选择：

1、自变量对因变量必须有显著的影响，并呈密切的线性相关；

2、自变量与因变量之间的线性相关必须是真实的，而不是形式上的；　

3、自变量之间应具有一定的互斥性，即自变量之间的相关程度不应高于自变量与因变量之因的相关程度；　

4、自变量应具有完整的统计数据，其预测值容易确定。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/316288.html

Mplus中关于SEM的介绍

发表评论

评论列表（0条）