Mplus中关于SEM的介绍

Mplus中关于SEM的介绍,第1张

    结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说,这些潜变量是连续的。这里需要注意的是:1. 潜变量(latent variables)是与观察变量(Observed variables)相对的,可通过数据分析观察;2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts),或者是这些类别的组合形式。

    SEM有两个部分:一个测量模型(measurement model)和一个结构模型(structural model)。

     测量模型 相当于一个多元回归模型(multivariate regression model),用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此,这一组可观察的因变量被称为因子指标(factor indicators),这一组连续潜变量被称为因子(factors)。

    如何描述它们之间的关系?可以通过以下方式:

1. 若因子指标是连续的,用线性回归方程(linear regression equations);

2. 若因子指标是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若因子指标是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若因子指标是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若因子指标是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

     结构模型 则在一个多元回归方程中描述了三种变量关系:

1. 因子之间的关系;

2. 观察变量之间的关系;

3. 因子和不作为因子指标的观察变量之间的关系。

    同样,这些变量有不同的种类,所以要根据它们的类别来选择合适的方程进行分析:

1. 若因子为因变量,及可观察的因变量是连续的,用线性回归方程(linear regression equations);

2. 若可观察的因变量是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若可观察的因变量是二进制的或者是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若可观察的因变量是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若可观察的因变量是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

    在回归中,有序的类别变量可通过建立比例优势(proportional odds)模型进行说明;最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。

    以下特殊功能也可以通过SEM实现:

1. 单个或多组分析(Single or multiple group analysis);

2. 缺失值(Missing data);

3. 复杂的调查数据(Complex survey data);

4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood);

5. 随机斜率(Random slopes);

6. 限制线性和非线性参数(Linear and non-linear parameter constraints);

7. 包括特定路径的间接作用(Indirect effects including specific paths);

8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types);

9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals);

10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。

    以上功能也适用于CFA和MIMIC。

结构方程模型是:一般线性模型的扩展,并非单指某一种特定的统计方法,而是一套用以分析共变结构的技术整合。

结构方程模型组成及应用:

结构方程模型由两部分组成,即测量模型(Measurement Model)和结构模型(Structural Model)。本文将主要介绍以上两个模型的概念及其应用。

1、测量模型

在实际研究中,并非所有的概念都是可以被直接观察和测量的。

比如我们在调研爱采购卖家的体验时,这里的卖家体验其实就是一个抽象的概念,是卖家对平台所有可观测量化指标的综合反映,这些指标可能会包括卖家通过平台获得的询盘量、订单量、主要权益的满意度、接收到服务速度和质量等等。

在SEM中,如用户体验这些抽象且无法直接测量的概念,被称作“潜变量(Latent Variable)”,而那些能被直接观测的变量,如询盘量,则称为“观察变量(Observed Variable)”或“外显变量(Manifest Variable)”。

我们了解越多卖家对平台有效观察变量的反馈,对卖家体验的刻画就越真实可靠。

基于对测量模型的验证,我们发现卖家对平台的综合体验,可以在一定程度解释为卖家对平台的效果体验,权益体验和服务体验(满意度)的集合。

需要注意的是,观测变量并非能完全解释潜变量,在整体测量模型中同时存在无法解释的误差(也称残差),误差大小及分布的影响是实际施测中同样需要考虑的部分。

2、结构模型

与检验观测变量和潜变量之间关系的测量模型不同,结构模型主要用于检验潜变量间的关系。如果单独看待结构模型,就是传统的路径分析(Path Analysis),旨在解释变量间的因果或预测关系。

随着研究的深入,我们发现过去研究中常用的相关分析或一元/多元回归分析方法很难解释变量间的因果关系,比如在研究爱采购卖家续费意愿时,仅通过相关分析,很难判断是体验影响续费意愿,还是续费意愿影响体验。

而单纯的使用多元回归分析,我们只能发现各体验维度指标对续费意愿的独立影响,而忽视了各体验指标间的相互作用。

结构方程模型有以下几点需要注意:

1、SEM更多用于验证性的分析。

因此在实际研究中,需要我们先结合业务分析、定性研究、理论总结等方法设定初始的理论模型,再加以验证。

简而言之,假设先行,可以先把概念之间的影响路径画出来,再转变为统计模型进行修正;

2、SEM一般要求比较大的样本量。

由于SEM所处理的变量数目较多,变量间的关系较为复杂,样本

规模的大小会影响整体分析的稳定性和适用性。

一般而言样本量需要超过200,当涉及潜变量较多时,可根据题目量的10倍设置样本量;

3、分析数据时直接使用原始数据。

由于SEM的数学及统计学基础建立在方差和协方差分析中,使用SEM时应直接使用原始数据或样本的协方差矩阵,而非标准化数据或相关矩阵,以避免产生错误的参数估计或误差。

多元线性回归分析通过标准的统计方法可以计算出唯一的结果。多元线性回归分析的作用:

1、在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。

2、在多元线性回归分析是多元回归分析中最基础、最简单的一种。

3、运用回归模型,只要采用的模型和数据相同,通过标准的统计方法可以计算出唯一的结果。

多元线性回归分析自变量的选择:

1、自变量对因变量必须有显著的影响,并呈密切的线性相关;

2、自变量与因变量之间的线性相关必须是真实的,而不是形式上的; 

3、自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之因的相关程度; 

4、自变量应具有完整的统计数据,其预测值容易确定。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/316288.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-30
下一篇2023-04-30

发表评论

登录后才能评论

评论列表(0条)

    保存