SEM有两个部分:一个测量模型(measurement model)和一个结构模型(structural model)。
测量模型 相当于一个多元回归模型(multivariate regression model),用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此,这一组可观察的因变量被称为因子指标(factor indicators),这一组连续潜变量被称为因子(factors)。
如何描述它们之间的关系?可以通过以下方式:
1. 若因子指标是连续的,用线性回归方程(linear regression equations);
2. 若因子指标是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);
3. 若因子指标是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);
4. 若因子指标是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);
5. 若因子指标是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。
结构模型 则在一个多元回归方程中描述了三种变量关系:
1. 因子之间的关系;
2. 观察变量之间的关系;
3. 因子和不作为因子指标的观察变量之间的关系。
同样,这些变量有不同的种类,所以要根据它们的类别来选择合适的方程进行分析:
1. 若因子为因变量,及可观察的因变量是连续的,用线性回归方程(linear regression equations);
2. 若可观察的因变量是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);
3. 若可观察的因变量是二进制的或者是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);
4. 若可观察的因变量是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);
5. 若可观察的因变量是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。
在回归中,有序的类别变量可通过建立比例优势(proportional odds)模型进行说明;最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。
以下特殊功能也可以通过SEM实现:
1. 单个或多组分析(Single or multiple group analysis);
2. 缺失值(Missing data);
3. 复杂的调查数据(Complex survey data);
4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood);
5. 随机斜率(Random slopes);
6. 限制线性和非线性参数(Linear and non-linear parameter constraints);
7. 包括特定路径的间接作用(Indirect effects including specific paths);
8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types);
9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals);
10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。
以上功能也适用于CFA和MIMIC。
结构方程模型是:一般线性模型的扩展,并非单指某一种特定的统计方法,而是一套用以分析共变结构的技术整合。
结构方程模型组成及应用:
结构方程模型由两部分组成,即测量模型(Measurement Model)和结构模型(Structural Model)。本文将主要介绍以上两个模型的概念及其应用。
1、测量模型
在实际研究中,并非所有的概念都是可以被直接观察和测量的。
比如我们在调研爱采购卖家的体验时,这里的卖家体验其实就是一个抽象的概念,是卖家对平台所有可观测量化指标的综合反映,这些指标可能会包括卖家通过平台获得的询盘量、订单量、主要权益的满意度、接收到服务速度和质量等等。
在SEM中,如用户体验这些抽象且无法直接测量的概念,被称作“潜变量(Latent Variable)”,而那些能被直接观测的变量,如询盘量,则称为“观察变量(Observed Variable)”或“外显变量(Manifest Variable)”。
我们了解越多卖家对平台有效观察变量的反馈,对卖家体验的刻画就越真实可靠。
基于对测量模型的验证,我们发现卖家对平台的综合体验,可以在一定程度解释为卖家对平台的效果体验,权益体验和服务体验(满意度)的集合。
需要注意的是,观测变量并非能完全解释潜变量,在整体测量模型中同时存在无法解释的误差(也称残差),误差大小及分布的影响是实际施测中同样需要考虑的部分。
2、结构模型
与检验观测变量和潜变量之间关系的测量模型不同,结构模型主要用于检验潜变量间的关系。如果单独看待结构模型,就是传统的路径分析(Path Analysis),旨在解释变量间的因果或预测关系。
随着研究的深入,我们发现过去研究中常用的相关分析或一元/多元回归分析方法很难解释变量间的因果关系,比如在研究爱采购卖家续费意愿时,仅通过相关分析,很难判断是体验影响续费意愿,还是续费意愿影响体验。
而单纯的使用多元回归分析,我们只能发现各体验维度指标对续费意愿的独立影响,而忽视了各体验指标间的相互作用。
结构方程模型有以下几点需要注意:
1、SEM更多用于验证性的分析。
因此在实际研究中,需要我们先结合业务分析、定性研究、理论总结等方法设定初始的理论模型,再加以验证。
简而言之,假设先行,可以先把概念之间的影响路径画出来,再转变为统计模型进行修正;
2、SEM一般要求比较大的样本量。
由于SEM所处理的变量数目较多,变量间的关系较为复杂,样本
规模的大小会影响整体分析的稳定性和适用性。
一般而言样本量需要超过200,当涉及潜变量较多时,可根据题目量的10倍设置样本量;
3、分析数据时直接使用原始数据。
由于SEM的数学及统计学基础建立在方差和协方差分析中,使用SEM时应直接使用原始数据或样本的协方差矩阵,而非标准化数据或相关矩阵,以避免产生错误的参数估计或误差。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)