SEM结构方程模型是什么?

SEM结构方程模型是什么?,第1张

sem 结构方程模型是社会科学研究中的一个非常好的方法。该方法在20世纪80年代就已经成熟,可惜国内了解的人并不多。“在社会科学以及经济、市场、管理等研究领域,有时需处理多个原因、多个结果的关系,或者会碰到不可直接观测的变量(即潜变量),这些都是传统的统计方法不能很好解决的问题。20世纪80年代以来,结构方程模型迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具。 结构方程模型分析:结构方程模型是一种建立、估计和检验因果关系模型的方法。模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量。结构方程模型可以替代多重回归、通径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系。

结构方程简介

不论是因果关系的证明或量表内在结构的确认,均有赖于事前研究变项的性质与内容的厘清,并清楚描述变项的假设性关系,由研究者提出具体的结构性关系的假设命题,寻求统计上的检证。尤其在社会与行为科学领域所探究的变项结构性关系,大多是由一群无法直接观察与测量的抽象命题(或称为构念)所组成,需获得严谨的统计数据来证明构念的存在,此点也是SEM的主要长处之一(Bollen, 1989)。

(三)模型比较分析(modeling analysis and comparison)

SEM 的第三个主要特征,是模块化分析的应用。利用先前所讨论的假设检定与结构化验证功能,结构方程模式可以将一系列的研究假设同时结构成一个有意义的假设模型(hypothetical model),然后经由统计的程序对于此一模型进行检证。不同的模型之间,则可进行竞争比较。

在社会与行为科学的研究中,往往相同的一组变项会因为理论观点的不同,对于变项之间的假设关系亦会有不同的主张,因此,研究者可以基于不同的理论与假设前提,发展出不同的替代模型(alternative model),进行模式间的竞争比较。此一利用假设模型进行统计检证的优点,大大改善了传统路径分析在多组回归等式进行同时估计的限制,也提高了分析的应用广度。

Jöreskog &Sörbom(1996)指出SEM的模块化应用策略有三个层次,第一是单纯的验证(confirmatory),也就是针对单一的先验假设模型,评估其适切性,称为验证型研究;第二是模型的产生(model generation),其程序是先设定一个起始模型,在与实际观察资料进行比较之后,进行必要的修正,反复进行估计的程序以得到最佳契合的模型,称为产生型研究;第三是替代模型的竞争比较,以决定何者最能反应真实资料,称为竞争型研究。

Maccallum &Austin(2000)从文献整理中发现,以单纯的验证与模型产生为目的SEM研究约占20%与25%,涉及竞争比较的SEM研究则有55%。 Maccallum &Austin(2000)认为模型产生型SEM研究有其限制存在,尤其在模型修饰的过程中,往往过度依赖资料所呈现的讯息而忽略理论的意义,过度滥用修正程序以获得对自己有利的结果,是相当危险的作法,使用者应小心为之。相对之下,竞争比较的研究则有较为强固的理论基础,修饰问题较少,而可以发挥较大的弹性与说服力。

结构方程模式的此一模块化分析功能,最主要的一个贡献,即是为社会与行为科学研究界对于抽象理论进行实证的检验提供了一套严谨的程序,使得研究者可以透过统计的分析去检验所提出的理论模型(theoretical model)。此举将假设检定的运用,自单一参数的考验提升至理论模型整体考验的更高层次,突破了传统上计量技术对于理论模型欠缺整合分析能力的困境。

二、结构方程模式的特性

Hoyle(1995)指出,结构方程模式可视为不同统计技术与研究方法的综合体。从技术的层面来看,SEM并非单指某一种特定的统计方法,而是一套用以分析共变结构的技术的整合。SEM有时以共变结构分析(covariance structure analysis)、共变结构模型(covariance structure modeling)等不同的名词存在,有时则单指因素分析模式的分析,以验证性因素分析(CFA)来称呼之;有时,研究者虽然以SEM的分析软件来执行传统的路径分析,进行因果模型(causal modeling)的探究,但不使用SEM的名义,事实上这也是SEM的重要应用之一。不论是用何种名词来称呼,这些分析技术具有一些基本的共同特质(Kline, 1996, pp. 8-13),说明如下。

(一)SEM具有理论先验性

SEM分析最重要的一个特性,是它必须建立在一定的理论基础之上,也就是说,SEM是一个用以检证某一先期提出的理论模型(priori theoretical model)的适切性的一种统计技术。这也是SEM被视为是一种验证性(confirmatory)而非探索性(exploratory)统计方法的主要原因。SEM的分析过程中,从变项内容的界定、变项关系的假设、参数的设定、模型的安排与修正,一直到应用分析软件来进行估计,其间的每一个步骤都必须要有清楚的理论概念或逻辑推理作为依据。从统计的原理来看,SEM也必须同时符合多项传统统计分析的基本假设(例如线性关系、常态性)以及SEM分析软件所特有的假设要件,否则所获得的统计数据无法采信。

    结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说,这些潜变量是连续的。这里需要注意的是:1. 潜变量(latent variables)是与观察变量(Observed variables)相对的,可通过数据分析观察;2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts),或者是这些类别的组合形式。

    SEM有两个部分:一个测量模型(measurement model)和一个结构模型(structural model)。

     测量模型 相当于一个多元回归模型(multivariate regression model),用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此,这一组可观察的因变量被称为因子指标(factor indicators),这一组连续潜变量被称为因子(factors)。

    如何描述它们之间的关系?可以通过以下方式:

1. 若因子指标是连续的,用线性回归方程(linear regression equations);

2. 若因子指标是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若因子指标是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若因子指标是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若因子指标是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

     结构模型 则在一个多元回归方程中描述了三种变量关系:

1. 因子之间的关系;

2. 观察变量之间的关系;

3. 因子和不作为因子指标的观察变量之间的关系。

    同样,这些变量有不同的种类,所以要根据它们的类别来选择合适的方程进行分析:

1. 若因子为因变量,及可观察的因变量是连续的,用线性回归方程(linear regression equations);

2. 若可观察的因变量是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若可观察的因变量是二进制的或者是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若可观察的因变量是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若可观察的因变量是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

    在回归中,有序的类别变量可通过建立比例优势(proportional odds)模型进行说明;最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。

    以下特殊功能也可以通过SEM实现:

1. 单个或多组分析(Single or multiple group analysis);

2. 缺失值(Missing data);

3. 复杂的调查数据(Complex survey data);

4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood);

5. 随机斜率(Random slopes);

6. 限制线性和非线性参数(Linear and non-linear parameter constraints);

7. 包括特定路径的间接作用(Indirect effects including specific paths);

8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types);

9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals);

10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。

    以上功能也适用于CFA和MIMIC。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/185875.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-29
下一篇2023-03-29

发表评论

登录后才能评论

评论列表(0条)

    保存