如何理解结构方程模型

如何理解结构方程模型,第1张

结构方程模型(SEM, Structural Equation Modeling)是建立在回归模型(Regression Models)的基础上,针对潜变量(Latent Variables)的统计方法。

&ltimg src="https://pic1.zhimg.com/v2-9097acc14cb5f4a901d4e2d1cf883030_b.png" data-rawwidth="308" data-rawheight="260" class="content_image" width="308"&gtf为latent variable, 例如智力、自尊等,在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量,在该SEM模型中为indicators。λ1-3为factor loadings,ε为residual error。

f为latent variable, 例如智力、自尊等,在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量,在该SEM模型中为indicators。λ1-3为factor loadings,ε为residual error。

先前提到SEM是建立在regression model基础上的,该模型可写为如下方程:

y1 = λ1*f + ε1

y2 = λ2*f + ε2

y3 = λ3*f + ε3

即可看到与regression model的联系。

SEM较为广泛应用的是方差/协方差估计法。即可由上述方程写出关于y1,y2,y3的方差/协方差矩阵:(σ为f的variance)

&ltimg src="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_b.png" data-rawwidth="453" data-rawheight="93" class="origin_image zh-lightbox-thumb" width="453" data-original="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_r.png"&gt而后计算机根据实际矩阵,对factor loadings等parameters进行估计并输出估计矩阵,与实际矩阵差异最小(最理想)时,即输出结果,得到各估计参数和拟合指数。

而后计算机根据实际矩阵,对factor loadings等parameters进行估计并输出估计矩阵,与实际矩阵差异最小(最理想)时,即输出结果,得到各估计参数和拟合指数。

应用较多的模型/方法:MIMIC, multiple group models(比较组间差异), latent growth modeling(比较纵向差异)等。

应用广泛的软件:

1、Mplus。优点:编程简单,结果全面。缺点:收费,贵。学生版是300$。

2、Amos。优点:傻瓜,画图拖数据即可。缺点:模型稍一复杂就很费时。

3、R。下个package即可。优点:兼容性、专业性强。缺点:用的人少,不利于伸手党。

4、LISREL。优点:易入门。缺点:需输入各矩阵,略过时。

其他还有一些软件,不了解。

SEM入门不久,以上为个人理解,求探讨求轻喷。么么哒

    结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说,这些潜变量是连续的。这里需要注意的是:1. 潜变量(latent variables)是与观察变量(Observed variables)相对的,可通过数据分析观察;2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts),或者是这些类别的组合形式。

    SEM有两个部分:一个测量模型(measurement model)和一个结构模型(structural model)。

     测量模型 相当于一个多元回归模型(multivariate regression model),用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此,这一组可观察的因变量被称为因子指标(factor indicators),这一组连续潜变量被称为因子(factors)。

    如何描述它们之间的关系?可以通过以下方式:

1. 若因子指标是连续的,用线性回归方程(linear regression equations);

2. 若因子指标是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若因子指标是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若因子指标是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若因子指标是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

     结构模型 则在一个多元回归方程中描述了三种变量关系:

1. 因子之间的关系;

2. 观察变量之间的关系;

3. 因子和不作为因子指标的观察变量之间的关系。

    同样,这些变量有不同的种类,所以要根据它们的类别来选择合适的方程进行分析:

1. 若因子为因变量,及可观察的因变量是连续的,用线性回归方程(linear regression equations);

2. 若可观察的因变量是删失的,用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations);

3. 若可观察的因变量是二进制的或者是有序的类别变量,用profit或logistic回归方程(probit or logistic regression equations);

4. 若可观察的因变量是无序的类别变量,用多元logistic回归方程(multinomial logistic regression equations);

5. 若可观察的因变量是计数的,用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

    在回归中,有序的类别变量可通过建立比例优势(proportional odds)模型进行说明;最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。

    以下特殊功能也可以通过SEM实现:

1. 单个或多组分析(Single or multiple group analysis);

2. 缺失值(Missing data);

3. 复杂的调查数据(Complex survey data);

4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood);

5. 随机斜率(Random slopes);

6. 限制线性和非线性参数(Linear and non-linear parameter constraints);

7. 包括特定路径的间接作用(Indirect effects including specific paths);

8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types);

9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals);

10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。

    以上功能也适用于CFA和MIMIC。

第一,指标是定义建构的特征还是建构的外在表现。如果指标所定义的特征联合起来解释建构的意义,那么形成性模型是合适的。如果指标是由构念决定的,那么应选择反映性模型。换句话说,可以通过判断潜在构念的变化引起指标的变化还是指标的变化引起潜在构念的变化来判断反映性模型还是形成性模型。

第二,指标是否可在概念上互换。如果是反映性指标,它们反映的是共同的主题,任何一个条目都是建构内容的实质性体现,所以可以互换。在心理测量学中,反映性指标其实就是一组行为样本,而形成性指标则不是。形成性指标之间并不必然含有共同成分,所以形成性指标捕捉了建构的独特部分,不能互换。

第三,指标是否彼此共变。反映性模型明确预示指标间彼此高相关,而形成性模型并没有这样的预测,它们之间即可以高相关,也可以低相关,甚至其他任何的相关形式。

最后,所有的指标是否具有相同的前因或/和后果。反映性指标反映相同的潜在构念所以它们具有相同的前因或/和后果。然而,形成性指标彼此不能相互替代,并且仅代表构念领域的特有部分,所以它们有着不同的前因和/或后果。表1总结了形成性和反映性指标/模型间在多个方面的区别。

传统的测量模型(反映性模型)可以用下式表达:χ1 = λ1 ξ1 + δ1

上式与公因子模型(Spearman, 1904Thurstone, 1947)和经典测量理论(CTT)假设 (X = T + E, Lord &Novick, 1968)是一致的,即指标与潜变量之间为线性函数关系,潜变量的变化会导致指标的变化。心理学及社会科学领域的很多概念都可以据此模型构造出相应的测量工具(Bollen, 2002)。在传统测量模型中指标与潜在构念之间的关系如图1a所示,潜变量的意义通过测量指标反映,所以模型意义通过潜在构念指向测量指标的单向箭头来表示,这种模型称作反映性测量模型(Reflective Measurement Model),相应的指标称为反映性指标(Reflective Indicator),在统计上对应公因子模型。

在很多情况下,反映性测量模型是合适的,但有些情况测量指标并不总是反映潜在建构,而是相反,如下图1b所示。在这种情况下,潜变量的意义是由测量指标来定义的,即通过观测指标指向潜在建构的单向箭头表示,这样的测量模型称作形成性测量模型(Formative Measurement Model)或组合测量模型(Composite Measurement Model),指标称作形成性指标(Formative Indicator)也称作成因性指标(Causal Indicator),在统计上对应主成分模型。

与反映性测量模型对应,形成性测量模型也存在不同的形式,如二阶或高阶模型以及与反映性模型组合成的混合模型(Diamantopoulos, Riefler, &Roth, 2008Jarvis et al., 2003Law, Wong, &Mobley, 1998MacKenzie, Podsakoff, &Jarvis, 2005)。

形成性测量模型在社会科学领域也很常见。例如,工作满意度和社会支持的概念。通常一个组织成员的工作满意度取决于他对薪水、工作环境、同事、上司、升职空间和个人发展等多方面的满意度,此时这些单个领域的满意度作为工作满意度的形成性指标而共同决定其整体满意度水平。社会支持水平是另外一个常见的形成性测量模型的例子。研究者将个体社会支持水平划分为不同的来源,如同事/同学、亲戚、朋友、邻居、社区、政府和教会等,这些不同来源的支持水平决定了个体的社会支持总水平,而不是相反。类似的概念还有社会经济地位(Socioeconomic Status, SES)。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/133439.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-17
下一篇2023-03-17

发表评论

登录后才能评论

评论列表(0条)

    保存