sem的模型介绍_服务器知识

SEM简单介绍，以下资料来源

因果关系：SEM一般用于建立因果关系模型，但是本身却并不能阐明模型的因果关系。

一般应用于：测量错误、错漏的数据、中介模型（mediation model）、差异分析。

历史：SEM 包括了回归分析，路径分析（wright, 1921）,验证性因子分析（confirmatory factor analysis）（Joreskog, 1969）.

SEM也被称为协方差结构模型（covariance structure modelling），协方差结构分析和因果模型。

因果关系：

究竟哪一个是“真的”？在被假设的因果变量中其实有一个完整的因果链。

举一个简单的例子：吃糖果导致蛀牙。这里涉及2个变量，“吃糖果”和“蛀牙”，前者是因，后者是果。如果上一个因果关系成立，那将会形成一个因果机制，也许会出现这样的结构：

3. 这时还有可能出现更多的潜在变量：

这里我又举另外一个例子，回归模型

在这里，回归模型并不能很好的描述出因果次序，而且也不能轻易的识别因果次序或者未测量的因子。这也是为什么在国外学术界SEM如此流行的原因。

我们在举另外一个例子“路径分析”

路径分析能让我们用于条件模型（conditional relationships），上图中的模型是一种调解型模型或者中介模型，在这里Z 是作为一个中介调节者同时调节X和Y这两个变量的关系。

在这里我们总结一下：

回归分析简单的说就是：X真的影响Y 吗？

路径分析：为什么/如何 X 会影响Y？是通过其他潜在变量Z 来达到的吗？例子：刷牙（X）减少蛀牙（Y）通过减少细菌的方法（Z）。------测量和测试中介变量（例如上图中的Z变量）可以帮助评估因果假设。

在这里要提一下因素模型（factor model）

在这个模型当中，各个变量有可能由于受到未被观察到的变量所影响，变得相互有内在的联系，一般来说那些变量都很复杂、混乱，而且很多变量是不能直接被观察到的。

举个例子：“保龄球俱乐部的会员卡”和“本地报纸阅读”，是被观察到的变量，而“社会资产”则是未被观察到的变量。另一个例子：“房屋立法”和“异族通婚”是被观察到的变量，而“种族偏见”是未被观察到的变量。

相互关系并不完全由被观察到的变量的因果关系所导致，而是由于那些潜在的变量而导致。

这些被观察到变量（y1--y4）也有可能由一个潜在的变量（F）所影响。

结构方程模型（SEM, Structural Equation Modeling）是建立在回归模型（Regression Models）的基础上，针对潜变量（Latent Variables）的统计方法。

&ltimg src="https://pic1.zhimg.com/v2-9097acc14cb5f4a901d4e2d1cf883030_b.png" data-rawwidth="308" data-rawheight="260" class="content_image" width="308"&gtf为latent variable, 例如智力、自尊等，在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量，在该SEM模型中为indicators。λ1-3为factor loadings，ε为residual error。

f为latent variable, 例如智力、自尊等，在该SEM模型中为predictor。y1,y2,y3为observed variables, 即可直接测量得到的变量，在该SEM模型中为indicators。λ1-3为factor loadings，ε为residual error。

先前提到SEM是建立在regression model基础上的，该模型可写为如下方程：

y1 = λ1*f + ε1

y2 = λ2*f + ε2

y3 = λ3*f + ε3

即可看到与regression model的联系。

SEM较为广泛应用的是方差/协方差估计法。即可由上述方程写出关于y1,y2,y3的方差/协方差矩阵：（σ为f的variance）

&ltimg src="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_b.png" data-rawwidth="453" data-rawheight="93" class="origin_image zh-lightbox-thumb" width="453" data-original="https://pic3.zhimg.com/v2-4d1ae9e59cf5987bc5ad78ac07b42c7a_r.png"&gt而后计算机根据实际矩阵，对factor loadings等parameters进行估计并输出估计矩阵，与实际矩阵差异最小（最理想）时，即输出结果，得到各估计参数和拟合指数。

而后计算机根据实际矩阵，对factor loadings等parameters进行估计并输出估计矩阵，与实际矩阵差异最小（最理想）时，即输出结果，得到各估计参数和拟合指数。

应用较多的模型/方法：MIMIC, multiple group models（比较组间差异）, latent growth modeling（比较纵向差异）等。

应用广泛的软件：

1、Mplus。优点：编程简单，结果全面。缺点：收费，贵。学生版是300$。

2、Amos。优点：傻瓜，画图拖数据即可。缺点：模型稍一复杂就很费时。

3、R。下个package即可。优点：兼容性、专业性强。缺点：用的人少，不利于伸手党。

4、LISREL。优点：易入门。缺点：需输入各矩阵，略过时。

其他还有一些软件，不了解。

SEM入门不久，以上为个人理解，求探讨求轻喷。么么哒

结构方程模型(SEM)包括连续潜变量之间的回归模型(Bollen, 1989Browne &Arminger, 1995Joreskog &Sorbom, 1979)。也就是说，这些潜变量是连续的。这里需要注意的是：1. 潜变量(latent variables)是与观察变量(Observed variables)相对的，可通过数据分析观察；2. 观察变量可以是连续的(continuous)、删失的(censored)、二进制的(binary)、有序的(ordinal)、无序的(nominal)、计数的(counts)，或者是这些类别的组合形式。

SEM有两个部分：一个测量模型(measurement model)和一个结构模型(structural model)。

测量模型相当于一个多元回归模型(multivariate regression model)，用于描述一组可观察的因变量和一组连续潜变量之间的关系。在此，这一组可观察的因变量被称为因子指标(factor indicators)，这一组连续潜变量被称为因子(factors)。

如何描述它们之间的关系？可以通过以下方式：

1. 若因子指标是连续的，用线性回归方程(linear regression equations)；

2. 若因子指标是删失的，用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations)；

3. 若因子指标是有序的类别变量，用profit或logistic回归方程(probit or logistic regression equations)；

4. 若因子指标是无序的类别变量，用多元logistic回归方程(multinomial logistic regression equations)；

5. 若因子指标是计数的，用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

结构模型则在一个多元回归方程中描述了三种变量关系：

1. 因子之间的关系；

2. 观察变量之间的关系；

3. 因子和不作为因子指标的观察变量之间的关系。

同样，这些变量有不同的种类，所以要根据它们的类别来选择合适的方程进行分析：

1. 若因子为因变量，及可观察的因变量是连续的，用线性回归方程(linear regression equations)；

2. 若可观察的因变量是删失的，用删失回归或膨胀删失回归方程(censored normal or censored-inflated normal regression equations)；

3. 若可观察的因变量是二进制的或者是有序的类别变量，用profit或logistic回归方程(probit or logistic regression equations)；

4. 若可观察的因变量是无序的类别变量，用多元logistic回归方程(multinomial logistic regression equations)；

5. 若可观察的因变量是计数的，用Poisson或零膨胀Poisson回归方程(Poisson or zero-inflated Poisson regression equations)。

在回归中，有序的类别变量可通过建立比例优势(proportional odds)模型进行说明；最大似然估计和加权最小二乘估计(maximum likelihood and weighted least squares estimators)都是可用的。

以下特殊功能也可以通过SEM实现：

1. 单个或多组分析(Single or multiple group analysis)；

2. 缺失值(Missing data)；

3. 复杂的调查数据(Complex survey data)；

4. 使用最大似然估计分析潜变量的交互和非线性因子(Latent variable interactions and non-linear factor analysis using maximum likelihood)；

5. 随机斜率(Random slopes)；

6. 限制线性和非线性参数(Linear and non-linear parameter constraints)；

7. 包括特定路径的间接作用(Indirect effects including specific paths)；

8. 对所有输出结果的类型进行最大似然估计(Maximum likelihood estimation for all outcome types)；

9. bootstrap标准误差和置信区间(Bootstrap standard errors and confidence intervals)；

10. 相等参数的Wald卡方检验(Wald chi-square test of parameter equalities)。

以上功能也适用于CFA和MIMIC。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/410341.html

sem的模型介绍

发表评论

评论列表（0条）