能画出结构方程模型图的软件有很多,比如Amos和SmartPLS,这两个软件在可视化方面做的非常好,Mplus和前两个软件有所不同,它是通过语法输入,从diagrammer生成图形,而Amos和SmartPLS是用户直接绘制图形。
R语言也可以绘制结构方程模型图,其优势在于用户可以对SEM图中的变量、线条、形状和颜色进行DIY。本文使用semPlot包中的semPaths函数进行模型图的绘制。
在构建一个结构方程模型时,比较常见的方式是使用路径图。路径图的作用就是表达出这个模型中存在的变量(无论是显变量还是潜变量)以及变量之间的关系。这种方式比较直观,下面简单介绍一下路径图以及图中各个不同符号的含义。变量
我们用矩形代表显变量,用椭圆代表潜变量(潜变量又分为两种,下面介绍)。
变量之间的关系
变量之间的关系用线段表示,如果两个变量之间没有线,则表明两者之间没有直接关系。线段上的箭头指向的变量表明该变量受到另一变量的影响。此时,如果线段连结的是显变量和潜变量之间的效应,线段上的数字或符号代表的是因子载荷;如果线段连结的是潜变量之间的关系,线段上的数字或符号代表的是路径系数。双向箭头则说明两者具有相关关系,此时线段上的数字或符号代表相关系数。图 1 给出了路径图的一个示例。
图 1
内生潜变量和外生潜变量
这时候会发现,虽然都是显变量,但是有的用x来表示,有的则用y。同样,测量误差和路径系数的符号也会有所不同。这是因为我们进一步区分了两种不同的潜变量:内生潜变量和外生潜变量(图中已经标出)。
外生潜变量是只那些模型外部因素影响的潜变量,简单的说就是没有箭头指向它的潜变量(不考虑相关)。
那么其他会被箭头指向的潜变量则是内生潜变量。
正是因为区分了上述两种不同的潜变量,所以与他们向匹配的符号会有所不同,但含义是相同的。最后再解释一下线段上符号的下标,例如r12,前面的1代表的是该线段指向的变量,后面的2代表线段出发的变量。
在上一篇中说到,一个结构方程模型分为测量模型和结构模型。测量模型是显变量与这些显变量测量的潜变量构成的,结构模型则是潜变量之间的关系。
1.2.1 测量模型
测量模型的意义主要是衡量显变量(也就是测量工具)对潜变量的测量的好坏,例如在心理学中的大五人格测验是不是能很好的测出OCEAN这五个特质。这一部分我们采用验证性因子分析(confirm factor analysis,CFA)来衡量,它的目的是获得显变量和潜变量之间的关系。验证问卷是不是如设计的那样测量了我们相要的因子结构。
那么在图1的例子中的测量模型一共有三个,见图 2。
图 2
其中(a)图存在两个潜变量,因为两者之间的关系是相关而非指向性或因果的关系,所以属于一个测量模型。如果两者之间没有相关,那么各自分别是一个测量模型。
(b)图则是一个具有三个显变量,一个潜变量的测量模型,此时属于饱和模型。此时无法获得模型拟合指标(这个以后)的结果,也就是不能衡量模型拟合的好坏。之所以成为饱和模型,是因为此时自由度为0。这个图中因为有三个显变量,我们可以获得这三个变量的方差和它们两两之间的3个协方差(3+3=6)。而要估计的参数分别是1个潜变量、3个测量误差,和2个因子载荷(其中一个在估计是会固定为1,所以只有2个要估计),也就是要估计1+3+2=6个参数。6-6=0,这就获得了自由度。想要估计出模型拟合的好坏,需要自由度大于0。也就需要更多个显变量。
(c)图中一个显变量对应一个潜变量,此时两者相等,此时成为完美测量,因子载荷就是1,测量误差就是0。
1.2.2 结构模型
结构模型则是前变量之间的关系。估计是采用路径分析,获得路径系数,图1中的结构部分见图3。如果在结构方程模型中的所有变量都是显变量,这就是传统的路径分析了。
在一个SEM中,测量部分和结构部分是同时估计的。
图 3
1.2.3 用公式构建模型。
通过画出路径图,我们就可以清晰的表达出我们感兴趣的SEM,随偶可以根据路径图来写出我们的结构方程模型的数学公式。
对于图1中的例子,我们可以用1个线性方程表达结构部分,2个线性方程分别表达内生和外生潜变量的测量部分,三个公式联立就是这个图的完整的结构方程模型的公式。
因为知乎这个输入希腊符号麻烦(也可能是我不会用),另外现在我们只需要通过专业软件指定就可以了,所以也不需要了解数学公式(尤其是大家更多的可能做社会科学,也不想去理解数学公式),这里就略掉了。如果某位同学看到想了解的话可以私信我,我看到会给大家回复的。前置知识需要了解线性代数的基本知识,不过不需要太深入
一般我们论文分析有很多个题项时,也就是多变量时,建立SEM结构化方程时 ,如果没有坚实的理论基础支撑,不清楚那些变量分为一个组时,题项对应哪个因子。一般可以先用EFA再在此基础上用 CFA。 (探索性因素分析用spss软件做,验证性因素分析用amos软件。) 探索性因子分析可以实现用少量因子反映大量问卷题目的信息,从而实现降低维度,便于分析的目的,并对因子命名用于后续分析。前面的SPSS分析方法-因子分析中,也提到因子分析的前提条件 : KMO检验和巴特利特检验: 用于检查变量间的偏相关性,取值在0-1之间。KMO值越接近于1,因子分析效果就好。一般KMO值0.9以上极适合做因子分析,0.8以上适合做因子分析,0.7以上尚可,0.6以上勉强度可以,0.5以上不适合,0.5以下非常不适合。实际运用中,在0.7以上,效果比较好;在0.5以下时,不适合应用因子分析。
Bartlett 球形检验: P<0.05,不服从球形检验,应拒绝各权变量独立的假设,即变量间有较强相关;P>0.05时,服从球形检验,各变量相互独立,不能做因子分析。
接下来我们建立SEM模型。
一、画好路径图
打开AMOS,按照我们做EFA分好的题项或者根据理论分好的题项设计路径图。
二、读取数据文件
因为SPSS14.0版本以后已经将AMOS整合到SPSS内,所以一般我们数据以SPSS存储来分析比较兼容,不容易出问题。当然,在读取数据之前,我们要对数据的完整性问题做处理。
步骤:1、在工具箱中选择“Select data file(s)”图示,或者点菜单栏File-Data Files
2、勾选【Files Name】,然后选择分析的后缀名.sav数据文件读入
3、可以看到读入文件成功,数据样本145个
4、点击OK,结束数据读入,也可点击View Data阅览数据
二、命名变量名称
前面我们建立了路径图,但其中的潜在变量和观察变量以及相关误差都还没命名,和关联数据。
步骤:
[if !supportLists]1. [endif]命名观察变量。点击工具箱中”List Variablles in data set”,按住鼠标左键把观察变量拖入方形框中。
2.命名潜在变量。双击椭圆框框,打开Object Properties,在Variables Name窗口中输入潜在变量名。
3.命名误差变量。自动命名:点击菜单Plugins-Name Unobserved Variables。手动命名,可以双击打开Object Properties,保持视窗开启,逐个命名。
4.我们可以点击,调整一下观察变量的方框,美化路径图
5.最后我们就得出一个完整模型了。
三、在路径中显示重要的参数。
步骤:1、点击Title图示,在绘图区点一下,输入参数的宏函数
2、常见的参数宏函数命令如下
四、存档,点击,保存文件
五、估算分析,输出结果
步骤:
[if !supportLists]1. [endif]点击Analysis properties图示,选择Output,勾选需要分析的系数、输入的模型拟合度和需报告的相关值。
2、点击Calculate estimates图示,产生估计值。
六、分析验证输出结果
1.点击工具箱View Test图示,浏览输出估计值,输出报表内容。
2.报表解读
3.模型的总体
4.非标准化回归系数
5.标准化回归系数
6.相关系数
7.方差 :检查是否有违反估计
原文来自https://mp.weixin.qq.com/s/ORu4ez12YoB036tuN5KuuQ
想要学习更多知识,欢迎关注wx公z号程式科技。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)