实用教程！验证性因子分析思路总结_服务器知识

验证性因子分析，是用于测量因子与测量项(量表题项)之间的对应关系是否与研究者预测保持一致的一种研究方法。尽管因子分析适合任何学科使用，但以社会科学居多。

目前有很多软件都可以非常便利地实现验证性因子分析，本文将基于SPSSAU系统进行说明。

因子分析可分为两种类型：探索性因子分析（EFA）和验证性因子分析（CFA）。

探索性因子分析，主要用于浓缩测量项，将所有题项浓缩提取成几个概括性因子，达到减少分析次数，减少重复信息的目的。

验证性因子分析与探索性因子分析相似，两者区别只在于探索性因子分析(EFA)用于探索因子与测量项之间的对应关系，验证性因子分析(CFA)用于验证结果与理论预期是否一致。

在实际研究中，验证性因子分析常会与结构方程模型、路径分析等方法联系到一起，对于不熟悉概念的研究人员容易搞混这些方法，下表对这几种方法进行简单说明：

探索性因子分析：验证因子与分析项的对应关系，检验量表效度，非经典量表通常用探索性因子分析。

验证性因子分析：验证因子与分析项的对应关系，检验量表效度，成熟量表通常用验证性因子分析。确认测量关系后，后续可进行路径分析/线性回归分析研究具体的影响关系。

路径分析：用于研究多个自变量与多个因变量影响关系；如果因变量只有一个，可以使用线性回归分析。

结构方程模型SEM ：包括测量关系和影响关系。如果仅包括影响关系，此时称作路径分析（Path analysis，有时也称通径分析）。通常需要进行探索性因子分析和验证性因子分析，均保证测量关系无误之后，再进行结构方程模型构建。

从分析思路上看，建议先用探索性因子分析EFA构建模型，确定存在几个因子及各分析项与因子的对应关系，再用验证性因子分析CFA加以检验。

（1）模型设定

首先需要确定因子数及对应分析题项，顺序放入分析框内。

（2）模型拟合

通过因子载荷系数表格可以展示因子(潜变量)与分析项(显变量)之间的关系情况。如果因子与测量项间的对应关系出现严重偏差，或者因子载荷系数值过低，则需要删除掉该测量项。

分析时主要关注P值及标准载荷系数，建议结合SPSSAU给出的“分析建议”进行分析。

模型拟合指标用于整体模型拟合效度情况分析。

常用的拟合值及其判断标准，都展示在上表中，实际输出值在标准范围内及说明模型拟合程度较好。模型拟合指标非常多,通常下很难保证所有指标均达标，只要多数指标达标或接近标准值即可。

*常用指标包括卡方自由度比，GFI，RMSEA，RMR，CFI，NFI和NNFI。

（3）模型修正

根据模型拟合指标情况，评价模型的优劣，如果模型拟合情况不佳，则需要进一步修正模型。

MI指标越大说明该项与其他因子的相关性越强，MI过大时会干扰模型需要进行修正或剔除该项。

模型构建过程需要重复多次，以找到最优模型。同时SPSSAU会自动生成模型结果图。

（4）模型分析

在完成模型构建后，即可使用模型进行分析。验证性因子分析主要有三个方面的功能，分别是聚合效度、区分效度、共同方法偏差。

聚合效度

聚合效度，也叫做收敛效度。AVE和CR是用于判断聚合效度的常用指标，AVE>0.5，并且CR>0.7，则说明具有良好的聚合效度。如果AVE或CR值较低,可考虑移除某因子后重新分析聚合效度。

上图为SPSSAU输出的AVE、CR值指标表格，可以根据此表格进行查看。

区分效度

区分效度，常用的做法是将AVE根号值与‘相关系数值’进行对比，SPSSAU也会输出相应结果。

如果每个因子的AVE根号值均大于“该因子与其它因子的相关系数最大值”，说明具有良好的区分效度。

共同方法偏差

共同方法偏差，SPSSAU提供两种方法检验，一种是探索性因子分析(也称作Harman单因子检验方法)，做法是将所有变量进行探索性因子分析，如果只得出一个因子或者第一个因子的解释力（方差解释率）特别大，则判定存在共同方法偏差。

另一种是验证性因子分析，所有变量全部放在一个因子里面进行分析，如果测量出来显示模型的拟合指标无法达标，模型拟合不佳，说明所有的测量项并不应该同属于一个因子，也就说明数据无共同方法偏差问题。

验证性因子分析需要较大的样本量，通常建议样本量至少为测量项(量表题)的5倍以上，最好10倍以上，且一般情况下至少需要200个样本。

一个因子对应的测量项最好在5~8个之间，便于后续删除掉不合理测量项。

绝大多数情况下均为一阶验证性因子分析。如果说验证性因子分析时为二阶模型，此时参数处选中‘二阶’即可。

一般来说，使用验证性因子分析需要有一定的理论基础支持，如果拟合指标不能达标，最好按照分析思路：探索性因子分析→验证性因子分析，进行分析。

以及对于不熟悉的步骤，建议大家阅读SPSSAU帮助手册的相关说明以及SPSSAU的教学视频。

验证性因子分析视频教学： https://www.bilibili.com/video/av69372013

上一篇文章中，初步介绍了验证性因子分析的功能及应用场景。下面通过一个实例来具体了解一下，验证性因子分析的操作步骤以及过程中需要注意的内容。

当前有一份215份的研究量表数据，共由四个因子表示，第一个因子共5项，分别是A1~A5；第二项因子共5项，分别是B1~B5；第三个因子共4项，分别是C1~C4；第4个因子共6项，分别是D1~D6。现希望验证此量表的聚合效度和区分效度，并且希望进行共同方法偏差分析。

验证性因子分析的步骤大致可分为四步，分别是：模型构建、删除不合理测量项、模型MI指标修正和模型分析。

（1）模型构建

即将因子与测量项对应关系放置规范；在进行CFA分析前一般需要进行EFA，清理掉对应关系出现严重偏差的测量项

（2）删除不合理测量项

如果因子与测量项间的对应关系出现严重偏差，此时可考虑删除某测量项；也或者某测量项与因子间的载荷系数值过低(比如小于0.5)，说明该测量项与因子间关系较弱，需要删除掉该测量项

（3）模型MI指标修正

如果说模型拟合指标不佳，可考虑进行模型MI指标修正【SPSSAU默认提供MI大于20，MI大于10，MI大于5，和MI大于3共四种模型修正方式】

（4）最终模型分析

本例子中的量表共分为四个因子，暂不进行模型MI修正，放置如下：

SPSSAU共输出6个表格，各表格对应解释说明如下：

从上表可知，本次针对共4个因子，以及20个分析项进行验证性因子分析(CFA)分析。本次分析有效样本量为215，超出分析项数量的10倍，样本量适中。

CFA分析建议样本量至少为测量项(量表题)的5倍以上，最好10倍以上，且一般情况下至少需要200个样本。一个因子对应的测量项最好在5~8个之间，便于后续删除掉不合理测量项。

因子载荷系数表格展示因子和测量项之间的关联关系，通常使用标准载荷系数值表示因子与分析项间的相关关系。分析时主要看标准载荷系数值和P值。

如果呈现出显著性，且标准载荷系数值大于0.70，则说明有着较强的相关关系。反之，如果没有呈现出显著性，也或者标准载荷系数值较低(比如低于0.4)，则说明该分析项与因子间相关关系较弱。

上表格显示，B1与Factor2之间的因子载荷系数值为0.562 <0.7，说明对应关系较弱，可考虑将此项从Factor2中移除出去。从整体上看，各个测量项全部均呈现出0.001水平的显著性(P<0.001)，而且标准化载荷系数值均大于0.7(除B1外)，因而说明整体上看，因子与测量项之间有着良好的对应关系，聚合效度较好。

此表格主要查看指标的聚合效度和区分效度情况，输出指标包括AVE和CR值。通常AVE值>0.5，CR值>0.7,说明数据聚合效度较好。

从上格可知：本研究涉及的4个因子（SPSSAU默认给定名字为Factor 1, Factor 2, Factor 3, Factor 4），它们的AVE值全部均大于0.5，而且CR值全部均大于0.7，因而说明本次测量量表数据具有优秀的聚合效度。

此表格展示模型拟合指标，共分为常用指标和其它指标。表中提供各指标相应的建议判断标准，可直接对比判断标准值。一些其它指标通常使用较少，研究人员可结合实际情况进行选择。如果模型拟合不好需要，需要根据相关专业知识和模型修正指标对模型进行修正。

上表来看：卡方自由度值为3.389，大于3，而且GFI小于0.9，RMSEA为0.105接近于0.1这一标准，RMR值为0.091不在标准范围内。综合来看，模型构建欠佳，需要进行模型修正。比如这里将MI>10作为修正标准然后重新进行模型拟合，得到结果如下

上表格展示因子与测量项的对应关系MI值，因子与其下属测量项的关系可通过因子载荷系数表格进行查看。MI值并不固定标准大小，一般情况下，该值如果大于20则说明关联性很强。

从上表格可以看到，C2与Factor2，Factor4这两个因子间的MI指标均大于15，说明C2与Factor2，Factor4之间可能有着较强的关联性；同时，D5与Factor3之间的MI值为18.121，说明二者有较强的关联性。

综合可知：可考虑将C2，D6这两个指标进行删除，同时上述因子载荷表格分析还发现B1也可以进行删除。因而将此三项进行删除后可再次进行模型（限于篇幅限制，SPSSAU并不继续进行分析）。

上表格展示因子与因子之间的关联性，可通过标准系数进行分析。从上表可知，在进行因子协方差表格分析时，本研究共4个因子，他们两两之间的标准系数值均介于0.6~0.85之间，说明因子之间具有较强的关联性。

聚合效度通常是针对 AVE，CR，因子载荷系数这三个指标进行分析，并且均是在模型最终确认后的指标进行分析。

分析结果表明：本研究量表数据具有优秀的聚合效度

区分效度的测量是使用 AVE的平方根值，然后与4个因子的相关系数进行对比。

如果AVE平方根值大于“该因子与其它因子间的相关系数”，此时说明具有良好的区分效度。

区分效度首先需要进行相关分析（以及每个因子对应多项，需要使用‘生成变量’功能将其概括成一个整体后再进行两两相关分析）。如下：

常见的区分效度分析时，会将上表格中斜对角线的1，换成AVE值的平方根，然后再进行对比分析。最终如下表格式：

上图可知，因子1的AVE根号值为0.843，大于因子1与另外3个因子之间的相关系数值(最大为0.777)；因子2的AVE根号值为0.84，大于因子2与另外3个因子之间的相关系数值（最大为0.753）；类似地，因子3的AVE根号值，因子4的AVE根号值均大于它们与其它因子的相关系数值。因而说明研究量表数据的区分效度良好。

特别提示：

常见的区分效度分析是将AVE根号值与‘相关系数值’进行对比；有时候区分效度的验证方法为：“比较多个CFA模型进行分析说明”，建议研究人员以参考文献为准；

区分效度进行时，需要先进行相关分析，以及取AVE均方根，然后将手工表格合并处理好后进行分析说明。

共同方法偏差(CMV)常见有两种验证方式，一种是使用探索性因子分析EFA方法进行检验 (也称作Harman单因子检验方法)，即查看把所有量表项进行探索性因子分析EFA时，如果只得出一个因子或者第一个因子的解释力（方差解释率）特别大，通常以50%为界，此时可判定存在同源方差（共同方法偏差），反之说明没有共同方法偏差问题。

如果是使用CFA进行验证；则将所有的测量项(即所有因子对应的测量量表题项)放在一个因子里面，然后进行分析，如果测量出来显示模型的拟合指标，比如卡方自由度比，RMSEA,RMR,CFI等无法达标，则说明模型拟合不佳，即说明所有的测量项并不应该同属于一个因子(放在一起时模型不好)，因而说明数据通过共同方法偏差CMV检验，数据无共同方法偏差问题。

本次共有4个因子对应20个测量项，将此20个测量项全部放在一个因子里面进行CFA分析并且得到模型拟合指标，如下图：

上图显示卡方自由度值为11.137，明显高于标准（>3），并且GFI,CFI,NFI,NNFI这四个指标值全部均低于0.7，明显偏差标准值(大于0.9)，RMSEA和RMR值均大于0.15，也严重偏差标准值。其它指标比如AGFI,IFI,PGFI,PNFI等也均低于0.7，严重偏差大于0.9这一标准，因而说明模型拟合质量非常糟糕，也即说明不能本次研究量表数据无法聚焦成一个因子，即说明无共同方法偏差问题。

特别提示：

上述为两种常见的共同方法偏差验证方法，还有其它验证方法，建议研究人员以参考文献为准；

研究人员需要在事前注意共同方法偏差问题，而不能等到事后发现共同方法偏差才能处理。

验证性因子分析（confirmatory factor analysis, CFA）是用于测量因子与测量项(量表题项)之间的对应关系是否与研究者预测保持一致的一种研究方法。

验证性因子分析CFA 的主要目的在于进行效度验证，同时还可以进行共同方法偏差CMV 的分析。

结合实际应用情况，验证性因子分析通常有三个用途：

聚合效度，又称收敛效度，强调那些应属于同一因子（指标）下的测量项，测量时确实落在同一因子下面。

如果目的在于进行聚合(收敛)效度分析，则可使用 AVE 和 CR 这两个指标进行分析，如果每个因子的AVE值大于0.5，并且CR值大于0.7，则说明具有良好的聚合效度，同时一般还要求每个测量项对应的因子载荷系数（factor loading）值大于0.7。有时候还可能会结合模型拟合指标，以及进行模型MI值修正，以达到更好的结论。

由上表可知，AVE值全部均大于0.5，而且CR值全部均大于0.7，因而说明本次测量量表数据具有优秀的聚合效度。

区分效度，强调本不应该在同一因子（指标）下的测量项，测量时确实不在同一因子下面。

如果目的在于进行区分效度分析，则可使用AVE根号值和相关分析结果进行对比，如果每个因子的AVE根号值均大于“该因子与其它因子的相关系数最大值”，此时则具有良好的区分效度，为更好表述，使用下图展示：

上图的斜对角线为AVE的根号值,，比如因子对应的AVE根号值为0.843，该值大于因子1与另外3个因子的相关系数(分别是0.700，0.646和0.777)，类似因子2，因子3，因子4也这样进行分析。最终发现因子的AVE根号值，全部均大于该因子与其它因子的相关系数值，因而说明具有很好的区分效度。

操作步骤：

分析时首先完成验证性因子分析的模型构建，通过' 生成变量 '功能将题项合并为一个整体（因子）进行相关分析。

共同方法偏差，是指由于测量外部的某些因素导致数据出现集中的偏差。换句话说，测量的差异是由于研究本身（或其他），如测量工具、问题构成或测量环境等导致的。

如果目的在于进行共同方法偏差(CMV)分析，常见的做法为：将所有的测量项(即所有因子对应的测量量表题项)放在一个因子里面，然后进行分析。

如果测量出来显示模型的拟合指标，比如卡方自由度比，RMSEA,RMR,CFI等无法达标，则说明模型拟合不佳，即说明所有的测量项并不应该同属于一个因子(放在一起时模型不好)，因而说明数据通过共同方法偏差CMV检验，数据无共同方法偏差问题。

上图显示卡方自由度值为11.137，明显高于标准（>3），并且GFI,CFI,NFI,NNFI这四个指标值全部均低于0.7，明显偏差标准值(大于0.9)，RMSEA和RMR值均大于0.15，也严重偏差标准值。因而说明模型拟合质量非常糟糕，也即说明不能本次研究量表数据无法聚焦成一个因子，说明无共同方法偏差问题。

针对CMV检验，上种思路同样也适用于使用探索性因子分析EFA方法进行检验CMV问题(也称作Harman单因子检验方法)，即查看把所有量表项进行探索性因子分析EFA时，如果只得出一个因子或者第一个因子的解释力（方差解释率）特别大，通常以50%为界，此时可判定存在同源方差（共同方法偏差），反之则说明没有共同方法偏差问题。

针对共同方法偏差(CMV)分析，还有其它的一些做法，建议用户以文献为准。

（1）进行聚合(收敛)效度，或区分效度分析，建议首先进行探索性因子分析(EFA)，然后再进行CFA分析。

原因在于CFA对于数据质量要求高，如果探索性因子分析就发现因子与测量项对应关系出现偏差，需要首先进行处理，确认好因子与测量项对应关系后，再进行CFA分析。

（2）如果使用CFA进行分析，建议样本量至少为测量项(量表题)的5倍以上，最好10倍以上，且一般情况下至少需要200个样本。

（3）一个因子对应的测量项最好在5~8个之间，便于后续删除掉不合理测量项。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/243288.html

实用教程！验证性因子分析思路总结

发表评论

评论列表（0条）