SEM简单介绍,以下资料来源
因果关系:SEM一般用于建立因果关系模型,但是本身却并不能阐明模型的因果关系。
一般应用于:测量错误、错漏的数据、中介模型(mediation model)、差异分析。
历史:SEM 包括了 回归分析,路径分析(wright, 1921),验证性因子分析(confirmatory factor analysis)(Joreskog, 1969).
SEM也被称为 协方差结构模型(covariance structure modelling),协方差结构分析和因果模型。
因果关系:
究竟哪一个是“真的”? 在被假设的因果变量中其实有一个完整的因果链。
举一个简单的例子: 吃糖果导致蛀牙。这里涉及2个变量,“吃糖果”和“蛀牙”,前者是因,后者是果。 如果上一个因果关系成立,那将会形成一个因果机制,也许会出现这样的结构:
3. 这时还有可能出现更多的潜在变量:
这里我又举另外一个例子,回归模型
在这里,回归模型并不能很好的描述出因果次序,而且也不能轻易的识别因果次序或者未测量的因子。这也是为什么在国外学术界SEM如此流行的原因。
我们在举另外一个例子“路径分析”
路径分析能让我们用于条件模型(conditional relationships),上图中的模型是一种调解型模型或者中介模型,在这里Z 是作为一个中介调节者同时调节X和Y这两个变量的关系。
在这里我们总结一下:
回归分析简单的说就是:X真的影响Y 吗?
路径分析:为什么/如何 X 会影响Y? 是通过其他潜在变量Z 来达到的吗?例子:刷牙(X)减少蛀牙(Y)通过减少细菌的方法(Z)。------测量和测试中介变量(例如上图中的Z变量)可以帮助评估因果假设。
在这里要提一下因素模型(factor model)
在这个模型当中,各个变量有可能由于受到未被观察到的变量所影响,变得相互有内在的联系,一般来说那些变量都很复杂、混乱,而且很多变量是不能直接被观察到的。
举个例子:“保龄球俱乐部的会员卡”和“本地报纸阅读”,是被观察到的变量,而“社会资产”则是未被观察到的变量。另一个例子:“房屋立法”和“异族通婚”是被观察到的变量,而“种族偏见”是未被观察到的变量。
相互关系并不完全由被观察到的变量的因果关系所导致,而是由于那些潜在的变量而导致。
这些被观察到变量(y1--y4)也有可能由一个潜在的变量(F)所影响。
问题一:路径分析的步骤 路径分析的主要步骤是:①选择变量和建立因果关系模型。这是路径分析的前提。研究人员多用路径图形象地将变量的层次,变量间因果关系的路径、类型、结构等,表述为所建立的因果模型。下图是5个变量因果关系的路径。 图中带箭头的直线“→”连接的是具有因果关系的两个变量,箭头的方向与因果的方向相同当两变量只有相关关系而无因果关系时,用弧线双向箭头表示。图中变量分为:a.外生变量。因果模型中只扮演因,从不扮演果的变量,是不受模型中其他变量影响的独立变量,如x1与 x2。b.内生变量。模型中既可为因又可为果的变量,其变化受模型中其他变量的影响,如x3、x4与x5。c.残差变量。来自因果模型之外的影响因变量的所有变量的总称,如e3、e4、e5。若变量间的关系是线性可加的,则图中的因果模型可用3个标准化多元线性回归方程表示: pij 称为由xj到xi的路径系数,它表示xj与xi间因果关系的强弱,即当其他变量均保持不变时,变量xj对变量xi的直接作用力的大小。pie称为残差路径系数,它表示所有自变量所不能解释的因变量的变异部分,其大小对于因果模型的确定有重要作用。②检验假设。路径分析要以下列假定为前提:a.变量间的因果关系是单向的,不具有反馈性,又称递归模型;b.变量间具有线性可加关系;c.变量具有等距以上测量尺度;d.所有误差均为随机的,外生变量无测量误差;e.所有内生变量的误差变量间及与内生变量有因果关系的所有自变量间无相关。当某些假定,如递归性或变量的测量尺度不满足时,要做适当的处理才能应用路径分析。③估计参数。首先计算路径系数与残差路径系数,然后计算两变量间相关系数rji。此外,要计算两变量间总因果作用力,包括变量xj对xi的直接作用力、xj经中间变量而对xi的间接作用力两部分。例如,上图的因果模型中,x1对x5的总作用力由直接作用力p51和间接作用力构成。这两部分作用力的大小可由两变量间的相关系数rij的分解得到。最后还要计算决定系数,它表示所有作用于xi的自变量所能解释xi变异量的比例。公式是: ④评估因果模型。评估的主要指标是:a. ,若太小,则要考虑是否需要增加新的自变量,以保证模型精度。b,一个理想的因果模应当很小,当它很大时,则有必要重新估计此因果路径也可由公计算。c.进行F检验。 式中Q为残差平方和,U为回归平方和,N为样本数,K为变量数,检验不显著时要修改模型。 路径分析是多元回归分析的延伸,与后者不同的是:①路径分析间的因果关系是多层次的,因果变量之间加入了中介变量,使路径分析模型较一般回归模型对于现实因果关系的描述更丰富有力。②路径分析不是运用一个而是一组回归方程,在分析时更应注意保证各方程式所含意义的一致性。
问题二:如何进行路径分析 您好,我目前想做一个路径分析,但不知道程序应该怎么写,也找不到相关资料。想跟您请教一下,
用Lisrel或是Sas怎么做呢?
我的外生变量很多(超过25个),包括一些个人背景的、家庭和同伴特征的,请问是否能通过主成分来缩减指标呢?
如果两个内生变量之间是相关的关系,那么在写方程时是否也要把相关关系写上呢?
庄主@2007-03-13:
为了便于其他读者的理解,我先交待一下路径分析 (path *** ysis) 的简单背景。
路径分析可以用作多种目的:一是将因变量之间有关系的的若干个回归模型整合在一个模型里,以助分析和表达的完整和简洁;二是在该整合模型中的各自变量对各因变量的“总影响”(total effects) 分解为“直接影响“(direct effects) 和“间接影响”(indirect effects),如果发现间接影响较大,那就有理论价值了(当然,如下所示,很难发现大的间接影响);三是通过直接影响和间接影响的比较来验证一个自变量是否为“中介变量”(mediating variable),即其直接影响不显著而间接影响显著(上面已说过,不容易发现间接影响、如果同时又要其直接影响不显著,那就更难了)。
如此看来,路径分析是个好东西(不好意思,赶了一回时髦)。其从1960年代兴起,1970-80年代已十分流行。我在Indiana念博士时,学院里的老师常用路径分析做研究。后来学了SEM(结构方程模型),才知道路径分析有“含测量误差”和“不含测量误差”两种。前者只研究自变量和因变量之间因果关系,即SEM中的structural model(结构模型)那部分(见图一),而后者则加上了各变量的CFA(验证性因子分析),也即SEM中的measurement model(测量模型)那部分(图二)。
如何写路径分析的指令(转载) 如何写路径分析的指令(转载)
好了,现在直接回答你的问题。问题1从字面上看,只涉及结构模型那部分,所以比较简单、容易。这种路径分析,不仅可以用LISREL、SAS或其它SEM软件,其实也可以用SPSS等通用统计软件,其结果是一样的。先说在SPSS中如何做。图一是我日前在“Confirmatory regression vs. hierarchical regression 一文中举的例子相仿(当时只用了三个公式,没有此图)。如前文中所说,因为该模型中有两个因变量(或内生变量,endogenous variables),所以需要建立两个回归模型,分别为公式一和二,其中变量名和系数名有些改动,系数分别记为b和g,是为了与LISREL用法一致,b表示一个内生变量(如W)对另一个内生变量(如Y)的影响、g表示一个外生变量(如X)对一个内生变量(如W或Y)的影响:
Y = b0 + g1X + b2W (公式一)
W = g0 +g2X (公式二)
在SPSS中,就按上述两个公式分别做一个回归分析。如果你习惯用SPSS指令的话,其syntax分别为:
Regression Dependent=Y/Enter X, W.
Regression Dependent=W/Enter X.
然后将两个回归分析所得到的回归系数填入图一,此时要用standardized Beta(即 B1、B2、G1分别为公式一和三中b1、b2、g1的标准化值),......>>
问题三:路径分析的介绍 路径分析是常用的数据挖据方法之一, 是一种找寻频繁访问路径的方法,它通过对Web服务器的日志文件中客户访问站点访问次数的分析,挖掘出频繁访问路径。LBS不仅需要能确定目标的地理位置,还需要能实现对地理环境的有效分析。网络分析是地理环境分析中的一个重要技术,包括最短路径分析、网络流分析等内容。在网络分析中,最短路径分析是最基本的,也是最关键的技术,一直是计算机科学、运筹学、交通工程学、地理信息学等学科的一个研究热点。如今,最短路径分析算法已经非常成熟,如以Dijkstra算法为代表的宽度搜索方法、动态规划方法等。
问题四:软件测试中路径分析法是什么 熟悉测试理论的人都知道,路径覆盖是白盒测试中一种很重要的方法,广泛应用于单元测试。那么基于路径覆盖的分析方法是不是只能应用于单元测试呢,能不能将其推而广之呢。一般而言,在单元测试中,路径就是指函数代码的某个分支,而实际上如果我们将软件系统的某个流程也看成路径的话,我们将可以尝试着用路径分析的方法来设计测试用例。采用路径分析的方法设计测试用例有两点好处:一是降低了测试用例设计的难度,只要搞清了各种流程,就可以设计出高质量的测试用例来,而不用太多测试方面的经验;二是在测试时间较紧的情况下,可以有的放矢的选择测试用例,而不用完全根据经验来取舍。下面就具体的介绍一下如何用路径分析的方法编写测试用例。
首先是将系统运行过程中所涉及到的各种流程图表化,可以先从最基本的流程入手,将流程抽象成为不同功能的顺序执行。在最基本流程的基础上再去考虑次要或者异常的流程,这样将各种流程逐渐细化,这样既可以逐渐加深对流程的理解,还可以将各个看似孤立的流程关联起来。完成所有流程的图表化后就完成了所有路径的设定。
找出了所有的路径,下面的工作就是给每条路径设定优先级,这样在测试时就可以先测优先级高的,再测优先级低的,在时间紧迫的情况下甚至可以考虑忽略一些低优先级的路径。优先级根据两个原则来选取:一是路径使用的频率,使用越频繁的优先级越高;二是路径的重要程度,如果失败对系统影响越大的优先级越高。将根据两个原则所分别得到的优先级相加就得到了整个路径的优先级。根据优先级的排序就可以更有针对性的进行测试。
为每条路径设定好优先级后,接下来的工作就是为每条路径选取测试数据,构造测试用例。一条路径可以对应多个测试用例,在选取测试数据时,可以充分利用边界值选取等方法,通过表格将各种测试数据的输入输出对应起来,这样就完成了测试用例的设计。
问题五:结构方程模型 和路径分析的区别,原理是否一样? 路径分析是结构方程模型的一部分,完整的结构方程模型包含两部分:1、测量模型,研究因子和指标的关系,也就是一般我们说的验证性因子分析;2、因果模型,也就是路径分析,研究的是因子之间的关系。另外提一下,狭义上的路径分析指的是把显变量直接当做潜变量的因果模型。
因此,结构方程模型和路径分析其实是概念与子概念的关系。他们所涉及的统计学原理自然是一样的,只不过如果是狭义上的路径分析,那么默认变量无测量误差,其计算的精确度及误差的控制是不如完整的结构方程模型的。
问题六:路径分析的最优路径分析模型 最优路径分析是地理网络分析中最常见的基本功能,也是LBS需要具备的功能。地理网络中的最优路径是指在地理网络中满足某些优化条件的一条路,包括距离最短或最长、通行时间最短、运输费用最低、行使最安全、容量最大等。
问题七:SPSS如何做路径分析 路径分析用amos,amos以前是spss的一个模块,现在分离出去了,要单独安装,现在出最新的spss21.0和amos21.0,先装spss,再装amos,装amos的时候还会提醒安装最新的.NET Framework,先装好就ok了。
SPSS AMOS 21.0是一款使用结构方程式,探索变量间的关系的软件 ,轻松地进行结构方程建模(SEM) 。快速创建模型以检验变量之间的相互影响及其原因,比普通最客服乘回归和探索性因子分析更进一步 。
Microsoft .NET Framework是用于Windows的新托管代码编程模型。它将强大的功能与新技术结合起来,用于构建具有视觉上引人注目的用户体验的应用程序,实现跨技术边界的无缝通信,并且能支持各种业务流程。
问题八:因果路径分析用什么软件 两款比较流行的软件是lisrel和Amos
问题九:如何做用户行为路径分析 用户行为一直是网站优化关注的重点,分析网站用户行为,对提高网站的转换率帮助很大,至少你知道用户需要什么,接下来你应该怎么去满足这些行为。目前几乎90%上的网站几乎都销售为主,无论是产品还是服务,都的为了销售。当然还有一些是需要用户参与网站的某些调查,但是一般专门为这些行为做的网站还是比较少, seo培训下面主要分析用户的购买行为。在做SEO的朋友当中,可能有50%不会卖东西,但是我相信100%的都会买,我们这里也是研究购买者的行为,所以每个人都很可以平等参与,从购买者的角度去分析。如果你对某一些方面的产品感兴趣。但是不知道拥有这种功能的产品名称甚至具体型号,这在营销专家来看,是属于“初级需求”,他们使用经济术语“需求” 来描述当一个购买者对某物质的需要,处于这一阶段的用户遇见了问题,但是不知道是否有相关产品或服务可以帮助他们解决;或者在很多方案中却不知道如何选择 (选择性需求);甚至是知道某一产品能解决自己的问题,正在需找某一喜好的品牌或适合自己的某一型号。这就是购买者行为。初级需求用户行为一个处于“初级需求”的用户,在他准备进入“选择性需求”之前,他可能正在努力寻找关于可以解决他目前问题的有效方法,这个时候他对产品并不敏感,而对信息特别喜好。
在构建一个结构方程模型时,比较常见的方式是使用路径图。路径图的作用就是表达出这个模型中存在的变量(无论是显变量还是潜变量)以及变量之间的关系。这种方式比较直观,下面简单介绍一下路径图以及图中各个不同符号的含义。变量
我们用矩形代表显变量,用椭圆代表潜变量(潜变量又分为两种,下面介绍)。
变量之间的关系
变量之间的关系用线段表示,如果两个变量之间没有线,则表明两者之间没有直接关系。线段上的箭头指向的变量表明该变量受到另一变量的影响。此时,如果线段连结的是显变量和潜变量之间的效应,线段上的数字或符号代表的是因子载荷;如果线段连结的是潜变量之间的关系,线段上的数字或符号代表的是路径系数。双向箭头则说明两者具有相关关系,此时线段上的数字或符号代表相关系数。图 1 给出了路径图的一个示例。
图 1
内生潜变量和外生潜变量
这时候会发现,虽然都是显变量,但是有的用x来表示,有的则用y。同样,测量误差和路径系数的符号也会有所不同。这是因为我们进一步区分了两种不同的潜变量:内生潜变量和外生潜变量(图中已经标出)。
外生潜变量是只那些模型外部因素影响的潜变量,简单的说就是没有箭头指向它的潜变量(不考虑相关)。
那么其他会被箭头指向的潜变量则是内生潜变量。
正是因为区分了上述两种不同的潜变量,所以与他们向匹配的符号会有所不同,但含义是相同的。最后再解释一下线段上符号的下标,例如r12,前面的1代表的是该线段指向的变量,后面的2代表线段出发的变量。
在上一篇中说到,一个结构方程模型分为测量模型和结构模型。测量模型是显变量与这些显变量测量的潜变量构成的,结构模型则是潜变量之间的关系。
1.2.1 测量模型
测量模型的意义主要是衡量显变量(也就是测量工具)对潜变量的测量的好坏,例如在心理学中的大五人格测验是不是能很好的测出OCEAN这五个特质。这一部分我们采用验证性因子分析(confirm factor analysis,CFA)来衡量,它的目的是获得显变量和潜变量之间的关系。验证问卷是不是如设计的那样测量了我们相要的因子结构。
那么在图1的例子中的测量模型一共有三个,见图 2。
图 2
其中(a)图存在两个潜变量,因为两者之间的关系是相关而非指向性或因果的关系,所以属于一个测量模型。如果两者之间没有相关,那么各自分别是一个测量模型。
(b)图则是一个具有三个显变量,一个潜变量的测量模型,此时属于饱和模型。此时无法获得模型拟合指标(这个以后)的结果,也就是不能衡量模型拟合的好坏。之所以成为饱和模型,是因为此时自由度为0。这个图中因为有三个显变量,我们可以获得这三个变量的方差和它们两两之间的3个协方差(3+3=6)。而要估计的参数分别是1个潜变量、3个测量误差,和2个因子载荷(其中一个在估计是会固定为1,所以只有2个要估计),也就是要估计1+3+2=6个参数。6-6=0,这就获得了自由度。想要估计出模型拟合的好坏,需要自由度大于0。也就需要更多个显变量。
(c)图中一个显变量对应一个潜变量,此时两者相等,此时成为完美测量,因子载荷就是1,测量误差就是0。
1.2.2 结构模型
结构模型则是前变量之间的关系。估计是采用路径分析,获得路径系数,图1中的结构部分见图3。如果在结构方程模型中的所有变量都是显变量,这就是传统的路径分析了。
在一个SEM中,测量部分和结构部分是同时估计的。
图 3
1.2.3 用公式构建模型。
通过画出路径图,我们就可以清晰的表达出我们感兴趣的SEM,随偶可以根据路径图来写出我们的结构方程模型的数学公式。
对于图1中的例子,我们可以用1个线性方程表达结构部分,2个线性方程分别表达内生和外生潜变量的测量部分,三个公式联立就是这个图的完整的结构方程模型的公式。
因为知乎这个输入希腊符号麻烦(也可能是我不会用),另外现在我们只需要通过专业软件指定就可以了,所以也不需要了解数学公式(尤其是大家更多的可能做社会科学,也不想去理解数学公式),这里就略掉了。如果某位同学看到想了解的话可以私信我,我看到会给大家回复的。前置知识需要了解线性代数的基本知识,不过不需要太深入
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)