问题二:如何进行路径分析 您好,我目前想做一个路径分析,但不知道程序应该怎么写,也找不到相关资料。想跟您请教一下,
用Lisrel或是Sas怎么做呢?
我的外生变量很多(超过25个),包括一些个人背景的、家庭和同伴特征的,请问是否能通过主成分来缩减指标呢?
如果两个内生变量之间是相关的关系,那么在写方程时是否也要把相关关系写上呢?
庄主@2007-03-13:
为了便于其他读者的理解,我先交待一下路径分析 (path *** ysis) 的简单背景。
路径分析可以用作多种目的:一是将因变量之间有关系的的若干个回归模型整合在一个模型里,以助分析和表达的完整和简洁;二是在该整合模型中的各自变量对各因变量的“总影响”(total effects) 分解为“直接影响“(direct effects) 和“间接影响”(indirect effects),如果发现间接影响较大,那就有理论价值了(当然,如下所示,很难发现大的间接影响);三是通过直接影响和间接影响的比较来验证一个自变量是否为“中介变量”(mediating variable),即其直接影响不显著而间接影响显著(上面已说过,不容易发现间接影响、如果同时又要其直接影响不显著,那就更难了)。
如此看来,路径分析是个好东西(不好意思,赶了一回时髦)。其从1960年代兴起,1970-80年代已十分流行。我在Indiana念博士时,学院里的老师常用路径分析做研究。后来学了SEM(结构方程模型),才知道路径分析有“含测量误差”和“不含测量误差”两种。前者只研究自变量和因变量之间因果关系,即SEM中的structural model(结构模型)那部分(见图一),而后者则加上了各变量的CFA(验证性因子分析),也即SEM中的measurement model(测量模型)那部分(图二)。
如何写路径分析的指令(转载) 如何写路径分析的指令(转载)
好了,现在直接回答你的问题。问题1从字面上看,只涉及结构模型那部分,所以比较简单、容易。这种路径分析,不仅可以用LISREL、SAS或其它SEM软件,其实也可以用SPSS等通用统计软件,其结果是一样的。先说在SPSS中如何做。图一是我日前在“Confirmatory regression vs. hierarchical regression 一文中举的例子相仿(当时只用了三个公式,没有此图)。如前文中所说,因为该模型中有两个因变量(或内生变量,endogenous variables),所以需要建立两个回归模型,分别为公式一和二,其中变量名和系数名有些改动,系数分别记为b和g,是为了与LISREL用法一致,b表示一个内生变量(如W)对另一个内生变量(如Y)的影响、g表示一个外生变量(如X)对一个内生变量(如W或Y)的影响:
Y = b0 + g1X + b2W (公式一)
W = g0 +g2X (公式二)
在SPSS中,就按上述两个公式分别做一个回归分析。如果你习惯用SPSS指令的话,其syntax分别为:
Regression Dependent=Y/Enter X, W.
Regression Dependent=W/Enter X.
然后将两个回归分析所得到的回归系数填入图一,此时要用standardized Beta(即 B1、B2、G1分别为公式一和三中b1、b2、g1的标准化值),......>>
问题三:路径分析的介绍 路径分析是常用的数据挖据方法之一, 是一种找寻频繁访问路径的方法,它通过对Web服务器的日志文件中客户访问站点访问次数的分析,挖掘出频繁访问路径。LBS不仅需要能确定目标的地理位置,还需要能实现对地理环境的有效分析。网络分析是地理环境分析中的一个重要技术,包括最短路径分析、网络流分析等内容。在网络分析中,最短路径分析是最基本的,也是最关键的技术,一直是计算机科学、运筹学、交通工程学、地理信息学等学科的一个研究热点。如今,最短路径分析算法已经非常成熟,如以Dijkstra算法为代表的宽度搜索方法、动态规划方法等。
问题四:软件测试中路径分析法是什么 熟悉测试理论的人都知道,路径覆盖是白盒测试中一种很重要的方法,广泛应用于单元测试。那么基于路径覆盖的分析方法是不是只能应用于单元测试呢,能不能将其推而广之呢。一般而言,在单元测试中,路径就是指函数代码的某个分支,而实际上如果我们将软件系统的某个流程也看成路径的话,我们将可以尝试着用路径分析的方法来设计测试用例。采用路径分析的方法设计测试用例有两点好处:一是降低了测试用例设计的难度,只要搞清了各种流程,就可以设计出高质量的测试用例来,而不用太多测试方面的经验;二是在测试时间较紧的情况下,可以有的放矢的选择测试用例,而不用完全根据经验来取舍。下面就具体的介绍一下如何用路径分析的方法编写测试用例。
首先是将系统运行过程中所涉及到的各种流程图表化,可以先从最基本的流程入手,将流程抽象成为不同功能的顺序执行。在最基本流程的基础上再去考虑次要或者异常的流程,这样将各种流程逐渐细化,这样既可以逐渐加深对流程的理解,还可以将各个看似孤立的流程关联起来。完成所有流程的图表化后就完成了所有路径的设定。
找出了所有的路径,下面的工作就是给每条路径设定优先级,这样在测试时就可以先测优先级高的,再测优先级低的,在时间紧迫的情况下甚至可以考虑忽略一些低优先级的路径。优先级根据两个原则来选取:一是路径使用的频率,使用越频繁的优先级越高;二是路径的重要程度,如果失败对系统影响越大的优先级越高。将根据两个原则所分别得到的优先级相加就得到了整个路径的优先级。根据优先级的排序就可以更有针对性的进行测试。
为每条路径设定好优先级后,接下来的工作就是为每条路径选取测试数据,构造测试用例。一条路径可以对应多个测试用例,在选取测试数据时,可以充分利用边界值选取等方法,通过表格将各种测试数据的输入输出对应起来,这样就完成了测试用例的设计。
问题五:结构方程模型 和路径分析的区别,原理是否一样? 路径分析是结构方程模型的一部分,完整的结构方程模型包含两部分:1、测量模型,研究因子和指标的关系,也就是一般我们说的验证性因子分析;2、因果模型,也就是路径分析,研究的是因子之间的关系。另外提一下,狭义上的路径分析指的是把显变量直接当做潜变量的因果模型。
因此,结构方程模型和路径分析其实是概念与子概念的关系。他们所涉及的统计学原理自然是一样的,只不过如果是狭义上的路径分析,那么默认变量无测量误差,其计算的精确度及误差的控制是不如完整的结构方程模型的。
问题六:路径分析的最优路径分析模型 最优路径分析是地理网络分析中最常见的基本功能,也是LBS需要具备的功能。地理网络中的最优路径是指在地理网络中满足某些优化条件的一条路,包括距离最短或最长、通行时间最短、运输费用最低、行使最安全、容量最大等。
问题七:SPSS如何做路径分析 路径分析用amos,amos以前是spss的一个模块,现在分离出去了,要单独安装,现在出最新的spss21.0和amos21.0,先装spss,再装amos,装amos的时候还会提醒安装最新的.NET Framework,先装好就ok了。
SPSS AMOS 21.0是一款使用结构方程式,探索变量间的关系的软件 ,轻松地进行结构方程建模(SEM) 。快速创建模型以检验变量之间的相互影响及其原因,比普通最客服乘回归和探索性因子分析更进一步 。
Microsoft .NET Framework是用于Windows的新托管代码编程模型。它将强大的功能与新技术结合起来,用于构建具有视觉上引人注目的用户体验的应用程序,实现跨技术边界的无缝通信,并且能支持各种业务流程。
问题八:因果路径分析用什么软件 两款比较流行的软件是lisrel和Amos
问题九:如何做用户行为路径分析 用户行为一直是网站优化关注的重点,分析网站用户行为,对提高网站的转换率帮助很大,至少你知道用户需要什么,接下来你应该怎么去满足这些行为。目前几乎90%上的网站几乎都销售为主,无论是产品还是服务,都的为了销售。当然还有一些是需要用户参与网站的某些调查,但是一般专门为这些行为做的网站还是比较少, seo培训下面主要分析用户的购买行为。在做SEO的朋友当中,可能有50%不会卖东西,但是我相信100%的都会买,我们这里也是研究购买者的行为,所以每个人都很可以平等参与,从购买者的角度去分析。如果你对某一些方面的产品感兴趣。但是不知道拥有这种功能的产品名称甚至具体型号,这在营销专家来看,是属于“初级需求”,他们使用经济术语“需求” 来描述当一个购买者对某物质的需要,处于这一阶段的用户遇见了问题,但是不知道是否有相关产品或服务可以帮助他们解决;或者在很多方案中却不知道如何选择 (选择性需求);甚至是知道某一产品能解决自己的问题,正在需找某一喜好的品牌或适合自己的某一型号。这就是购买者行为。初级需求用户行为一个处于“初级需求”的用户,在他准备进入“选择性需求”之前,他可能正在努力寻找关于可以解决他目前问题的有效方法,这个时候他对产品并不敏感,而对信息特别喜好。
在用户研究工作中,如何让自己的数据和结论更有说服力,是很重要的问题。最近将自己积累的用研信度和效度的笔记整理一下,罗列在文中,希望对大家有所帮助。一、调查的质量取决于调查的信度和效度。
信度主要指测量结果的一致性、稳定性。也就是说结论和数据是否反映了用户最真实稳定的想法。用户在回答问题的时候,往往会受到环境、时间、当时当地的情绪影响,而作出并不真实的想法,即会有随机误差。信度就是衡量这种随机误差对用户想法的影响大小。
效度是指多大程度上测量了你想要测量的东西。
对某个产品用研,我们现在用得最多是用户访谈、问卷调查和可用性测试。而在这几个过程中都会涉及信度和效度的问题。
二、用户访谈中的效度和信度
1. 访谈不能仅仅局限于用户
任何一个产品项目都会受到市场环境、公司战略、技术力量、平台规范和流行趋势等各个方面的影响。对某一产品的需求,可能来自用户、产品、技术、交互以及视觉。不同岗位人员看待产品的角度不一样,侧重点也不一样,找多个角色有助于把需求找全,不遗漏,所以必须提前了解他们的需求。这样才能使我们的研究更有针对性、全面性、有用性。有用程度、全面程度是效度的重要组成部分。
2. 巧妙的选择访谈用户
通常,前期深度访谈的用户数量不会太多,所以用户条件一定要把握适当。反馈的问题才能全面、合理、有用。
比如是做Android平台上的某一软件。
首先Android新手用户和熟练用户都是必须的,熟练用户更能反映android用户习惯性操作方式、平台特点、以及长期使用过程中积累的意见和建议;而新手用户可以更好的反映该平台哪些地方存在学习困难,从而通过我们的设计帮助用户去降低学习成本。
其次非Android平台用户也是必须的,可以从侧面了解他们不用Android的原因。从而帮助产品挖掘更多潜在用户提供方向。
人口学信息(学历、职业、性别、年龄)要覆盖全面。不同属性的用户看重地方会存在差异。需求也会不一样。
包含竞品用户。通过了解用户对竞品的评价,可以提炼出竞品的优劣势,从而为增强产品竞争力提供方向。
3. 一定要有专家
专家是重要的信息携带者。李乐山教授说专家有三类,用户专家、制造专家、市场销售专家,他指出判断某人是否是专家的标准是:(1)能够熟练使用一种产品;(2)能够比较同类产品;(3)有关的新知识容易整合到自己的知识结构中;(4)具有10年专业经验;(5)积累大量经验并且在使用经验方面具有绝招;(6)了解有关的历史(该产品设计史、技术发展史等);(7)关注产品发展趋势(8)知识链或者思维链比较长,提起任何一个有关话题,他们都能够谈出大量的有关信息;(9)能够提出改进或创新的建议,他们的创新或改进方案,其高水平体现在采用简单方法解决复杂问题。
对于互联网,专家应该指的是用户专家、开发专家、设计专家以及产品专家;他们凭借丰富的经验,系统全面的掌握行业同类产品、开发及设计模式、历史及发展趋势、专业水平极高。他们可以为我们提供很多我们始料未及的建议。这是保证用研过程,特别是对于后期问卷结构效度有很大的作用。
三、问卷调查与分析中的信度与效度
为了提高工作效率,问卷调查往往采用网络调查的方法,信度效度问题出现的可能性就更大。
最近看到一些满意度调查是采用量表加结构方程模型(SEM)的方式。我们看看哪些地方可能会出现信度和效度的问题。
1. 理论模型支持
由于SEM进行的是验证性因子分析,是检验而不是探索新的模型,因此,整个因果关系的假设必须有强有力的理论支持和严密的逻辑框架。包括模型中变量关系的假定、指标的选取、甚至测度项的表达方式等。如果最终输出的模型和理论模型结构不符,那么该模型是没有任何说服力的。比如用ACSI模型作为满意度的理论模型时,是否真的按照感知质量、感知价值、顾客期望这几个层面去设计问卷?
2. 保证份量
普通抽样调查中原则上是越多越好,但遇到目标用户较少的情况,只要保证一定的条件就ok的,样本量受到置信区间、抽样误差范围的影响,可根据实际的况测算出最小样本量。常用的公式是:
14N=Z2蟽2d2′<</span>(N为样本量、Z为置信区间、d为抽样误差范围、 14蟽’<为标准差,常取0.5)
但对于结构方程模型大样本是必须的,SEM中涉及的变量众多,变量间的关系很复杂交错,小样本量会导致模型不稳定,收敛失败进而影响模型中参数。朱远程等[1]在文献中指出,当样本低于100时,几乎所有的结构方程模型分析都是不稳定的,大于200以上的样本,才称得上一个中型样本。若要得到稳定的结构方程模型结构,低于200的样本数量是不鼓励的。有些学者将最低样本量与模型变量结合在一起,建议样本数至少应为变量的十倍,这一规则经常被引用。模型中变量越多,对大样本的要求就越高。
3. 变量需遵循原则
a. SEM模型中各变量的函数关系要是线性的,否则是不能用回归计算路径系数的。
b. 在使用最大似然估计法时,变量一定要是多元正态分布的,这就要求指标要呈正态分布,否则就要对指标进行正态处理才行。
c. 变量间的多重共线性程度要低,否则路径系数会有很大误差。
d. SEM建立的过程中会不断的修正才能得到比较完美的模型,比如因子分析时,若发现某一测度项对应的因子载荷过小,就会人为的将该测度项删除,但是若模型建立之后,一些变量对应了4~5个测度项,一些变量只剩下1~2个测度项,那么我们就需要思考只有两个测度项的变量是否被完全解释,这仅有的两个测度项就全面真实的反映该变量么?如果是这样,就算KMO、Bartlett、因子载荷都通过了,效度也是难以保证的。所以问卷前期需要反复的预调研,不断的对问题进行修正,而不是随意的人为删除。我学生时代对淘宝满意度进行调查时,就犯了类似的错误,模型中的“互动性”片段,互动性由四个变量衡量,其中“双向沟通性”一开始设计的时候由5个测度项支持,但是因子分析检验通不过,就直接将因子载荷比较小的客服、论坛、淘江湖三者去掉了,最后虽然在数据上通过了信度效度检验,但是只有阿里旺旺、留言板这两个测度项支持是绝对不能解释“双向沟通性”的。
4. 数据质量是根源
要使模型结构稳定有效,首先要保证数据质量,反复检验问卷的信度。
a. 不同时间的一致性。
在设计问卷时,可以将同样的问题对同一个人重复测试,如果这两道题得到的答案是不一致的,相关系数(Pearson r)小于0.7,那么这份问卷的稳定信度就值得考量。
假如问卷样本足够大,可以一分为二(每一个样本也要保证足够样本量),分别建立两个模型;通过对比两个模型中参数的差异,便可以检验该模型的稳定性和适用性。如果两者差异太大,就说明模型本身是有问题的。
b. 不同形式的一致性
用内容等效但表达方式不同的两份问卷调查,检测两者的等效信度,比如Gamma系数。
c. 内在一致性
问卷中相关的问题为同样的目标服务,他们在逻辑一致,也就是同质的。首先要测量每个测度项与总体的相关性(item-total correlation),然后再测量同一变量下相关问题间的同质性,而对于不同的提问方式选择对应的方法:比如,对于李克特量表方法,就用Chronbach系数检验;在基础研究中,信度至少应达到 0.80 才可接受,在探索性研究中,0.70 可接受,0.70-0.98 为高信度,小于0.35 为低信度。对于是非题则采用kuder-Richardson系数检验。在进行内在一致性检验时,要看题目选项是否反序,如果两道题都是问“对该产品是否满意”,一道7代表满意,1代表不满意;另一道1代表满意,7代表不满意,这样就会影响信度。遇到这种情况要提前人为调整过来。
5. 看得更远一点
问卷结论不仅要解决当前的问题和需求,还有具有一定的预测作用,市场是变化的,当前的目标用户不一定就是未来的(或者下一个版本的)目标用户,比如目标用户的收入可能有增加的趋势,某一平台的使用率在快速提高,当前的满意度模型可能在一个月之后就不适用了(比如新功能点的出现)。
假设我们要对QQ影音进行满意度调查,现在建立了一个满意度模型,但若下个月QQ影音中多了一个重要的功能,对整个满意度的提升产生了很大作用,那么,模型中各项的路径系数会不会产生变化?该模型在下个月可能就不适用了,造成的后果就是当前的满意度值与下个月的满意度值没有可比性了,很多工作也就白费了。所以,诸如满意度模型这样的研究,是需要反复调查,长期对该满意度模型进行监控和修正,以求得到最稳定的模型,就可以让模型会具有很预测和比对作用啦。
6.关注细节
a. 问卷设计中题项表述不能出现歧义、避免太专业词汇以及诱导词汇
b. 选项间要有明确的区分(互斥)
c. 避免遗漏,“其他”选项是必须的,而且最好配有输入框,记忆中,每次问卷调查中都能从“其他”选项中获取大量信息。
d. 一般题项不能太多,设置问题选项的时候,尽可能的让选项随机显示,特别是在选项较多的情况下。
e. 数据处理过程中删除重复项矛盾项之外,最好能统计到用户填写问卷的时间差。如果整个填写的时间极短,完全可以判定用户没有认真填写。
f. 极端的、离群的选项可以考虑将其删除。
四、可用性测试中的信度与效度
首先保证,主持人的态度亲切、测试前随意聊聊彼此熟悉、测试提纲清晰全面。另外,以下几点也对保证测试的信度和效度很重要。
1. 不要忽略异想天开
脑暴中要求彼此不能批评,在进行访谈或测试中,也不能对用户某些操作做出评论,否则用户很有可能隐藏内心真实的感受。关注并记录用户出错,但是用户出错时态度要中立。
通常,用户在体验的真实的原型后,会产生很多看似异想天开的诉求,有些虽然在当前不能实现,但是会为未来发展提供很多思路和方向。所以,我们要积极鼓励用户进行思维发散。
2. 前后验证、竞品比对
在测试完成后,可以加上一个总体调查问卷,一者让用户对自己体验的各个功能点有一个回顾和比较,同样也可以验证用户体验过程的态度和最终的态度是否具有一致性。如果存在不一致,应该进一步追问理由,确定用户的真实想法。
测试时,让用户体验竞品,并作出比较,也是发现有效信息的途径。
3. 敏锐观察
测试中,除了按照已定的提纲进行问答之外,过程中还要敏锐的观察用户一些细微的表情、停留、思考。不但要了解用户对个功能点如何评价的,还要知道用户做某一任务过程中,是怎么思考、计划、实施的,用户的第一反应、习惯性的操作、思维路线的作用远远大于单纯的评价。用户任务完成之后,要追问用户如此操作的原因。
4. 记录原话并习惯性确认
测试结论要有用户的原话支持,不能轻易的改变用户的表述。和用户交流过程中,要习惯性的问:“请问你的意思是……?”“我这样理解你的意思,你看对么……?”以保证测试结论的效度。
5. 必要时进行入户调查
首先,入户调查会大大减少外界环境的影响,用户在自己的空间中,会更真实的反映常见的问题。其次,入户调查一般是在用户画像提取出来之后,按照用户画像描述的属性,有意识有针对性去挑选具有某些典型属性的对象进行深入、全面、系统调查(典型调查),比如某一产品的目标用户,他们反映的问题,代表性强,往往有以一当十的功效,避免了非目标用户信息造成的干扰。
6. 用户条件与数量
参与测试用户根据目标用户特征选择。
一般衡量测试是否需要继续进行的方法是:看是否发现新的问题,如果有新的问题,就应该继续,反之,可以结束。
Neilson研究结果表明,5名用户的测试可以发现85%的可用性问题。而在我们在以往的可用性测试经验中,用户数一般定为6个,基本上能发现全部问题。当然任何数字都只是一个参考,用户数量最好根据具体的测试情况(衡量时间、资源、投入产出比)而定。总之,关键在于是否有新的问题出现。
p值就是路径系数的显著性水平,路径系数固定为1,只是设置了一个参考路径,并不影响标准化路径系数的估计。 SPSS AMOS 21.0是一款使用结构方程式,探索变量间的关系的软件 轻松地进行结构方程建模(SEM) 快速创建模型以检验变量之间的相互影响欢迎分享,转载请注明来源:夏雨云
评论列表(0条)