双因素方差分析(Double factor variance analysis) 有两种类型:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。例如,若假定不同地区的消费者对某种品牌有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。这里介绍无交互作用的双因素方差分析
双因素方差分析的基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
下面用一个简单的例子来说明双因素方差分析的基本思想:
如某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下:
问该地克山病患者与健康人的血磷值是否不同?
患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
从以上资料可以看出,24个患者与健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均数的变异情况,则总变异有以下两个来源:
组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;
组间变异,即由于克山病的影响使得患者与健康人组的血磷值均数大小不等。
而且:SS总=SS组间+SS组内 v总=v组间+v组内,如果用均方(即自由度v去除离均差平方和的商)代替离均差平方和以消除各组样本数不同的影响,则方差分析就是用组内均方去除组间均方的商(即F值)与1相比较,若F值接近1,则说明各组均数间的差异没有统计学意义,若F值远大于1,则说明各组均数间的差异有统计学意义。实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表(方差分析用)获得。
因素A位于列的位置,共有r个水平,表示第j种水平的样本平均数;
因素B位于行的位置,共有k个水平,表示第I种水平的样本平均数。
x为样本总平均数
样本容量为 n = r x k 。
每一个观察值xij是由因素A的r个水平和因素B的k个水平所组成的总体中抽取的样本容量为1的独立随机样本。
在进行双因素方差分析时,假定在个总体中,每一个总体都服从正态分布,而且有相同的方差。
在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。例如饮料销售,除了关心饮料品牌之外,我们还想了解销售地区是否影响销售量,如果在不同的地区,销售量存在显著的差异,就需要分析原因。采用不同的销售策略, 使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位;在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解、接受该产品。若 把饮料的品牌看作影响销售量的因素A,饮料的销售地区则是影响因素B。对因素A和因素B同时进行分析,就属于双因素方差分析的内容, 双因素方差分析是对影响因素进行检验,究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著[2]。
双因素方差分析的前提假定:采样地随机性,样本的独立性,分布的正态性,残差方差的一致性。
双因素方差分析的方法多种多样,比如EXCEL,matlab,spss等等;具体实现以及实现后的表达的意思还需要大家共同来完成。
不是很准确,统计学中的所有统计分析,包括相关分析、因素分析等,首先需要保证变量之间理论或事实相关,否则研究将毫无意义。比如天气变化和股市变化之间也许你用统计分析也能找到相关性,但是这是毫无意义的无稽之谈而已。所以,如果双因素中某个因素对定量变量的现实相关性几乎为零,而只存在数字相关性的话,那么效果肯定将不如但因素。而如果两个分类变量对一个定量变量的都存在现实相关性的话,那么双因素方差分析的效果一般要优于但因素方差分析。
但是需要注意的是,如果采用无交互式双因素方差分析,其单个因素的方差分析结果与单因素方差分析结果一样。而交互式双因素方差分析结果则应该更能反映实际情况。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)