如何检验两组回归系数之间的差别

如何检验两组回归系数之间的差别,第1张

例如,把性别作为调节变量,在AMOS里就可以用多组比较的方法,从结果报告的P值可以看出模型对男女是否等同;如在spss里对男女分别做回归,该如何分别回归,如何比较两个方程所得标准回归系数是否有差异呢? 举例: 女生组 y1=a1+b1x+c1z; 男生组 y2=a2+b2x+c2z。 可以用的方法有---- 1. 比较两个回归系数之间差别的公式为:(b1-b2)/se12,其中b1和b2是被比较的回归系,se12是两者的Join Standard Error(联合标准误差),其结果是一个以自由度为n-k-2的t分布(其中n是样本量、k是原来的自变量数,本案中为x和c两个)。可是,在SPSS(其实是任何OLS回归)中,你如果将男女分成两个样本分布做回归可以得到b1和b2,却得不到联合标准误差se12(因为b1和b2出现在不同的模型中国),所以无法用到上述公式。 2. SEM(包括AMOS)是通过比较男女样本的拟合度之差别来比较两组回归系数之间的等同性。不过,SEM的这种做法是有代价的:它将一个总样本分成两个小样本,其结果是降低了Power of Analysis (统计分析效力),从而在没有降低犯Type I的误差的同时又提高了犯Type II误差。 3. 较合理的方法是男女不分组、保留在同一样本内,将性别转换成dummy变量,再生成性别与你想比较的自变量(如X)的交互变量(如X*性别),这就是我和小彭各自发的前贴的意思。也就是说,将你的公式1(或公式2)中改成: Y = a + bX + cZ + dS +eSX + fSZ 其中S是性别(假定男=0、女=1),SX是性别与X的交互变量、SZ是性别与Z的交互变量。如果男女在S上的取值(即0和1)代人该公式,就可以分解成以下两个公式(注意:样本还是一个): 女生组(S=1):Y = a + bX + cZ + d1 +e1X + f1Z = (a+d) + (b+e)X + (c+f)Z 男生组(S=0):Y = a + bX + cZ + d0 + e0X + f0Z = a + bX + cZ 如果d是显著的(即男女本身之差别),就说明女生在Y上的截距(即平均值)比男生高d个单位(见以下左右图的截距);如果e是显著的(即性别对X与Y之关系的影响),就说明女生的X斜率比男生大e个单位(见左下图红线的斜率);如果f是显著的(即性别对Z与Y之关系的影响),就说明女生的Z斜率比男生大f个单位(见右下图紫线的斜率)。 注:上两图应该是合并在一个三维图,但是不容易看清楚,所以分开来画。

组间系数差异检验的结果:直接看最后一个表的Sig(双侧),可以看到是.000,说明差异显著,一般Sig值小于.05就可以认为是显著了,这个配对T检验的结果表达的时候就说E1和E2在.01水平上差异显著即可。

SEM(包括AMOS)是通过比较男女样本的拟合度之差别来比较两组回归系数之间的等同性。不过,SEM的这种做法是有代价的:它将一个总样本分成两个小样本,结果是降低了Power of Analysis (统计分析效力),从而在没有降低犯Type I的误差的同时又提高了犯Type II误差。

无效假设

显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的几率(P)水平的选择。所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。经统计学分析后,如发现两组间差异是抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。

适用于数据不服从正态分布的情况

t 检验成员都有非参数检验的「对应版本」:

单样本 t 检验和成对样本的 t 检验对应于威尔科克森符号秩检验,以下简称 符号秩检验

独立样本的 t 检验对应于曼-惠特尼 U 检验(也叫做曼-惠特尼秩和检验),下面简称 秩和检验

秩和检验是非参数检验中,用来比较两个独立样本数据的检验方法。秩和检验用 U 统计量来检验原假设。

秩和检验并没有用到一个数据的绝对数值,而只用到了数据的相对大小——秩。

结论不会受个别极端数据值干扰

秩和检验并不要求数据正态

秩和检验还适用于代表等级的定序变量

如果数据确实来自正态分布的总体,如果用了秩和检验而不是 t 检验,会降低统计功效。即实际上有显著差异的两组数据更容易被误判为没有差异。

直接检验两组数据的均值是否相等,因此结果有着直观的解释,而秩和检验是检验一组数据大于另外一组数据的概率是不是大于 0.5,这并不直观。

t 检验是为了对一组或者两组个体的某个连续变量的平均值进行统计推断。

非参数检验则是中位数。

极端地说,不管与原假设的差别有多小,只要样本量足够大,p 值总会达到显著的水平。

一个很低的 p 值,可以源于很大的效应,也可以来自很小的效应但很大的样本量,还可能是效应大、样本量也大。

我们可以把平均值与标准值之差除以样本的标准差。这样一来,效应大小就是一个综合了平均值的差异及其不确定性的数量了,称为 Cohen 氏 d 值:

Cohen 氏 d 值使我们能够把来自完全不同的数据的若干 t 检验的效应大小放在同一个尺度上比较

Cohen 氏 d 值的发明人 Jacob Cohen 曾经提出过一条经验准则,把 d 值为 0.2,0.5 和 0.8 的效应分别称为小、中、大效应

由于成对样本和独立样本 t 检验都涉及两个样本,因此这个标准差是结合了两个样本的「合并标准差」(pooled standard deviation)

效应大小、显著性水平(α,通常为 0.05)、统计功效(1-β,通常为 0.8)和样本量(n)只要知道其中三个,就能求出第四个

使用G*Power软件

不会受到测量单位和尺度的影响

用一个范围或区间来表示效应大小及其不确定性。用统计学的术语来说,这叫做 区间估计 (interval estimation)。

而这个范围或区间本身,被称为 置信区间 (confidence interval)。

如果我们重复从同一个总体中获得样本,用同样的方法构建出许多用于估计效应大小的区间,这些区间中包含真实值的比例便是区间估计的 置信度 (confidence level)。

一般选用 95% 的置信度,从而与 p=0.05 的显著性水平相对应。

一个 95% 置信区间并不意味着真实值落在这一个区间内的概率为 95%,而是说如果重复许多次实验,每个实验按这样的方法构造出一个 95% 置信区间,在这所有的置信区间中,将有 95% 的区间包含了真实值。

如果总体标准差已知,那么样本均值的分布仍然是个正态分布,但是它的标准差将会是总体标准差根据样本量(在刚才的例子里是 10)按一定比例缩小所确定的值;如果总体标准差未知,那么样本均值的分布就变成了一个 t 分布,它的具体参数由样本均值、样本量、样本标准差三者共同确定。

八股文:

用单样本 t 检验对比了格格巫包子的重量与标准包子重量(50g)的区别,发现格格巫包子的重量(平均值=45g,标准差=3g,95% 置信区间 [ 43.8g,46.2g ] )与标准值 50g 有显著区别( t (25)=4.2, p <0.001 )。

信息量的角度,散点图>箱线图>柱状图

标准差 ( standard deviation, 缩写为 sd 或者 std )

标准误差 (standard error of the mean,缩写 se 或者 sem )

后者是前者除以 √n,这里 n 是样本量

两组数据各自进行某个检验,其显著性的差别并不代表这两组数据的差别具有显著性

只要数据的结构是有「嵌套」( nested )关系的,都会具有相互不独立的特征。

比方说,我们希望分析江苏省居民的可支配收入,同时我们还记录了所有江苏省居民住在哪个小区、哪个城市, 这样就形成了一个具有嵌套关系的样本,因为每个小区都包含了若干个居民数据点(居民被「嵌套」在小区里),而每个城市又包含了若干小区(小区被「嵌套」在城市里)

解决方案

第一,我们可以选定嵌套关系中的某一层,以该层为单位将不同的数据点取平均,这样一来,这一层的每个单元就只有一个数据点,在有些条件下它们之间可以认为是相互独立的。

在上面这个例子里,格格巫可以先把每只小鼠的 3 个血压降低值取平均,然后再对两组(每组 10 个数据点)数据做 t 检验。这样做的优点是让我们回到基本的 t 检验等方法,容易掌握和解读,但缺点则是损失了原始数据中的一部分信息(每只小鼠重复测量的波动性的差别),因而会在一定程度上降低统计效能。

而更好、也更复杂的解决方法,是使用多层模型( multilevel models,又称分层模型 hierarchical models )


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/350833.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-08
下一篇2023-05-08

发表评论

登录后才能评论

评论列表(0条)

    保存