https://www.codetd.com/article/916129
软件AMOS可以做
https://mp.weixin.qq.com/s?__biz=MjM5MTI5MDgxOA==&mid=2650098738&idx=1&sn=319fcc4198fbcd36fc30fd1329e27bf0&chksm=beb6289f89c1a189115d96bb0f9bc3114a752f9bf1fed4c9979b2e965322d8e38c60844316de&scene=21#wechat_redirect
https://mp.weixin.qq.com/s?__biz=MjM5MTI5MDgxOA==&mid=2650098759&idx=1&sn=0099b81e77a2f8b6324e88a5b49773ed&chksm=beb628ea89c1a1fcdb4c068466e6f099e0bd1af0909bbc538aca4247477978b4b52b3b9aa036&scene=21#wechat_redirect
https://www.jianshu.com/p/d698dc099dec
https://www.jianshu.com/p/e0938fb35c45
https://blog.csdn.net/yjj20007665/article/details/66967966
χ2 卡方拟合指数 检验选定的模型协方差矩阵与观察数据协方差矩阵相匹配的假设。原假设是模型协方差阵等于样本协方差阵。如果模型拟合的好,卡方值应该不显著。
RMR 是残差均方根。RMR 是样本方差和协方差减去对应估计的方差和协方差的平方和,再取平均值的平方根。RMR应该小于0.08,RMR越小,拟合越好。
RMSEA 是近似误差均方根 RMSEA应该小于0.06,越小越好。
GFI 是拟合优度指数,范围在0和1间,但理论上能产生没有意义的负数。按照约定,要接受模型,GFI 应该等于或大于0.90。
CFI 是比较拟合指数,其值位于0和1之间。CFI 接近1表示拟合非常好,其值大于0.90表示模型可接受,越接近1越好。
同时要求样本和指标之间有一个最低数量比例
因为A是有序分类指标,但是Pearson卡方检验其实并不针对有序分类指标,所以对有序变量并不敏感。可以试试用Kendall's Test验证一下,这个是一个对有序分类变量更敏感的假设检验。
如何验证多组数据之间有⽆显著差异利⽤⽅差分析和卡⽅分布验证多组数据之间的某些属性有⽆显著性差异,对于连续性属性可以⽤⽅差分析,对于离散型属性可以⽤卡⽅检验。
⽅差分析
单因素⽅差分析
通过箱线图可以⼈⾁看出10组的订单量看起来差不多,为了更科学⽐较10组的订单量有⽆显著差异,我们可以利⽤⽅差分析
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
model = ols('orders~C(label)',data=need_data).fit()
anova_table = anova_lm(model, typ =2)
print(anova_table)
结果显⽰,p值为0.62⼤于0.05,不能拒绝原假设,所以这10组的订单量分布没有显著差异。
卡⽅检验
如果是⽐较多组之间的⾮连续值指标是否存在差异呢?
如检查上⾯10组的男⼥⽐例是否存在显著差异
计算各组观察频数
data2=data1.melt(id_vars=['性别'],value_name='观察频数')
data2.head()
计算总体的男⼥⽐例
rate=(data2.groupby(['性别'])['观察频数'].sum()/data2.groupby(['性别'])['观察频数'].sum().sum()).reset_index() rate.columns=['性别','rate']
rate
计算各组⽤户总数
group_sum=data2.groupby(['组别'])['观察频数'].sum().reset_index()
group_sum.columns=['组别','组内⽤户数']
group_sum
计算卡⽅值
import math
data3=pd.merge(data2,group_sum,on=['组别'],how='left')
data3=pd.merge(data3,rate,on=['性别'],how='left')
data3['期望频数']=data3['组内⽤户数']*data3['rate']
data3['卡⽅值']=data3.apply(lambda x: math.pow((x.期望频数-x.观察频数),2)/x.期望频数,axis=1)
data3.head()
本案例的⾃由度为(10-1)*(2-1)=9,选取显著性⽔平为0.05,查卡⽅分布表得临界值为18.31因为7.01<18.31,所以不能拒绝原假设,即各组的性别分布不存在显著性差异。
参考链接
¥
5.9
百度文库VIP限时优惠现在开通,立享6亿+VIP内容
立即获取
如何验证多组数据之间有无显著差异
如何验证多组数据之间有⽆显著差异
利⽤⽅差分析和卡⽅分布验证多组数据之间的某些属性有⽆显著性差异,对于连续性属性可以⽤⽅差分析,对于离散型属性可以⽤卡⽅检验。
⽅差分析
单因素⽅差分析
通过箱线图可以⼈⾁看出10组的订单量看起来差不多,为了更科学⽐较10组的订单量有⽆显著差异,我们可以利⽤⽅差分析
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)