如何估计调查前的样本容量 简单易懂

如何估计调查前的样本容量 简单易懂,第1张

 在95%的置信度下,允许误差5%,样本容量需要400才能最大限度地满足调查要求。

样本容量又称“样本数”。指一个样本的必要抽样单位数目。在组织抽样调查时,抽样误差的大小直接影响样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素之一。因此,在抽样设计时,必须决定样本单位数目,因为适当的样本单位数目是保证样本指标具有充分代表性的基本前提。

样本容量的大小涉及到调研中所要包括的单元数。样本容量是对于你研究的总体而言的,是在抽样调查中总体的一些抽样。比如:中国人的身高值为一个总体,你随机取一百个人的身高,这一百个人的身高数据就是总体的一个样本。某一个样本中的个体的数量就是样本容量。注意:不能说样本的数量就是样本容量,因为总体中的若干个个体只组成一个样本。样本容量不需要带单位。

在假设检验里样本容量越大越好。但实际上不可能无穷大,就像你研究中国人的身高不可能把所有中国人的身高都量一量一样。

样本容量问题

回归分析是从已经发生的经济活动的样本数据中寻找经济活动中内含的规律性,它对样本数据具有很强的依赖性。样本的容量太小会导致参数估计值的大小和符号违反经济理论和实际经验。从建模需要来讲,样本容量越大越好,但收集与整理样本数据是一件困难的工作,因此,选择合适的样本容量,既能满足模型估计的需要,又能减轻收集数据的困难,是一个重要的实际问题。

(1) 最小样本容量

所谓“最小样本容量”,即从普通最小二乘法原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限,它是:n≥k+1

其中,k为解释变量的数目。

(2) 满足基本要求的样本容量

一般经验认为,当n≥30或者至少n≥3(k+1)时,才能满足模型估计的基本要求。

公式计算 N=Z^2×(P ×(1-P))/E^2,Z为置信区间、n为样本容量、d为抽样误差范围、σ为标准差,一般取0.5。

首先要说的是样本容量和样本数的概念,Cpk研究时应该说是样本数不小于30,而不是样本容量。比如使用单值移动极差图时,样本容量为1,但是在样本数(样本的个数)在30以上时也可以进行Cpk研究。至于为什么要样本数不小于30,其原理就是中心极限定理。

解释

样本容量的大小涉及到调研中所要包括的单元数。样本容量是对于你研究的总体而言的,是在抽样调查中总体的一些抽样。比如:中国人的身高值为一个总体,你随机取一百个人的身高,这一百个人的身高数据就是总体的一个样本。某一个样本中的个体的数量就是样本容量。注意:不能说样本的数量就是样本容量,因为总体中的若干个个体只组成一个样本。样本容量不需要带单位。

生存分析最小样本量有要求。最低样本量的确定以一定误差和置信水平下的最小样本数量表为主要依据。最小的样本量要求为分析中的任一单元格期望频数大于5。允许误差越小,所需样本量越大。当允许误差小于3时,再提高精度,所需样本量成倍增加。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/434550.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-28
下一篇2023-05-28

发表评论

登录后才能评论

评论列表(0条)

    保存