第一步,要知道什么是分位数。分位数也叫分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点。常用的有中位数(即二分位数)、四分位数、百分位数等。
第二步,生活中,最常见有中位数(也就是二分位数)、四分位数、百分位数等等。
第三步,对于二分位数,也就是中位数,可以通过把所有观察值高低排序后,找出正中间的一个作为中位数。注意观察法适用于有限的数集。
第四步,如果观察值有偶数个,则中位数不唯一,通常取最中间的两个数值的平均数作为中位数,即二分位数。
第五步,四分位数的计算方法就是即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
第六步,对于四分位数我们也要区分好第一四分位数、第二四分位数、第三分位数等。
注意二分位数使用观察法时,适用于数集有限,并数量较少。
分位数回归思想的提出至今已经有近30多年了,经过这近30多年的发展,分位数回归在理论和方法上都越来越成熟,并被广泛应用于多种学科中。它对于实际问题能提供更加全面的分析,无论是线性模型还是非线性模型,分位数回归都是一种很好的工具,它对一般回归模型做了有益的补充。
分位数亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。分位数指的就是连续分布函数中的一个点,这个点对应概率p。若概率0一天,老班气冲冲地走进教室对我们说:“太不像话了,这次考试竟然有60%的同学不及格!” 老师这句话里就有一个分位数的应用,60为0.6分位数。什么是分位数?
在此我不想给出书上的定义,因为有那么多的同学发问怎么求分位数,正是因为不理解书上所写,好,怎么才能快速理解分位数呢?
一句话,分位数就是用概率作为依据将一批数据分开的那个点。
一、你首先得有数据
分位数是数据分析中常用的一个统计量,经过抽样得到一个样本值,以学生成成绩为例:
60,70,87,56,35,64,28,84,89,65.
二、p分位数
如果想在这10位同学中淘汰至少35%,同时让至少65%的同学晋级,你怎么选?
当然的想法是找一个数,小于等于这个数的同学至少有35%,大于等于这个数的同学至少有65%, 我们就把这个数记为0.35分位点,记为x0.35 ,见下图:
要想顺利地找到这个数,需要将数据排序:
28, 35, 56, 60,64, 65, 70,84, 87, 89
排序后上面十个数分别记为x(1)到x(10).
至少有35%,即至少有10*35%=3.5个学生,所以x0.35 ≥60=x(4)
至少有65%,即至少有10*65%=6.5个学生,所以x0.35≤60=x(4)
故二者取交集,令x0.35 =60.
以上是np不为整数的情况,如果np为整数,不妨设p=0.3
至少有30%,即至少有10*30%=3个学生,所以x0.3 ≥56=x(3)
至少有70%,即至少有10*70%=7个学生,所以x0.3≤60=x(4)
二者取交集,有两个值,一个是56,一个是60,如何选取?就取二者的平均值:
x0.3=(56+60)/2=58.
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)