次序统计量及其分布

上传人:ldj****22 文档编号:48518816 上传时间:2018-07-16 格式:PPT 页数:24 大小:608.50KB
返回 下载 相关 举报
次序统计量及其分布_第1页
第1页 / 共24页
次序统计量及其分布_第2页
第2页 / 共24页
次序统计量及其分布_第3页
第3页 / 共24页
次序统计量及其分布_第4页
第4页 / 共24页
次序统计量及其分布_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《次序统计量及其分布》由会员分享,可在线阅读,更多相关《次序统计量及其分布(24页珍藏版)》请在金锄头文库上搜索。

1、5.3 次序统计量及其分布定义定义 5-3-1: 设为取自总体X的样本, 将其按大小顺序排序 则称 X(k) 为第 k 个次序统计量( No.k Order Statistic) 特别地,称(5-3-1)为最小顺序统计量(Minimum order Statistic) 称(5-3-2)为最大顺序统计量(Maximum order Statistic) 。例5-3-1:设总体X的分布为仅取 0, 1, 2 的离散均 匀分布,其分布列为x 0 1 2p现从中抽取容量为 3 的样本,其一切可能取值有 种,现将它们以及由它们所构成的次序统计量 的一切可能值列在表中(P243),由此可给出的分布列如下

2、:X(1)012 P19/277/271/27X(2)012 P7/2713/277/27X(3)012 P1/277/2719/27可见这三个次序统计量的分布是不相同的。 进一步,我们可以给出两个次序统计量的联合分布 ,如 x(1) 和 x(2) 的联合分布列为x(2) x(1) 01207/279/273/27 104/273/27 2001/27 易于看出不等于即 x(1) 和 x(2) 是不独立的。次序统计量的分布(一)单个次序统计量的分布定理 5-3-1:设总体X的密度函数为 p (x) ,分布函数 为 F (x) ,x1, x2, , xn 为样本,则第 k 个次序统计 量 x (

3、k) 的密度函数为(5-3-3) 证明: 对任意的实数 x ,考虑次序统计量 x(k) 取值落 在小区间 (x , x + x 内这一事件,它等价于“样本容 量为 n 的样本中有 1 个观测值落在区间 (x , x + x 之间,而有 k-1 个观测值小于等于 x ,有 n-k 个观测 值大于 x + x ”,其直观示意图见下图 5-8 .x x+xn-kk - 11图 58 x (k) 的取值示意图样本的每一分量小于等于 x 的概率为 F (x) , 落入区 间 ( x , x + x 概率为F(x+ x)-F(x),落入区间 (x+ x, b的概率为 1-F(x+x) ,而将 n 个分量分

4、成这 样的三组,总的分法有种,于是,若以 Fk (x) 记 x (k) 的分布函数,则由多 项分布可得两边同除以 x , 并令 x0 , 即有推论1 :最大次序统计量 x (n) 的概率密度函数为推论2 :最小次序统计量 x (1) 的概率密度函数为(5-3-4)(5-3-5)例 5-3-2 :设总体X 的密度函数为现从该总体中抽得一个容量为 5 的样本,试计算解: 我们首先应求出 x (2) 的分布。由总体密度函数 不难求出总体分布函数为由公式(5-3-3)可以得到 x (2) 的密度函数为于是(二)多个次序统计量的联合分布仅讨论任意二个次序统计量的情形。定理 5-3-2 :设总体 有密度函

5、数 f (x) , a x b , ( 同样可设 a = - , b = + ) 。并且 1 , 2 , , n 是取 自这这一总总体的一个样样本,则则其任意两个次序统计统计 量 (1) 0 可以推出则该分布参数为 ( n-1, 2 ) 的贝塔分布。总体分位数与样本分位数(一)总体分位数定义5-3-2: 设总体 X 的分布函数为 F (x) ,满足(5-3-7)的 x称为为 X 的 分位数,如下图图所示。几种常用分布 的分位数都在书后附表中可以查到。其中 N ( 0, 1 )是分布函 数表 ( x ) 反过来查,而其它几个分布,则是分别 对给出 的几个的常用值如 =0, 0.25, 0.05,

6、 0.1, 0.9, 0.95, 0.975 等等,列出相应分布对应值的 分 位点。图 5-9 给出了四种常用分布的 分位点表示 方法,其中 N ( 0, 1 ) 的 分位点通常记成 u . 图 5-9这里要注意到如下几个有用的事实。,要求的分位数 x, 可化成求1) 若N ( 0, 1 )的分位数 .此时,故从而2) 对于 T t (n) ,由密度函数的对称性可知即(5-3-8)(5-3-9)3)对于 F分布由于所以即(5-3-10)(二)样本分位数定义5-3-3:设为取自总体 X 的次序统计量,称 mp为样本 p 分位数。(Sample p Quantile )特别地,当 p = 时,称

7、mp 为样本中位数。(5-3-11)(5-3-12)对多数总体而言,要给出样本 p 分位数的精确分布 通常不是一件容易的事,但当 n+ 时,样本 p 分 位数的渐近分布有比较简单的表达式,我们这里不 加证明地给出如下定理。定理 5-3-4:设总体密度函数为 f (x) , xp 为其 p 分位 数, f (x) 在 xp 处连续且 f (x) 0 , 则当 n+ 时, 样本 p 分位数 mp 的渐近分布为特别地,对样本中位数有(5-3-13)例5-3-2: 设总体 X 为柯西分布,其密度函数为其分布函数为易知,是该总该总 体的中位数,即 x = . 设是来自该总体的样本,则当样本容量 n 较大

8、时,样本中位数 m 0.5 的渐近分布 为五数概括与箱线图次序统计量的应用之一就是五数概括与箱线图。在 得到有序样本后,容易计算如下五个值:最小观测值 x min = x (1) ;最大观测值 x max = x (n);中位数 m 0.5 ;第一 4 分位数 Q 1 = m 0.25第三 4 分位数 Q3 = m 0.75 。所谓五数概括就是指用这五个数来大致描述一批数 据的轮廓。例 5-3-4 :表 55 是某厂 160 名销售人员某月的销 售量数据的有序样本,由该批数据可计算得到:五数概括的图形表示称为箱线图,由箱子和线段组成 。图5-11 是该例中样本数据的箱线图,其作法如下下面就通过

9、一个具体的实例说明之。45747680879192939596 9899104106111113117120122122 124126127127129129130131131133 134134135136137137139141141143 145148149149149150150153153153 153154157160160162163163165165 167167168170171172173174175175 176178178178179179179180181181 188189189191191191192192194194 1941941951961971971981

10、98198199 200201202204204205205206207210 214214215215216217218219219221 221221221221222223223224227227 228229232234234238240242242242 244246253253255258282290314319表 511 某厂 160 名销售员的月销售量的有序样本(1)画一个箱子,其两侧恰为第一 4 分位数和第三 4 分位数,在中位数位置上画一条竖线,它在箱子 内,这个箱子包含了样本中 50% 的数据;45 144 181 212 319图 5-11 月销售量数据的箱线图(2)在箱子左右两侧各引出一条水平线,分别至最 小值和最大值为止,每条线段包含了样本中 25% 的 数据。 箱线图可用来对数据分布的形状进行大致的判断。 图 5-12 给出三种常见的箱线图,分别对应对称分布 、左偏分布和右偏分布。左偏 对称 右偏图 5-12 三种常见的箱线图及其对应的分布轮廓如果我们要对几批数据进行比较,则可以在一张纸 上同时画出这批数据的箱线图。图 513 是某厂 20 天生产的某种产品的直径数据画成的箱线图,从图 中可以清楚地看出,第 17 天的产品出现了异常。1 2 3 4 5 6 7 8 9 10 12 14 16 18 20304050

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号