次序统计量及其分布上课讲义

上传人:yulij****0329 文档编号:129913579 上传时间:2020-04-24 格式:PPT 页数:24 大小:609KB
返回 下载 相关 举报
次序统计量及其分布上课讲义_第1页
第1页 / 共24页
次序统计量及其分布上课讲义_第2页
第2页 / 共24页
次序统计量及其分布上课讲义_第3页
第3页 / 共24页
次序统计量及其分布上课讲义_第4页
第4页 / 共24页
次序统计量及其分布上课讲义_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《次序统计量及其分布上课讲义》由会员分享,可在线阅读,更多相关《次序统计量及其分布上课讲义(24页珍藏版)》请在金锄头文库上搜索。

1、 5 3次序统计量及其分布 定义 定义5 3 1 设 为取自总体X的样本 将其按大小顺序排序 则称X k 为第k个次序统计量 No kOrderStatistic 特别地 称 5 3 1 为最小顺序统计量 MinimumorderStatistic 称 5 3 2 为最大顺序统计量 MaximumorderStatistic 例5 3 1 设总体X的分布为仅取0 1 2的离散均匀分布 其分布列为 现从中抽取容量为3的样本 其一切可能取值有 种 现将它们以及由它们所构成的次序统 计量的一切可能值列在表中 P243 次序统计量的分布 一 单个次序统计量的分布 定理5 3 1 设总体X的密度函数为p

2、 x 分布函数为F x x1 x2 xn为样本 则第k个次序统计量x k 的密度函数为 5 3 3 证明 对任意的实数x 考虑次序统计量x k 取值落在小区间 x x x 内这一事件 它等价于 样本容量为n的样本中有1个观测值落在区间 x x x 之间 而有k 1个观测值小于等于x 有n k个观测值大于x x 其直观示意图见下图5 8 图5 8x k 的取值示意图 样本的每一分量小于等于x的概率为F x 落入区间 x x x 概率为F x x F x 落入区间 x x b 的概率为1 F x x 而将n个分量分成这样的三组 总的分法有 种 于是 若以Fk x 记x k 的分布函数 则由多项分布

3、可得 两边同除以 x 并令 x 0 即有 推论1 最大次序统计量x n 的概率密度函数为 推论2 最小次序统计量x 1 的概率密度函数为 5 3 4 5 3 5 例5 3 2 设总体X的密度函数为 现从该总体中抽得一个容量为5的样本 试计算 解 我们首先应求出x 2 的分布 由总体密度函数不难求出总体分布函数为 由公式 5 3 3 可以得到x 2 的密度函数为 于是 二 多个次序统计量的联合分布 仅讨论任意二个次序统计量的情形 定理5 3 2 设总体 有密度函数f x a x b 同样可设a b 并且 1 2 n是取自这一总体的一个样本 则其任意两个次序统计量 1 2 的联合分布密度函数为 5

4、 3 6 证明 对增量 y z以及y z 事件 可以表述为 容量为n的样本x1 x2 xn中有i 1个观测值小于等于y 一个落入区间 y y y j i 1个落入区间 y y z 一个落入区间 z z z 而余下的n j个大于z z i 11j i 11n j 于是由多项分布得 i 11j i 11n j i 11j i 11n j i 11j i 11n j 考虑到F x 的连续性 当 有 于是 例5 3 4 设总体分布为U 0 1 x1 x2 xn为样本 则 x 1 x n 的联合密度函数为 令 由R 0可以推出 则 该分布参数为 n 1 2 的贝塔分布 总体分位数与样本分位数 一 总体分

5、位数 定义5 3 2 设总体X的分布函数为F x 满足 5 3 7 的x 称为X的 分位数 如下图所示 都在书后附表中可以查到 其中N 0 1 是分布函数表 x 反过来查 而其它几个分布 则是分别对给出 的几个的常用值如 0 0 25 0 05 0 1 0 9 0 95 0 975等等 列出相应分布对应值的 分位点 图5 9给出了四种常用分布的 分位点表示方法 其中N 0 1 的 分位点通常记成u 图5 9 这里要注意到如下几个有用的事实 N 0 1 的分位数 此时 故 从而 2 对于T t n 由密度函数的对称性可知 即 5 3 8 5 3 9 3 对于F 分布 由于 所以 即 5 3 10

6、 二 样本分位数 定义5 3 3 设 为取自总体X的次序统计量 称mp 为样本p分位数 Samplep Quantile 特别地 当p 时 称mp为样本中位数 5 3 11 5 3 12 对多数总体而言 要给出样本p分位数的精确分布通常不是一件容易的事 但当n 时 样本p分位数的渐近分布有比较简单的表达式 我们这里不加证明地给出如下定理 定理5 3 4 设总体密度函数为f x xp为其p分位数 f x 在xp处连续且f x 0 则当n 时 样本p分位数mp的渐近分布为 特别地 对样本中位数有 5 3 13 例5 3 2 设总体X为柯西分布 其密度函数为 其分布函数为 易知 是该总体的中位数 即

7、x 当样本容量n较大时 样本中位数m0 5的渐近分布为 五数概括与箱线图 次序统计量的应用之一就是五数概括与箱线图 在得到有序样本后 容易计算如下五个值 最小观测值xmin x 1 最大观测值xmax x n 中位数m0 5 第一4分位数Q1 m0 25第三4分位数Q3 m0 75 所谓五数概括就是指用这五个数来大致描述一批数据的轮廓 例5 3 4 表5 5是某厂160名销售人员某月的销售量数据的有序样本 由该批数据可计算得到 五数概括的图形表示称为箱线图 由箱子和线段组成 图5 11是该例中样本数据的箱线图 其作法如下 下面就通过一个具体的实例说明之 表5 11某厂160名销售员的月销售量的

8、有序样本 1 画一个箱子 其两侧恰为第一4分位数和第三4分位数 在中位数位置上画一条竖线 它在箱子内 这个箱子包含了样本中50 的数据 图5 11月销售量数据的箱线图 2 在箱子左右两侧各引出一条水平线 分别至最小值和最大值为止 每条线段包含了样本中25 的数据 箱线图可用来对数据分布的形状进行大致的判断 图5 12给出三种常见的箱线图 分别对应对称分布 左偏分布和右偏分布 左偏对称右偏 图5 12三种常见的箱线图及其对应的分布轮廓 如果我们要对几批数据进行比较 则可以在一张纸上同时画出这批数据的箱线图 图5 13是某厂20天生产的某种产品的直径数据画成的箱线图 从图中可以清楚地看出 第17天的产品出现了异常

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号