统计学之统计量与抽样分布

上传人:tang****xu4 文档编号:124384312 上传时间:2020-03-11 格式:PPT 页数:71 大小:1.33MB
返回 下载 相关 举报
统计学之统计量与抽样分布_第1页
第1页 / 共71页
统计学之统计量与抽样分布_第2页
第2页 / 共71页
统计学之统计量与抽样分布_第3页
第3页 / 共71页
统计学之统计量与抽样分布_第4页
第4页 / 共71页
统计学之统计量与抽样分布_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《统计学之统计量与抽样分布》由会员分享,可在线阅读,更多相关《统计学之统计量与抽样分布(71页珍藏版)》请在金锄头文库上搜索。

1、统计学 ch5 suyl1 第6章统计量与抽样分布 总体和样本的分布 统计量 抽样分布及抽样分布定理 统计学 ch5 suyl2 6 1 总体和样本的分布 l 6 1 1 统计推断中的总体及总体分布 l 要了解研究对象的整体情况 最理想的方法似乎是 进行普查 但实际上这样做往往是不必要 不可能 或不允许的 l 如 要研究灯泡寿命 由于寿命试验是破坏性的 逐 个试验是不允许的 l l 数理统计的方法 数理统计的方法 从所研究的全体对象中 抽取一 小部分来进行试验 称为抽样 根据这一小部分所 显示的统计特性 来推断整体的统计特性 统计学 ch5 suyl3 总体是根据一定的目的确定的所要研究的事物

2、的全体 它是由客观存在的 具有某种共同性质的众多个别事物 构成的整体 总体是研究对象的全体 l 在具体的统计推断中 我们感兴趣的是总体单位的某个或 某些数量特征 例如研究某种型号灯泡的寿命这一数量 特征 总体的含义抽象为所感兴趣的变量的所有取值 我们可以想象 这些值的出现有不同的频率 假设这批 灯泡有无限多个 那么频率就收敛到了概率 从而有了 使用寿命这个随机变量的概率分布 这个分布称为总体 或总体分布 总体 总体分布 是对客观对象变量取值 情况的数学描述 总体所含个体的数目称为总体容量 这 样要研究的总体实质上是某个概率分布 因此我们将总体 定义为一个随机变量X 数理统计学中 总体 这个基本

3、概念从本质上讲 总体就是一个随机变量 我们对我们对总体总体的研究的研究 就是对就是对 相应的相应的随机变量随机变量X X的研究的研究 统计学 ch5 suyl4 从社会统计到数理统计总体的演化 实物总体实物总体数字总体数字总体分布总体分布总体 组成元素 具体对象 组成元素 重复数字 组成元素 数字的取值 及其概率 分布 研究的标志 数字的取值和 重复的频率 例 研究班级同学的身高 班级的同学的集 合 全体同学 组成元素 每位同 学 具体对象 同学身高的集合 组成元素 身高的 数字 重复数字 身高的取值及其 概率 组成元素 身高的 分布 统计学 ch5 suyl5 对所研究的对象 我们常常关心某

4、一项或几项指标 总体 研究对象的某项变量值的全体 个体 组成总体的每一个基本元素 例如 某工厂生产的灯泡的使用寿命的全体是一个总体 而每一个灯泡的使用寿命是一个个体 而每个男生的身高是一个个体 我校男生的身高的全体是一个总体 总体所含个体的数目称为总体容量 统计学 ch5 suyl6 一般地 我们是从总体中抽取一部分 比如说 n 个进行观 测 再根据这 n 个观测值去推断总体的性质 在总体X中 抽取 n 个个体 这n个个体称为 总体X的一个样本样本 抽样抽样就是抽取样本的过程 样本中所含个体的数目n称为样本容量 由于 是从总体X中随机抽取出来的可能结果 是n个随机变量 但是在 一次一次抽取之后

5、 它们都是具体的数值具体的数值 样本 通过观测或试验的方法 获得的总体中一部分个体 的集合 称为样本 每个个体的取值称为样本点 6 1 1统计推断中的样本及样本分布 统计学 ch5 suyl7 l如随机抽取n只灯泡 试验得到其使用寿命 x1 x2 xn 称这n个确定的数值 x1 x2 xn 是灯泡使用寿命总体的一个样本 但是 当灯泡样本点的使用寿命还未观测 出来时 只能将每个样本点看作与总体同 分布的随机变量 这是因为每个样本点的 可能取值范围和某个值出现的可能性与总 体是一样的 这时样本记为 X1 X2 Xn 统计学 ch5 suyl8 l在相同的条件下对总体X进行n次重复独立 的观察 将n

6、次观察结果按试验的次序记为 X1 X2 Xn 大写英语字母表示 由于X1 X2 Xn 是对随机变量X观 察的结果 且各次观察是在相同的条件下 独立进行的 所以有理由认为X1 X2 Xn是相互独立的 且都是与总体X具有相 同分布的随机变量 这样得到的X1 X2 Xn 称为来自总体X的一个简单随机样 本 n称为这个样本的容量 以后无另外说 明 所得的样本都是指简单随机样本 统计学 ch5 suyl9 n次观察一经完成 我们就得到一组实数 x1 x2 xn 小写英语字母表示 它们依次是随机变量X1 X2 Xn的观 察值 称为样本观测值 对于有限总体 采用放回抽样就能得 到简单随机样本 但放回抽样使用

7、起来不 方便 当个体的总数N比样本的容量n大得 多时 在实际中可将不放回抽样近似地当 作放回抽样来处理 统计学 ch5 suyl10 简单随机样本的两个最基本的特性 1 独立性 是相互独立的随机变量 即中各个随机变量的取值互不影响 这时称 2 代表性 同分布性 即 样本中的每个样本点都与总 体同分布 即 中每一个随 机变量都与总体X有相同的概率 分布 6 1 2统计推断中的样本及其性质 统计学 ch5 suyl11 总体和样本的关系 数理统计中 样本和总体具有相同的分布 取值1 概率0 2 取值2 概率0 4 取值3 取值0 1 分布 总体 样品X1 总体的分布 总体中重复数字取各值的概率 分

8、布总体 总体各个值的概 率可以认为是有相应比重的个 体取该值 随机样本 由于每一个体都 有均等被抽中的概率 因而样 本取总体各个值的概率即样本 分布与总体分布相同 样品X2 样品Xn 统计学 ch5 suyl12 总体 样本 样本观察值 理论分布 统计统计是从手中已有的资料 样本观察值 去推断总体的情况 总体分布 总体分布总体分布决定了样本取值的概率规律 也就是样本取到样本观 察值的规律 因而可以用样本观察值去推断总体 样本样本是联系两者的桥梁 总体 样本 样本观察值的关系如下总体 样本 样本观察值的关系如下 统计学 ch5 suyl13 6 2 统计量 统计量 统计量分布的概念 在统计推断中

9、 总体信息是未知的 但从总体中抽 取的样本中含有总体的信息 统计推断就是利用样 本的信息来推测总体的信息 然而样本的信息是隐 蔽的 不明显的 必须要经过必要的加工处理才能 用来推断总体信息 构造样本统计量是加工样本提 出总体信息的有效手段之一 统计学 ch5 suyl14 6 2 1 统计量及统计量的分布 如果样本X1 Xn的函数T X1 Xn 不含 未知参数 则称T X1 Xn 是总体X的一个统计量 统计量有以下两个特征 统计量是样本的函数 统计量不能含有未知的总体参数 统计学 ch5 suyl15 判断下列是否为统计量 是是 是 是 是是 统计学 ch5 suyl16 是 不是 是 是 是

10、 是 统计学 ch5 suyl17 2 样本k阶矩 6 2 2 几个常用的统计量 统计学 ch5 suyl18 样本均值和方差的性质 l 1 均值的性质 l 2 方差的性质 统计学 ch5 suyl19 证明 统计学 ch5 suyl20 统计学 ch5 suyl21 3 顺序统计量 顺序统计量 对于样本X1 X2 Xn 如果按照升幂排列 得到 称X 1 X 2 X n 为顺序统计量 统计学 ch5 suyl22 l 利用顺序统计量可以计算一些常用的统计量 l 1 最大顺序统计量和最小顺序统计量 l 2 样本中位数 l 3 样本极差 l 4 样本的p分位数 l 5 样本的切尾均值 统计学 ch

11、5 suyl23 统计量的分布 统计量分布的概念 统计量既然是随机变量的函数 那么它也应该 是随机变量 并有其概率分布 统计量的分布 也称为抽样分布 抽样分布和统计推断有着密 切的联系 统计量提出以后 必须要知道其分布 才能在统计推断中使用 因为只有知道了统计量 的分布 才能利用概率论对总体的特征进行推断 并得到相应的推断的置信度 所以在统计推断 中 一项重要的工作就是寻找统计量和导出统计 量的分布 我们从一个简单的例子来讨论统计量 分布的概念 统计学 ch5 suyl24 例6 3 设有一总体N 3 2 4 6 以样本容量n 1 n 2 n 4及n 8 从总体中进行复置抽样 抽出全部可能的样

12、本 于表6 1 表6 1中列出这些不同样本容量的 抽样分布 并在图4 1 用方柱形图表示其分布形状 由表中第一列当N 3 n 1的总体平均数和方差为 当样本容量依次为2 4 8时 其 相应为4 4 4 其 相应为4 3 2 3 1 3 即 统计学 ch5 suyl25 n 1n 2n 4n 8 yffff 2 4 6 1 1 1 2 3 4 5 6 1 2 3 2 1 2 0 2 5 3 0 3 5 4 0 4 5 5 0 5 5 6 0 1 4 10 16 19 16 10 4 1 2 00 2 25 2 50 2 75 3 00 3 25 3 50 3 75 4 00 4 25 4 50

13、4 75 5 00 5 25 5 50 5 75 6 00 1 8 36 112 266 504 784 1016 1107 1016 784 504 266 112 36 8 1 39816561 平均数4444 方 差8 34 32 31 3 表6 1 各种不同样本容量的样本平均数 的抽样分布 统计学 ch5 suyl26 n 1n 2 图图6 1 各种不同样样本容量的 分布方柱形图 统计学 ch5 suyl27 图图6 1 各种不同样样本容量的 分布方柱形图 n 4n 8 统计学 ch5 suyl28 从这个例子我们可以了解关于样本均值的 分布 即所有可能样本计算出的均值所服从的 分布

14、直方图验证了中心极限定理 但是在 实际工作中 总体的容量远不止3 总体的分布 也是十分复杂的 统计量也各有不同 象这样 一一列举给出统计量的分布是行不通的 我们 必须借助于总体分布的类型来讨论统计量的分 布的情况 后面我们将集中讨论正态总体的统 计量分布的问题 通常称为样本的精确分布 统计学 ch5 suyl29 统计学 ch5 suyl30 6 3抽样分布及抽样分布定理 主要内容 2 分布 t 分布 F 分布 抽样分布的重要定理 统计学 ch5 suyl31 为了讨论统计量的分布 本节首先介绍 数理统计中的三个著名分布 它们是t分布 2分布和F分布 参数估计和假设检验等 统计推断问题中这三个

15、分布有广泛的应用 统计学 ch5 suyl32 6 3 1 分布的定义 为独立同分布于标准正态总体N 0 1 的随机变量 列 则称随机变量 所服从的分布为自由度是n的 分布 记为 统计学 ch5 suyl33 2 n 分布实质上就是参数为n 2 1 2的 分布 即 2 n 的密度函数为 统计学 ch5 suyl34 2分布随着自由度 增加 分布渐近于正态 图图4 1 2的概率密度曲线线 统计学 ch5 suyl35 1 期望与方差 若X 2 n 则 E X n D X 2n 2 2 分布的性质特征 统计学 ch5 suyl36 2 分布可加性 若X 2 n1 Y 2 n2 X Y独立 则 X

16、Y 2 n1 n2 统计学 ch5 suyl37 3 关于自由度 统计学 ch5 suyl38 统计学 ch5 suyl39 l 4 为便于今后的应用 现在我们引入上 侧分位数的概念 所谓一个分布的 上侧分位 数就是指这样一个数 它使相应分布的随机 变量不小于该数的概率为 比如 若记 2变 量的 上侧分位数为 则满足 统计学 ch5 suyl40 通过Excel查分位点 函数为CHIINV 统计学 ch5 suyl41 1 t 分布构造和密度函数 t n 称为自由度为n的t 分布 6 3 2 t 分布 t n 的概率密度为 若 N 0 1 2 n 与 独立 则 统计学 ch5 suyl42 分子是标准正态随机变量 分母是自由度为n的卡方随机变量 分子分母相互独立 且满足构造公式 新随机变量服从新随机变量服从 自由度为自由度为n n的的t t分分 布布 t分布的三个要点 统计学 ch5 suyl43 t分布的图像 统计学 ch5 suyl44 t分布和标准正态分布类似 他们都是对称分布 但是t 分布与标准正态分布也是有区别的 t分布尾部厚 即服 从 分布的随机变量取到尾部值的概率比标准正

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号