大学生数学课件:抽样分布

上传人:w****6 文档编号:127688344 上传时间:2020-04-04 格式:PPT 页数:42 大小:921.50KB
返回 下载 相关 举报
大学生数学课件:抽样分布_第1页
第1页 / 共42页
大学生数学课件:抽样分布_第2页
第2页 / 共42页
大学生数学课件:抽样分布_第3页
第3页 / 共42页
大学生数学课件:抽样分布_第4页
第4页 / 共42页
大学生数学课件:抽样分布_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《大学生数学课件:抽样分布》由会员分享,可在线阅读,更多相关《大学生数学课件:抽样分布(42页珍藏版)》请在金锄头文库上搜索。

1、抽样分布 数理统计的基本概念 数理统计包括两大内容 一 试验的设计和研究 研究更合理 更有效 更精确地获取观察资料的方法 二 统计推断 研究如何利用一定的资料对所关心的问题作出尽可能精确 可靠的结论 例为了解某城市市民2006年收入情况 现抽样调查10000人的收入 问题 1 怎样从10000人的收入情况去估计全体市民的平均收入 怎样估计所有市民的收入与平均收入的偏离程度 2 若市政府提出了全体某城市民平均收入应达到的标准 从抽查得到的10000人收入数据 如何判断全体市民的平均收入与收入标准有无差异 差异是否显著 3 抽查得到的10000人的收入有多有少 若这10000人来自不同的行业 那么

2、 收入的差异是由于行业不同引起的 还是仅由随机因素造成的 4 假设收入与年龄有关 从抽查得到的10000人收入和年龄的对应数据 如何表述全体市民的收入与年龄之间的关系 问题1实质 从10000人的收入出发 估计全体市民收入分布的某些数字特征 此处是期望和方差 在数理统计中 解决这类问题的方法称为参数估计 问题2实质 根据抽查得到的数据 去检验总体收入的某个数字特征 此处是期望 与给定值的差异 在数理统计中 解决这类问题的方法称为假设检验 问题3实质 分析数据误差的原因 此处是行业 当有多个因素起作用时 还要分析哪些因素起主要作用 在数理统计中 解决这类问题的方法称为方差分析 问题4实质 根据观

3、察数据研究变量间 此处是收入与年龄间 的关系 在数理统计中 解决这类问题的方法称为回归分析 1 1统计量 一 总体与样本 在数理统计中 将所研究的对象的某项指标值的全体称为总体 或母体 而将构成总体的每个单位称为一个个体 当总体中包含的个体总数是有限的 就称总体为有限总体 否则称总体为无限总体 设待研究的指标为X 由于X的取值是对随机抽取的个体观察得到的 因而可将X视为随机变量 并设其分布函数为F x 定义1 1 设总体X具有分布函数F x 是从总体X中抽取的n个个体 称为来自总体X的一个样本容量为n的样本 若相互独立 且具有相同的分布 则称为一个简单随机样本 简称样本 若的抽样数值为则称为的

4、样本观察值 样本点 即 样本应具有 代表性 独立性 P225 若将总体在进行第i次抽样时对应的随机变量记为 则就是的观察值 二 样本 设X的分布函数为F x 由定义4 1 总体X的容量为n的样本的第i个分量的分布函数为 因相互独立 故联合分布函数为 若X是离散型随机变量 其分布律为P X i 1 2 则的联合分布律为 若X是连续型随机变量 其密度函数为f x 则的联合密度函数为 例题1 写出正态总体样本的联合密度函数 解 设总体 为取自总体的样本 则联合密度函数为 三 统计量 定义1 2设是总体X的一个样本 是不含任何未知参数的 样本的 连续函数 则称g是一个统计量 统计量的分布称为抽样分布

5、例题2 设总体 为取自总体的样本 已知 未知 则 是一个统计量 就不是统计量 那个是是统计量 常见的统计量 例如 P227 若是一个统计量 是一组样本观察值 则称是的一个观察值 当k为正整数 称 今后若不加说明 一般都用样本方差 引入样本矩的意义 称为总体X的k阶原点矩 对样本因为与总体X同分布 故有 例题3 P227 利用依概率收敛的性质 对任何连续函数有 P 结论 只要总体的k阶矩存在 则样本k阶矩的任何连续函数依概率收敛于总体k阶矩的同一函数 说明 该结论正是我们进行参数估计的理论基础 由辛钦大数定律 对样本k阶原点矩 有 例题 茆P208 1 2抽样分布 统计量既然是依赖于样本的 而后

6、者又是随机变量 故统计量也是随机变量 它的分布叫做统计量的 抽样分布 即 统计量的分布称为抽样分布 研究统计量的性质和评价一个统计推断的优良性 取决于其抽样分布的性质 抽样分布 精确抽样分布 渐近分布 一 样本均值的分布 证明 P230 由此可得抽样分布 推论设总体服从正态分布 是来自的一个样本 是来自的一个样本 两个总体相互独立 则随机变量 证明 P231 定理1 2设为任意总体 其期望 方差分别为 是来自总体的一个样本 则当n充分大时 近似服从正态分布 即 大家很快会看到 有很多统计推断是基于正态分布的假设的 以标准正态变量为基石而构造的三个著名统计量在实际中有广泛的应用 这是因为这三个统

7、计量不仅有明确背景 而且其抽样分布的密度函数有明显表达式 它们被称为统计中的 三大抽样分布 二 卡方分布 1 定义1 3若随机变量X的密度函数为 则称X服从 n个自由度的分布 记为 该密度函数的图像是一只取非负值的偏态分布 2 卡方分布性质 性质1 若随机变量且 相互独立 则 即 卡方分布具有可加性 性质2 若则 性质3 即为 当n越大 密度函数越趋于对称 当时 分布以正态分布为极限 由P115例题26结论可得 3 2分布的由来 定理1 3若随机变量 则 证明 P233 推论设随机变量 则 是来自总体的样本 则 定理1 4设随机变量 服从自由度为n的卡方分布 即 独立的标准正态分布的平方和服从

8、卡方分布 即 设X1 X2 Xn 独立同分布于标准正态分布N 0 1 则 2 X12 Xn2的分布为自由度为n的 2分布 记为 2 2 n 性质2又一证明方法 由习题2第12题 1 n 1 定理1 5设随机变量 是来自总体的样本 则对 有结论 当随机变量 2 2 n 时 对给定 0 1 称满足P 2 1 2 n 的 1 2 n 是自由度为n 1的卡方分布的1 分位数 分位数 1 2 n 可以从附表3中查到 4 2分布上侧分为数 查表例题P235 例题1 P233 已知求满足 的和 例题2 P233 例题 设为来自正态总体的样本 当a b分别为何值时 解 由题意 卡方分布的由来 知 a 1 20

9、b 1 100 三 t分布 1 定义1 4若随机变量X的密度函数为 则称X服从 n个自由度的t分布 记作 t分布的密度函数的图象是一个关于纵轴对称的分布 与标准正态分布的密度函数形状类似 只是峰比标准正态分布低一些尾部的概率比标准正态分布的大一些 定理1 6若随机变量且X与Y相互独立 则随机变量 证明 由商的密度可得 略 自由度为1的t分布就是标准柯西分布 它的均值不存在 n 1时 t分布的数学期望存在且为0 n 2时 t分布的方差存在 且为n n 2 当自由度较大 如n 30 时 t分布可以用正态分布N 0 1 近似 推论1设总体 为来自总体的样本 则随机变量 证明 由于 因此由定理1 6可

10、得 推论2设总体服从正态分布 是来自的一个样本 其中 是来自的一个样本 两个总体相互独立 且 则随机变量 称为 联合样本方差 t分布的上侧分位数 对于给定的 由 决定的实数 称为自由度为n的t分布水平的上侧分位数 记为 由t分布的对称性可知 不难看到 当n充分大时 t分布近似N 0 1 分布 但对于较小的n t分布与N 0 1 分布相差很大 例题 P238 四 F分布 1 定义1 5若随机变量X的密度函数为 则称X服从 第一n个自由度为第二自由度为的F分布 记为 定理1 7设随机变量且它们相互独立 则随机变量 证明略 由该定理易见 四 F分布 推论设 且X和Y相互独立 则随机变量 分别是来自总

11、体和的样本 证明 P241 F分布的上侧分位数 对于给定的 由 决定的实数 称为随机变量的水平的上侧分位数 记为 例题 P241 244 例1 设 F 24 15 分别求满足 解 1 F0 025 24 15 2 29 2 P X 0 05 所以 F0 05 24 15 2 70 3 P X 0 975 比较大 P 1 X 1 0 025 所以 0 41 解 故 因此 解 则 即 由此 例3在总体X 中 随机地抽取一个容量为36的样本 求样本均值落在50 8到53 8之间的概率 思考题1 2001年数学三考研试题填空题 服从 分布 参数为 设总体X服从正态分布而 是来自总体X的简单随机样本 则随机变量 证明 统计量Z t 2 例设是来自总体的样本 分别是样本均值和样本方差 例 993 设是来自正态总体X的样本 证明 随机变量 t 9 解 故 与独立 所以 例 97 设随机变变量X和Y相互独立且都服从正态分布 而和分别是来自 总体X和Y的样本 则统计量服从 分布 参数为 思考题2 2003年数学一考研试题选择题 设随机变量X t n n 1 则 Y n B Y n 1 C Y F n 1 D Y F 1 n C 解法1 解法2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号