高等应用数学下 提升模块2概率论与数理统计 项目4 参数估计与假设检验

上传人:f****u 文档编号:123319634 上传时间:2020-03-08 格式:PPT 页数:83 大小:2.09MB
返回 下载 相关 举报
高等应用数学下 提升模块2概率论与数理统计 项目4 参数估计与假设检验_第1页
第1页 / 共83页
高等应用数学下 提升模块2概率论与数理统计 项目4 参数估计与假设检验_第2页
第2页 / 共83页
高等应用数学下 提升模块2概率论与数理统计 项目4 参数估计与假设检验_第3页
第3页 / 共83页
高等应用数学下 提升模块2概率论与数理统计 项目4 参数估计与假设检验_第4页
第4页 / 共83页
高等应用数学下 提升模块2概率论与数理统计 项目4 参数估计与假设检验_第5页
第5页 / 共83页
点击查看更多>>
资源描述

《高等应用数学下 提升模块2概率论与数理统计 项目4 参数估计与假设检验》由会员分享,可在线阅读,更多相关《高等应用数学下 提升模块2概率论与数理统计 项目4 参数估计与假设检验(83页珍藏版)》请在金锄头文库上搜索。

1、高 等 应 用 数 学 提升模块二 概率论与数理统计 项目四 参数估计与假设检验 n任务一 总体与样本 n任务二 统计量的分布 n任务三 参数的点估计 n任务四 区间估计 n任务五 假设检验 任务一 总体与样本 1 总体与样本 2 分布密度的近似求法 3 样本的数字特征 研究对象的全体称为总体 或母体 组成总体的 每一个基本单位称为个体 从总体中抽取的一部分个体称为 样本 样本中所包含的个体数称为样本容量 1 总体与样本 例如 欲检查1000只灯泡的质量 这1000只灯泡的质量 就是总体 其中的每一只灯泡的质量就是一个个体 若从 中抽取10个灯泡进行检查 则这10只灯泡组成样本 样本容 量为1

2、0 定义1 任务一 总体与样本 说总体X也就是指它所对应的随机变量X 说总体X的 分布也就是指它对应的随机变量X的分布 如果从总体X中抽取n个个体 组成一个样本 则记作 第i次从总体X中取得的个体 随机样本 任务一 总体与样本 称为简单随机样本 为了研究方便 常常假定样本满足下面两个性质 1 独立性 具有上述两个性质的随机样本 2 代表性 任务一 总体与样本 解 设X表示从袋中取得球的号码数 则总体X仅由3个数 0 1 2 构成 又设第i次抽得球的号码数为 由于抽样是有放回的 故所有可能的样本观测值为 0 0 0 1 0 2 1 0 1 1 1 2 2 0 2 1 2 2 例1 设袋中有3个球

3、 依次编号为0 1 2 有放回地从该总体 中抽取容量为n 2的样本 求样本的所有可能的样本观测值 则样本为 任务一 总体与样本 2 分布密度的近似求法 例2 从某商场过去3年中每天商品零售额的统计资料中 抽出50天的零售额 结果数字如下 单位 万元 33 0 23 0 35 0 35 5 26 0 32 3 41 0 29 0 38 5 42 0 31 0 54 2 34 0 26 5 27 0 37 0 40 1 30 0 39 0 43 0 23 0 36 5 43 0 45 0 31 0 46 3 42 8 52 1 49 0 48 0 40 0 52 7 39 0 37 0 48 1

4、35 0 58 0 32 0 31 5 37 0 28 0 19 0 34 0 38 0 59 5 32 5 43 0 47 0 33 0 26 0 试求该商场商品零售额的近似概率分布密度 任务一 总体与样本 1 找出数据中的最大值L 最小值S和极差R L S 解 R 59 5 19 40 5 2 决定分组的组数 组数k可由下表决定 样本容量n50 100100 250250以上 组数k6 107 1210 20 取k 9 任务一 总体与样本 3 计算组距h 决定分点 选一个比最小值S稍小的数B 作为左边第一组的起点 为了使 样本数据不成为分点 B要比样本数据多取一位小数 这里 取 a 12

5、25 然后 由公式 就可计算出每个组的端点值 从而得到分组的情况 4 统计频数 计算频率和频率密度 任务一 总体与样本 表15 1 频率分布表 任务一 总体与样本 5 绘频率直方图 任务一 总体与样本 3 样本的数字特征 是来自总体X的样本 则我们称 样本均值 样本方差 定义2 样本均方差或样本标准差 任务一 总体与样本 例3 某商店抽查9个柜组 每个柜组某日的销售额 万元 分别为10 9 8 8 7 6 6 5 4 求该商店9个柜组销售额的样本 均值与方差 解 任务一 总体与样本 任务一 总体与样本 例4 对某批花生仁中的含油量作了5次抽样检测 结果如下 59 30 59 24 59 41

6、59 35 59 36 求样本均值和标准差 解 又 任务一 总体与样本 任务一 总体与样本 任务二 统计量的分布 1 样本均值的分布 3 t分布 2 分布 1 样本均值的分布 是服从正态分布的随机变量 定义3 定理 任务二 常用统计量的分布 任务二 常用统计量的分布 为n 6 查表求 例1 设有一个来自正态总体N 4 24 的随机样本 其容量 解 即 任务二 常用统计量的分布 推论 如果总体 为来自总体X的 样本 则统计量 U 服从标准正态分布 即 解 例2 求 查附表2 得 任务二 常用统计量的分布 例3 求 解 查表 得 任务二 常用统计量的分布 一般地 若已知a查表求 使 则根据标准正态

7、分布的对称性 有 反查正态分布表 即得 通常记 并称 为临界值 即 任务二 常用统计量的分布 任务二 常用统计量的分布 是n个随机变量的和 但这n个随机变量必须满足约束条件 在n个随机变量中只有n 1个可以 自由 变化 即只有n 1个独 立的随机变量 因此 n 1叫做 的自由度 记作 任务二 常用统计量的分布 则 读作 卡方 的自由度亦为n 1 因此称之为自由度是 n 1的 变量 它的概率分布叫做自由度为n 1的 分布 记作 即 的临界值可由附表3查得 任务二 常用统计量的分布 变量的密度曲线 任务二 常用统计量的分布 例4 查表得 解 任务二 常用统计量的分布 例5 如果样本容量 n 11

8、解 任务二 常用统计量的分布 选取这样一组 使两尾部的面积都等于0 05 即 任务二 常用统计量的分布 查表即得 的值 通常记 和样本容量n 求 一般地 已知 使 可根据自由度 即 及 任务二 常用统计量的分布 3 t分布 可用样本均值 代替 从而得到统计量 它的概率分布称为自由度为n 1的t分布 简记作 t分布临界值表见附表4 在统计量 中 当总体X的方差未知时 任务二 常用统计量的分布 t分布的密度曲线图 任务二 常用统计量的分布 1 当 解 例6 若 试求自由度为7 10 14时的 值 2 当 3 当 任务二 常用统计量的分布 可根据自由度 及 查表即得 一般地 已知a和样本容量n 求

9、使 任务二 常用统计量的分布 任务三 参数的点估计 1 点估计的概念 2 点估计的评价 1 点估计的概念 为来自总体X的样本 如果我们构造一个统计量 的一个估计量 并记作 设 是总体X的需要估计的参数 称为待估参数 作为参数 的估计 则称这个统计量为参数 定义1 就是的一个点估计值 任务三 参数的点估计 总体均值 总体方差和总体标准差的点估计分别记作 任务三 参数的点估计 例1 已知某厂生产一批圆钢 现只检测其直径 随机抽取 12根 测得直径 单位 cm 如下 13 30 13 38 13 40 13 32 13 43 13 48 13 51 13 31 13 34 13 47 13 44 1

10、3 5 试估计该批圆钢直径的均值E X 和方差D X 解 任务三 参数的点估计 设 是未知参数 的估计量 若 则称 为 的无偏估计 2 点估计的评价 设 是来自总体X的样本 且总体的均值 E X 存在 则样本均值 是总体均值E X 的无偏估计 即 定义2 定理1 任务三 参数的点估计 设 是来自总体X的样本 且总体的均值 E X 与方差D X 存在 则样本方差 是总体方差D X 的无偏估 计 即 证 定理2 任务三 参数的点估计 注意 统计量 称 为D X 的渐近无偏估计 不是总体方差D X 的无偏估计 定义3设 和 都是 的无偏估计 若 则称 是较 有效的估计 如果在 的一切无偏估计中 的方

11、差达到最小 则 称为 的最优无偏估计 任务三 参数的点估计 例2 设某批稻谷的发芽率为p 并规定 则X服从二点分布 且 现从该批稻种中取n颗作发芽试验 并记 则 是总体X的样本 任务三 参数的点估计 1 证明 均是p的无偏估计 2 比较 的有效性 解 任务三 参数的点估计 任务三 参数的点估计 注意 1 上例表明 在二点分布总体中 样本均值 是 总体参数p的无偏估计 如果在n颗稻谷中 有m颗发了芽 则 2 对于一般总体X 不一定存在参数的最优无偏估计 但对正态总体 可以证明 样本均值 和方差 分别是总体均值 和方差 的最优无偏估计 任务三 参数的点估计 任务四 区间估计 1 区间估计的概念 2

12、 正态总体均值的区间估计 3 正态总体方差的区间估计 1 区间估计的概念 则称随机区间 为 的置信区间 定义1 设 是总体X的未知参数 对于事先给定的 若由样本 确定的统计量 1 称为置信区间的置信概率或置信度 任务四 区间估计 的意义是 由样本统计量得到的随机区间 能以 95 的可靠性包含 的真值 具体地说 抽取100个随机样 本 可以得到100个随机区间 则在这100个随机区间中 约有95个区间包含 的真值 例如 如果置度 则等式 任务四 区间估计 设总体 是来自总体X的样本 由前 面的讨论知 是 的无偏估计 自然想到利用 来求得 的置信区间 当 时 统计 量 1 方差已知时 均值的区间估

13、计 2 正态总体均值的区间估计 任务四 区间估计 即 对于给定的置信度 查正态分布表 可求得 使 上式表明 的置信度为 的置信区间为 任务四 区间估计 置信度 临界值 置信区间 0 901 65 0 951 96 0 992 58 表15 2 U区间估计表 任务四 区间估计 因此 该品种水稻的平均亩产量有95 的可能性在 例1 某农场试种新品种水稻 假定水稻亩产量X服从正态 分布 现从该农场的水稻田中随机抽16亩实割实 测 平均亩产为412 5kg 试以95 的置信度估计该种水稻 的平均亩产量 解 任务四 区间估计 解 设从总体X中取得的样本为 则 例2 设总体X服从二点分布 即 求p的置信区

14、间 可以证明 当n充分大 一般要求 时 统计量 近似地服从标准正态分布N 1 0 任务四 区间估计 解出p的变化范围 就可得到p的置信区间 任务四 区间估计 有两个实根 所以p的置信区间是 任务四 区间估计 均大于5 例3 在某大学学生会主席选举前 随机挑选了400名大学生 进行民意测验 发现有240名学生都支持主席连任 试求原 学生会主席的支持率的置信区间 解 任务四 区间估计 p的区间估计为 0 5513 0 6468 任务四 区间估计 2 方差未知时 均值的区间估计 用样本方差 估计总体方差 因此 代替U统计 量 考虑统计量 服从自由度为n 1的t分布 任务四 区间估计 任务四 区间估计

15、 例4 用某仪器间接测量温度 重复测量5次 得到如下数据 单位 1250 1265 1245 1260 1275 假设温度服从正态分布 试求温度真值的置信区间 解 于是 所求置信区间为 任务四 区间估计 3 正态总体方差的区间估计 设是来自总体的样本 由于样本方差 是 的无偏估计 均未知 因此可以利用 来求得 的置信区间 对于给定的 和自由度 查 分布表 可得到临界值 任务四 区间估计 使 任务四 区间估计 例5 假定初生婴儿 男孩 的体重服从正态分布 随机抽 取12名新生婴儿 测其体重为 单位 g 3100 2520 3000 3000 3600 3160 3560 3320 2880 26

16、00 3400 2640 试对新生婴儿体重的方差进行区间估计 置信度为0 95 解 于是 所求置信区间为 任务四 区间估计 任务五 假设检验 1 假设检验原理 2 几种常见的假设检验方法 例1 某厂有一批产品 共10000件 需经检验后方可出 厂 按规定 次品率不得超过5 今在其中任意选取25件产 品进行检查 发现有2件次品 问这批产品能否出厂 1 假设检验原理 例2 某车间有一台包装机包装白糖 额定标准为每袋 净重50kg 假定包装机称得糖的重量服从正态分布 且根据 经验知其标准差 kg 某天开工后 为检验包装机工 作是否正常 随机抽取它包装的糖9袋 称得的重量为 单 位 kg 49 65 48 35 50 25 49 15 49 85 49 75 51 05 50 25 这一天包装机工作得是否正常 任务五 假设检验 作为检验对象的假设称为原假设 通常用H0表示 例如 例2中的原假设为H0 用样本提供的信息来推断原假设是否成立的过程 叫做假设检验 假设检验的基本原理是 先假设H0为真 其次在H0成立 的条件下 构造一个小概率事件B 然后通过样本提供的信息 判断小概率事件B是否发生了

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号