假设检验(完整版)ppt课件

上传人:资****亨 文档编号:130041854 上传时间:2020-04-24 格式:PPT 页数:106 大小:2.55MB
返回 下载 相关 举报
假设检验(完整版)ppt课件_第1页
第1页 / 共106页
假设检验(完整版)ppt课件_第2页
第2页 / 共106页
假设检验(完整版)ppt课件_第3页
第3页 / 共106页
假设检验(完整版)ppt课件_第4页
第4页 / 共106页
假设检验(完整版)ppt课件_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《假设检验(完整版)ppt课件》由会员分享,可在线阅读,更多相关《假设检验(完整版)ppt课件(106页珍藏版)》请在金锄头文库上搜索。

1、 统计假设检验 假设检验 第一节 假设检验概述第二节 总体平均数的假设检验 Z T 第三节 总体比率的假设检验 P 第四节 总体方差的假设检验 卡方 F 第一节假设检验概述 1 假设检验的基本思想2 假设检验的步骤3 两类错误和假设检验的规则 RonaldAylmerFisher 英国著名的统计学家 遗传学家 现代数理统计的奠基人之一 他在抽样分布理论 相关回归分析 多元统计分析 最大似然估计理论 方差分析和假设检验有很多的建树 女士品茶 20世纪20年代后期在英国剑桥一个夏日的下午 一群大学的绅士和他们的夫人以及来访者 正围坐在户外的桌旁享用下午的奶茶 奶茶一般是由牛奶和茶混合而成的 调制时

2、候可以先倒茶后倒牛奶 也可以先倒牛奶后倒茶 这时候 一名女士说她能区分这两种不同做法的调制出来的奶茶 那么如何检验这位女士的说法 为此Fisher进行了研究 从而提出了假设检验的思想 1 推广素质教育以后 教学效果是不是有所提高 教育统计 2 某种新胃药是否比以前更有效 卫生统计 3 醉酒驾车认定为刑事犯罪后是否交通事故会减少 司法统计 4 如何检测某批种子的发芽率 农业统计 5 海关工作人员如何判定某批产品能够通关 海关统计 6 红楼梦 后40回作者的鉴定 文学统计 7 民间借贷的利率为多少 金融统计 8 兴奋剂检测 体育统计 假设检验的应用 1 假设检验的基本思想为研究某山区的成年男子的脉

3、搏均数是否高于一般成年男子脉搏均数 某医生在一山区随机抽查了25名健康成年男子 得其脉搏均数x为74 2次 分 标准差为6 0次 分 根据大量调查已知一般健康成年男子脉搏均数为72次 分 能否据此认为该山区成年的脉搏均数 高于一般成年男子的脉搏均数 0 问题1 造成这25名男子脉搏均数高于一般男子的原因是什么 问题2 怎样判断以上哪个原因是成立的 若x与 0接近 其差别可用抽样误差解释 x来自于 0 若x与 0相差甚远 其差别不宜用抽样误差解释 则怀疑x不属于 0 由资料已知样本均数与总体均数不等 原因有二 1 两者非同一总体 即两者差异由地理气候等因素造成 也就是可以说高山成年人的脉搏比一般

4、人的要高 2 两者为同一总体 即两者差异由抽样误差造成 检验如下假设 原假设 高山成年人脉搏与一般人的脉搏没有差异 0备择假设 高山成年人脉搏与一般人的脉搏有差异 0 假设检验的基本概念 概念事先对总体参数或分布形式作出某种假设然后利用样本信息来以一定的概率判断原假设是否成立参数检验和非参数检验 第8章的内容 作用一般是对有差异的数据进行检验 判断差异是否显著 概率 如果通过了检验 不能拒绝原假设 说明没有显著差异 那么这种差异是由抽样造成的如果不能通过检验 则拒绝原假设 说明有显著差异 这种差异是由系统误差造成的 证伪不能存真 第一节假设检验概述 1 假设检验的基本思想2 假设检验的步骤3

5、两类错误和假设检验的规则 二 假设检验的步骤 1 根据具体的问题 建立原假设和备择假设2 构造一个合适的统计量 计算其抽样分布 均值检验 3 给定显著水平 和确定临界值 显著水平 通常取0 1 0 05或0 01 在确定了显著水平后 根据统计量的分布就可以确定找出接受区域和拒绝区域的临界值 4 根据样本的值计算统计量的数值并作出决策 如果统计量的值落在拒绝域中 那么就没有通过检验 说明有显著差异 拒绝原假设 如果统计量的值落在接受域中 通过了假设检验 说明这种差异是由于抽样造成 这个样本不能拒绝原假设 1 原假设与备择假设 原假设 nullhypothesis 一般研究者想收集证据予以反对的假

6、设 表示为H0备择假设 alternativehypothesis 一般研究者想收集证据予以支持的假设 表示为H1由于假设检验中只有在小概率事件发生的情况下才拒绝原假设 因此在假设检验过程中是保护原假设的 有三种形式 1 双侧检验H0 0 H1 0 不等 有差异 2 左侧检验H0 0 H1 0 提高 增加 采用哪种形式要根据实际问题 某种饮料的易拉罐瓶的标准容量为335毫升 为对生产过程进行控制 质量监测人员定期对某个分厂进行检查 确定这个分厂生产的易拉罐是否符合标准要求 如果易拉罐的平均容量大于或小于335毫升 则表明生产过程不正常 试陈述用来检验生产过程是否正常的原假设和备择假设 解 研究

7、者想收集证据予以证明的假设应该是 生产过程不正常 建立的原假设和备择假设为H0 335mlH1 335ml 消费者协会接到消费者投诉 指控品牌纸包装饮料存在容量不足 有欺骗消费者之嫌 包装上标明的容量为250毫升 消费者协会从市场上随机抽取50盒该品牌纸包装饮品进行假设检验 试陈述此假设检验中的原假设和备择假设 解 消费者协会的意图是倾向于证实饮料厂包装饮料小于250ml 建立的原假设和备择假设为H0 250mlH1 250ml 例 一家研究机构估计 某城市中家庭购买有价证券的比率超过30 为验证这一估计是否正确 该研究机构随机抽取了一个50户组成的样本进行检验 试陈述此问题中的原假设和备择假

8、设 解 研究者想收集证据予以支持的假设是 城市中家庭购买有价证券的比率超过30 建立的原假设和备择假设为H0 30 H1 30 根据样本观测结果计算得到的 并据以对原假设和备择假设作出决策的某个样本统计量 2 设计检验统计量 2 标准化的检验统计量 非正态小样本情形不讨论 3 拒绝域和接受域的确定 双侧检验 抽样分布 0 临界值 临界值 a 2 a 2 样本统计量 拒绝H0 拒绝H0 1 置信水平 拒绝域 接受域 拒绝域 4 判断规则从概率的角度来讲 如果统计量取值的概率小于或者等于显著水平 表明小概率事件发生了 因此拒绝原假设 反之 不能拒绝原假设 p值 如果统计量的值正好落在拒绝域之内 那

9、么拒绝原假设 如果落在接受域之内 则不能拒绝原假设 如果正好等于临界值 也要拒绝原假设 例1 一种罐装饮料采用自动生产线生产 每罐的容量是255ml 标准差为5ml 服从正态分布 为检验每罐容量是否符合要求 质检人员在某天生产的饮料中随机抽取了16罐进行检验 测得每罐平均容量为257 2ml 取显著性水平 0 05 检验该天生产的饮料容量是否符合标准要求 双侧检验 H0 255H1 255 0 05n 16临界值 Zc 检验统计量 决策 不能拒绝H0 结论 样本提供的证据表明 该天生产的饮料与标准没有显著差异 样本均值与标准的差异是因为随机因素所引起的 总体 某种假设 抽样 样本 观察结果 检

10、验 不能拒绝原假设 拒绝原假设 小概率事件未发生 小概率事件发生 3 做法采用逻辑上的反证法依据统计上的小概率原理 核心是构造小概率事件 假设检验中的反证法与数学中的反证法的比较 小概率事件在一次实验中不可能发生的事件 如果发生了 那么就可以拒绝原来的假设 泰力布 等待黑天鹅的人 显著性水平和拒绝域 单侧检验 拒绝域 接受域 显著性水平和拒绝域 左侧检验 显著性水平和拒绝域 左侧检验 观察到的样本统计量 例2 一种罐装饮料采用自动生产线生产 每罐的容量是255ml 标准差为5ml 服从正态分布 换了一批工人后 质检人员在某天生产的饮料中随机抽取了16罐进行检验 测得每罐平均容量为257 2ml

11、 取显著性水平 0 05 检验该天生产的饮料容量是否增加了 右侧检验 H0 255H1 255 决策 拒绝H0 结论 样本提供的证据表明 该天生产的饮料与标准有显著差异 可以认为换工人后容量增加了 显著性水平和拒绝域 右侧检验 显著性水平和拒绝域 右侧检验 第一节假设检验概述 1 假设检验的基本思想2 假设检验的步骤3 两类错误和假设检验的规则 三 两类错误和假设检验的规则 1 第 类错误 弃真错误 原假设为真时拒绝原假设第 类错误的概率记为 被称为显著性水平2 第 类错误 取伪错误 原假设为假时未拒绝原假设第 类错误的概率记为 Beta H0 无罪 假设检验中的两类错误 假设检验就好像一场审

12、判过程 统计检验过程 H0 药品为真药 假设检验中的两类错误之间的关系 宁可错杀三千 不可放过一个 H0 某次面试为好机会 错误和 错误的关系 你不能同时减少两类错误 只能增加样本容量 和 的关系就像翘翘板 小 就大 大 就小 四 置信区间与假设检验之间的关系1 根据置信度1 构造置信区间 如果统计量落在置信区间中 那么接受原假设 如果不在置信区间中 那么拒绝原假设 2 根据显著水平 可以构建置信度为1 的置信区间 一个总体的检验 第二节总体均值的检验一 单个总体均值的检验 ZT 二 两个总体均值检验 等方差 异方差 三 两个非正态总体均值之差的检验 成对检验 一 单个正态总体均值的检验 确定

13、检验统计量的因素 1 样本容量的大小2 总体分布形状3 总体方差是否已知主要情形 6种 正态总体 方差未知 且为小样本 1种 正态总体 方差已知 小样本 1种 大样本 不论总体是否正态 不论方差是否已知 4种 三种假设检验的形式 双侧 左侧和右侧 一 总体平均数的检验 小样本 正态 方差已知 1 假定条件总体服从正态分布小样本 n 30 但是总体方差已知检验统计量 某机床厂加工一种零件 根据经验知道 该厂加工零件的椭圆度近似服从正态分布 其总体均值为 0 0 081mm 总体标准差为 0 025 今换一种新机床进行加工 抽取n 200个零件进行检验 得到的椭圆度为0 076mm 试问新机床加工

14、零件的椭圆度的均值与以前有无显著差异 0 05 H0 0 081 H1 0 081 0 05 n 200临界值 s 双侧检验 检验统计量 决策 拒绝H0 结论 有证据表明新机床加工的零件的椭圆度与以前有显著差异 均值的单侧Z检验 根据过去大量资料 某厂生产的灯泡的使用寿命服从正态分布N 1020 1002 现从最近生产的一批产品中随机抽取16只 测得样本平均寿命为1080小时 试在0 05的显著性水平下判断这批产品的使用寿命是否有显著提高 0 05 右侧检验 H0 1020H1 1020 决策 在0 05的水平上拒绝H0 结论 样本提供的证据表明 该天生产的饮料与标准有显著差异 可以认为试用寿

15、命提高了 总体均值的检验 z检验 P值的计算与应用 第1步 进入Excel表格界面 直接点击 f x 粘贴函数 第2步 在函数分类中点击 统计 并在函数名的菜单下选择 NORMSDIST 然后确定第3步 将z的绝对值2 4录入 得到的函数值为0 9918P值 1 0 9918 0 0082P值小于 故拒绝H0 总体均值的检验 z检验 P值的图示 例3 一种罐装饮料采用自动生产线生产 每罐的容量是255ml 标准差为5ml 服从正态分布 换了一批工人后 质检人员在某天生产的饮料中随机抽取了16罐进行检验 测得每罐平均容量为252 8ml 取显著性水平 0 05 检验该天生产的饮料容量是否减少了

16、左侧检验 H0 255H1 255 决策 在0 05水平上拒绝H0 结论 样本提供的证据表明 该天生产的饮料与标准有显著差异 可以认为换工人后容量减少了 总体均值的检验 z检验 P值的计算与应用 第1步 进入Excel表格界面 直接点击 f x 粘贴函数 第2步 在函数分类中点击 统计 并在函数名的菜单下选择 NORMSDIST 然后确定第3步 将z的绝对值 1 76录入 得到的函数值为0 039204P值 0 039204P值小于 故拒绝H0 总体均值的检验 z检验 P值的图示 总体均值的检验规则 正态 小样本 方差已知 练习一 二 总体平均数检验 小样本 正态 方差未知 1 假定条件总体服从正态分布小样本 n 30 但总体方差未知检验统计量 总体均值的检验规则 正态 方差未知 小样本情形 例1 某机器制造的肥皂厚度规定为5cm 假设肥皂厚度服从正态分布 今欲了解机器性能是否良好 取16块肥皂为样本 测得平均厚度为5 2cm 标准差为0 4cm 问在显著水平为0 05的水平下 机器是否为良好 双侧检验 H0 5H1 5 决策 不能拒绝H0 结论 认为该机器还是良好的 没有充分的理由拒

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号