假设检验(完整版).

上传人:我** 文档编号:116829339 上传时间:2019-11-17 格式:PPT 页数:105 大小:4.65MB
返回 下载 相关 举报
假设检验(完整版)._第1页
第1页 / 共105页
假设检验(完整版)._第2页
第2页 / 共105页
假设检验(完整版)._第3页
第3页 / 共105页
假设检验(完整版)._第4页
第4页 / 共105页
假设检验(完整版)._第5页
第5页 / 共105页
点击查看更多>>
资源描述

《假设检验(完整版).》由会员分享,可在线阅读,更多相关《假设检验(完整版).(105页珍藏版)》请在金锄头文库上搜索。

1、统计假设检验 假设检验 第一节、假设检验概述 第二节、总体平均数的假设检验(Z 、 T) 第三节、总体比率的假设检验(P) 第四节、总体方差的假设检验(卡方、F) 第一节 假设检验概述 1、假设检验的基本思想 2、假设检验的步骤 3、两类错误和假设检验的规则 Ronald Aylmer Fisher,英国 著名的统计学家,遗传学家,现 代数理统计的奠基人之一。 他在抽样分布理论、相关回 归分析、多元统计分析、最大似 然估计理论,方差分析和假设检 验有很多的建树。 女士品茶 20世纪20年代后期在英国剑桥一个夏日的下午, 一群大学的绅士和他们的夫人以及来访者,正围 坐在户外的桌旁享用下午的奶茶。

2、 奶茶一般是由牛奶和茶混合而成的,调制时候可 以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这 时候,一名女士说她能区分这两种不同做法的调 制出来的奶茶。 那么如何检验这位女士的说法?为此Fisher进行 了研究,从而提出了假设检验的思想。 1、推广素质教育以后,教学效果是不是有所提高? (教育统计) 2、某种新胃药是否比以前更有效?(卫生统计) 3、醉酒驾车认定为刑事犯罪后是否交通事故会减少 ?(司法统计) 4、如何检测某批种子的发芽率?(农业统计) 5、海关工作人员如何判定某批产品能够通关?(海 关统计) 6、红楼梦后40回作者的鉴定(文学统计)。 7、民间借贷的利率为多少?(金融统计) 8、兴

3、奋剂检测(体育统计) 假设检验的应用假设检验的应用 1、假设检验的基本思想 为研究某山区的成年男子的脉搏均数是否高于一般 成年男子脉搏均数,某医生在一山区随机抽查了25名 健康成年男子,得其脉搏均数x为74.2次/分,标准差 为6.0次/分。根据大量调查已知一般健康成年男子脉 搏均数为72次/分,能否据此认为该山区成年的脉搏 均数高于一般成年男子的脉搏均数0? 问题1:造成这25名男子脉搏均数高于一般男子的原因是 什么? 问题2、怎样判断以上哪个原因是成立的? 若x与0接近,其差别可用抽样误差解释,x来自于0 ; 若x与0相差甚远,其差别不宜用抽样误差解释,则怀疑x不 属于0 。 由资料已知样

4、本均数与总体均数不等,原因有二: (1)两者非同一总体,即两者差异由地理气候等因素造成 ,也就是可以说高山成年人的脉搏比一般人的要高; (2)两者为同一总体,即两者差异由抽样误差造成。 检验如下假设: 原假设:高山成年人脉搏与一般人的脉搏没有差异:= 0 备择假设:高山成年人脉搏与一般人的脉搏有差异: 0 假设检验的基本概念 1.概念 事先对总体参数或分布形式作出某种假设 然后利用样本信息来以一定的概率判断原假设是否成 立 参数检验和非参数检验(第8章的内容) 2.作用 一般是对有差异的数据进行检验,判断差异是否显著 (概率) 如果通过了检验,不能拒绝原假设,说明没有显著差异 ,那么这种差异是

5、由抽样造成的 如果不能通过检验,则拒绝原假设,说明有显著差异, 这种差异是由系统误差造成的. 证伪不能存真. 第一节 假设检验概述 1、假设检验的基本思想 2、假设检验的步骤 3、两类错误和假设检验的规则 二、假设检验的步骤 1、根据具体的问题,建立原假设和备择假设 2、构造一个合适的统计量,计算其抽样分布 (均值检验) 3、给定显著水平和确定临界值 。 显著水平通常取0.1、0.05或0.01。在确定了显著水平 后,根据统计量的分布就可以确定找出接受区域和拒绝 区域的临界值。 4、根据样本的值计算统计量的数值并作出决策。 如果统计量的值落在拒绝域中,那么就没有通过检验, 说明有显著差异,拒绝

6、原假设。 如果统计量的值落在接受域中,通过了假设检验,说明 这种差异是由于抽样造成,这个样本不能拒绝原假设。 1、原假设与备择假设 原假设(null hypothesis) :一般研究者想收集证据予以反对 的假设。表示为H0 备择假设(alternative hypothesis):一般研究者想收集证据 予以支持的假设。表示为H1 由于假设检验中只有在小概率事件发生的情况下才拒绝原 假设,因此在假设检验过程中是保护原假设的。 有三种形式: (1)双侧检验 H0: 0,H1: 0(不等,有差异); (2)左侧检验 H0: 0 , H1 : 0 (提高,增加) 采用哪种形式要根据实际问题。 某种饮

7、料的易拉罐瓶的标准容量为335毫升,为对生 产过程进行控制,质量监测人员定期对某个分厂进 行检查,确定这个分厂生产的易拉罐是否符合标准 要求。如果易拉罐的平均容量大于或小于335毫升, 则表明生产过程不正常。试陈述用来检验生产过程 是否正常的原假设和备择假设 解:解:研究者想收集证据予以证明的假设应该是“ 生产过程不正常”。建立的原假设和备择假设为 H0 : 335ml H1 : 335ml 消费者协会接到消费者投诉,指控品牌纸包装 饮料存在容量不足,有欺骗消费者之嫌。包装 上标明的容量为250毫升。消费者协会从市场上 随机抽取50盒该品牌纸包装饮品进行假设检验 。试陈述此假设检验中的原假设和

8、备择假设。 解:消费者协会的意图是倾向于证实饮料厂包装 饮料小于250ml 。建立的原假设和备择假设为 H0 : 250ml H1 : H1成立 小概率事件发生拒绝H0成 立 没有发现矛盾 证明失败 小概率事件没有发生不能 拒绝H0成立 小概率事件在一次实验中不可能发生的事件,如果发生了 ,那么就可以拒绝原来的假设。泰力布:等待黑天鹅的人 显著性水平和拒绝域 (单侧检验 ) 0 0 临界值临界值 样本统计量样本统计量 拒绝拒绝H H 0 0 抽样分布抽样分布 1 - 1 - 置信水平置信水平 拒绝域 接受域 显著性水平和拒绝域 (左侧检验 ) 0 0 临界值临界值 样本统计量样本统计量 拒绝拒

9、绝H H 0 0 抽样分布抽样分布 1 - 1 - 置信水平置信水平 观察到的样本统计量观察到的样本统计量 显著性水平和拒绝域 (左侧检验 ) 0 0 临界值临界值 样本统计量样本统计量 拒绝拒绝H H 0 0 抽样分布抽样分布 1 - 1 - 置信水平置信水平 观察到的样本统计量观察到的样本统计量 【例2】一种罐装饮料采用自动生产线生产,每罐的容量 是255ml,标准差为5ml,服从正态分布。换了一批工人后 ,质检人员在某天生产的饮料中随机抽取了16罐进行检验 ,测得每罐平均容量为257.2ml。取显著性水平=0.05 ,检 验该天生产的饮料容量是否增加了? 右侧检验右侧检验 H0 : 25

10、5 H1 : 255 z z 0 0 拒绝拒绝H H 0 0 0.050.05 1.6451.645 决策:拒绝H0 结论:样本提供的证据表明:该天 生产的饮料与标准有显著差异,可 以认为换工人后容量增加了。 显著性水平和拒绝域 (右侧检验 ) 0 0 临界值临界值 样本统计量样本统计量 拒绝拒绝H H 0 0 抽样分布抽样分布 1 - 1 - 置信水平置信水平 观察到的样本统计量观察到的样本统计量 显著性水平和拒绝域 (右侧检验 ) 0 0 临界值临界值 样本统计量样本统计量 抽样分布抽样分布 1 - 1 - 置信水平置信水平 拒绝拒绝H H 0 0 第一节 假设检验概述 1、假设检验的基本

11、思想 2、假设检验的步骤 3、两类错误和假设检验的规则 三、两类错误和假设检验的规则 1. 第类错误(弃真错误) 原假设为真时拒绝原假设 第类错误的概率记为 被称为显著性水平 2. 第类错误(取伪错误) 原假设为假时未拒绝原假设 第类错误的概率记为(Beta) H H0 0 : : 无罪无罪 假设检验中的两类错误假设检验中的两类错误 陪审团审判 裁决 实际情况 无罪有罪 有罪错误正确 无罪正确错误 H0 检验 决策 实际情况 H0为真H0为假 拒绝H0 第类错 误( ) 正确决策 (1-b ) 未拒绝H0 正确决策 (1 ) 第类错 误(b ) 假设检验就 好像一场审判过程 统计检验统计检验

12、过程过程 H H0 0 : : 药品为真药药品为真药 假设检验中的两类错误之间的关系假设检验中的两类错误之间的关系 真药假药 拒绝 拒绝域大 大弃真 正确 不拒绝 正确 接受域小 b小取伪 宁可错杀三千,不可放过一个。 H H0 0 : : 某次面试为好机会某次面试为好机会 好机会 不好的机 会 拒绝 (不去) 拒绝域小 小 正确 不拒绝 (去) 正确 接受域大 b大 错误和 错误的关系 你不能同时减少 两类错误!只能 增加样本容量。 和 的关系就像 翘翘板,小 就 大, 大 就小 四、置信区间与假设检验之间的关系 1、根据置信度1- 构造置信区间,如果统计量落在 置信区间中,那么接受原假设,

13、如果不在置信区间中 ,那么拒绝原假设。 2、根据显著水平 ,可以构建置信度为1- 的置 信区间。 一个总体的检验 Z 检验 (单侧和双侧) t 检验 (单侧和双侧) Z 检验 (单侧和双侧) 检验 (单侧和双侧) 均值 一个总体 比例方差 第二节 总体均值的检验 一、单个总体均值的检验 (Z T) 二、两个总体均值检验 (等方差、异方差) 三、两个非正态总体均值之差的检验( 成对检验) 一、单个正态总体均值的检验 确定检验统计量的因素: 1、样本容量的大小 2、总体分布形状 3、总体方差是否已知 主要情形(6种) 1.正态总体(方差未知,且为小样本,1种) 2.正态总体(方差已知,小样本,1种

14、) 3.大样本(不论总体是否正态,不论方差是否已 知,4种) 三种假设检验的形式(双侧,左侧和右侧) (一)总体平均数的检验(小样本,正态,方差已知) 1. 假定条件 总体服从正态分布 小样本(n 0 0 必须必须显著地显著地大于大于 0 0 ,小的小的 值满足值满足 H H0 0 ,不能拒绝 ,不能拒绝 Z Z 0 0 拒绝拒绝 H H 0 0 根据过去大量资料,某厂生产的灯泡的使用寿命 服从正态分布N(1020,1002)。现从最近生产的 一批产品中随机抽取16只,测得样本平均寿命为 1080小时。试在0.05的显著性水平下判断这批产 品的使用寿命是否有显著提高?(0.05) 右侧检验右侧

15、检验 H0 : 1020 H1 : 1020 z z 0 0 拒绝拒绝H H 0 0 0.050.05 1.6451.645 决策:在在 0.050.05的水平上的水平上拒绝H0 结论:样本提供的证据表明:该天 生产的饮料与标准有显著差异,可 以认为试用寿命提高了。 总体均值的检验(z检验) (P 值的计算与应用) 第1步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数) 第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定 第3步:将 z 的绝对值2.4录入,得到的函数值为 0.9918 P值= 1-0.9918= 0.0082 P值小于,故拒绝H0 总体均值的检验(z检验) (P 值的图示) 抽样分布抽样分布 P P = = 0.0082 0 0 1.6451.645 = =0.050.05 拒绝拒绝H H 0 0 1 - 1 - 计算出的样本统计量计算出的样本统计量=2.4=2.4 P P 值值 【例3】一种罐装饮料采用自动生产线生产,每罐的容量是 255ml,标准差为5ml,服从正态分布。换了一批工人后, 质检人员在某天生产的饮料中随机抽取了16罐进行检验, 测得每罐平均容量为252.8ml。取显著性水平

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号