第五章期末复习总结与习题 假设检验.doc

上传人:M****1 文档编号:543120673 上传时间:2022-12-23 格式:DOC 页数:6 大小:125.51KB
返回 下载 相关 举报
第五章期末复习总结与习题 假设检验.doc_第1页
第1页 / 共6页
第五章期末复习总结与习题 假设检验.doc_第2页
第2页 / 共6页
第五章期末复习总结与习题 假设检验.doc_第3页
第3页 / 共6页
第五章期末复习总结与习题 假设检验.doc_第4页
第4页 / 共6页
第五章期末复习总结与习题 假设检验.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《第五章期末复习总结与习题 假设检验.doc》由会员分享,可在线阅读,更多相关《第五章期末复习总结与习题 假设检验.doc(6页珍藏版)》请在金锄头文库上搜索。

1、假设检验概述一、假设检验的基本概念1.假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。 2.与原假设对立的是备选假设(alternative hypothesis) ,备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。 构造一个统计量来决定是“接受原假设,拒绝

2、备选假设”,还是“拒绝原假设,接受备选假设”。对不同的问题,要选择不同的检验统计量。检验统计量确定后,就要利用该统计的分布以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。在给定的显著性水平下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平的区域,是原假设的拒绝区域;大概率区域是概率为1-的区域,是原假设的接受区域。 二、两种类型的错误 接受拒绝 真实判断正确弃真错误(第一类错误或错误) 不真实取伪错误(第二类错误或错误) 判断正确原假设1. 研究者想收集证据予以反对的假设2. 又称“0假设”3. 总是有

3、符号 =, 或 4.表示为 H0n H0 : m = 某一数值 n 指定为符号 =, 或 备择假设1. 研究者想收集证据予以支持的假设2. 也称“研究假设”3. 总是有符号 , 4. 表示为 H1n H1 : m 某一数值n 例如, H1 : m 10cm提出假设(结论与建议)1. 原假设和备择假设是一个完备事件组,而且相互对立n 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2. 先确定备择假设,再确定原假设 3. 等号“=”总是放在原假设上 4. 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)显著性水平a1.是一个概率值 2.原假设为真时,拒绝原假设

4、的概率 被称为抽样分布的拒绝域3.表示为 a (alpha) 常用的 a 值有0.01, 0.05, 0.104.由研究者事先确定总体参数检验一、单侧检验与双侧检验1. 备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 2. 备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)n 备择假设的方向为“”,称为右侧检验 假设双侧检验单侧检验左侧检验右侧检验原假设H0 : m = m0H0 : m m0H0 : m m0备择假设H1 : m m0H1 : m m0用单侧检验还是双

5、侧检验,使用左侧检验还是右侧检验,决定于备选假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。 二、参数检验参数检验都是先对样本所属总体的性质作出若干的假定,或对总体的分布形状加以限定,然后对总体的有关参数情况进行统计假设检验。因此,参数检验又称为限定分布检验。如在总体服从正态分布条件下,对其均值进行检验。下面通过具体例子来说明参数检验方法。在例1中,按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下: 第一步:确定原假设与备选假设。 : =250; : 250 以

6、上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。 第二步:构造出检验统计量。 我们知道,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到: 可用z作为检验统计量。 第三步:确定显著性水平,确定拒绝域。 通常显著水平由实际问题确定,我们这里取=0.05,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值: - =-1.645,拒绝域是z-1.645。 第四步:计算检验统计量的数值。 样本平均数 ,n=50,代入检验统计量得

7、第五步:判断。 检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺诈之嫌 总体标准差未知时对总体均值检验经常用t统计量: 但是,在大样本场合(样本容量n大于30时),t-统计量与标准正态分布统计量近似,通常用z检验代替t检验。三、p-值检验p-值检验就是通过计算p-值,再将它与显著性水平作比较,决定拒绝还是接受原假设。所谓p-值就是拒绝原假设所需的最低显著性水平。p-值判断的原则是:如果p-值小于给定的显著性水平,则拒绝原假设;否则,接受原假设。或者,更直观来说就是:如果p-值很小,拒绝原假设,p-值很大,

8、接受原假设。请大家注意的是这里的p-值是指概率,不要与成数指标相混淆。 z检验的p-值: 检验统计量为z统计量的p-值计算公式, 表示检验统计量的抽样数据,则p-值的计算方法如下: 如果: , p-值=2 如果: , p-值= 如果: , p-值= 总体均值的检验(z检验).1.假定条件n 正态总体或非正态总体大样本(n30)2. 使用z检验统计量n s 2 已知:n s 2 未知:总体均值的检验 (检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0统计量s 已知:s 未知:拒绝域P值决策拒绝H0总体均值的检验(t检验

9、)1.假定条件 总体服从正态分布2. 检验统计量s 2 未知总体均值的检验 (检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0统计量s 未知:拒绝域P值决策拒绝H01将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是( b )。a. 单侧检验b.双侧检验c.右侧检验d.左侧检验2.检验功效定义为( b )。a. 原假设为真时将其接受的概率b. 原假设不真时将其舍弃的概率c. 原假设为真时将其舍弃的概率d. 原假设不真时将其接受的概率3.符号检验中,(+)号的个数与(-)号的

10、个数相差较远时,意味着(c )。a.存在试验误差(随机误差)b.存在着条件误差c.不存在什么误差d.既有抽样误差,也有条件误差4.得出两总体的样本数据如下:甲:8,6,10,7,8乙:5,11,6,9,7,10秩和检验中,秩和最大可能值是( c )。a. 15b. 48c. 45d. 661.显著性水平与检验拒绝域关系( a b d )a. 显著性水平提高(变小),意味着拒绝域缩小b. 显著性水平降低,意味着拒绝域扩大 c. 显著性水平提高,意味着拒绝域扩大d. 显著性水平降低,意味着拒绝域扩大化e. 显著性水平提高或降低,不影响拒绝域的变化2. 错误( a c d e )a. 是在原假设不真

11、实的条件下发生b. 是在原假设真实的条件下发生c. 决定于原假设与真实值之间的差距d. 原假设与真实值之间的差距越大,犯错误的可能性就越小e. 原假设与真实值之间的差距越小,犯错误的可能性就越大1假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平a=0.01与a=0.05,分别检验这批产品的平均重量是否是800克。解:假设检验为 (产品重量应该使用双侧检验)。采用t分布的检验统计量。查出0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。因为2.1312.34(2.32),所以拒绝原假设,无故障时

12、间有显著增加。3回顾本章开头的案例,医院从2008年元旦出生的新生儿中随机抽取了50名,测量他们的平均体重为3300克,而2007年元旦时抽取的50名新生儿的平均体重是3200克。现假设根据以住的调查,新生儿体重的标准差是65克。试问:(1)以0.05的显著性水平,检验新生儿体重在这两年中是否有显著的变化?(2)计算检验的p-值,并根据p-值重新检验(1)中的结论。解:(1)假设检验为。新生儿体重服从正态分布,构造检验统计量。查出0.05水平下的临界值为1.645。计算统计量值。因为z1.645,所以拒绝原假设。(2)对应p值1/2*(1-F(z) ,由于z=10.878573,可以认为p值几

13、乎等于0,拒绝原假设。(1)、(2)都说明这两年新生儿的体重显著增加了。4某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。试问:(1)以0.05的显著性水平,是否有证据说明平均加油量并非12加仑?(2)计算(1)的p-值。(3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油?(4)计算(3)的p-值。(5)在加油量服从正态分布假设下,若样本容量为25,计算(1)和(2)。解:(1)(2)假设检验为。采用正态分布的检验统计量。查出0.05水平下的临界值为1.96。计算统计量值。因为z

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号