概率论与数理统计课件22

上传人:飞*** 文档编号:56889852 上传时间:2018-10-16 格式:PPT 页数:51 大小:1.37MB
返回 下载 相关 举报
概率论与数理统计课件22_第1页
第1页 / 共51页
概率论与数理统计课件22_第2页
第2页 / 共51页
概率论与数理统计课件22_第3页
第3页 / 共51页
概率论与数理统计课件22_第4页
第4页 / 共51页
概率论与数理统计课件22_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《概率论与数理统计课件22》由会员分享,可在线阅读,更多相关《概率论与数理统计课件22(51页珍藏版)》请在金锄头文库上搜索。

1、8.1 假设检验的概念,假设检验是统计推断的一个主要部分。其想法和前面的最大似然类似:如果实际观测到得到数据在某假设下不太可能出现则认为该假设错误。,第八章 假设检验,解: 隧道南3.5公里, 隧道北6.5公里.用p表示一起交通事故发生在隧道南的概率.,则p=0.35表示隧道南北的路面发生交通事故的可能性相同.p0.35表示后隧道南的路面发生交通事故的概率比隧道北的路面发生交通事故的概率大.,例 1.1: 一条新建的南北交通干线全长10公里. 公路穿过一个隧道(长度忽略不计),隧道南面3.5公里, 北面6.5公里. 在刚刚通车的一个月中, 隧道南发生了3起交通事故, 而隧道北没有发生交通事故,

2、能否认为隧道南的路面更容易发生交通事故?,为了作出正确的判断, 先作一个假设H0: p=0.35. 我们称H0是原假设或零假设.再作一个备择假设H1: p 0.35.在本问题中,如果判定H0不对,就应当承认H1.,三起交通事故的发生是相互独立的, 他们之间没有联系.如果H0为真, 则每一起事故发生在隧道南的概率都是0.35,于是这三起交通事故都发生在隧道南的概率是这是一个很小的概率, 一般不容易发生.所以我们否定H0, 认为隧道南的路面发生交通事故的概率比隧道北大.,做出以上结论也有可能犯错误, 犯错误的概率正是0.043.,这是因为当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都

3、出现在隧道南时, 我们才犯错误. 这一概率正是P=0.043.,于是, 我们判断正确的概率是1-0.043=95.7% (在多次解决类似问题意义下).,通过对例1.1的分析, 我们得到以下的概 念,进行假设检验时, 根据问题的背景, 提出 原假设H0: p=0.35, 及其备择假设H1: p0.35.,在H0 成立的假设下, 计算观测数据出现的概率P.,如果P很小(一般用0.05衡量), 就应当否定 , 承认 ;,为了简便, 我们把以上的原假设和备择假设记作H0: p=0.35 vs H1: p0.35. 其中的vs是versus的缩写.,如果P不是很小, 也不必急于承认H0, 这是因为证据往

4、往还不够充分.如果继续得到的观测数据还不能使得P降低下来, 再承认H0不迟.,一般来讲,设 是来自总体X的样本,是总体的未知参数, 但是已知 。 这里 是 的大写, 是互不相交的参数集合。对于假设,的检验法(我们用表示这个检验法),,参数检验的一般提法,如果否定 时犯错误的概率不超过 , 就称 是检验水平为 的检验,称 是检验法的检 验水平。,定义1.1. 设 是(0,1)中的常数。如果对一切的,有,就称拒绝域W的检验水平或 显著性水平是 。,即:,检验法可以被事件完全确定,事件发 生时拒绝 ,称为拒绝域。,假设检验的两类错误,在解决假设检验的问题时, 无论作出否定还是接受原假设 的决定, 都

5、有可能犯错误.我们称否定 时犯的错误为第一类错误, 接受 时犯的错误为第二类错误.,假设检验一般控制第一类错误在检验水平 以下, 所以否定 时结论比较可靠。如果承认 ,可能犯第二类错误,错误概率可能会比较大。,在正确的统计推断前提下, 犯错误的原因总是随机因素造成的。要有效减少犯错误的概率, 只好增加观测数据,或在可能的情况下提高数据的质量,这相当于降低数据的样本方差.,在例1.1中, 如果第一起交通事故发生后, 就断定隧道南更容易发生交通事故, 犯第一类错误的概率是0.35.,当第二起交通事故发生后, 断定隧道南更容易发生交通事故, 犯第一类错误的概率是0.352 = 0.1225.如果第四

6、起交通事故又发生在隧道南, 否定p=0.35时犯第一类错误的概率是0.354=0.015.,例1.:第一类错误与第二类错误的比较一个有20多年教龄的教师声称他上课从来不“点名”. 如何判定他讲的话是真实的?,确立原假设H0: 他没有点过名, 然后再调查H0是否为真.,当调查了他教过的3个班, 都说他没有点过名, 这时如果承认H0, 犯错误的概率还是较大的.,当调查了他教过的10个班, 都说他没有点过名, 这时承认H0 犯错误的概率会明显减少。,如果调查了他教过的30个班, 都说他没有点过名, 这时承认H0犯错误的概率就会很小了。可惜调查30个班是很难做到的!,反过来, 在调查中只要有人证实这位

7、老师点过名, 就可以否定H0了(不论调查了几个班), 并且这样做犯错误的概率很小.,例1.2告诉我们, 要否定原假设H0是比较简单的, 只要观测到了H0下小概率事件就可以。,要承认H0就比较费力了: 必须有足够多的证据(样本量), 才能够以较大的概率保证H0的真实.,在这个例子中还有一个现象值得注意: 当调查10个班发现都没有点过名就承认H0时, 即使判断失误, 造成的后果也不严重. 因为数据已经说明这位老师不爱点名.,8.2 正态均值的假设检验,A. 已知时, 的正态检验法,例 2.1: 一台方差是0.8克的自动包装机在流水线上包装净重500克的袋装白糖。随机抽取了包装的9袋白糖, 测得净重

8、如下(单位:克):499.12 499.48 499.25 499.53 500.82 499.11 498.52 500.01 498.87.能否认为包装机在正常工作?,分析: 抽查的9袋白糖中有7袋净重少于500克, 似乎净重0=500不对.,但是, 方差是0.8克, 也可能是由于包装机的随机误差导致了以上的数据.,下面的分析说明, 由于随机误差导致上述观测数据的概率不超过0.05.,将包装机包装的袋装白糖的净重视为总体X,则X N ( 2), 其中2 =0.8已知,未知.,在H0下,|Z|取值应当与0差距不大。当|Z|取值较大时, 要否定H0.,用Xj表示第j袋白糖的净重, 则X1,X2

9、,X9是来自总体X的n=9个样本.,设0=500, 作假设H0: =0 vs H1: 0.,对于标准正态分布的上/2分位数z/2, 在H0下, P(|Z| z/2 )= 。,本例中,如果取 =0.05, 则 z/2 =1.96 , P(|Z| 1.96)=0.05.当|Z| 1.96时, 不该发生的小概率事件发生了, 于是否定原假设H0.,所以应当否定H0, 认为包装机没有正常工作.,在H0下, 检验统计量,解:设0=500, 作假设 H0: =0 vs H1: 0.,查标准正态分布表, 得 z/2 =1.96 ,拒绝域为:,所以应当否定H0, 认为包装机没有正常工作.,由于,在例2.1中,称

10、为检验的显著性水平, 简称为显著性水平, 检验水平, 或水平(level);,称Z为检验统计量;称|Z| z/2为检验的拒绝域或否定域;,值得注意, 拒绝域是一个事件, 它的发生与否由|Z|, 从而由观测样本X1,X2,.,Xn决定.,如果|Z| z/2发生, 就称检验是显著的. 这时否定H0, 犯第一类错误的概率不超过; 检验水平就是犯第一类错误的概率.,其中,如果 发生,就称检验是显著的.,如果 是来自总体 的样本.已知时,,的显著性水平为 的拒绝域是,这时,否定 犯错误的概率不超过 。,特别当 时,,由于这种检验方法是基于正态分布的方法, 所以又称为正态检验法或检验法.,已知 时, 的正

11、态检验法,在例2.1中, 如果取检验水平 =0.04, 则临界值z/2=2.054 (查附录C1(续). 这时|Z|=1.972.054, 不能否定H0.,降低犯第一类错误的概率, 就会使得拒绝域减小,,从而拒绝 的机会变小,接受 的机会变大。,说明在不同的检验水平下可以得到不同的检验结果.,在例2.1中, 从实际数据计算得到 |z|=1.97. 如果拒绝域取成 |Z| 1.97, 则刚刚能够拒绝H0. 这时犯第一类错误的概率是P=P(|Z|1.97)=0.0488. 我们称P=0.0488是 检验的P值(P-value).,B. p值检验法,检验的P值(P-value) 是指在H0成立的假设

12、下根据已知观测, 被拒绝时最小的显著性水平。,引入P值,可以使假设检验的结果更有意义。,如果检验的显著性水平是事先给定的, 当P值小于等于, 就要否定H0.检验法(2.1)的P值是P=P(|Z| |z|) =2(-|z|).,P值是在H0成立的假设下观测到的样本倾向于 H1的概率。,P值越小, 数据提供的否定H0的证据越充分。, 0, 0, 0, 0, 0,Z 检验法 (2 已知),C.未知时,均值 的t 检验法,例 2.2: 在例2.1中如果9个袋装白糖的样品是从超级市场仓库中随机抽样得到的, 能否认为这批500克袋装白糖的平均重量是500克?,标准差未知, 可用样本标准差S代替.,分析:

13、对0=500克, 仍作假设 H0: = 0 vs H1: 0.,在H0下, 从 7.3节的定理3.6知道检验统计量,说明在H0下, T在0附近取值是正常的, 如果|T|取值较大就应当拒绝H0.,根据分位数t/2(n-1)的性质, 有P(|T| t/2(n-1)= . 于是H0的显著性水平为的拒绝域是,作出以上判断也有可能犯错误, 但是犯错误的概率不超过 0.05.,取=0.05, 查表得到t0.05/2(8)=2.306. 经过计算得到 |T|= 2.609 2.306, 所以应当否定H0, 认为500.,解: 对0=500克, 假设H0: = 0 vs H1: 0.,在H0下, 检验统计量:

14、,取 =0.05, 查表得到t0.05/2(8)=2.306。拒绝域为:,经过计算样本标准差 S=0.676, |T|= 2.609 2.306。,所以应当否定H0, 认为500。犯错误的概率不超过 0.05.,其中,如果 发生,就称检验是显著的。,如果 是来自总体 的样本.未知时,,的显著性水平为 的拒绝域是,这时,否定 犯错误的概率不超过 。,未知 时, 的检验法,由于这种检验方法是基于t分布的方法, 所以又称为t检验法.,设统计量的计算结果为a,则检验法(2.3)的值为,其中,,例2.1和例2.2都是检验:,当 比 大许多或小许多时,都应当否定原 假设 。所以这种检验问题又被称为双边检验

15、。,下面是单边检验问题,D.未知时,均值 的单边检验法,例2.3:在例2.2中, 抽查的9袋白糖的平均重量为499.412克可以引起我们的怀疑. 这批袋装白糖的平均重量是否不足呢?,分析:为了解决这个问题, 我们提出假设H0: 500 vs H1: 500 如果否定了H0,就认定这批袋装白糖的份量不足由于在H0下,不知道 的具体值, 所以检验统计量,的分布是未知的。,但是这时有,H0: 500 vs H1: 500,因为P(T t(n-1) P( T0 t(n-1)= ,所以可以构造拒绝域为,T t(n-1),当T t(n-1), 应当否定H0。,本例中,查表得到 t0.05(8)=1.86,经计算得 T=2.6091.86,所以应当否定H0,认定这批袋装白糖的分量不足。此时,犯第一类错误的概率不超过0.05。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 其它考试类文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号