《《假设检验》PPT课件》由会员分享,可在线阅读,更多相关《《假设检验》PPT课件(58页珍藏版)》请在金锄头文库上搜索。
1、理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计第八章第八章假假 设设 检检 验验ch81理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计 所谓假设检验假设检验是指提出关于总体的某项假设,然后根据所获得的样本来判断这个假设是否成立。 假设检验问题可分为参数假设检验和非参数假设检验两类。 做假设检验,首先要提出假设。假设分为原假原假
2、设设(记为H0)和备择假设备择假设(记为H1)。备择假设又分为双边备择假设和单边备择假设(右边备择假设或左边备择假设)。1 1 假设检验假设检验ch82理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计例1、某车间用一台包装机包装葡萄糖,每包的重量是一个随机变量,它服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015公斤。某日开工后为检验包装机是否正常工作,随机地抽取它所包装地9袋葡萄糖,称得净重为(千克):现设标准差不变,问机器是否正常工作?由题意
3、知:XN(,0.0152),这里未知,问题是根据样本值来判断是 00.5,还是 0?0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 ch83理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计假设检验的基本步骤:1、建立假设:、建立假设: 在假设检验中,常把一个被检验的假设称为原假设原假设,用H0表示,通常将不应轻易加以否定的假设作为原假设;当H0被拒绝时而接受的假设称为备择假设备择假设,用H1表示,在例1
4、中我们可以建立两个假设:H0: 00.5;原假设;H1: 0 备择假设ch84理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计2、选择检验统计量,给出拒绝域形式、选择检验统计量,给出拒绝域形式 由样本对假设进行判断,总是通过一个统计量来完成的,由样本对假设进行判断,总是通过一个统计量来完成的,该统计量称为该统计量称为检验统计量检验统计量。使原假设被拒绝的样本观测。使原假设被拒绝的样本观测值的区域称为值的区域称为拒绝域拒绝域。 选择合适的统计量选择合适的统计量,
5、由由H1确定拒绝域形式确定拒绝域形式。 在例1中,由于样本均值 是0的无偏估计量,我们说H1: 0是指 :某个正数ch85理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计3、选择显著性水平、选择显著性水平 任何检验方法都不能完全排除犯错误的可能性任何检验方法都不能完全排除犯错误的可能性. 在假设在假设检验中可能犯的错误有两种:检验中可能犯的错误有两种: 一种是一种是H0为真时而拒绝为真时而拒绝H0,称之为,称之为第一类错误第一类错误; 一种是一种是H0为假时而接
6、受为假时而接受H0,称之为,称之为第二类错误。第二类错误。 理想的检验方法应使犯两类错误的概率都很小理想的检验方法应使犯两类错误的概率都很小, 但在样但在样本容量给定的情形下本容量给定的情形下, 不可能使两者都很小。而是降低不可能使两者都很小。而是降低一个一个, 往往会使另一个增大往往会使另一个增大.ch86理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计假设检验的两类错误假设检验的两类错误 犯第一类错误的概率通常记为犯第一类错误的概率通常记为 犯第二类错误的概
7、率通常记为犯第二类错误的概率通常记为 正确正确正确正确H0 为真为真H0 为假为假真实情况真实情况所作判断所作判断接受接受 H0拒绝拒绝 H0第一类错误第一类错误( (弃真弃真) )第二类错误第二类错误( (取伪取伪) )ch87理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计 假设检验的指导思想是假设检验的指导思想是“犯第一类错误为小概率事件犯第一类错误为小概率事件”,即控制犯第一类错误的概率不超过,即控制犯第一类错误的概率不超过 一个较小的一个较小的数数称为
8、称为显著性水平显著性水平,一般取,一般取 0.05, 0.01等等, 然后然后, 若有必要若有必要,通过增大样本容量的方法来减少通过增大样本容量的方法来减少 。在例1中,我们取 0.05,ch88理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计4、求出拒绝域,做出判断、求出拒绝域,做出判断 根据显著性水平,我们可以求出拒绝域,根据所取样本观测值,做出接受还是拒绝H0的判断。ch89理学院University of Shanghai for Science and
9、 TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计例1的解题过程:解解 按题意需检验假设 H0: 00.5 原假设; H1: 0 备择假设。选择检验统计量:拒绝域:在显著性水平取 0.05时:ch810理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计由所给样本计算得:于是因此,拒绝H0认为这天包装机工作不正常。ch811理学院University of Shanghai for Science and Techn
10、ologyCollege of Science 上海理工大学上海理工大学概率论与数理统计 某厂生产的螺钉,按标准强度为68/mm2, 而实际生产的强度X 服N(, 3.62 ).当E(X)=68时, 认为这批螺钉符合要求,否则认为不符合要求.现从整批螺钉中取容量为36的样本,其均值为 68.5。在显著性水平取 0.05时,检验这批螺钉是否符合要求?解:提出如下假设:H0 : = 068原假设的对立面:H1 : 068例2ch812理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学
11、概率论与数理统计著性水平取0.05,则由由即区间即区间( ,66.824 ) 与与 ( 69.18 , + )为检验的为检验的拒绝域拒绝域ch813理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计为检验的为检验的接受域接受域 (实际上没理由拒绝实际上没理由拒绝),现现称称 的取值区间的取值区间( ( 66.824 , , 69.18 ) )落入接受域落入接受域,则接受原假设则接受原假设 H H0 0: : = = 68即认为即认为这批螺钉这批螺钉是是符合要求符合
12、要求的。的。ch814理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计单侧检验单侧检验 前面的检验,拒绝域取在两侧,称为双侧前面的检验,拒绝域取在两侧,称为双侧检验检验.即做假设:即做假设: H0: 0原假设;H1: 0除了双侧检验以外,我们还常做单边检验除了双侧检验以外,我们还常做单边检验.如需检验假设:H0: 0; H1: 0右边检验;或H0: 0; H1: 0右边检验的拒绝域的确定:由于H0中的全部比H1中的全部要小,当H1为真时观察值 x 一般偏大。因此
13、,拒绝域为:H0: 0; H1: 0=40(即假设新方法有显著提高)。通过样本均值计算得:这是右边检验问题。其拒绝域为拒绝假设H0,即认为新方法使得燃烧率有显著提高。ch818理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计例例4 某织物强力指标某织物强力指标X的均值的均值 =21公斤公斤. 改改进工艺后生产一批织物,今从中取进工艺后生产一批织物,今从中取30件,测件,测得得 =21. 25公斤公斤. 假设强力指标服从正态分假设强力指标服从正态分布布 且已知且已
14、知 =1.2公斤,公斤, 问在显著问在显著性水平性水平 =0.01下,新生产织物比过去的织物下,新生产织物比过去的织物强力是否有提高强力是否有提高?ch819理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计解解: :提出假设提出假设: : 取统计量取统计量否定域为否定域为 W :=2.33 是是一小概率事件一小概率事件代入代入 =1.2, n=30,并由样本值计算得并由样本值计算得统计统计量量Z的实测值的实测值U=1.1412.33故接受原假设故接受原假设H0
15、.认为认为新生产织物比过去的织新生产织物比过去的织物强力没有显著提高。物强力没有显著提高。落入接受域落入接受域ch820理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计2 2 正态总体的均值与方差检验正态总体的均值与方差检验ch821理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计拒绝域的推导拒绝域的推导设 X N ( 2),2
16、已知,做双边检验,需检验:H0: 0 ; H1: 0构造统计量 给定显著性水平与样本值(x1,x2,xn)单个正态总体均值与方差的假设检验单个正态总体均值与方差的假设检验一、方差已知时,正态总体均值的假设检验Z 检验ch822理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计P拒绝H0|H0为真所以本检验的拒绝域为所以本检验的拒绝域为W :U检验法检验法ch823 0 0 0 0 0U 检验法检验法 ( 2 已知已知)原假设 H0备择假设 H1检验统计量及其H0为
17、真时的分布拒绝域ch824理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计例1某厂生产一种零件,其平均长度等于100mm才算合格. 现从一批这种零件中随机抽出25个,测得其长度平均值为98.5mm,已知这种零件的长度且已知N ( 2) ,其标准差=10mm,试在显著性水平=0.05之下判定该批零件是否合格.解:本题要在显著性水平=0.05下,检验假设 H0: =100; H1: 100;此时,是在2已知条件下对作检验,故用Z检验,取ch825理学院Univers
18、ity of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计而由于故接受H0,判定该批零件合格. ch826理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计 二、二、 2未知时,均值未知时,均值的假设检验的假设检验t t 检验检验 设总体XN(, 2) , 2未知,(X1,X2,Xn)是来自总体 X 的样本这里要检验的是对于给定的显著性水平 ,拒绝域为我们用 S
19、 2 代替 2 ,当H0为真时,检验统计量 上述检验统计量服从 t 分布,称这种检验为 t 检验类似地可以进行单边检验.H0: 0 ; H1: 0ch827 0 0 0 0 0t t 检验法检验法 ( 2 2 未知未知) )原假设 H0备择假设 H1检验统计量及其H0为真时的分布拒绝域ch828理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计例例1 1 某厂生产的马达说明书上写着: 在正常负载下马达平均消耗电流不会超过0.8 安培. 现随机抽取16台马达试验,
20、求得平均消耗电流为0.92安培, 消耗电流的标准差为0.32安培. 假设马达所消耗的电流服从正态分布, 取显著性水平为 = 0.05, 问据此样本, 能否否定厂方的断言?ch829理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计解解 根据题意待检假设可设为 H0 : 0.8 ; H1 : 0.8 未知, 检验统计量:拒绝域W为现故接受原假设, 即不能否定厂方断言.ch830理学院University of Shanghai for Science and Tec
21、hnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计解二解二 H0 : 0.8 ; H1 : 02 2 0.00040. 此时可采用效果相同的单边假设检验 H0 : 2 =0.00040 ;H1 : 2 0.00040. 取统计量ch837理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计落在拒绝域内, 故拒绝H0. 即改革后的方差显著大于改革前, 因此下一步的改革应朝相反方向进行.拒绝域 :ch838理学院Universi
22、ty of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计例例3 3 某自动机床加工车轴,根据要求车轴直径的方差不应超过0.1. .为检验自动机床的工作精度,从加工后的车轴中抽取25件产品,测得数据如下:车轴直径车轴直径 xi 3.2 3.6 3.9 4.3 4.5 频频 数数 ni 3 5 8 7 2设车轴直径服从正态分布,取0.05检验机床是否达到所要求的精度?ch839理学院University of Shanghai for Science and TechnologyCollege
23、of Science 上海理工大学上海理工大学概率论与数理统计 解解 设X为加工车轴的直径,则作右侧假设检验取检验统计量 拒绝域 算得 ch840理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计ch841理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计落拒绝域W外,接受Ho即认为机床达到所要求的精度. ch842理学院Univer
24、sity of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计设 X N ( 1 1 2 ), Y N ( 2 2 2 ) 两样本 X , Y 相互独立, 样本 (X1, X2 , Xn1 ), ( Y1, Y2 , Yn2 ) 样本值 ( x1, x2 , xn1 ), ( y1, y2 , yn2 )显著性水平 两个正态总体的检验两个正态总体的检验ch8431 2 = ( 12,22 已知)(1) (1) 关于均值差关于均值差 1 1 2 2 的的t t检验检验1 2 1 2 1 2 1
25、2 原假设 H0备择假设 H1检验统计量及其在H0为真时的分布拒绝域ch8441 2 = 1 2 1 2 1 2 1 2 其中12, 22未知12 = 22原假设 H0备择假设 H1检验统计量及其在H0为真时的分布拒绝域ch845理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计例例4 4 杜鹃总是把蛋生在别的鸟巢中,现从两种鸟巢中得到杜鹃蛋24个.其中9个来自一种鸟巢, 15个来自另一种鸟巢, 测得杜鹃蛋的长度(mm)如下:m = 1519.8 20.0 20.
26、3 20.8 20.9 20.9 21.0 21.0 21.0 21.2 21.5 22.0 22.0 22.1 22.3n = 921.2 21.6 21.9 22.0 22.022.2 22.8 22.9 23.2ch846理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计 试判别两个样本均值的差异是仅由随机因素造成的还是与来自不同的鸟巢有关 ( =0.05 ).解解 H0 : 1 = 2 ; H1 : 1 2 取统计量ch847理学院University o
27、f Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计拒绝域 0:统计量值 . 落在0内,拒绝H0 即蛋的长度与不同鸟巢有关.ch848 12 = 22 12 22 12 22 12 22 12 22 12 22(2) (2) 关于方差比关于方差比 1 12 2 / / 2 22 2 的检验的检验1, 2 均未知原假设 H0备择假设 H1检验统计量及其在H0为真时的分布拒绝域ch849理学院University of Shanghai for Science and TechnologyColle
28、ge of Science 上海理工大学上海理工大学概率论与数理统计 例例4 为比较两台自动机床的精度,分别取容为比较两台自动机床的精度,分别取容量为量为10和和8的两个样本,测量某个指标的尺的两个样本,测量某个指标的尺寸寸(假定服从正态分布假定服从正态分布),得到下列结果:,得到下列结果:在在 =0.1时,时, 问这两台机床是否有同样的问这两台机床是否有同样的精度精度?车床甲:车床甲:1.08, 1.10, 1.12, 1.14, 1.15, 1.25, 1.36, 1.38,1.40,1.42车床乙:车床乙:1.11, 1.12, 1.18, 1.22, 1.33, 1.35, 1.36,
29、 1.38ch850理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计解解: :设设两台自动机床的方差分别为两台自动机床的方差分别为在在 =0.1=0.1下检验假设下检验假设: : 其中其中 为两样本的样本方差为两样本的样本方差取统计量取统计量否定域为否定域为 W:或或ch851理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计由样本
30、值可计算得由样本值可计算得F的实测值为的实测值为: :查表得查表得由于由于 0.3041.513.68, 故接受故接受H0 .否定域为否定域为 W:或或F=1.51这时可能犯第二类错误这时可能犯第二类错误.ch852理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计例例5 5 假设机器 A 和 B 都生产钢管, 要检验 A 和 B 生产的钢管内径的稳定程度. 设它们生产的钢管内径分别为 X 和 Y , 且都服从正态分布 X N (1, 12) , Y N (2,
31、22) 现从机器 A和 B生产的钢管中各抽出18 根和13 根, 测得 s12 = 0.34, s22 = 0.29,ch853理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计 设两样本相互独立. 问是否能认为两台机器生产的钢管内径的稳定程度相同? ( 取 = 0.1 )解解设 H0 : 12 = 22 ;H1 : 12 22 查表得 F0.05( 17, 12 ) = 2.59,F0.95( 17, 12 ) = ch854理学院University of S
32、hanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计拒绝域为:或由给定值算得:落在拒绝域外,故接受原假设, 即认为内径的稳定程度相同.ch855理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计作业P2631,2,3 ,4,5ch856理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计已知某次考试的成绩服从正态分布N(, 152 ) ,现从中随机的抽取36位考生的成绩,算得平均成绩为,试在显著水平0.05下检验: ch857理学院University of Shanghai for Science and TechnologyCollege of Science 上海理工大学上海理工大学概率论与数理统计自测试题浏览自测试题浏览:上海理工大学主页课程中心课程资源全部课程理学院22000172概率论与数理统计B教师网站水平自测ch858