《假设与检验统计学第三版贾俊平》由会员分享,可在线阅读,更多相关《假设与检验统计学第三版贾俊平(62页珍藏版)》请在金锄头文库上搜索。
1、第五章第五章 假设检验假设检验假设检验假设检验参数检验参数检验非参数检验非参数检验数学期望数学期望方差方差(z检验法检验法)(t 检验法检验法) 2检验法检验法(单正态总体单正态总体)F检验法检验法(双正态总体双正态总体)分布分布检验检验独立性独立性检验检验第第 五五 章章 统计假设检验统计假设检验 假设检验的基本问题假设检验的基本问题 总体均值的假设检验总体均值的假设检验 总体比例的假设检验总体比例的假设检验5.4 非参数检验非参数检验 假设检验是统计推断的一种方式,它首先对假设检验是统计推断的一种方式,它首先对总体的分布函数形式或分布的某些参数做出假设,总体的分布函数形式或分布的某些参数做
2、出假设,然后根据样本数据和然后根据样本数据和“小概率原理小概率原理”,对假设做,对假设做出判断。出判断。 假设检验就是根据假设检验就是根据样本样本对所提出的对所提出的假设假设作作出判断出判断: : 是接受是接受, , 还是拒绝。还是拒绝。 有参数检验和有参数检验和非非参数检验。参数检验。一、假设检验的基本概念假设检验假设检验1、原理: (1). 在一次试验中,一个几乎不可能发生的事件发生的概率(2). 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设(3). 小概率由研究者事先确定 先提出假设先提出假设H0 , 再根据再根据一次抽样所得到的样本值进行计算一次抽样所得到的样本值进行计算.
3、若导致小概率若导致小概率事件发生,则否认假设事件发生,则否认假设H0 ; 否则,接受假设否则,接受假设H0 .采用采用采用采用概率性质概率性质概率性质概率性质的的的的反证法:反证法:反证法:反证法:2、 基本思想方法3、假设检验的相关概念(1 1)原假设)原假设)原假设)原假设(null hypothesis)与备择假设与备择假设与备择假设与备择假设(alternative hypothesis)原假设:研究者想收集证据予以反对的假设,用H0表示 ;备择假设:研究者想收集证据予以支持的假设;用H1表示。1.原假设和备择假设是一个完备事件组,而且相互对立。2.等号“=”总是放在原假设上 3.因研
4、究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设提出假设【例例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。试陈述用来检验生产过程是否正常的原假设和被择假设。提出假设提出假设 H HH0 0 0 : 10cm 10cm 10cm H HH1 1 1 : 10cm 10cm 10cm 【例例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。提出假
5、设提出假设H H H0 0 0 : 500 500 500 H H H1 1 1 : 500 500 ”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)备择假设的方向为“”,称为右侧检验右侧检验 (2 2)双侧检验与单侧检验)双侧检验与单侧检验双侧检验与单侧检验 (假设的形式)假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0 : : = 0 0H0 : : 0 0H0 : : 0 0备择假设备择假设H1 : : 0 0H1 : : 0 0(3 3)检验统计量:)检验统计量:用于检验假设的统计量,用于检验假设的统计量,Z,T,F(4)拒绝域与临界点拒
6、绝域与临界点拒绝域拒绝域W1:拒绝原假设拒绝原假设H0的所有样本值的所有样本值(x1, x2, , xn)所组成的集合。所组成的集合。临界点临界点(值值):拒绝域的边界点拒绝域的边界点(处的检验统计处的检验统计量的值量的值)。显著性水平和拒绝域(双侧检验 )临界值临界值临界值临界值/2/2 /2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平显著性水平和拒绝域(左侧检验 )0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分
7、布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量显著性水平和拒绝域(右侧检验 )0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t
8、或t/22.将检验统计量的值与 水平的临界值进行比较3.作出决策双侧检验:I统计量I 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H0二、假设检验中的两类错误1. 第第类错误类错误(弃真错误弃真错误)原假设为真时拒绝原假设第类错误的概率记为2. 第第类错误类错误(取伪错误取伪错误)原假设为假时未拒绝原假设第类错误的概率记为 H H0 0: : 无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正
9、确决策(1 ) )第第类错类错误误( ( ) )拒绝拒绝H0第第类错类错误误( () )正确决策正确决策(1-(1- ) )假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检验过程3、 错误和 错误的关系 你不能同时减你不能同时减少两类错误少两类错误! 和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板, 小小小小 就就就就大,大,大,大, 大大大大 就小就小就小就小4、影响 错误的因素1. 显著性水平 当减少时增大2. 总体标准差 当 增大时增大3. 样本容量 n当 n 减少时增大第二节 总体均值的检验
10、是否已是否已知知小小小小小小样本容量样本容量n大大大大大大 是否已是否已知知否否否否否否 t 检验检验否否否否否否z 检验检验是是是是是是z 检验检验 是是是是是是z 检验检验总体总体总体总体假设检验的过程抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 x x = 20= 20我我认为人口的平人口的平均年均年龄是是5050岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设 别无选择别无选择! 作出决策作出决策作出决策作出决策假设检验步骤1.陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显
11、著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0一、总体均值的检验2 2、 取检验统计量取检验统计量3 3、 给定显著水平给定显著水平 ( 0 ( 0 0.05)0.05)总体均值的检验( 2 已知)【例例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为。取显著性水平 ,检验该天生产的饮料容量是否符合标准要求?双侧检验双侧检验绿色绿色绿色绿色健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品255
12、255255255255255总体均值的检验( 2 已知)H0 : = 255H1 : 255 n = 40临界值临界值(c):检验统计量检验统计量检验统计量检验统计量: :z z0 01.961.96-1.96-1.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025决策决策决策决策: :结论结论结论结论: : 不拒绝不拒绝H H0 0样样本本提提供供的的证证据据表表明明:该该天天生生产的饮料符合标准要求产的饮料符合标准要求 2 2 取检验统计量取检验统计量取检验统计量取检验统计量3 3 给定显著水平给定显著水平给定显著水平给定显著水平 ( 0 ( 0 0
13、.05)0.05)拒绝域:拒绝域:拒绝域:拒绝域:总体均值的检验( 2 未知)【例例】一种机床加工的零件尺寸绝对平均误差允许值为。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01) 左侧检验左侧检验50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.
14、021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验( 2 未知)H0 : H1 : n = 50临界值临界值(c):检验统计量检验统计量检验统计量检验统计量: : 拒绝拒绝H H0 0新新机机床床加加工工的的零零件件尺尺寸寸的的平平均均误误差与旧机床相比有显著降低差与旧机床相比有显著降低决策决策决策决策: :结论结论结论结论: :-2.33-2.33z z0 0拒绝拒绝H H0 0
15、0.010.01二、P 值检验(P-value)1.定义: 在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率2. 实质:计算样本统计量对应的显著性水平,与已知a比较,小于a,拒绝原假设,大于a,接受原假设。反映实际观测到的数据与原假设H0之间不一致的程度。双侧检验的P 值 / / 2 2 / / 2 2 Z Z拒绝拒绝拒绝拒绝H H0 0拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的
16、样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值左侧检验的P 值0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值右侧检验的P 值0 0 0临界值临界值临界值 拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水
17、平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值总体均值的检验【例例】一种机床加工的零件尺寸绝对平均误差允许值为。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01) 左侧检验左侧检验50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.
18、130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验H0 : H1 : n = 50临界值临界值(c):检验统计量检验统计量检验统计量检验统计量: : 拒绝拒绝H H0 0新新机机床床加加工工的的零零件件尺尺寸寸的的平平均均误误差与旧机床相比有显著降低差与旧机床相比有显著降低决策决
19、策决策决策: :结论结论结论结论: :0 0 0-2.33-2.33-2.33=0.05=0.05=0.05z z z拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量=2.6061=2.6061=2.6061P P P 值值值P PP= =0.0040.0040.004579579579 总体均值的检验 (检验方法的总结)假设假设双侧检验双侧检验左左侧检验右右侧检验假设形式假设形式H0: =0H1 : 0H0 : 0H1 : 0统计量统计量 已知: 未
20、知:拒绝域拒绝域P值决策值决策拒绝H0三、总体成数检验1.假定条件总体服从二项分布可用正态分布来近似(大样本)2.检验的 z 统计量 0为假设的总体比例为假设的总体比例 【例例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 和 ,检验该杂志读者群中女性的比例是否为80%?它们的值各是多少?双侧检验双侧检验总体成数的检验H0 : = 80%H1 : 80% n = 200临界值临界值(c):检验统计量检验统计量检验统计量检验统计量: :拒绝拒绝H H0 0 (
21、(P P = = 0.013328 0.013328 0.013328 = 0.01) = 0.01)该杂志的说法属实该杂志的说法属实 决策决策决策决策: :结论结论结论结论: :z z0 02.582.58-2.58-2.580.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025总体成数的检验 (检验方法的总结)假设假设双侧检验双侧检验左左侧检验右右侧检验假设形式假设形式H0: = 0H1: 0H0: 0H1 : 0统计量统计量拒绝域拒绝域P值决策值决策拒绝H0第三节 非参数检验非参数检验是对总体的分布不作任何限制的统计检验。故非参数检验又称为自由分布检验。一、
22、自由分布检验概述 自由分布检验优点:1、检验条件比较宽松,适应性强。2、自由分布检验的方法比较灵活,用途广泛。3、自由分布检验的计算相对简单。自由分布检验缺点:检验的功效相对较弱二、符号检验符号检验:建立在以正、负号表示样本数据与假设参数值差异关系基础上的。检验总体的中位数是否在某一指定的位置。该方法既适用于单样本场合,也适用于配对样本场合。 (一)单样本场合的符号检验 Eg:中位数检验 : : =A1.样本每个数据都减去A,只记录其差数的符号。n+与n-分别是正、负符号的个数。2.查表确定拒绝域.3.选择 max(n+, n-)与临界值比较。4.判断。例:设有20个工人,他们一天生产的产品件
23、数,抽样结果如下:168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170。试以的检验水平,判定总体中位数是否是160。解:第一步:作出假设。 : =160, : 160由备选假设知,这个检验是双侧的。第二步:计数。对样本数据,大于160的记下“+”,小于160的记下“-”,等于160的,予以剔除(以0记之),结果如下:+ + 0 + + + - - + + + - + + 0 + + + + +计数以上“+”的个数是n+=15,“-”的个数n-=3,剔除数据2个。最后有效的样本个数为 n=n
24、+n-=18 。第三步:确定拒绝域。显著水平,由于进行双侧检验,拒绝域分布在两边,每侧概率,查二项分布临界值表,得到拒绝域的临界值是13。第四步:选择n+、n-较大者,再与临界值比较。结果是1513。第五步:判断。由于上一步的比较结果可知,样本落入拒绝域,所以拒绝原假设,认为样本数据不能证明总体中位数等于160件。(二)配对样本场合的符号检验设从两个总体中分别抽出一个容量相等的样本,然后将两样本的数据进行一一配对,得到一组配对值。再将各对配对值相减,记录下差数的符号,计算出“+”的个数n+与“-”的个数n-。如果两个样本的总体差异不显著,配对值之差的正负号出现的概率各是1/2,则n+与n-应当
25、非常接近;如果n+、n-相差太大的话,说明两总体存在显著差异。从某铁矿南北两段各抽取容量为10的样本,随机配对如下:用符号检验法在的条件下,检验南北两段含铁量无显著差异的假设。南28204328121648820北2011131045151113258三、秩和检验1、定义:两个样本混合起来按数据大小排序,计算容量小样本的秩次来判断两个独立的样本是否来自同一个总体,或判断总体间是否存在显著性的差异。 它和符号检验最主要的区别是,符号检验只考虑样本间差数的符号,而秩和检验还要考虑差数的顺序,比符号检验利用数据信息更加充分,因此,检验功效就更强。 2、秩和检验原理:、秩和检验原理:设分别从两个未知的
26、总体独立、随机地抽取容量为n1和n2的样本,把样本容量较小的总体称为总体。另一个总体称作总体。将两个样本混合起来,并按数据的大小,从小到大排列编号,每个数值的编号就是它的秩次。如果混合样本中有若干个相同的数值,则把它们的秩次进行简单算术平均,用此平均值作为这些数值的秩次,计算来自总体计算来自总体的的n1个数据在混合样本个数据在混合样本中的秩次之和,记为中的秩次之和,记为T。显然T最小的可能值是:T1=1+2+3+n1=n1(n1+1)/2 ;最大的可能值是T2=(n2+1)+(n2+2)+(n2+n1)=n1(n2+1)+(n2+n1)/2。如果两个总体分布无显著差异,则T值不应太大或太小,等
27、于中间值(T1+T2)/2;因此,我们可以用秩和T作为检验的统计量。第一种方法,当n1和n2都不超过10时,查“秩和检验表”确定临界值;第二种方法,当n1和n2都超过10时,秩和T服从正态分布:先对T进行标准化变换,再利用标准正态分布表,确定检验的临界值。 例:有A、B两家厂商供应同一种商品,两家商品价格与性能一致,但使用寿命是否一致有待检验。今分别从两家生产产品中抽出样本,测定产品使用寿命(见下表,单位:小时):试以的显著性水平,检验两厂商产品寿命是否有差异?解:第一步:作出假设。H0:MA=MB,H1:原假设是两厂商生产的产品没有差异,平均寿命相同,备选假设是平均寿命不相同,是双侧检验。第
28、二步:求秩和。将样本混合、排序:以上数据下面划横线的为B厂商产品寿命。B厂商产品样本容量小,看做总体,n1=5。A厂商产品是总体,n2=6。总体的秩和 。 第三步:确定拒绝域。显著水平,进行双侧检验,查“秩和检验表”,n1=5,n2=6,得临界值T1()=20,T2( )=40。第四步:比较秩和与临界值大小。结果是:2029.540,即 T1() T T2( ) 。第五步:判断。样本落入接受域,所以接受原假设,样本数据证明A、B两厂商产品的寿命是一致的。四、游程检验1、游程:一个重复出现的某一种类字符串 游程数:同一类游程出现的次数 总游程数:不同类型游程数的和2、原理:通过总游程数检验样本是否随机来自总体,随机分布没有规律。某加油站有两种商标的汽油a,b,某天售出20桶汽油按商标a,b 排列的顺序为aabaa,babba,aabba,bbabb,试问在显著性水平条件下这一序列是否随机性。