《概率统计A课件》由会员分享,可在线阅读,更多相关《概率统计A课件(49页珍藏版)》请在金锄头文库上搜索。
1、第第第第八八八八章作业题章作业题章作业题章作业题P229: 1, 2, 3, 5;P234: 1, 3;P250: 1, 2, 3, 6.1概率统计A8.1 8.1 假设检验的基本概念假设检验的基本概念 8.2 8.2 正态总体均值的假设检验正态总体均值的假设检验 8.3 8.3 正态总体方差的假设检验正态总体方差的假设检验 假设检验Ch82概率统计A1 问题的提出问题的提出引例引例: 某工厂正常情况下生产的电灯泡的使用寿命某工厂正常情况下生产的电灯泡的使用寿命X服从正服从正态分布态分布N( ,802),现从该厂生产的这批灯泡中随机抽取,现从该厂生产的这批灯泡中随机抽取10个灯泡,测得它们的使
2、用寿命如下:个灯泡,测得它们的使用寿命如下:1450,1480,1640,1610,1500,1600,1420,1530,1700,1550。如果标准。如果标准差不变,能否认为该工厂生产的这批灯泡的寿命均值为差不变,能否认为该工厂生产的这批灯泡的寿命均值为1600小时?小时?假设:假设: = 1600, 要求根据样本信息判断该假设是否成立。要求根据样本信息判断该假设是否成立。8.1 8.1 一一 基本概念3概率统计A原假设和备择假设原假设和备择假设原假设原假设(零假设):(零假设):H0:待检验的假设;:待检验的假设;备择假设备择假设(对立假设):(对立假设): H1:与原假设对立的假设。:
3、与原假设对立的假设。引例引例 H0: = 1600 H1: 1600 注:注:1 原假设和备择假设的划分不是绝对的;原假设和备择假设的划分不是绝对的; 通常把受保护的假设取做原假设通常把受保护的假设取做原假设H0 ,如,如“无变化无变化”“”“无差异无差异”“”“无改进无改进”等等, , 而备择假设而备择假设H1一般是新论断,一般是新论断,不轻易接受不轻易接受H1,(即不轻易拒绝即不轻易拒绝H0) 2 等号一般放在原假设中。等号一般放在原假设中。4概率统计A二、基本原理引例引例: : 某粮食加工厂用自动包装机包装大米,某粮食加工厂用自动包装机包装大米,每袋标准重量为每袋标准重量为50kg50k
4、g,某日开工后检查机器是,某日开工后检查机器是否工作正常?(长期实践表明,均方差为否工作正常?(长期实践表明,均方差为1.51.5)假设假设(机器工作正常)(机器工作正常)(机器工作不正常)(机器工作不正常)5概率统计A 如抽查如抽查9 9袋,得样本袋,得样本X X1 1,X X9 9,根据这些,根据这些值来判断生产是否正常值来判断生产是否正常. .通常的办法是进行通常的办法是进行抽样检查抽样检查. . 在正常生产条件下,由于种种随机因素的影在正常生产条件下,由于种种随机因素的影响,每袋重量应在响,每袋重量应在50kg50kg上下波动上下波动. .这些因素中没这些因素中没有哪一个占有特殊重要的
5、地位有哪一个占有特殊重要的地位. .因此,根据中心因此,根据中心极限定理,假定每袋重量服从极限定理,假定每袋重量服从正态分布正态分布. .如何检验如何检验假设?假设?6概率统计A这样,我们可以认为这样,我们可以认为X X1 1,X X9 9是取自正态是取自正态总体总体 的样本,的样本,是一个常数是一个常数. . 当生产比较稳定时,当生产比较稳定时,现在要检验的假设是:现在要检验的假设是:假设假设(机器工作正常)(机器工作正常)(机器工作不正常)(机器工作不正常)7概率统计A那么,如何判断原假设那么,如何判断原假设H0 是否成立呢?是否成立呢?较大、较小是一个相对的概念,合理的界较大、较小是一个
6、相对的概念,合理的界限在何处?应由什么原则来确定?限在何处?应由什么原则来确定?由于由于 是正态分布的期望,其估计量可以是是正态分布的期望,其估计量可以是样本均值样本均值 ,因此可以根据,因此可以根据 与与 的差距的差距来判断来判断H0 是否成立是否成立.- |较小时,可以认为较小时,可以认为H0是成立的;是成立的;当当- |生产已不正常生产已不正常.当当较大时,应认为较大时,应认为H0不成立,即不成立,即- |8概率统计A如何给出这个界限?如何给出这个界限?这里用到人们在实践中普遍采用的一个原则:这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验小概率事件在一次试验中几乎不会发生中
7、几乎不会发生 .假设检验的基本原理假设检验的基本原理:实际推断原理实际推断原理(小概率原理)(小概率原理)9概率统计A引例引例4:4: 某粮食加工厂用自动包装机包装大米,某粮食加工厂用自动包装机包装大米,每袋标准重量为每袋标准重量为50kg50kg,某日开工后检查机器是,某日开工后检查机器是否工作正常?(长期实践表明,均方差为否工作正常?(长期实践表明,均方差为1.51.5)假设假设(机器工作正常)(机器工作正常)(机器工作不正常)(机器工作不正常)10概率统计A选择选择检验统计量检验统计量由于由于 已知,已知,它能衡量差异它能衡量差异大小大小. 对给定的对给定的显著性水平显著性水平 ,得得
8、N(0,1)1-/2/211概率统计A故我们可以取故我们可以取拒绝域拒绝域为:为:也就是说也就是说,“”是一个是一个小概率事件小概率事件.如果由样本值算得该统计量的实测值落入如果由样本值算得该统计量的实测值落入拒绝域,则拒绝拒绝域,则拒绝H0 ;否则,接受;否则,接受H0 .1-/2/212概率统计A 不否定不否定H0并不是肯定并不是肯定H0一定对,而一定对,而只是说差异还不够显著,还没有达到足只是说差异还不够显著,还没有达到足以否定以否定H0的程度的程度 .所以假设检验又叫所以假设检验又叫“显著性检验显著性检验”13概率统计A其产生的后果是:其产生的后果是: H0难于被拒绝难于被拒绝.如果在
9、如果在 很小的情况很小的情况下下H0仍被拒绝了,则说仍被拒绝了,则说明实际情况很可能与之明实际情况很可能与之有显著差异有显著差异.基于这个理由,人们常把基于这个理由,人们常把 时拒绝时拒绝H0称为是称为是显著显著的,而把在的,而把在 时拒绝时拒绝H0称为是称为是高度显著高度显著的的.1-/2/214概率统计A引例引例4:4: 某粮食加工厂用自动包装机包装大米,某粮食加工厂用自动包装机包装大米,每袋标准重量为每袋标准重量为50kg50kg,某日开工后检查机器是,某日开工后检查机器是否工作正常?(长期实践表明,均方差为否工作正常?(长期实践表明,均方差为1.51.5)抽样:抽样: 取取0 0 0临
10、界值临界值临界值临界值临界值临界值 /2 /2 /2 /2/2 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH000拒绝拒绝拒绝H HH0001 - 1 - 1 - 15概率统计A假设检验的一般步骤假设检验的一般步骤(1)(1)提出假设提出假设H0、H1(2)(2)引入检验统计量引入检验统计量( (分布已知分布已知) )(3)(3)给定显著性水平给定显著性水平(0(01),1),确定拒绝域确定拒绝域(4)(4)取样,计算检验统计量的观察值,作出决策取样,计算检验统计量的观察值,作出决策拒绝拒绝H0 或或 接受接受H016概率统计A注注: : H0、H1地位不对等地位不对等17概率统计A假设
11、检验的两类错误假设检验的两类错误第第I I类错误类错误: : 弃真错误弃真错误第第IIII类错误类错误: :取伪错误取伪错误H0不真不真, ,但检验统计量不在拒绝域内但检验统计量不在拒绝域内, ,从而从而接受接受H0H0为真为真, ,但检验统计量在拒绝域内但检验统计量在拒绝域内, ,从而拒从而拒绝绝H018概率统计AH0为真为真实际情况实际情况决定决定拒绝拒绝H0接受接受H0H0不真不真第一类错误第一类错误正确正确正确正确第二类错误第二类错误P拒绝拒绝H0|H0为真为真= ,P接受接受H0|H0不真不真= . 犯两类错误的概率犯两类错误的概率:显著性水平显著性水平 为犯第一类错误的概率为犯第一
12、类错误的概率.假设检验的两类错误假设检验的两类错误19概率统计A当样本容量固定时,一类错误概率的减少导致当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加另一类错误概率的增加. . 和和 的关系的关系 你不能同时减你不能同时减少两类错误少两类错误! 和和 的关系就像的关系就像翘翘板,翘翘板, 小小 就就大,大, 大大 就小就小20概率统计A 要同时降低两类错误的概率要同时降低两类错误的概率 ,或者,或者要在要在 不变的条件下降低不变的条件下降低 ,需要增加样,需要增加样本容量本容量. .基本原则:力求在控制基本原则:力求在控制前提下减少前提下减少奈曼皮尔逊(奈曼皮尔逊(Neyman-
13、PearsonNeyman-Pearson)提出:)提出:21概率统计A (2)检验统计量检验统计量:分析分析:2已知已知,的假设检验的假设检验(4)将样本观测值代入将样本观测值代入,解解(1)假设假设 H0:=15; H1:15,(3) =0.05,查表查表(u1-/2)=(u0.975)=0.975 得得u0.975=1.96,所以拒绝域为所以拒绝域为|U| 1.96, |U|u1-/2,故接受故接受H0,即零件的平均重量仍为,即零件的平均重量仍为15.1.96例例 由经验知某零件重量由经验知某零件重量XN(,2),其中其中=15, 2=0.05,技术革技术革新后新后,抽查抽查6个样品测得
14、重量为个样品测得重量为(单位单位: 克克)14.7,15.1,14.8, 15.0,15.2,14.6,已知方差不变已知方差不变,问平均重量是否仍为问平均重量是否仍为15?( =0.05)22概率统计A假设的几种形式(关于假设的几种形式(关于的检验)的检验)双边检验双边检验单边检验单边检验单边检验:单边检验:主要关心带方向性的检验问题。主要关心带方向性的检验问题。分分两两种种情情况况:一一种种是是我我们们所所考考察察的的数数值值越越大大越越好好。例例如如某某机机构构购购买买灯灯泡泡的的使使用用寿寿命命,轮轮胎胎的的行行驶驶里里程程数数,等等等等。另另一一种是数值越小越好,例如废品率、生产成本等
15、等。种是数值越小越好,例如废品率、生产成本等等。单单边边检检验验可可分分为为左左边边检检验验和和右右边边检检验验2 2种种,它它们们都都只只有有一一个个拒拒绝区域。绝区域。23概率统计A单边检验(单边检验(2 2)已知)已知检验统计量检验统计量故可取故可取拒绝域拒绝域为:为:即即“ ”“ ”是是H H0 0成立下一个成立下一个小概率事件小概率事件. .对给定的显著性水平对给定的显著性水平 ,拒绝域形式拒绝域形式24概率统计A拒绝域拒绝域为:为:0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 -
16、1 - (右边检验右边检验)25概率统计A类似:类似:拒绝域拒绝域为:为:0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - (左边检验左边检验)26概率统计A例例: :问用新方法后燃烧率是否较以往有显著提高问用新方法后燃烧率是否较以往有显著提高?27概率统计A一般说来,一般说来,按照检验所用的统计量的分布按照检验所用的统计量的分布, 分为分为F 检验检验 用用 F分布分布U 检验检验 用正态分布用正态分布t 检验检验 用用 t 分布分布检验检验用用分布分布按照对立假设的提法按照对立假设
17、的提法,分为,分为单侧检验,它的拒绝域取在左侧或右侧单侧检验,它的拒绝域取在左侧或右侧 .双侧检验,它的拒绝域取在两侧双侧检验,它的拒绝域取在两侧;28概率统计A8.2 8.2 正态总体均值的假设检验正态总体均值的假设检验(一一)单个总体单个总体 的检验的检验1 . 2已知已知检验统计量检验统计量拒绝域:拒绝域:(U检验检验)双边双边单边单边29概率统计A1- 2. 2未知未知检验统计量检验统计量拒绝域:拒绝域:(t 检验检验)拒绝域:拒绝域:1-1-30概率统计AH0不成立时,不成立时,T偏太大,偏太大,故拒绝域为故拒绝域为H0不成立时,不成立时,T偏太小,偏太小,故拒绝域为故拒绝域为H0不
18、成立时,不成立时,T偏太大或偏太小,偏太大或偏太小,故拒绝域为故拒绝域为1-1-1-31概率统计A例例 以往一台机器生产的垫圈的平均厚度为以往一台机器生产的垫圈的平均厚度为0.050厘米,为了检厘米,为了检查这台机器是否处于正常工作状态,现抽取查这台机器是否处于正常工作状态,现抽取10个垫圈,测得其个垫圈,测得其平均厚度为平均厚度为0.053厘米,样本方差为厘米,样本方差为0.00322, 在显著水平在显著水平 =0.01下,检验机器是否处于正常工作状态。下,检验机器是否处于正常工作状态。分析分析:2未知未知,的假设检验的假设检验 (2) 2 2未知未知, 检验统计量检验统计量: (4)计算统
19、计量的观测值计算统计量的观测值,解解 (1)假设假设 H0:=0.050; H1: 0.050,(3)查查t分布的分位数表得分布的分位数表得t1-/2=3.250,所以拒绝域为所以拒绝域为|T| 3.250, |T|225检验的拒绝域为检验的拒绝域为现在现在n=16,t0.95(15)=1.7531.=241.5,s=98.7259,有有=0.6685 1.9636概率统计A(4)将样本观测值代入将样本观测值代入,故拒绝原假设故拒绝原假设.即认为两厂灯泡的平均寿命有显著差异。即认为两厂灯泡的平均寿命有显著差异。37概率统计A例例 某纺织厂生产的纱线,其强力服从正态分布。为比较甲、乙某纺织厂生产
20、的纱线,其强力服从正态分布。为比较甲、乙两地生产的棉花所纺纱线的强力,各抽取两地生产的棉花所纺纱线的强力,各抽取7个和个和8个样本进行测个样本进行测量,得数据如下(单位:公斤量,得数据如下(单位:公斤)甲地:甲地:1.55, 1.47, 1.52, 1.60, 1.43, 1.53, 1.54乙地:乙地:1.42, 1.49, 1.46, 1.34, 1.38, 1.54, 1.38, 1.51问两地棉花所纺纱线的强力有无显著差异?问两地棉花所纺纱线的强力有无显著差异?解:设甲地棉花所纺纱线的强力为解:设甲地棉花所纺纱线的强力为X, 乙地棉花所纺纱线的强乙地棉花所纺纱线的强力为力为Y, 已知:
21、已知: XN( 1, 12), YN( 2, 22 ),其中,其中 12 , 22 未知,在这种情况下应先检验假设未知,在这种情况下应先检验假设“H0: 12= 22 ”,此处不妨假此处不妨假设设 12= 22 ,但未知。问题归结为对假设,但未知。问题归结为对假设H0: 1= = 2 的检验。的检验。(1) 提出原假设和备择假设提出原假设和备择假设: H0: 1= = 2,H1: 1 2(2)选择统计量)选择统计量T, 在在H0成立的条件下成立的条件下38概率统计A(3)对给定的)对给定的 =0.05,查查T分布表得统计量分布表得统计量T的临界值的临界值t1-/2(13)=2.16,所以拒绝域
22、为,所以拒绝域为|T| 2.16.(4) 由样本数据计算可得由样本数据计算可得由于由于|T| t1-/2(13), 故拒绝原假设故拒绝原假设H0 ,即认为两种棉,即认为两种棉花所纺纱线强力有较明显的差异。花所纺纱线强力有较明显的差异。 39概率统计A8.3 8.3 正态总体方差的假设检验正态总体方差的假设检验(一一)单个总体单个总体 的检验的检验(未知)未知)检验统计量检验统计量拒绝域:拒绝域:( 检验检验)或或40概率统计AH0不成立时,不成立时, 偏大,故拒绝域偏大,故拒绝域:H0不成立时,不成立时, 偏小,故拒绝域偏小,故拒绝域:41概率统计A例例 某炼铁厂铁水含碳量在正常情况下服从方差
23、为某炼铁厂铁水含碳量在正常情况下服从方差为0.1122的正态的正态分布,现对操作工艺进行了改变,从中抽取分布,现对操作工艺进行了改变,从中抽取7炉铁水测得含碳量炉铁水测得含碳量如下:如下:4.421,4.052,4.357,4.394,4.326,4.287,4.683. 问新工艺炼出问新工艺炼出的铁水含碳量的方差有无明显改变的铁水含碳量的方差有无明显改变?( =0.05) (2)检验统计量检验统计量:故拒绝原假设故拒绝原假设. 即认为方差有明显变化。即认为方差有明显变化。 解解:(1)假设假设 H0: 2 = 02 =0.1122; H1: 2 0.1122(3)查表得查表得14.449接受
24、域为接受域为1 2 (4)由样本观测值计算得由样本观测值计算得统计量观测值统计量观测值(H0成立时)成立时)42概率统计A两样本独立两样本独立(二)两个正态总体(二)两个正态总体 ( 未知)未知)检验统计量检验统计量拒绝域:拒绝域:或或( F 检验检验)43概率统计A例例8 某纺织厂生产的纱线,其强力服从正态分布。为比较甲、某纺织厂生产的纱线,其强力服从正态分布。为比较甲、乙两地生产的棉花所纺纱线的强力,各抽取乙两地生产的棉花所纺纱线的强力,各抽取7个和个和8个样本进行个样本进行测量,得数据如下(单位:公斤测量,得数据如下(单位:公斤)甲地:甲地:1.55, 1.47, 1.52, 1.60,
25、 1.43, 1.53, 1.54乙地:乙地:1.42, 1.49, 1.46, 1.34, 1.38, 1.54, 1.38, 1.51问两地棉花所纺纱线的强力的方差有无显著差异?问两地棉花所纺纱线的强力的方差有无显著差异?(1) 建立统计假设:建立统计假设: H0: 12 = 22; H1: 12 22(2)在)在H0成立的情况下,统计量成立的情况下,统计量:(3)根据)根据 =0.05,自由度为(,自由度为(6,7),), 查出临界值查出临界值44概率统计A(4) 将样本观测值代入将样本观测值代入F, 计算得计算得1 F 2 ,故接受原假设,即认为两地棉花所纺纱线强,故接受原假设,即认为
26、两地棉花所纺纱线强力的方差无显著差异。力的方差无显著差异。拒绝域为拒绝域为F 2=5.1245概率统计A 例例 为比较两台自动机床的精度,分别取容为比较两台自动机床的精度,分别取容量为量为10和和8的两个样本,测量某个指标的尺的两个样本,测量某个指标的尺寸寸(假定服从正态分布假定服从正态分布),得到下列结果:,得到下列结果:在在 =0.1时,时, 问这两台机床是否有同样的问这两台机床是否有同样的精度精度?车床甲:车床甲:1.08, 1.10, 1.12, 1.14, 1.15, 1.25, 1.36, 1.38,1.40,1.42车床乙:车床乙:1.11, 1.12, 1.18, 1.22,
27、1.33, 1.35, 1.36, 1.3846概率统计A单正态总体参单正态总体参数的假设检验数的假设检验双正态总体双正态总体的假设检验的假设检验小结小结: :期望假设检验期望假设检验方差的假设检验方差的假设检验2已知已知 U2未知未知 T均值差的假设检验均值差的假设检验方差比的假设检验方差比的假设检验两个方差都已知两个方差都已知 U两个方差未知但相等两个方差未知但相等 TF47概率统计A正态总体均值、方差正态总体均值、方差的的 检验法检验法(P229)检验统计量检验统计量H01.2.3.4.0 0= 0( 2已知已知)拒绝域拒绝域0 0= 0( 2未知未知)1- 21- 21- 2=( 12, 22已知已知)1- 21- 21- 2=( 12= 22= 2未知未知)48概率统计A正态总体均值、方差正态总体均值、方差的的 检验法检验法(P229)检验统计量检验统计量H05.6.7. 2 02 2 02 2 = 02(未未知知)拒绝域拒绝域D0D0D=0(成对数据成对数据) 12 22 12 22 12 = 22(1, 2未未知知)或或或或49概率统计A