概率论与数理统计：第8章第一节假设检验

资源描述

《概率论与数理统计：第8章第一节假设检验》由会员分享，可在线阅读，更多相关《概率论与数理统计：第8章第一节假设检验（31页珍藏版）》请在金锄头文库上搜索。

1、概率统计假设检验假设检验参数假设检验参数假设检验非参数假设检验非参数假设检验总体分布已知，总体分布已知，检验关于未知参数检验关于未知参数的某个假设的某个假设总体分布未知时的总体分布未知时的假设检验问题假设检验问题根据样本的信息检验关于总体根据样本的信息检验关于总体的某个假设是否正确。的某个假设是否正确。假设检验问题假设检验问题: 假设检验问题分类假设检验问题分类: 概率统计一一. 假设检验的基本思想假设检验的基本思想设总体设总体 X 含有未知参数含有未知参数 (或总体分布函数或总体分布函数 F(x) 未知未知)检验下述假设检验下述假设:假设假设或或是某个已知常数是某个已知常数 (或或

2、是某个已知的分布函数是某个已知的分布函数)。则抽取容量为。则抽取容量为 n 的样本，利用样本提供的信息对的样本，利用样本提供的信息对假设假设作出判断，从而确定是否接受作出判断，从而确定是否接受第一节第一节假设检验假设检验其中：其中：概率统计例如例如:根据上一章的讨论，显然根据上一章的讨论，显然是可以被接受的，是可以被接受的，因为因为是总体是总体 X 的待估计参数的待估计参数的无偏估计。的无偏估计。二二. 判断判断 “假设假设” 的根的根据据小概率事件原理小概率事件原理小概率事件在一次试验中是小概率事件在一次试验中是几乎几乎不可能发生的不可能发生的未知未知检验假设：检验假设：如果

3、在假设如果在假设成立的条件下某事件是小概率事件成立的条件下某事件是小概率事件,但在一次试验中却发生了但在一次试验中却发生了,于是就可怀疑假设于是就可怀疑假设的正确性从而拒绝的正确性从而拒绝不是一定不发生不是一定不发生概率统计现用一个例子来说明这个原则现用一个例子来说明这个原则.现有两个盒子，各装有现有两个盒子，各装有100个球个球.99个白球个白球一个红球一个红球99个个例如：例如：99个红球个红球一个白球一个白球99个个现从两盒中随机取出一个盒子，问：这个盒子里是现从两盒中随机取出一个盒子，问：这个盒子里是白球白球 99个还是红球个还是红球 99 个？个？概率统计若假设：若假设：这个盒子

4、里有这个盒子里有 99 个白球个白球.当从中随机摸出一个球时，发现是红球：当从中随机摸出一个球时，发现是红球：此时应如何判断这个假设是否成立呢此时应如何判断这个假设是否成立呢？假设其中真有假设其中真有 99 个白球，摸出个白球，摸出红球的概率只有红球的概率只有 1/100 ，这是小，这是小概率事件概率事件.但此小概率事件在一次试验中竟然发生但此小概率事件在一次试验中竟然发生了，这就不得不怀疑所作的假设。了，这就不得不怀疑所作的假设。概率统计概率反证法概率反证法的逻辑是：如果小概率事件在一次试的逻辑是：如果小概率事件在一次试验中居然发生了，则就可以以很大的把握否定原验中居然发生了，则就可以

5、以很大的把握否定原假设，否则就不能否定原假设。假设，否则就不能否定原假设。一般的反证法一般的反证法要求在原假设成立的条件下导出的要求在原假设成立的条件下导出的结论是绝对成立的，如果事实与之矛盾，则完全结论是绝对成立的，如果事实与之矛盾，则完全绝对地否定原假设。绝对地否定原假设。这个例子中所使用的推理方法，可以称为是带概这个例子中所使用的推理方法，可以称为是带概率性质的反证法。但它不同于一般的反证法。率性质的反证法。但它不同于一般的反证法。注：注：在假设检验中，常称这个小概率为在假设检验中，常称这个小概率为显著性水平显著性水平，用用表示。表示。概率统计三三. 假设检验的两类错误假

6、设检验的两类错误 1. 第一类错误第一类错误 (弃真弃真): 如果如果是正确的，但却被错是正确的，但却被错误地否定了。误地否定了。 2. 第二类错误第二类错误 (取伪取伪): 如果如果是不正确的，但却被是不正确的，但却被错误地接受了。错误地接受了。若设若设犯两类错误的概率分别为犯两类错误的概率分别为:P 拒绝拒绝H0 | H0为真为真 = P 接受接受 H0 | H0 不真不真 = 则显著性水平则显著性水平为犯第一类错误的概率。为犯第一类错误的概率。概率统计两类错误是两类错误是互相关联互相关联的，的，当样本容量当样本容量 n 固定固定时，一类错误概率的减少必导致另一类错误时，

7、一类错误概率的减少必导致另一类错误概率的增加。概率的增加。要同时降低两类错误的概率要同时降低两类错误的概率，或者要，或者要在在不变的条件下降低不变的条件下降低，需要，需要增加增加样本容样本容量量 n注：注：在实际问题中，在实际问题中，通常的做法通常的做法是：是：先对犯第一类错误（弃真）的概率加以控制，先对犯第一类错误（弃真）的概率加以控制，同时再考虑使犯第二类错误（取伪）的概率同时再考虑使犯第二类错误（取伪）的概率尽可能的小。尽可能的小。概率统计四四. 假设检验的具体做法假设检验的具体做法例例1. 罐装可乐容量的检验问题罐装可乐容量的检验问题在一条生产可乐的流水线上罐装在一条生产可乐

8、的流水线上罐装可乐不断地封装，然后装箱外运。可乐不断地封装，然后装箱外运。罐装可乐的容量按标准应在罐装可乐的容量按标准应在 350 毫升和毫升和 360 毫升之间。毫升之间。试问：如何检验这批罐装可乐的试问：如何检验这批罐装可乐的容量是否合格呢？容量是否合格呢？分析：分析：若把每一罐可乐都打开倒入量杯若把每一罐可乐都打开倒入量杯, 看看容量是否合于标准。这显然看看容量是否合于标准。这显然是是不可行不可行的。的。概率统计即，即，每隔一定时间，抽查若干罐每隔一定时间，抽查若干罐。如：。如：每隔每隔 1小时，抽查小时，抽查 5 罐，得罐，得 5个容量的值：个容量的值：X1，X5 ，根据这些值来

9、判断生产是否正常根据这些值来判断生产是否正常.如发现不正常则应停产，找出原因，排除故障，然如发现不正常则应停产，找出原因，排除故障，然后再生产；如生产正常，就继续按规定时间再抽样，后再生产；如生产正常，就继续按规定时间再抽样，以此监督生产，保证质量。以此监督生产，保证质量。通常的办法是：通常的办法是：进行抽样检查进行抽样检查.显然：显然：不能由不能由 5 罐容量的数据，在把握不大的情罐容量的数据，在把握不大的情况下就判断生产况下就判断生产不正常，因为停产的损失是很大不正常，因为停产的损失是很大的；当然也不能总认为正常，有了问题不能及时的；当然也不能总认为正常，有了问题不能及时发现，这也要造

10、成损失发现，这也要造成损失.概率统计如何处理这两者的关系？如何处理这两者的关系？现用假设检验的方法来处理这对矛盾现用假设检验的方法来处理这对矛盾在正常生产条件下，由于种种随机因素的在正常生产条件下，由于种种随机因素的影响，每罐可乐的容量应在影响，每罐可乐的容量应在 355 毫升上下毫升上下波动波动. 这些因素中没有哪一个占有特殊重这些因素中没有哪一个占有特殊重要的地位要的地位. 因此，根据中心极限定理，假因此，根据中心极限定理，假定每罐容量定每罐容量服从正态分布服从正态分布是合理的是合理的. 注意到：注意到：故故: 可以认为样本是取自正态总体可以认为样本是取自正态总体现抽查了现抽查了n 罐

11、，测得容量为：罐，测得容量为：当生产比较稳定时，当生产比较稳定时，是一个常数是一个常数. 现在要检验的假设是：现在要检验的假设是：概率统计它的对立假设是：它的对立假设是：称称 H0 为为原假设原假设（或（或零假设零假设）称称 H1 为为备择假设备择假设（或（或对立假设对立假设）.在实际问题中，在实际问题中，往往把不轻易往往把不轻易否定的命题作否定的命题作为原假设为原假设. H0：H1：那么，如何判断原假设那么，如何判断原假设H0 是否成立呢？是否成立呢？由于由于是正态分布的期望值，它的无偏估计量是是正态分布的期望值，它的无偏估计量是样本均值样本均值，因此可以根据，因此可以根据与与的差距

12、的差距来判断来判断 H0 是否成立是否成立.概率统计而较大、较小是一个相对的概念，那么它应由什么而较大、较小是一个相对的概念，那么它应由什么原则来确定？原则来确定？对差异作对差异作定量定量的分析，以确定其性质的分析，以确定其性质.问题问题归结为归结为：当差异是由抽样的随机性引起时，则称其当差异是由抽样的随机性引起时，则称其为为“抽样误差抽样误差”或或随机误差随机误差；它反映了由；它反映了由偶然、非本质的因素所引起的随机波动。偶然、非本质的因素所引起的随机波动。然而，这种随机性的波动是有一定限度的然而，这种随机性的波动是有一定限度的注意到：注意到：较小时，可以认为较小时，可以认为 H0 是成

13、立的；是成立的；当当生产已不正常生产已不正常.当当较大时，应认为较大时，应认为 H0 不成立，即不成立，即概率统计如果差异超过了这个限度，则就不能用抽样的随如果差异超过了这个限度，则就不能用抽样的随机性来解释了。此时可认为这个差异反映了事物机性来解释了。此时可认为这个差异反映了事物的本质差别，则称其为的本质差别，则称其为“系统误差系统误差”如何判断差异是由如何判断差异是由“抽样误差抽样误差”还是还是“系统误差系统误差”所引起的？所引起的？从而问题就从而问题就转化为：转化为：解决的方法：解决的方法：给出一个量的界限给出一个量的界限，即，即显著性水平显著性水平从而从而提出假设：提出假设：H0：H

14、1：因为因为已知，已知，所以构造统计量为：所以构造统计量为：概率统计检验统计量：检验统计量： N ( 0, 1 )对给定的显著性水平对给定的显著性水平，查正态分布的上分位，查正态分布的上分位点的值点的值，使：，使：即即是一个小概率事件是一个小概率事件故可以故可以取拒绝域取拒绝域 C为：为：概率统计如果如果H0 是对的，那么衡量差异大小的某个统计是对的，那么衡量差异大小的某个统计量落入区域量落入区域 C (拒绝域拒绝域) 是个小概率事件。是个小概率事件。这里所这里所依据的逻辑依据的逻辑是：是：如果由样本值算得该统计量的实测值落入区域如果由样本值算得该统计量的实测值落入区域C，则拒绝，则拒

15、绝 H0 ；否则就接受否则就接受 H0 .注：注：如果该统计量的实测值落入如果该统计量的实测值落入C，即，即 H0 成立下的成立下的小概率事件发生了，那么就认为小概率事件发生了，那么就认为H0不可信而否定不可信而否定它；否则就不能否定它；否则就不能否定H0 而只好接受而只好接受H0不否定不否定H0并不是肯定并不是肯定H0一定对，而只是说差异一定对，而只是说差异还不够显著，还没有达到足以否定还不够显著，还没有达到足以否定H0的程度的程度。所以假设检验又叫所以假设检验又叫“显著性检验显著性检验”。概率统计如果在如果在很小的情况下很小的情况下H0仍被拒绝了，则说明实际仍被拒绝了，则说明实际情况很

16、可能与之有显著差情况很可能与之有显著差异。异。基于这个理由，人们常把基于这个理由，人们常把时拒绝时拒绝 H0 称为是称为是显著的。显著的。如果显著性水平如果显著性水平取得很小，则拒绝域也会比取得很小，则拒绝域也会比较小。其产生的后果较小。其产生的后果是是：难于被拒绝。难于被拒绝。把在把在时拒绝时拒绝称为是称为是高度显著的。高度显著的。概率统计某工厂生产的一种螺钉，标准要求长度是某工厂生产的一种螺钉，标准要求长度是 32.5 毫米毫米. 实际生产的产品，其长度实际生产的产品，其长度 X 假定服从正假定服从正态分布态分布其中其中未知，现从该厂生未知，现从该厂生产的一批产品中抽取产

17、的一批产品中抽取 6 件件, 得尺寸数据如下：得尺寸数据如下：32.56, 29.66, 31.64, 30.00, 31.87, 31.03问：这批产品是否合格问：这批产品是否合格?设设：这批产品：这批产品(螺钉长度螺钉长度)的的全体组成问题的总体为全体组成问题的总体为 X 例例2 解解：则问题是要检验则问题是要检验 E(X) 是否为是否为32.5.由已知，由已知，概率统计提出原假设和备择假设提出原假设和备择假设第一步：第一步：因为已知因为已知未知未知. 第二步：第二步：能衡量能衡量差异大差异大小且分小且分布已知布已知故取检验统计量为：故取检验统计量为：在在成立下求出它的分布为：成立下

18、求出它的分布为：概率统计第三步：第三步：即即“ ”是一个是一个小概率事件小概率事件 . 小概率事件在一次小概率事件在一次试验中基本上不会试验中基本上不会发生发生 .使得：使得：故得否定域为：故得否定域为：对给定的显著性水平对给定的显著性水平查查分布表得临界分布表得临界值：值：概率统计故不能拒绝故不能拒绝H0 ，即应接受，即应接受H0 第四步：第四步：没有落入没有落入拒绝域拒绝域接受接受H0这并不意味着这并不意味着H0一定对，只是差异一定对，只是差异还不够显著，不足以否定还不够显著，不足以否定H0 。将样本值代入，计算出统计量将样本值代入，计算出统计量的实测值：的实测值：可认为这批产品是

19、合格的。可认为这批产品是合格的。结论：结论：注：注：概率统计例例3. 设某异常区磁场强度服从正态分布设某异常区磁场强度服从正态分布，由以前观察知道由以前观察知道，现有一台，现有一台新型号的仪器，用它对该区进行磁测，抽取了新型号的仪器，用它对该区进行磁测，抽取了41个点，其样本均值与方差为：个点，其样本均值与方差为：问：此仪器测出的结果是否符合要求问：此仪器测出的结果是否符合要求?解解: 以以分别表示用这台机器测出的异常区的分别表示用这台机器测出的异常区的磁场强度磁场强度 X 的均值和均方差的均值和均方差(标准差标准差)。于是：于是：这里这里是未知的是未知的.根据长期实践的经验表明异常

20、区磁场强度的标根据长期实践的经验表明异常区磁场强度的标准差比较稳定，所以可设准差比较稳定，所以可设概率统计提出假设：提出假设：第一步：第一步：第二步：第二步：由已知条件取检验统计表量为：由已知条件取检验统计表量为：第三步：第三步：对给定的显著性水平对给定的显著性水平查正态分布表得临查正态分布表得临界值：界值：概率统计使得：使得：故得否定域为：故得否定域为：即：即：是一个是一个小概率事件小概率事件 .概率统计第四步：第四步：将样本值代入，计算出统计量将样本值代入，计算出统计量的实测值：的实测值：没有落入没有落入拒绝域拒绝域故不能拒绝故不能拒绝H0 ，即应接受，即应接受H0 结论：

21、结论：可认为这台仪器测出的结果是符合要求的。可认为这台仪器测出的结果是符合要求的。即这台机器是基本正常的。即这台机器是基本正常的。概率统计提出提出假设假设根据统计调查的目的，提出根据统计调查的目的，提出原假设原假设H0 和备选假设和备选假设H1作出作出决策决策抽取样本抽取样本检验检验假设假设拒绝拒绝H0还是还是接受接受H0显著性显著性水平水平小小结结-犯第一类错犯第一类错误的概率，误的概率， C 为拒绝域。为拒绝域。对差异进行定量的分析，对差异进行定量的分析，确定其性质确定其性质(是随机误差是随机误差还是系统误差还是系统误差. 为给出两为给出两者界限，找一检验统计量者界限，找一检验统计

22、量 T，在在H0 成立下其分布已知成立下其分布已知.）概率统计注注:备择假设备择假设表示表示可能大于可能大于也可能小于也可能小于，故称其为，故称其为双边备择假设。双边备择假设。从而对应的假从而对应的假设检验称为设检验称为双边假设检验。双边假设检验。拒绝域与临界点拒绝域与临界点(1)当统计量取某个区域当统计量取某个区域 C 中的值时，拒绝原假中的值时，拒绝原假(2) 设设，则称区域，则称区域 C 为为拒绝域。拒绝域。(2) 拒绝域的边界点称为拒绝域的边界点称为临界点临界点单边检验单边检验(1) 右边检验右边检验:(2) 左边检验左边检验:概率统计则称则称与与的的差异显著差

23、异显著在正态分布中针对显著性水平在正态分布中针对显著性水平，一般有：，一般有：则称则称与与的的差异不显著差异不显著例如例如，当当当当概率统计五五. 假设检验问题的步骤假设检验问题的步骤3. 确定检验统计量及拒绝域的形式确定检验统计量及拒绝域的形式1. 根据实际问题要求，提出原假设根据实际问题要求，提出原假设及备择假设及备择假设2. 给定显著性水平给定显著性水平及样本容量及样本容量4. 按按，求出拒绝域，求出拒绝域5. 取样本，根据样本观察值确定接受取样本，根据样本观察值确定接受还是拒绝还是拒绝概率统计某编织物强力指标某编织物强力指标 X 的均值的均值公斤。公斤。改改进工艺后

24、生产了一批编织物，今从中取进工艺后生产了一批编织物，今从中取 30 件，件，测得测得公斤。公斤。假设强力假设强力X 指标服从正指标服从正态分布态分布，且已知，且已知公斤。公斤。提出假设提出假设: : 取统计量：取统计量：否定域否定域 C C 为：为：是一小概是一小概率事件率事件例例4问：在显著性水平问：在显著性水平下，新生产编织物比下，新生产编织物比过去的编织物强力是否有提高过去的编织物强力是否有提高 ?解解:概率统计并由样本值计算并由样本值计算，得得统计量统计量 U 的实测值为：的实测值为：故拒绝原假设故拒绝原假设 H0 ，可认为新生产编织物比过去的编，可认为新生产编织物比过去的编织物强力是有提高的。织物强力是有提高的。落入否定域落入否定域此时可能会犯第一类错误，但犯错误的概此时可能会犯第一类错误，但犯错误的概率不会超过率不会超过 0.01.由已知，由已知，注：注：

展开阅读全文

概率论与数理统计：第8章 第一节假设检验

最新文档

概率论与数理统计：第8章第一节假设检验