概率论与数理统计第八讲.课件

上传人:ni****g 文档编号:588250575 上传时间:2024-09-07 格式:PPT 页数:77 大小:1.37MB
返回 下载 相关 举报
概率论与数理统计第八讲.课件_第1页
第1页 / 共77页
概率论与数理统计第八讲.课件_第2页
第2页 / 共77页
概率论与数理统计第八讲.课件_第3页
第3页 / 共77页
概率论与数理统计第八讲.课件_第4页
第4页 / 共77页
概率论与数理统计第八讲.课件_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《概率论与数理统计第八讲.课件》由会员分享,可在线阅读,更多相关《概率论与数理统计第八讲.课件(77页珍藏版)》请在金锄头文库上搜索。

1、内容内容总体分布参数的假设检验总体分布参数的假设检验总体分布的总体分布的2 2检验检验学习目标学习目标1.1.假设检验假设检验, ,原假设、备择假设原假设、备择假设2.2.两类错误两类错误3. 3. 显著水平,拒绝域显著水平,拒绝域4. 正态总体均值或方差的假设检验正态总体均值或方差的假设检验8.1 假设检验的基本概念假设检验的基本概念 数理统计的基本任务是根据对样本的考察来数理统计的基本任务是根据对样本的考察来对总体的某些情况作出判断。采用先对总体对总体的某些情况作出判断。采用先对总体X的分布或未知参数作某种假设,再运用统计的分布或未知参数作某种假设,再运用统计分析的方法来检验这一假设是否正

2、确,从而作分析的方法来检验这一假设是否正确,从而作出接受或拒绝的决定。这就是假设检验问题。出接受或拒绝的决定。这就是假设检验问题。例例 某车间用一台包装机包装葡萄糖。包得的某车间用一台包装机包装葡萄糖。包得的袋装糖重是一个袋装糖重是一个R.V,它服从正态分布它服从正态分布N(,0.0152)。当机器正常时,其均值为。当机器正常时,其均值为0.5kg,随,随机地抽取它所包装的糖机地抽取它所包装的糖9袋,称得净重袋,称得净重(kg),分别为分别为 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512问包装机工作是否正常?问包装机工作是否正常?H

3、0,称为称为原假设原假设(或(或零假设零假设)(null hypothesis) H1,称为,称为备择假设备择假设.(alternative hypothesis)H0为真时为真时,统计量统计量两类错误:两类错误:第一类错误第一类错误 在原假设为真时,决定拒绝原假设,在原假设为真时,决定拒绝原假设,称称为为第一类错误第一类错误,其出现的概率通常记作,其出现的概率通常记作; 第二类错误第二类错误 在原假设不真时,决定接受原假设,在原假设不真时,决定接受原假设, 称为称为第二类错误第二类错误,其出现的概率通常记作,其出现的概率通常记作。原则原则原则原则在控制第一类错误的概率在控制第一类错误的概率的

4、条件下,使犯的条件下,使犯第二类错误的概率第二类错误的概率尽量小。尽量小。 这样的假设这样的假设检验问题称为检验问题称为显著性检验显著性检验问问题,概率题,概率称为显著性水平称为显著性水平 ( (evidence level).).1) 1) 反证法思想反证法思想2) 2) 小概率原理小概率原理 概率很小的事件在一次试验中实际上是概率很小的事件在一次试验中实际上是不会发生的。不会发生的。原假设原假设H0和和备择假设备择假设H1,可有如下的形式:,可有如下的形式:参数假设参数假设检验:检验:对未知参数提出假设,再根据样本进行对未知参数提出假设,再根据样本进行检验。检验。非参数假设非参数假设检验:

5、检验:常见是对总体的未知分布提出假设,再根据常见是对总体的未知分布提出假设,再根据样本进行样本进行检验。检验。拒绝域:拒绝域:当样本观测值当样本观测值(x1,x2,xn)落在某区域落在某区域C时我们时我们拒绝原假设,则称区域拒绝原假设,则称区域C为拒绝域,拒绝域的为拒绝域,拒绝域的边界点称为临界点。边界点称为临界点。假设检验的步骤如下:假设检验的步骤如下: 建立建立H0和和H1; 选定统计量并分析选定统计量并分析拒绝域的形式拒绝域的形式; 给定显著性水平给定显著性水平 ,并确定出,并确定出拒绝域拒绝域C; 根据样本观测值作出判断是否拒绝根据样本观测值作出判断是否拒绝H H0 0。 8.2 单个

6、正态总体参数的假设检验单个正态总体参数的假设检验 设设( (x1,x2,xn) )是正态总体是正态总体XN(,(,2 2) )的样本。的样本。1 1 关于关于的假设检验的假设检验对对常见的假设检验问题:常见的假设检验问题:双边检验双边检验右边检验右边检验左边检验左边检验(1)(1)2 2已知已知取统计量取统计量当当H H0 0为真时,为真时,给定显著性水平给定显著性水平 ,有,有试计算此时犯第二类错误的概率。试计算此时犯第二类错误的概率。(2)(2)2 2未知未知取统计量取统计量当当H H0 0为真时,为真时,给定显著性水平给定显著性水平 ,有,有例例作物栽培作物栽培已知豌豆百粒重已知豌豆百粒

7、重X( (单位:单位:g)g)服从正态分布服从正态分布N(37.72,0.1089)(37.72,0.1089),在改善栽,在改善栽培条件后随机抽出培条件后随机抽出9 9粒,平均重量粒,平均重量37.9237.92,问,问改善栽培条件是否显著地提高了豌豆的百粒改善栽培条件是否显著地提高了豌豆的百粒重,重,0.050.05。解:因为改善栽培条件不会降低豌豆籽的解:因为改善栽培条件不会降低豌豆籽的百粒重,所以设百粒重,所以设 H0为为37.72,H1为为37.72计算出计算出z=1.818,=1.818,例例 设考生的某次考试成绩服从正态分布,从设考生的某次考试成绩服从正态分布,从中任取中任取36

8、36位考生的成绩,其平均成绩为位考生的成绩,其平均成绩为66.566.5分,标准差为分,标准差为1515分。分。问在问在0.050.05的显著水平下,能否认为全体考生的显著水平下,能否认为全体考生这次的平均成绩为这次的平均成绩为7070分。分。2 2 关于关于2 2的假设检验的假设检验对对2 2常见的假设检验问题:常见的假设检验问题:双边检验双边检验右边检验右边检验左边检验左边检验由于样本方差由于样本方差s2是总体方差是总体方差2的无偏估计,的无偏估计,当当H0为真时,为真时,给定显著性水平给定显著性水平,1)双边检验双边检验2)右边检验右边检验3)左边检验左边检验原假设原假设备择假备择假设设

9、检验统计量检验统计量H0为真为真时检验时检验统计量统计量的分布的分布拒绝域拒绝域C未未知知时时例例品种提纯品种提纯一个混杂的小麦品种,一个混杂的小麦品种,其株高的标准差为其株高的标准差为14cm14cm,经提纯后随机地,经提纯后随机地抽出抽出1010株,它们的株高株,它们的株高( (单位:单位:cm)cm)为为90,90,105,101,95,100,100,101,105,93,97105,101,95,100,100,101,105,93,97,试,试检验提纯后的群体是否比原来的群体较为检验提纯后的群体是否比原来的群体较为整齐,整齐,0.050.05。解:提纯后的群体应该比原来的群体解:提

10、纯后的群体应该比原来的群体较为整齐,故设较为整齐,故设 H0为为2196,H1为为20, 对左边检验问题对左边检验问题:t检验法,也可从附表检验法,也可从附表6查得所需容量查得所需容量n,使得,使得当当H1且且 时,犯第时,犯第类错误的概率类错误的概率不超过不超过.3) 双边检验问题双边检验问题:t检验法,也可从附表检验法,也可从附表6查得所需容量查得所需容量n,使得,使得当当H1且且 时,犯第时,犯第类错误的概率类错误的概率不超过不超过.例例 考虑在显著水平考虑在显著水平=0.05下进行下进行t检验:检验:要求在要求在H1中中1=68+时犯第时犯第类错类错误的概率不超过误的概率不超过=0.0

11、5,求所需的样本容量求所需的样本容量.若样本容量为若样本容量为n=30, 问在问在H1中中=1=68+0.75时犯第时犯第类错误的概率是多少类错误的概率是多少. 8.6 8.6 分布拟合检验分布拟合检验Pearson构造了统计量构造了统计量定理定理 设设 是总体的真实分是总体的真实分布,其中布,其中 为为r个未知参数。在个未知参数。在F0中中用用 的极大似然估计的极大似然估计 代代替替 令令此时拒绝域此时拒绝域 对总体分布作对总体分布作2 2检验的步骤如下:检验的步骤如下: 设设H0 0为总体为总体X服从某个指定的分布;服从某个指定的分布; 将随机变量将随机变量X的取值范围划分为的取值范围划分

12、为k个互不个互不相交的区间或区域相交的区间或区域D( (i1 1至至k) ); 由样本的观测值求随机变量由样本的观测值求随机变量X在各个在各个Di中取值的观测频数中取值的观测频数vi(i1至至k);按所指定的分布求随机变量按所指定的分布求随机变量X在各个在各个Di中取值的概率中取值的概率pi(i1至至k),如果所指如果所指定的分布中有未知的参数时,可先用极定的分布中有未知的参数时,可先用极大似然法求出各个未知参数的估计量后大似然法求出各个未知参数的估计量后再求上述各个概率的估计值再求上述各个概率的估计值 ; 根据样本容量根据样本容量n及概率及概率pi或估计值或估计值 求随机变量求随机变量X在各

13、个在各个Di中取值的理论频数中取值的理论频数 或理论频数的估计值或理论频数的估计值n (i1至至k); 计算计算2 2统计量的观测值统计量的观测值 当被估计的未知参数有当被估计的未知参数有r个个, 例例2.62.6丢掷骰子丢掷骰子将一粒均匀的骰子将一粒均匀的骰子丢掷丢掷100100次,次,1 1点朝上点朝上1313次、次、2 2点朝上点朝上1414次、次、3 3点朝上点朝上2020次、次、4 4点朝上点朝上1717次、次、5 5点点朝上朝上1515次、次、6 6点朝上点朝上2121次,试检验这粒次,试检验这粒骰子是否均匀。(骰子是否均匀。(=0.05=0.05) 解:如果这粒骰子是均匀的,则解

14、:如果这粒骰子是均匀的,则1至至6点朝上的次数服从均匀分布,即点朝上的次数服从均匀分布,即 P1点朝上点朝上P2点朝上点朝上P3点朝上点朝上P4点朝上点朝上P5点朝上点朝上P6点朝上点朝上1/6, 根据所给的观测值,根据所给的观测值, 因此接受因此接受2 2检验的原假设,认为这粒骰子检验的原假设,认为这粒骰子是均匀的。是均匀的。 例例2.72.7放射研究放射研究用计数器每隔一定用计数器每隔一定时间观测一次试验铀所放射的时间观测一次试验铀所放射的粒子数粒子数x,共,共100次,结果有次,结果有1个个x=0、5个个x=1、16个个x=2、17个个x=3、26个个x=4、11个个x=5、9个个x6、

15、9个个x7、2个个x8、1个个x9、2个个x=10、1个个x=11,试在,试在=0.05下检验下检验总体是否服从总体是否服从P()P()分布。分布。解:如果总体是否服从解:如果总体是否服从P()P()分布,则分布,则 x 0 1 2 3 4 5 6 7 vx 1 5 16 17 26 11 9 9 n 13.23 18.52 19.44 16.33 11.43 6.86 x 8 9 10 11 vx 2 1 2 1 n 3.60 1.68 0.71 0.21 6.26查查2 2分布的分位数表得到分布的分位数表得到 认为总体服从认为总体服从P(P() )分布。分布。 8.7 秩和检验秩和检验要检

16、验下述假设:要检验下述假设:秩秩(rank) 设设X为一总体,将一容量为为一总体,将一容量为n的样的样本观察值按从小到大的次序编号排列成本观察值按从小到大的次序编号排列成称称x(i)的足标的足标i为为x(i)的秩,的秩,i=1,2,,n.例例 考察两种不同类型的肥料考察两种不同类型的肥料A和和B对玉米的对玉米的增产效果增产效果,共选共选10块实验田块实验田,随抽取随抽取n1=5块地块地施用施用A肥料肥料, n n2 2=5=5块地施用块地施用B B肥料肥料, ,施用两种不施用两种不同肥料所得到的玉米产量如表同肥料所得到的玉米产量如表: : A A肥料肥料 84 76 86 70 9484 76

17、 86 70 94 B B肥料肥料 122 90 92 106 100 122 90 92 106 100 H0: A,B肥料有相同的效应肥料有相同的效应,H1:A,B肥料对于玉米增产效果不同肥料对于玉米增产效果不同.肥料种类肥料种类 A A A A B B A B B B 产量产量 70 76 84 86 90 92 94 100 106 122 秩秩 1 2 3 4 5 6 7 8 9 10计算出秩和计算出秩和RA=17,总秩和总秩和R=55,则得则得B秩和秩和RB=R-RA=38. 设自设自1,2两总体分别抽取容量为两总体分别抽取容量为n1,n2的样本的样本,且两样本独立且两样本独立,总

18、设总设n n1 1nn2 2, ,将这将这n n1 1nn2 2个观察个观察值放在一起值放在一起, ,按由小到大的秩序排列按由小到大的秩序排列. .求出每求出每个观察值的秩个观察值的秩, ,然后将属于第然后将属于第1 1个总体的样本个总体的样本观察值的秩相加观察值的秩相加, ,其和记为其和记为R R1 1, ,其余观察值的秩其余观察值的秩的总和记为的总和记为R R2 2, ,称为第称为第2 2样本的秩和样本的秩和, ,显然有显然有对双边检验问题,在给定显著水平对双边检验问题,在给定显著水平下,下,H0的拒绝域为的拒绝域为其中临界点其中临界点 是满足是满足的最大整数,而是满足的最大整数,而是满足

19、的最小整数而犯第的最小整数而犯第类错误的概率为类错误的概率为类似可得左边检验的拒绝域类似可得左边检验的拒绝域可得右边检验的拒绝域可得右边检验的拒绝域例为查明某种血清是否会抑制白血病,选例为查明某种血清是否会抑制白血病,选取患白血病已到晚期的老鼠取患白血病已到晚期的老鼠9只,其中有只,其中有5只只接受这种治疗,另接受这种治疗,另4支不作这种治疗。设两样支不作这种治疗。设两样本相互独立。从实验开始时计算,其存活时间本相互独立。从实验开始时计算,其存活时间(以月计)如下:(以月计)如下:不作治疗不作治疗 1.9 0.5 0.9 2.1接受治疗接受治疗 3.1 5.3 1.4 4.6 2.8设治疗与否

20、的存活时间的概率密度至多只差设治疗与否的存活时间的概率密度至多只差一个平移,取一个平移,取=0.05,问这种血清对白血病,问这种血清对白血病是否有抑制作用?是否有抑制作用?数据数据0.5 0.9 1.4 1.9 2.1 2.8 3.1 4.6 5.3 秩秩1 2 3 4 5 6 7 8 9 可以证明,当可以证明,当H0为真时为真时(即即a=0)而当而当n n1 1,n,n2 21010时时( (当当H H0 0为真时为真时),),近似地有近似地有故当故当n n1 1,n,n2 21010时,可以用时,可以用Z Z统计量检验统计量检验在水平在水平下双边检验,右边检验,左边检验下双边检验,右边检验,左边检验的近似拒绝域分别为的近似拒绝域分别为

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号