《概率论与数理统计23讲》由会员分享,可在线阅读,更多相关《概率论与数理统计23讲(51页珍藏版)》请在金锄头文库上搜索。
1、概率论与数理统计概率论与数理统计第第23讲讲本文件可从网址http:/上下载1假设检验2假设检验的概念任何一个有关随机变量未知分布的假设称为统计假设或简称假设. 一个仅牵涉到随机变量分布中几个未知参数的假设称为参数假设. 这里所说的假设只是一个设想, 至于它是否成立, 在建立假设时并不知道, 还需进行考察.3对一个样本进行考察, 从而决定它能否合理地被认为与假设相符, 这一过程叫做假设检验. 判别参数假设的检验称为参数检验. 检验是一种决定规则, 通过一定的程序作出是与否的判断.4例1抛掷一枚硬币100次, 正面出现了40次, 问这枚硬币是否匀称?若用X描述抛掷一枚硬币的试验, X=1及X=0
2、分别表示出现正面和出现反面, 上述问题就是要检验X是否服从p=1/2的0-1分布?5例2从1975年的新生儿(女)中随机地抽取20个, 测得其平均体重为3160克, 样本标准差为300克. 而根据过去统计资料, 新生儿(女)平均本重为3140克. 问现在与过去的新生儿(女)体重有无显著差异(假设新生儿体重服从正态分布)?6若把所有1975年新生儿(女)体重体现为一个总体X, 问题就是判断E(X)=3140是否成立?7例3在10个相同的地块上对甲,乙两种玉米进行对比试验, 得如下资料(单位:公斤)甲95196610081082983乙730864742774990从直观上看, 二者差异显著. 但
3、是一方面由于抽样的随机性, 我们不能以个别值进行比较就得出结论; 另一方面直观的标准可能因人而异. 因此这实际上需要比较两个正态总体的期望值是否相等.8这种作为检验对象的假设称为待检假设, 通常用H0表示,例如, 例1的假设是H0: Xb(1,0.5)例2的假设是H0: E(X)=3140例3的假设是H0: E(X)=E(Y) (X与Y是两种玉米的产量期望值)9如何根据样本的信息来判断关于总体分布的某个设想是否成立, 也就是检验假设H0成立与否的方法.10置信区间方法用置信区间的方法进行检验, 基本思想是这样的: 首先设想H0是真的成立; 然后考虑在H0条件下, 已经观测到的样本信息出现的概率
4、. 如果这个概率很小, 这就表明一个概率很小的事件在一次试验中发生了. 11而小概率原理认为, 概率很小的事件在一次试验中是几乎不可能发生的, 也就是说导出了一个违背小概率原理的不合理的现象. 这表明事先的设想H0是不正确的, 因此拒绝原假设H0. 否则, 不能拒绝H0.12至于什么算是概率很小, 在检验之前都事先指定. 比如概率为5%, 1%等, 一般记作a.a是一个事先指定的小的正数, 称为显著性水平或检验水平.13两类错误由于人们作出判断的依据是样本, 也就是由部分来推断整体, 因而假设检验不可能绝对准确, 它也可能犯错误. 其可能性的大小, 也是以统计规律性为依据的, 所可能犯的错误有
5、两类.14第一类错误是: 原假设H0符合实际情况, 而检验结果把它否定了, 这称为弃真错误.第二类错误是: 原假设H0不符合实际情况, 而检验结果把它肯定下来了, 这称为取伪错误.15一个正态总体的假设检验设总体为XN(m,s2). 关于总体参数m,s2的假设检验问题, 介绍下列四种:(1) 已知方差s2, 检验假设H0:m=m0;(2) 未知方差s2, 检验假设H0:m=m0; (3) 未知期望m, 检验假设H0:s2=s02; (4) 未知期望m, 检验假设H0:s2s02;其中H0中的s02, m0都是已知数.16例1 根据长期经验和资料的分析, 某砖瓦厂生产砖的抗断强度X服从正态分布,
6、 方差s2=1.21. 从该厂产品中随机抽取6块, 测得抗断强度如下(单位: kg/cm2):32.56, 29.66, 31.64, 30.00, 31.87, 31.03检验这批砖的平均抗断强度为32.50kg/cm2是否成立(a=0.05)?17解 设H0:m=32.50. 如果H0正确, 则样本(X1,., X6)来自正态总体N(32.50, 1.12), 令1819最后可以下结论否定H0, 即不能认为这批产品的平均抗断强度是32.50kg/cm2.20方差已知对期望值m的检验步骤:(1) 提出待检假设H0:m=m0(m0已知);(2) 选取样本(X1,.,Xn)的统计量, 如H0成立
7、,则21(3) 根据检验水平a, 查表确定临界值ua/2, 使 P(|U|ua/2)=a, 即F(ua/2)=1-a/2.(4) 根据样本观察值计算统计量U的值u并与临界值ua比较(5) 若|u|ua则否定H0, 否则接收H0.22例2 假定某厂生产一种钢索, 它的断裂强度X(kg/m2)服从正态分布N(m,402). 从中选取一个容量为9的样本, 得样本均值为780kg/m2. 能否据此样本认为这批钢索的断裂强度为800kg/cm2 (a=0.05)23可以接受H0, 认为断裂强度为800kg/cm224例3从1975年的新生儿(女)中随机地抽取20个, 测得其平均体重为3160克, 样本标
8、准差为300克. 而根据过去统计资料, 新生儿(女)平均本重为3140克. 问现在与过去的新生儿(女)体重有无显著差异(假设新生儿体重服从正态分布)?(a=0.01)25若把所有1975年新生儿(女)体重体现为一个正态总体N(m,s2), 问题就是判断 m=E(X)=3140是否成立?26解 待检假设H0:m=3140. 由于s2未知, 自然想到用S2代表s2. 则如果H0成立, 则272829方差未知对期望值m的检验步骤:(1) 提出待检假设H0:m=m0(m0已知);(2) 选取样本(X1,.,Xn)的统计量, 如H0成立,则30(3) 根据检验水平a, 查表确定临界值ta/2, 使 P(
9、|T|ta/2)=a;(4) 根据样本观察值计算统计量T的值t并与临界值ta/2比较;(5) 若|t|ta/2则否定H0, 否则接收H0.31例4 某炼铁厂的铁水含碳量X在正常情况下服从正态分布. 现对操作工艺进行了某些改进, 从中抽取5炉铁水测得含碳量数据如下:4.412, 4.052, 4.357, 4.287, 4.683据此是否可以认为新工艺炼出的铁水含碳量的方差仍为0.1082(a=0.05).32解 建立待检假设H0:s2=0.1082; 在H0成立时, 样本来自总体N(m,0.1082), 这时33对于给定的检验水平a=0.05, 可查表确定临界34因而应拒绝H0, 即方差不能认
10、为是0.108235未知期望对正态总体方差的假设检验步骤:(1) 建立待检假设H0:s2=s02;(2) 如H0成立, 则36(3) 由给定的检验水平a查表求ca2,cb2满足:(4) 计算c2的值与ca2,cb2比较;(5) 若c2cb2或c2ca2拒绝H0否则接收H0;37例5 机器包装食盐, 假设每袋盐的净重服从正态分布, 规定每袋标准重量为500g, 标准差不超过10g. 某天开工后, 为检查其机器工作是否正常, 从装好的食盐中随机取9袋, 测其净重(单位:g)为497,507,510,475,484,488,524,491,515问这天包装机工作是否正常(a=0.05)?38解 设X
11、为一袋食盐的净重, 则XN(m,s2). 今需假设H0:m=500以及H0:s2102是否成立?H0:m=500 :查表求临界值t0.05(9-1)=2.306, 计算得39如H0成立, 则有40当s2=102时, 必有414243顺便指出, 在检验假设H0:s2=s02时, 有两个临界值ca2和cb2, 即当(n-1)S2/s02cb2时, 都应拒绝H0. 这是基于若H0成立, 即s2=s02, 则S2/s02的值不应太大或太小. 而在检验假设H0:s2s02时, 考虑到若H0成立, 即s2s02, 则S2/s02不应太大, 但较小是合理的, 因此拒绝域只取(n-1)S2/s02ca2.44
12、对两个正态总体的假设检验在实际过程中还常常需要对两个正态总体进行比较. 即假设XiN(mi,si2), i=1,2.45三种情况:(1) 未知m1,m2, 检验假设H0:s12=s22;(2) 未知m1,m2, 检验假设H0:s12s22;(3) 未知s12,s22, 但知道s12=s22, 检验假设H0:m1=m2;46在统计前都分别对两个总体采样并分别计算出相样的样本均值和样本方差.47(1) 未知m1,m2, 检验假设H0:s12=s22如果H0为真, 则经查F分布表可以作出判决.48(2) 未知m1,m2, 检验假设H0:s12s22;因为当s12=s22时, 49(3) 未知s12,s22, 但知道s12=s22, 检验假设H0:m1=m2;如果H0成立, 则有因此可查t分布表作出判决.50作业 第136页开始 习题7-2第1,3,5题学号不小于2003021561的学生交作业51