第4章参数估计与假设检验知识讲解

上传人:yuzo****123 文档编号:142636010 上传时间:2020-08-21 格式:PPT 页数:55 大小:708.50KB
返回 下载 相关 举报
第4章参数估计与假设检验知识讲解_第1页
第1页 / 共55页
第4章参数估计与假设检验知识讲解_第2页
第2页 / 共55页
第4章参数估计与假设检验知识讲解_第3页
第3页 / 共55页
第4章参数估计与假设检验知识讲解_第4页
第4页 / 共55页
第4章参数估计与假设检验知识讲解_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《第4章参数估计与假设检验知识讲解》由会员分享,可在线阅读,更多相关《第4章参数估计与假设检验知识讲解(55页珍藏版)》请在金锄头文库上搜索。

1、第四章 连续型随机变量的 参数估计与检验,第一节 参数估计 第二节 假设检验 第三节 单个正态总体的参数检验 第四节 两个正态总体的参数检验,一、点估计及其性质,估计量:设 为总体X的一个未知参数,统计量 称为 的估计量。,通过一次具体抽样值 ,估计 参数 取值的方法称为参数的点估计问题。,一个待估参数 ,可以有几个不同的估计量, 这就引出了如何衡量估计量好坏的标准。,称为 的估计值。,1、无偏性,定义 若 ,则 称为 的无偏估计量。,结论 设总体为X,有 , , 为取自X的样本,则 、 分别为 的无偏估计量。,即,注意:S不是 的无偏估计量,只是 的一个估计量.,解:,所以 和 都是 的无偏

2、估计量,由此可 知一个未知参数的无偏估计量不是唯一的。,3、一致性,结论: 和 分别是总体均数 和 的一致 估计量。,因为 ,故 比 有效,定义 设总体X含有未知参数 ,(0,1),P(12)1,区间(1,2) 称为置信度为1的参数的置信区间,称为显著水平,二、区间估计概念,说明: 称为显著性水平,一般取0.1、0.05、0.01。,(1,2)是一个随机区间。对于某次试验所得到的 确切区间,它可能包含 的真值,也可能不包含。 包含 在内的概率为1。,临界值 : 设X是服从某种分布的连续型随机变量, 若对给定的实数 , 有 ,则 称为这种分布的上侧临 界值(或上侧分位数)。,例如,标准正态分布的

3、上侧临界值记为 ,双侧 临界值为,1、单个正态总体均数 的区间估计 设总体XN(,2) , 是从X中抽出来的样本,三、正态总体均数的区间估计,(1) 已知,可查表得,得 已知时, 的置信度为 的置信区间,或,例2 伤寒论用桂枝39张处方,桂枝用量服从=3g的正态分布,根据样本均数8.14g,显著水平0.05,估计桂枝用量的置信区间,解:的置信度0.95的置信区间为,(7.1984,9.0816)g,(2) 未知,fn1,选取样本函数,得 的置信度为 的置信区间为,或,例3 逍遥丸崩解时间服从正态分布,从同一批号随机抽取5丸测得崩解时间为21,18,20,16,15(min),求该批药丸崩解时间

4、总体均数置信度为0.99的置信区间。,该批丸崩解时间总体均数置信度0.99的置信区间,2、两个正态总体均数之差 的区间估计,设总体 , 。从X和Y中 分别抽出样本容量为 、 的样本 和,(1) , 已知,选取 样本函数,由,得,则 的置信度为 的置信区间为,例4 甲医院治愈2570名病人,平均住院天数为13.60 天,乙医院治愈2000名病人,平均住院天数为14.36 天,根据经验,住院天数的标准差甲院为1.25天, 乙院为1.16天,求两院平均住院天数差的区间估计 (设住院天数服从正态分布, ),解:已知,查临界值表 ,得,(2) 未知但,若为小样本, 取样本函数,由,其中样本联合方差,得

5、的置信度为 的置信 区间为,*,若为大样本, 可简化成,取样本函数,由,得 的置信度为 的 置信区间为,*,例5 为研究正常成年男女红细胞的平均数的差异, 检查某地正常成年男子156名,女子74名,求得 男、女红细胞平均数分别为465.13、422.16 万/(mm)3,标准差为54.8、49.2(单位同上), 由经验知道男女红细胞数服从正态分布,且方差相同, 试计算该地正常成年男女的红细胞平均数之差的 置信度为0.99的置信区间。,解:设X表示男性红细胞数,Y表示女性红细胞数, 已知,查临界值表,得,代入大样本公式*,得0.99的置信区间为,f50时,,若此题用公式*计算,给定 ,自由度 ,

6、查u分布临界值表,得,此题因为是大样本,故用两种方法计算结果相同, 而公式*较简便。如果是小样本,只能按小样本的 公式*计算。若按大样本公式计算,结果误差偏大。,(2) 未知且,若为小样本,取样本函数,其中,得 的置信度为 的置信区间为,若为大样本,取样本函数,(近似服从),得 的置信度为 的置信区间为,例6 用两种方法测得某药物中一种元素的含量(%) 得数据如下: 方法I:3.28,3.28,3.29,3.29 方法II:3.25,3.27,3.26,3.25 试估计这两种方法测得的元素含量的均数差的置信 区间(置信度为0.95),解:设方法I和II测得元素的含量服从正态分布,则 两组数据分

7、别是从两个正态总体中抽出的样本。由于 方法不同,可认为 。,已知,查临界值表,代入小样本置信区间得,四、正态总体方差2的区间估计,1、单个正态总体 的区间估计,取样本函数,由 ,得,fn1,例7 某药含碳量服从正态分布,允许方差在0.0482(mg2)内,任取5件测得含碳量1.32,1.55,1.36,1.40,1.44(mg),根据0.05判断该药生产是否稳定?,解:已知n5,1.414,S0.0882, fn-14,即得 的置信度为 的置信区间,查表得,2的置信度0.95的置信区间, (0.0028,0.0642),置信区间的下限0.00280.04820.0023,可认为该药生产不稳定,

8、2、两个正态总体方差比 的区间估计,取样本函数,对给定的置信度 ,有,则,即得 的置信度为 的置信区间,F分布的临界值性质:,例8 用两种方法各4次测定次品占总产品数量的百分 比,测定的标准差分别为0.11,0.07,求方差比的置信度 为0.95的置信区间。,解:已知,给定 ,自由度 ,查表得,代入置信区间得,一、假设检验的原理小概率原理,概率很小的事件,在一次试验中是不可能发生的,这一原理称为小概率原理。,例如有人说,我厂生产的1000个产品中只有1个是次品. 即次品率为1/1000,现从中随机抽取一个,结果恰是次品, 此时我们会怀疑这人的说法,认为次品率不是1/1000。,所以假设检验的基

9、本思想可以概括成一句话:“是 某种带有概率性质的反证法”。类似于数学中逻辑论 证的反证法,但又区别于纯数学中逻辑推理的反证法。 因为我们这里的所谓不合理,并不是绝对矛盾,而是 基于小概率原理。,概率不等于1-,减小,中一个时,另一个往往会增大,要同时减小,只有增加样本容量, 可先限制检验水准,再适当确定样本容量使尽量小。,二、假设检验中的两类错误,1、第一类错误: 为真时却拒绝了 ,也称 弃真错误。犯这类错误的概率就是所谓的小概率 事件发生的概率,常用 表示。通常取0.1,0.05,0.01,2、第二类错误: 为假时却接受了 ,也称取伪 错误。犯这类错误的概率常用 表示。,单侧检验,左侧检验:

10、,右侧检验:,双侧检验,原假设,备择假设,(可忽略不写),在实际问题中,有时需要推断总体参数是否增大 或者减小,如果事先有根据认为 可能大于 ,这时 采用右侧检验;反之,采用左侧检验.,三、假设检验的一般步骤,第一步:根据研究问题的需要提出原假设和备择假设。,第二步:确定检验的统计量并计算出它的值。,第三步:在给定的显著性水平 下,查表确定临 界值。(注意区分单侧、双侧检验),第四步:把统计量的值和临界值比较,决定是否接受,1、单个正态总体均数 的检验,(1) 已知u检验,统计量,拒绝域,信息,临界值,在上面的表格中,,和 ,即 , , 均为小概率事件。此时小概率事件若发生,则我们 就会怀疑原

11、假设 不成立,从而拒绝 ,接受 。,例1 六味地黄丸丸重服从正态分布,标准差=0.5g,规定标准丸重为9g,随机抽取100丸,样本均数为9.1g, 判断该批产品是否合格 ?,解:首先提出原假设和备择假设,该批产品合格的 标准是丸重为9g,故应采用双侧检验。,已知 ,=0.5,n=100.故采用u检验,计算,统计量得,查临界值,因为 ,故小概率事件发生,我们有理由拒绝 ,认为该产品不合格。,例2 安眠药睡眠时间服从正态分布,标准差为1.5小时,10人服用后,测得平均睡眠时间为21.15小时,该批号安眠药睡眠时间的总体均数是否高于20小时=0.01,解:已知 ,故此题应采用 右侧检验,H0:=20

12、, H1:20,统计量的值,查临界值,因为 ,小概率事件发生,故拒绝 ,接受 ,认为睡眠时间总体均数显著高于20小时。,(2) 未知t检验,统计量,拒绝域,信息,临界值,大样本时,总体不论是否服从正态分布,统计量渐近服从正态分布, 可使用u检验。,例3 人体注射麻疹疫苗后,抗体强度服从正态分布,16人注射测得抗体强度为1.2,2.5,1.9,1.5,2.7,1.7,2.2,2.2,3.0,2.4,1.8,2.6,3.1,2.3,2.4,2.1,根据样本能否证实该厂产品的平均抗体强度高于1.9 ? =0.05,解:由已知计算得 ,S=0.5183,n=16,f=15,设 , 未知,故用t检验,查

13、临界值,因为 ,故拒绝 ,认为该厂产品的平均 抗体强度显著高于1.9。,例4 甘草流浸膏中甘草酸含量服从正态分布,要求甘草酸含量不得低于8.32(%),随机抽取4个样品测得样本均数为8.30(%),样本标准差S=0.03(%),判断该厂产品的甘草酸含量是否低于标准?=0.05,解:已知 , 未知。故应用 左侧t检验,f=4-1=3,查临界值,计算统计量,因为 ,故接受 ,认为甘草酸含量没有 低于标准。,2、单个正态总体方差 的假设检验,统计量,拒绝域,信息,临界值,或,例5 某厂准备生产一批新药,通常收率的标准差在5%以内认为是稳定的,现试产9批,得平均收率(%)为75.244,方差为3.30

14、8。 问此药的生产是否稳定?显著水平0.01,解:已知,设,计算统计量,查临界值,f=8,,因为 ,故拒绝 ,即标准差不大于5% 认为生产是稳定的。,一、配比对较两个正态总体均数的差异,作出两组资料各对的差值d,问题转化为差值样本均数的总体均数d是否为0的t检验。,是从两正态总体中抽出的样本均数。假设两种 处理下的正态总体均数相同, 记,统计量,拒绝域,信息,临界值,其中,大样本时,总体不论是否正态分布,可用d的u检验,例1 考察中药眼伤宁对家兔角膜伤口愈合作用,测得造模兔用药前及用药后两月的角膜厚度值(mm),判断眼伤宁对促进角膜伤口愈合有无作用。 =0.01,解:由样本计算 =0.1360

15、,Sd=0.0430,f=n-1=9,H0:d=0, H1:d0,查临界值,,因为 ,故拒绝 ,认为眼伤宁对促进角 膜伤口愈合有极显著作用。,二、方差齐性检验F检验,设两总体 和 ,,和 是分别从总体X、Y中抽出的样本。,统计量,拒绝域,信息,临界值,( ),在计算F值时,总是以样本方差大的作分子,这样就 使F1。而F分布的右侧临界值 或 都是大于1的 数,根据F分布临界值的性质,左侧临界值 、 都是小于1的 数,所以在进行F值与临界值的比较 时,只需查右侧临界值即可。若把 大于1的F与左侧临界值比较,则 无意义。,例1 现有两批中药黄连,分别随机取出4个样品,测 定其小檗碱的含量,第一批得数据:8.96,8.90,8.96, 8.98.第二批得数据:8.82,8.90,8.8

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号