统计名言课件

上传人:M****1 文档编号:569828979 上传时间:2024-07-31 格式:PPT 页数:91 大小:618KB
返回 下载 相关 举报
统计名言课件_第1页
第1页 / 共91页
统计名言课件_第2页
第2页 / 共91页
统计名言课件_第3页
第3页 / 共91页
统计名言课件_第4页
第4页 / 共91页
统计名言课件_第5页
第5页 / 共91页
点击查看更多>>
资源描述

《统计名言课件》由会员分享,可在线阅读,更多相关《统计名言课件(91页珍藏版)》请在金锄头文库上搜索。

1、统计学统计学统统 计计 学学( (第三版第三版) )200820082008年8月5 - 2统计学统计学STATISTICS(第三版第三版)不象其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑。 Gudmund R.Iversen统计名言统计名言2008年8月第第 5 章章 参数估计参数估计5.1 参数估计的基本原理参数估计的基本原理 5.2 一个总体参数的区间估计一个总体参数的区间估计5.3 两个总体参数的区间估计两个总体参数的区间估计5.4 样本量的确定样本量的确定2008年8月5 - 4统计学统计学STATISTICS(第三版第三版)学习目标学习目标l参数估计的基本

2、原理参数估计的基本原理l点估计与区间估计点估计与区间估计l评价估计量优良性的标准评价估计量优良性的标准l一个总体参数的区间估计方法一个总体参数的区间估计方法l两个总体参数的区间估计方法两个总体参数的区间估计方法l样本量的确定方法样本量的确定方法2008年8月5 - 5统计学统计学STATISTICS(第三版第三版)大学生每周上网花多少时间?大学生每周上网花多少时间?为为了了解解学学生生每每周周上上网网花花费费的的时时间间,中中国国人人民民大大学学公公共共管管理理学学院院的的4 4名名本本科科生生对对全全校校部部分分本本科科生生做做了了问问卷卷调调查查。调调查查的的对对象象为为中中国国人人民民大

3、大学学在在校校本本科科生生,调调查查内内容容包包括括上上网网时时间间、途途径径、支支出出、目目的的、关关心心的的校校园园网网内内容容,以以及及学学生生对对收收费费的的态态度度,包包括括收收费费方式、价格等方式、价格等问问卷卷调调查查由由调调查查员员直直接接到到宿宿舍舍发发放放并并当当场场回回收收。对对四四个个年年级级中中每每年年级级各各发发6060份份问问卷卷,其其中中男男、女女生生各各3030份份。共共收收回回有有效效问问卷卷共共200200份份。其其中中有有关关上上网网时时间方面的数据经整理如下表所示间方面的数据经整理如下表所示 2008年8月5 - 6统计学统计学STATISTICS(第

4、三版第三版)大学生每周上网花多少时间?大学生每周上网花多少时间?回答类别回答类别回答类别回答类别人数(人)人数(人)人数(人)人数(人)频率(频率(频率(频率(%)3 3小时以下小时以下小时以下小时以下323216163 36 6小时小时小时小时353517.517.56 69 9小时小时小时小时333316.516.59 91212小时小时小时小时292914.514.51212小时以上小时以上小时以上小时以上717135.535.5合计合计合计合计200200100100平均上网时间为平均上网时间为8.588.58小时,标准差为小时,标准差为0.690.69小时。全校学生每周小时。全校学生

5、每周的平均上网时间是多少?每周上网时间在的平均上网时间是多少?每周上网时间在1212小时以上的学生比小时以上的学生比例是多少?你做出估计的理论依据是什么?例是多少?你做出估计的理论依据是什么?2008年8月5.1 参数估计的基本原理参数估计的基本原理 5.1.1 点估计与区间估计点估计与区间估计 5.1.2 评价估计量的标准评价估计量的标准第第 5 章章 参数估计参数估计2008年8月5.1.1 点估计与区间估计点估计与区间估计5.1 参数估计的一般问题参数估计的一般问题2008年8月5 - 9统计学统计学STATISTICS(第三版第三版)1.参参数数估估计计(parameter (para

6、meter estimation)estimation)就就是是用用样样本本统统计计量去估计总体的参数量去估计总体的参数2.估计量:用于估计总体参数的统计量的名称估计量:用于估计总体参数的统计量的名称n n如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等n n例如例如: : 样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量3.参数用参数用 表示,估计量表示,估计量用用 表示表示4.估计值:估计参数时计算出来的统计量的具体值估计值:估计参数时计算出来的统计量的具体值n n如果样本均值如果样本均值 x x =80 =80,则,则8080就是就是 的估计值的估计值估

7、计量与估计值估计量与估计值 (estimator & estimated value)2008年8月5 - 10统计学统计学STATISTICS(第三版第三版)点估计点估计 (point estimate)1.用样本的估计量的某个取值直接作为总体参数的估计值 例例如如:用用样样本本均均值值直直接接作作为为总总体体均均值值的的估估计计;用用两个样本均值之差直接作为总体均值之差的估计两个样本均值之差直接作为总体均值之差的估计2.无法给出估计值接近总体参数程度的信息n n由由于于样样本本是是随随机机的的,抽抽出出一一个个具具体体的的样样本本得得到到的的估计值很可能不同于总体真值估计值很可能不同于总体

8、真值n n一一个个点点估估计计量量的的可可靠靠性性是是由由它它的的抽抽样样标标准准误误差差来来衡衡量量的的,这这表表明明一一个个具具体体的的点点估估计计值值无无法法给给出出估估计的可靠性的度量计的可靠性的度量 2008年8月5 - 11统计学统计学STATISTICS(第三版第三版)区间估计区间估计 (interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个估估计计区区间,该区间由样本统计量加减估计误差而得到间,该区间由样本统计量加减估计误差而得到2.2.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计

9、计量量与与总总体体参数的接近程度给出一个概率度量参数的接近程度给出一个概率度量n n比如,某班级平均分数在比如,某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95% 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量 ( (点估计点估计点估计点估计点估计点估计) )置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限2008年8月5 - 12统计学统计学STATISTICS(第三版第三版)区间估计的图示区间估计的图示 x95% 95% 的样本的样本的样本的样本 -1.96 -1.96 x x +1.96+1.96 x

10、 x99% 99% 的样本的样本的样本的样本 - 2.58- 2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65 -1.65 x x +1.65+1.65 x x2008年8月5 - 13统计学统计学STATISTICS(第三版第三版)1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,也称置信度 2.表示为 (1 - n n 为是总体参数为是总体参数未在未在区间内的比例区间内的比例 3.常用的置信水平值有 99%, 95%, 90%n n相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置信水平

11、(confidence level) 2008年8月5 - 14统计学统计学STATISTICS(第三版第三版)1.由样本估计量构造出的总体参数在一定置信水平由样本估计量构造出的总体参数在一定置信水平下的估计区间下的估计区间2.统计学家在某种程度上确信这个区间会包含真正统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间的总体参数,所以给它取名为置信区间3.如果用某种方法构造的所有区间中有如果用某种方法构造的所有区间中有95%95%的区间的区间包含总体参数的真值,包含总体参数的真值,5%5%的区间不包含总体参数的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信

12、水的真值,那么,用该方法构造的区间称为置信水平为平为95%95%的置信区间。同样,其他置信水平的区的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表述间也可以用类似的方式进行表述置信区间的表述置信区间的表述 (confidence interval)2008年8月5 - 15统计学统计学STATISTICS(第三版第三版)1.总总体体参参数数的的真真值值是是固固定定的的,而而用用样样本本构构造造的的区区间间则则是是不不固固定定的的,因因此此置置信信区区间间是是一一个个随随机机区区间间,它它会会因因样样本本的的不不同同而而变变化化,而而且且不不是是所所有有的区间都包含总体参数的区间都包

13、含总体参数2.实实际际估估计计时时往往往往只只抽抽取取一一个个样样本本,此此时时所所构构造造的的是是与与该该样样本本相相联联系系的的一一定定置置信信水水平平( (比比如如95%)95%)下下的的置置信信区区间间。我我们们只只能能希希望望这这个个区区间间是是大大量量包包含含总总体体参参数数真真值值的的区区间间中中的的一一个个,但但它它也也可可能是少数几个不包含参数真值的区间中的一个能是少数几个不包含参数真值的区间中的一个置信区间的表述置信区间的表述 (confidence interval)2008年8月5 - 16统计学统计学STATISTICS(第三版第三版)1.1.当当抽抽取取了了一一个个

14、具具体体的的样样本本,用用该该样样本本所所构构造造的的区区间间是是一一个个特特定定的的常常数数区区间间,我我们们无无法法知知道道这这个个样样本本所所产产生生的的区区间间是是否否包包含含总总体体参参数数的的真真值值,因因为为它它可可能能是是包包含含总总体体均均值值的的区区间间中中的的一一个个,也也可可能能是是未未包包含含总总体体均均值值的那一个的那一个2.2.一一个个特特定定的的区区间间总总是是“ “包包含含” ”或或“ “绝绝对对不不包包含含” ”参参数数的的真真值值,不不存存在在“ “以以多多大大的的概概率率包包含含总总体体参参数数” ”的的问问题题3.3.置置信信水水平平只只是是告告诉诉我

15、我们们在在多多次次估估计计得得到到的的区区间间中中大大概概有有多多少少个个区区间间包包含含了了参参数数的的真真值值,而而不不是是针针对对所所抽抽取取的这个样本所构建的区间而言的的这个样本所构建的区间而言的 置信区间的表述置信区间的表述 (confidence interval)2008年8月5 - 17统计学统计学STATISTICS(第三版第三版)置信区间的表述置信区间的表述 (95%的置信区的置信区间)从均值为从均值为从均值为从均值为185185的总体中抽出的总体中抽出的总体中抽出的总体中抽出n=10n=10的的的的2020个样本构造出个样本构造出个样本构造出个样本构造出 的的的的2020

16、个个个个置信区间置信区间置信区间置信区间 我没有抓住参数!我没有抓住参数!点估计值点估计值点估计值点估计值 2008年8月5 - 18统计学统计学STATISTICS(第三版第三版)1.1.使使用用一一个个较较大大的的置置信信水水平平会会得得到到一一个个比比较较宽宽的的置置信信区区间间,而而使使用用一一个个较较大大的的样样本本则则会会得得到到一一个个较较准准确确( (较较窄窄) )的的区区间间。直直观观地地说说,较较宽宽的的区区间间会会有有更更大大的的可可能能性包含参数性包含参数2.2.但实际应用中,过宽的区间往往没有实际意义但实际应用中,过宽的区间往往没有实际意义l l比比如如,天天气气预预

17、报报说说“ “在在一一年年内内会会下下一一场场雨雨” ”,虽虽然然这这很很有有把把握握,但但有有什什么么意意义义呢呢?另另一一方方面面,要要求求过过于于准准确确( (过过窄窄) )的的区区间间同同样样不不一一定定有有意意义义,因因为为过过窄窄的的区区间间虽虽然然看看上上去去很很准准确确,但但把把握握性性就就会会降降低低,除除非非无无限限制制增增加加样样本本量量,而而现现实中样本量总是有限的实中样本量总是有限的3.3.区间估计总是要给结论留点儿余地区间估计总是要给结论留点儿余地 置信区间的表述置信区间的表述 (confidence interval)2008年8月5.1.2 评价估计量的标准评价

18、估计量的标准5.1 参数估计的一般问题参数估计的一般问题2008年8月5 - 20统计学统计学STATISTICS(第三版第三版)无偏性无偏性(unbiasedness)无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数P P P( ( ( ) ) )B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏2008年8月5 - 21统计学统计学STATISTICS(第三版第三版)有效性有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分

19、布P P( ( ) )2008年8月5 - 22统计学统计学STATISTICS(第三版第三版)一致性一致性(consistency)一致性:一致性:随着样本量的增大,估计量的 值越来越接近被估计的总体参数AB较小的样本量较小的样本量较小的样本量较小的样本量较大的样本量较大的样本量较大的样本量较大的样本量P P( ( ) )2008年8月5.2 一个总体参数的区间估计一个总体参数的区间估计 5.2.1 总体均值的区间估计总体均值的区间估计 5.2.2 总体比例的区间估计总体比例的区间估计 5.2.3 总体方差的区间估计总体方差的区间估计第第 5 章章 参数估计参数估计2008年8月5.2.1

20、总体均值的区间估计总体均值的区间估计5.2 一个总体参数估计的区间估计一个总体参数估计的区间估计2008年8月5 - 25统计学统计学STATISTICS(第三版第三版)一个总体参数的区间估计一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均均值比例比例方差方差2008年8月5 - 26统计学统计学STATISTICS(第三版第三版)总体均值区间的一般表达式总体均值区间的一般表达式1.总体均值的置信区间是由样本均值加减估计误差总体均值的置信区间是由样本均值加减估计误差得到的得到的2.估计误差由两部分组成:一是点估计量的标准误估计误差由两部分组成:一是点估计量的标准误差

21、,它取决于样本统计量的抽样分布。二是估计差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度为的分位数值,它取决于事先所要求的可靠程度3.总体均值在置信水平下的置信区间可一般性地表总体均值在置信水平下的置信区间可一般性地表达为达为 样本均值样本均值分位数值分位数值样本均值的标准误差样本均值的标准误差2008年8月5 - 27统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(大样本的估计大样本的估计)1.1.假定条件假定条件n n总体服从正态分布

22、总体服从正态分布, ,且方差且方差( ( ) ) 已已知知n n如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 ( (n n 30) 30)2.使用正态分布统计量使用正态分布统计量 z z3.总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为2008年8月5 - 28统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(大样本的估计大样本的估计)【例例例例】一一家家保保险险公公司司收收集集到到由由3636个个投投保保人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄( (单单位位:周周岁

23、岁) )数数据据如下表。试建立投保人年龄如下表。试建立投保人年龄90%90%的置信区间的置信区间 3636个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据 2323353539392727363644443636424246464343313133334242535345455454474724243434282839393636444440403939494938383434484850503434393945454848454532322008年8月5 - 29统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计 (大样本的估计大样本

24、的估计)解解解解:已已知知n n=36, =36, 1-1- = = 90%90%,z z /2/2=1.645=1.645。根根据据样样本本数数据计算得:据计算得: , 总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁2008年8月5 - 30统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(小样本的估计小样本的估计)1. 假定条件n n总体服从正态分布总体服从正态分布, ,但方差但方差( ( ) ) 未知未知n n小样本小样本

25、( (n n 30) 30)2.使用 t 分布统计量3.总体均值 在1-置信水平下的置信区间为2008年8月5 - 31统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计 (小样本的估计小样本的估计)【 例例例例 】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对产产量量质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已

26、已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,且且总总体体标标准准差差为为1010克克。试试估估计计该该批批产产品品平平均均重重量量的的置信区间,置信水平为置信区间,置信水平为95%95%2525袋食品的重量袋食品的重量袋食品的重量袋食品的重量 112.5112.5101.0101.0103.0103.0102.0102.0100.5100.5102.6102.6107.5107.5 95.0 95.0108.8108.8115.6115.6100.0100.0123.5123.5102.0102.0101.6101.6102.2102.2116.6116.6 95.4 95.4

27、 97.8 97.8108.6108.6105.0105.0136.8136.8102.8102.8101.5101.5 98.4 98.4 93.3 93.32008年8月5 - 32统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计 (小样本的估计小样本的估计)解解解解 : 已已 知知 N N( ( , 10102 2) ), n n=25, =25, 1-1- = = 95%95%,z z /2/2=1.96=1.96。根根据据样样本本数数据据计计算算得得: 。由由于于是是正正态态总总体体,且且方方差差已已知知。总总体体均均值值 在在1-1- 置置信信水

28、平下的置信区间为水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44g109.28g101.44g109.28g2008年8月5 - 33统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(小样本的估计小样本的估计)【例例例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命( (单单位位:h)h)如下。建立该批灯泡平均使用寿命如下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间1616灯泡使用寿命的数据灯泡使用寿命的数据

29、灯泡使用寿命的数据灯泡使用寿命的数据 151015101520152014801480150015001450145014801480151015101520152014801480149014901530153015101510146014601460146014701470147014702008年8月5 - 34统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(小样本的估计小样本的估计)解解解解:已知已知 N N( ( , 2 2) ),n n=16, 1-=16, 1- = 95%= 95%,t t /2/2=2.131=2.131 根据样本数据计算

30、得:根据样本数据计算得: , 总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8h h1503.21503.2h h2008年8月5.2.2 总体比例的区间估计总体比例的区间估计5.2 一个总体参数估计的区间估计一个总体参数估计的区间估计2008年8月5 - 36统计学统计学STATISTICS(第三版第三版)总体比例的区间估计总体比例的区间估计1.1.假定条件假定条件n n总体服从二项分布总体服从二项分布n n可以由正态分布来近似可以由正态分布来近似n nnpnp( (成功次数成

31、功次数) )和和n n(1-(1-p p)( )(失败次数失败次数) )均应该大于均应该大于10102.2.使用正态分布统计量使用正态分布统计量 z z3. 3. 3. 总体比例总体比例总体比例 在在在1-1-1- 置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为样本比例样本比例分位数值分位数值样本比例的标准误差样本比例的标准误差2008年8月5 - 37统计学统计学STATISTICS(第三版第三版)总体比例的区间估计总体比例的区间估计(例题分析例题分析)【例例例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机地地抽抽取取了了100

32、100名名下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的置信区间的置信区间解解解解:已已知知 n n=100=100,p p65% 65% , , 1 1- - = = 95%95%,z z /2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区间为区间为55.65%74.35%55.65%74.35% 2008年8月5.2.3 总体方差的区间估计总体方差的区间估计5.2 一个总体参数估计的区间估计一个总体参数估计的区间估计2008年8月5 - 3

33、9统计学统计学STATISTICS(第三版第三版)总体方差的区间估计总体方差的区间估计1. 估计一个总体的方差或标准差2. 假设总体服从正态分布3.总体方差 2 2 的点估计量为s2 2,且4. 总体方差在1- 置信水平下的置信区间为2008年8月5 - 40统计学统计学STATISTICS(第三版第三版)总体方差的区间估计总体方差的区间估计(图示图示) 1-1- 总体方差的总体方差的总体方差的1-1-1- 的置信区间的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的的的 2008年8月5 - 41统计学统计学STATISTICS(第三版第三版)总体方差的区间估计总体方差的

34、区间估计(例题分析例题分析)【例例例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布。以以95%95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 2525袋食品的重量袋食品的重量袋食品的重量袋食品的重量 112.5112.5101.0101.0103.0103.0102.0102.0100.5100.5102.6102.6107.5107.5 9

35、5.0 95.0108.8108.8115.6115.6100.0100.0123.5123.5102.0102.0101.6101.6102.2102.2116.6116.6 95.4 95.4 97.8 97.8108.6108.6105.0105.0136.8136.8102.8102.8101.5101.5 98.4 98.4 93.3 93.32008年8月5 - 42统计学统计学STATISTICS(第三版第三版)总体方差的区间估计总体方差的区间估计(例题分析例题分析)解解解解: :已知已知n n2525,1-1- 95% ,95% ,根据样本数据计算得根据样本数据计算得 s s2

36、 2 =93.21=93.21 2 2置信度为置信度为95%95%的置信区间为的置信区间为 该企业生产的食品总体重量标准差的的置信区该企业生产的食品总体重量标准差的的置信区间为间为7.54g13.43g7.54g13.43g2008年8月5 - 43统计学统计学STATISTICS(第三版第三版)一个总体参数的区间估计一个总体参数的区间估计(小结小结)2008年8月待估参数待估参数待估参数待估参数均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t

37、t分布分布5.3 两个总体参数的区间估计两个总体参数的区间估计 5.3.1 两个总体均值之差的区间估计两个总体均值之差的区间估计 5.3.2 两个总体比例之差的区间估计两个总体比例之差的区间估计 5.3.3 两个总体方差比的区间估计两个总体方差比的区间估计第第 5 章章 参数估计参数估计2008年8月5 - 45统计学统计学STATISTICS(第三版第三版)两个总体参数的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值差比例差方差比2008年8月5.3.1 两个总体均值之差的区间估计两个总体均值之差的区间估计5.3 两个总体参数估计的区间估计两个总体参数

38、估计的区间估计2008年8月5 - 47统计学统计学STATISTICS(第三版第三版)均值之差区间的一般表达式均值之差区间的一般表达式1.两个总体均值的置信区间是由两个样本均值之差两个总体均值的置信区间是由两个样本均值之差加减估计误差得到的加减估计误差得到的2.估计误差由两部分组成:一是点估计量的标准误估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度为的分位数值,它取决于事先所要求的可靠程度

39、3.两个总体均值之差两个总体均值之差( ( 1 1- - 2 2) )在置信水平下的置信在置信水平下的置信区间可一般性地表达为区间可一般性地表达为 ( ( x x1 1- - x x2 2 ) )分位数值分位数值分位数值分位数值 ( ( x x1 1- - x x2 2 ) )的标准误的标准误的标准误的标准误差差差差2008年8月5 - 48统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)1. 假定条件 两个两个总体都服从正态分布,总体都服从正态分布, 1 1、 2 2已知已知 若若不不是是正正态态分分布布, , 可可以以用用

40、正正态态分分布布来来近近似似( (n n1 1 3030和和n n2 2 30)30) 两个样本是独立的随机样本两个样本是独立的随机样本2.使用正态分布统计量 z2008年8月5 - 49统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)1.1. 1 1, 2 2已已知知时时,两两个个总总体体均均值值之之差差 1 1- - 2 2在在1-1- 置信水平下的置信区间为置信水平下的置信区间为2. 1 1、 2 2未知时,未知时,两个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下的置信区间为置信水平下的置信

41、区间为2008年8月5 - 50统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)【例例】某地区教育管理部门想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表 。建立两所中学高考英语平均分数之差95%的置信区间 两个样本的有关数据两个样本的有关数据两个样本的有关数据两个样本的有关数据 中学中学中学中学1 1中学中学中学中学2 2n n1 1=46=46n n1 1=33=33S S1 1=5.8=5.8 S S2 2=7.2=7.22008年8月5 - 51统计学统计学STATIST

42、ICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)解解解解: : 两两个个总总体体均均值值之之差差在在1-1- 置置信信水水平平下下的的置置信信区区间间为为 两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为5.035.03分分10.9710.97分分2008年8月5 - 52统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 1 = = )1.1.假定条件假定条件 两个两个总体都服从正态分布总体都服从正态分布 两个总体方差未知但相等:两个总体方差未知但相

43、等: 1 1= = 2 2 两个独立的小样本两个独立的小样本( (n n1 1 3030和和n n2 2 30)30)2.2.总体方差的合并估计量总体方差的合并估计量3.3.估计估计量量 x x1 1- - x x2 2的抽样标准差的抽样标准差2008年8月5 - 53统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 1 = = )1.两个样本均值之差的标准化2.两两个个总总体体均均值值之之差差 1 1- - 2 2在在1-1- 置置信信水水平平下下的的置置信区间为信区间为2008年8月5 - 54统计学统计学STATIS

44、TICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 1 = = )【例例例例】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排1212名名工工人人,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间( (单单位位:min)min)下下如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差相相等等。试试以以95%95%的的置置信信水水平平建建立立两两种种方方法法组组装装产产品品所所需平均时间差值的置信区

45、间需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法方法方法1 1方法方法方法方法2 228.328.336.036.027.627.631.731.730.130.137.237.222.222.226.026.029.029.038.538.531.031.032.032.037.637.634.434.433.833.831.231.232.132.128.028.020.020.033.433.428.828.830.030.030.230.226.526.52008年8月5 - 55统计学统计学S

46、TATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 1 = = )解解解解: : 根据样本数据计算得根据样本数据计算得 合并估计量为合并估计量为两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟2008年8月5 - 56统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 1 )1.1.假定条件假定条件 两个两个总体都服从正态分布总体都服从正态分布 两个总体方差未知且不相等:两个总体方差

47、未知且不相等: 1 1 2 2 两个独立的小样本两个独立的小样本( (n n1 1 3030和和n n2 2 30)30)2.使用统计量使用统计量2008年8月5 - 57统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 1 )两个总体均值之差1-2在1- 置信水平下的置信区间为自由度自由度2008年8月5 - 58统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 1 )【例例例例】沿沿用用前前例例。假假定定第第一一种种方方法法随随机机安安排排1212

48、名名工工人人,第第二二种种方方法法随随机机安安排排8 8名名工工人人,即即n n1 1=12=12,n n2 2=8 =8 ,所所得得的的有有关关数数据据如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差不不相相等等。以以95%95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法方法方法1 1方法方法方法方法2 228.328.336.036.027.627.631

49、.731.730.130.137.237.222.222.226.526.529.029.038.538.531.031.037.637.634.434.433.833.832.132.128.028.020.020.028.828.830.030.030.230.22008年8月5 - 59统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 1 )解解解解: : 根据样本数据计算得根据样本数据计算得 自由度为自由度为两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.1920.192

50、分钟分钟9.0589.058分钟分钟2008年8月5 - 60统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(匹配大样本匹配大样本)1.假定条件两个匹配的大样本两个匹配的大样本( (n n1 1 3030和和n n2 2 30)30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布2.两个总体均值之差d =1-2在1- 置信水平下的置信区间为 d 分位数值分位数值 d 的标准误差的标准误差2008年8月5 - 61统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样

51、本)1.假定条件两个匹配的小样本两个匹配的小样本( (n n1 1 3030和和n n2 2 30)30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布 2.两个总体均值之差d=1-2在1- 置信水平下的置信区间为2008年8月5 - 62统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样本)【 例例例例 】 由由 1010名名学学 生生 组组 成成 一一 个个随随 机机 样样 本本 , 让让他他们们分分别别采采用用A A和和B B两两套套试试卷卷进进行行 测测 试试 , 结结 果果如如下下表表 。试试建建

52、立立 两两 种种 试试 卷卷 分分数数 之之 差差 d d= = 1 1- - 2 2 95%95%的的置置信信区间区间 1010名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号学生编号学生编号试卷试卷试卷试卷A A试试卷卷卷卷B B差差差差值值d d1 1787871717 72 26363444419193 37272616111114 4898984845 56 69191747417175 549495151-2-27 76868555513138 87676606016169 9858577778 810105555393916162

53、008年8月5 - 63统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样本)解解解解: : 根据样本数据计算得根据样本数据计算得两种试卷所产生的分数之差的置信区间为两种试卷所产生的分数之差的置信区间为6.336.33分分15.6715.67分分2008年8月5.3.2 两个总体比例之差的区间估计两个总体比例之差的区间估计5.3 两个总体参数估计的区间估计两个总体参数估计的区间估计2008年8月5 - 65统计学统计学STATISTICS(第三版第三版)1.1.假定条件假定条件 两个两个总体服从二项分布总体服从二项分布 可以用正态分

54、布来近似可以用正态分布来近似 两个样本是独立的两个样本是独立的 n n1 1p p1 1和和n n1 1(1-(1-p p1 1) ), n n2 2p p2 2和和n n2 2(1-(1-p p2 2) ),均应该大于,均应该大于10102.2.两个总体比例之差两个总体比例之差 1 1- - 2 2在在1-1- 置信水平下的置置信水平下的置信区间为信区间为两个总体比例之差的区间估计两个总体比例之差的区间估计(传统方法传统方法)(p1- p2)分位数值分位数值(p1- p2)的标准误差的标准误差2008年8月5 - 66统计学统计学STATISTICS(第三版第三版)两个总体比例之差的估计两个

55、总体比例之差的估计(例题分析例题分析传统方法传统方法)【例例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计城市与农村收视率差别的置信区间 2008年8月5 - 67统计学统计学STATISTICS(第三版第三版)两个总体比例之差的估计两个总体比例之差的估计 (例题分析例题分析传统方法传统方法)解解解解: : 已知已知 n n1 1=500 =500 ,n n2 2=400=400, p p1 1=45%=45%, p p2 2=32%=32%, 1- 1- =95%=95%, z z

56、/2/2=1.96=1.96 1 1- - 2 2置信度为置信度为95%95%的置信区间为的置信区间为城城 市市 与与 农农 村村 收收 视视 率率 差差 值值 的的 置置 信信 区区 间间 为为6.68%19.32%6.68%19.32%2008年8月5 - 68统计学统计学STATISTICS(第三版第三版)两个总体比例之差的区间估计两个总体比例之差的区间估计(现代方法现代方法)1.通过修正试验次数通过修正试验次数n n1 1、 n n2 2( (样本量样本量) )和试验成功的和试验成功的比例比例P P1 1、 P P2 2( (样本比例样本比例) )改进置信区间改进置信区间2.将试验次数

57、将试验次数n n1 1和和n n1 1各加上各加上2 2,即用,即用 代代n n1 1, 3. 代替代替n n2 2;将试验成功的次数;将试验成功的次数x x1 1和和x x1 1各加上各加上1 1,即用,即用 代替代替p p1 1,用,用4. 代替代替p p2 23.对于任意大小的样本都可以使用该方法计算置信对于任意大小的样本都可以使用该方法计算置信区间区间2008年8月5 - 69统计学统计学STATISTICS(第三版第三版)两个总体比例之差的区间估计两个总体比例之差的区间估计(现代方法现代方法)1.1.设设两两总总体体都都服服从从二二项项分分布布,即即X X1 1(n n1 1,p p

58、1 1) ), X X2 2(n n2 2,p p2 2) ) 。x x1 1为为n n1 1次次独独立立伯伯努努利利试试验验成成功功的的次次数数,P P1 1位位成成功功的的概概率率概概率率,x x2 2 为为n n2 2次独立伯努利试验成功的次数,次独立伯努利试验成功的次数,P P2 2为成功的概率为成功的概率2.2.定义定义 , ; ,3.3. 1 1- - 2 2在在1-1- 置信水平下的置信水平下的置信区间置信区间4.4.该该区区间间也也称称为为Agresti-CaffoAgresti-Caffo区区间间( (由由Alan Alan AgrestiAgresti和和Brian Bri

59、an CaffoCaffo给出,以其姓氏命名给出,以其姓氏命名) )5.5.如果下限小于如果下限小于-1-1则用则用-1-1代替;如果上限大于代替;如果上限大于1 1则用则用1 1代替代替2008年8月5.3.3 两个总体方差比的区间估计两个总体方差比的区间估计5.3 两个总体参数估计的区间估计两个总体参数估计的区间估计2008年8月5 - 71统计学统计学STATISTICS(第三版第三版)两个总体方差比的区间估计两个总体方差比的区间估计1.1.比较两个总体的方差比比较两个总体的方差比2.用用两个样本的方差比来判断两个样本的方差比来判断 如果如果S S1 12 2/ / S S2 22 2接

60、近于接近于1 1, ,说明两个总体方差很接近说明两个总体方差很接近 如果如果S S1 12 2/ / S S2 22 2远离远离1 1, ,说明两个总体方差之间存在差异说明两个总体方差之间存在差异3.总体方差比在总体方差比在1-1- 置信水平下的置信区间为置信水平下的置信区间为2008年8月5 - 72统计学统计学STATISTICS(第三版第三版)两个总体方差比的区间估计两个总体方差比的区间估计(图示图示)F FF F1-1-1-1- F F 总体方差比的总体方差比的总体方差比的1-1-1- 的置信区间的置信区间的置信区间方差比置信区间示意图方差比置信区间示意图方差比置信区间示意图方差比置信

61、区间示意图方差比置信区间示意图方差比置信区间示意图2008年8月5 - 73统计学统计学STATISTICS(第三版第三版)两个总体方差比的区间估计两个总体方差比的区间估计(例题分析例题分析)【例例】为了研究男女学生在生活费支出(单位:元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果 男学生: 女学生: 试以90%置信水平估计男女学生生活费支出方差比的置信区间 2008年8月5 - 74统计学统计学STATISTICS(第三版第三版)两个总体方差比的区间估计两个总体方差比的区间估计 (例题分析例题分析)解解解解: :根根据据自自由由度度 n n1 1=25-1=24

62、=25-1=24 ,n n2 2=25-1=24=25-1=24,查查得得 F F /2/2(24)=1.98(24)=1.98, F F1-1- /2/2(24)=1/1.98=0.505(24)=1/1.98=0.505 1 12 2 / / 2 22 2置信度为置信度为90%90%的置信区间为的置信区间为男男 女女 学学 生生 生生 活活 费费 支支 出出 方方 差差 比比 的的 置置 信信 区区 间间 为为0.471.840.471.84 2008年8月5 - 75统计学统计学STATISTICS(第三版第三版)两个总体参数的区间估计两个总体参数的区间估计(小结小结)2008年8月待估

63、参数待估参数待估参数待估参数均值差均值差比例差比例差方差比方差比独立大样本独立大样本独立小样本独立小样本匹配样本匹配样本独立大样本独立大样本 1 12 2、 2 22 2已已 1 12 2、 2 22 2未未Z Z分布分布Z Z分布分布 1 12 2、 2 22 2已知已知 1 12 2、 2 22 2未知未知Z Z分布分布 1 12 2= = 2 22 2 1 12 2 2 22 2正态总体正态总体F F分布分布Z Z分布分布t t分布分布t t分布分布t分布分布5.4 样本量的确定样本量的确定 5.4.1 估计总体均值时样本量的确定估计总体均值时样本量的确定 5.4.2 估计总体比例时样本

64、量的确定估计总体比例时样本量的确定第第 5 章章 参数估计参数估计2008年8月6.4.1 估计总体均值时样本量的确定估计总体均值时样本量的确定6.4 样本量的确定样本量的确定2008年8月5 - 78统计学统计学STATISTICS(第三版第三版)1.估计总体均值时样本量n为2.2.样样本本量量n n与与总总体体方方差差 2 2、边边际际误误差差E E、可可靠靠性性系系数数Z Z或或t t之间的关系为之间的关系为 与总体方差成正比与总体方差成正比 与边际误差的平方成反比与边际误差的平方成反比 与可靠性系数成正比与可靠性系数成正比3.样样本本量量的的圆圆整整法法则则:当当计计算算出出的的样样本

65、本量量不不是是整整数数时时,将将小小数数点点后后面面的的数数值值一一律律进进位位成成整整数数,如如24.6824.68取取2525,24.3224.32也取也取2525等等等等估计一个总体均值时样本量的确定估计一个总体均值时样本量的确定 其中:其中:其中:2008年8月5 - 79统计学统计学STATISTICS(第三版第三版)估计一个总体均值时样本量的确定估计一个总体均值时样本量的确定 (例题分析例题分析)【例例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本量?2008年8月5 - 80统计学统计学S

66、TATISTICS(第三版第三版)估计一个总体均值时样本量的确定估计一个总体均值时样本量的确定 (例题分析例题分析)解解解解: : 已知已知 =2000=2000,E E=400, =400, 1-1- =95%=95%, z z /2/2=1.96=1.96 应抽取的样本量为应抽取的样本量为即应抽取即应抽取9797人作为样本人作为样本 2008年8月5 - 81统计学统计学STATISTICS(第三版第三版)估计两个总体均值之差时估计两个总体均值之差时样本量的确定样本量的确定 1.设设n n1 1和和n n2 2为来自两个总体的样本,并假定为来自两个总体的样本,并假定n n1 1= =n n

67、2 22.根据均值之差的区间估计公式可得两个样本的根据均值之差的区间估计公式可得两个样本的容量容量n n为为其中:其中:其中:2008年8月5 - 82统计学统计学STATISTICS(第三版第三版)估计两个总体均值之差时样本量的确定估计两个总体均值之差时样本量的确定 (例题分析例题分析)【例例】一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信水平为95%,预先估计两个班考试分数的方差分别为:试验班12=90 ,普通班 22=120 。如果要求估计的误差范围(边际误差)不超过5分,在两个班应分别抽取多少名学生进行调查? 2008年8月5 - 83统计学统计学STA

68、TISTICS(第三版第三版)估计两个总体均值之差时样本量的确定估计两个总体均值之差时样本量的确定 (例题分析例题分析)解解解解: : 已已知知 1 12 2=90=90, 2 22 2=120=120,E E=5, =5, 1-1- =95%=95%, z z /2/2=1.96=1.96即应抽取即应抽取3333人作为样本人作为样本 2008年8月6.4.2 估计总体比例时样本量的确定估计总体比例时样本量的确定6.4 样本量的确定样本量的确定2008年8月5 - 85统计学统计学STATISTICS(第三版第三版)1.根据比例区间估计公式可得样本量n为估计一个总体比例时样本量的确定估计一个总

69、体比例时样本量的确定 2. E的取值一般小于0.13. 未知时,可取使方差达到最大的值0.5其中:其中:其中:2008年8月5 - 86统计学统计学STATISTICS(第三版第三版)估计总体比例时样本量的确定估计总体比例时样本量的确定 (例题分析例题分析)【例例例例】根根据据以以往往的的生生产产统统计计,某某种种产产品品的的合合格格率率约约为为90%90%,现现要要求求 边边 际际 误误 差差 为为5%5%, 在在 求求 95%95%的的置置信信区区间间时时,应应抽抽取取多多少少个个产产品作为样本?品作为样本? 解解解解 : :已已 知知 =90%=90%, =0.05=0.05, z z

70、/2/2=1.96=1.96,E E=5%=5% 应抽取的样本量应抽取的样本量为为 应抽取应抽取139139个产品作为样本个产品作为样本2008年8月5 - 87统计学统计学STATISTICS(第三版第三版)1.设n1和n2为来自两个总体的样本,并假定n1=n22.根据比例之差的区间估计公式可得两个样本的容量n为估计两个总体比例之差时估计两个总体比例之差时样本量的确定样本量的确定 其中:其中:其中:2008年8月5 - 88统计学统计学STATISTICS(第三版第三版)估计两个总体比例之差时样本量的确定估计两个总体比例之差时样本量的确定 (例题分析例题分析)【例例例例】一一家家瓶瓶装装饮饮

71、料料制制造造商商想想要要估估计计顾顾客客对对一一种种新新型型饮饮料料认认知知的的广广告告效效果果。他他在在广广告告前前和和广广告告后后分分别别从从市市场场营营销销区区各各抽抽选选一一个个消消费费者者随随机机样样本本,并并询询问问这这些些消消费费者者是是否否听听说说过过这这种种新新型型饮饮料料。这这位位制制造造商商想想以以10%10%的的误误差差范范围围和和95%95%的的置置信信水水平平估估计计广广告告前前后后知知道道该该新新型型饮饮料料消消费费者者的的比比例例之之差差,他他抽抽取取的的两两个个样样本本分分别别应应包包括括多多少少人人?( (假假定定两两个样本量相等个样本量相等) ) 2008年8月5 - 89统计学统计学STATISTICS(第三版第三版)估计两个总体比例之差时样本量的确定估计两个总体比例之差时样本量的确定 (例题分析例题分析)解解: E=10%, 1-=95%,z/2=1.96,由于没有的信息,用0.5代替即应抽取193位消费者作为样本 2008年8月5 - 90统计学统计学STATISTICS(第三版第三版)本章小结本章小结l参数估计的基本原理参数估计的基本原理l一个总体参数的区间估计一个总体参数的区间估计l两个总体参数的区间估计两个总体参数的区间估计l样本量的确定样本量的确定2008年8月结结 束束2008年8月

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号