统计学原理:第八章 参数估计

上传人:人*** 文档编号:569591268 上传时间:2024-07-30 格式:PPT 页数:117 大小:7.36MB
返回 下载 相关 举报
统计学原理:第八章 参数估计_第1页
第1页 / 共117页
统计学原理:第八章 参数估计_第2页
第2页 / 共117页
统计学原理:第八章 参数估计_第3页
第3页 / 共117页
统计学原理:第八章 参数估计_第4页
第4页 / 共117页
统计学原理:第八章 参数估计_第5页
第5页 / 共117页
点击查看更多>>
资源描述

《统计学原理:第八章 参数估计》由会员分享,可在线阅读,更多相关《统计学原理:第八章 参数估计(117页珍藏版)》请在金锄头文库上搜索。

1、第八章参数估计学习目的与要求通过本章的教学,使学生掌握参数估计的基本思想,会进行点估计一个总体均值、比例和方差的区间估计。掌握评价估计量优劣的标准。重点和难点重点:区间估计的含义和思想;评价估计量优劣的标准;一个总体均值的区间估计。难点:区间估计的含义和思想;一个总体均值的区间估计。主要内容8.1参数估计的一般问题8.2一个总体参数的区间估计8.3两两个总体参数的区间估计8.4样本容量的确定参数估计在统计方法中的地位统计推断的过程样样本本总体总体样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方差差差总体均值、比总体均值、比例、方差等例、方差

2、等大学生每周上网花多少时间?为了解学生每周上网花费的时间,中国人民大学公共管理学院的4名本科生对全校部分本科生做了问卷调查。调查的对象为中国人民大学在校本科生,调查内容包括上网时间、途径、支出、目的、关心的校园网内容,以及学生对收费的态度,包括收费方式、价格等问卷调查由调查员直接到宿舍发放并当场回收。对四个年级中每年级各发60份问卷,其中男、女生各30份。共收回有效问卷共200份。其中有关上网时间方面的数据经整理如下表所示2008年8月大学生每周上网花多少时间?平均上网时间为8.58小时,标准差为0.69小时。全校学生每周的平均上网时间是多少?每周上网时间在12小时以上的学生比例是多少?你做出

3、估计的理论依据是什么?回答类别回答类别回答类别回答类别人数(人)人数(人)人数(人)人数(人)频率(频率(频率(频率(%)3小时以下小时以下321636小时小时3517.569小时小时3316.5912小时小时2914.512小时以上小时以上7135.5合计合计合计合计2002001001002008年8月8.1参数估计的一般问题一.估计量与估计值二.点估计与区间估计三.评价估计量的标准估计量与估计值估计量:在参数估计中,用来估计总体参数的统计量的名称。用符号表示。估计值:一个具体的样本计算出来的估计量的数值。参数估计的方法矩估计法矩估计法最小二乘法最小二乘法最大似然法最大似然法顺序统计量法顺

4、序统计量法估 计 方 法点 估 计区间估计点估计(point estimate)1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等区间估计(interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个区区间间范围,该区间由样本统计量加减抽样误差而得到的范围,该区间由样本统计量加减抽样误差而得到的2.2.根根据据样样本本统统计计量量的的抽抽样样分分布布

5、能能够够对对样样本本统统计计量量与与总总体参数的接近程度给出一个概率度量体参数的接近程度给出一个概率度量 比如,某班级平均分数在比如,某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95% 样本统计量样本统计量 ( (点估计点估计) )置信区间置信区间置信下限置信下限置信上限置信上限区间估计的图示X95%95%的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本 -1.65-1.65 x x +1.65+1.65 x x置信水平(置信度)1.将构造

6、置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平2.表示为(1-为是总体参数未在区间内的比例 3.常用的置信水平值有99%,95%,90%相应的 为0.01,0.05,0.10置信区间的表述(confidenceinterval)1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中

7、的一个置信区间的表述(confidenceinterval)1.总体参数的真值是固定的,而用样本构造的区间则是不固定的,因此置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数2.实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如95%)下的置信区间。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个2008年8月置信区间的表述(confidenceinterval)1.当抽取了一个具体的样本,用该样本所构造的区间是一个特定的常数区间,我们无法知道这个样本所产生的区间是否包含总体参数

8、的真值,因为它可能是包含总体均值的区间中的一个,也可能是未包含总体均值的那一个2.一个特定的区间总是“包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题3.置信水平只是告诉我们在多次估计得到的区间中大概有多少个区间包含了参数的真值,而不是针对所抽取的这个样本所构建的区间而言的2008年8月置信区间的表述(95%的置信区间)2008年8月从均值为从均值为185185的总体中抽出的总体中抽出n=10n=10的的2020个样本构造出个样本构造出 的的2020个个置信区间置信区间 我没有抓住参数!我没有抓住参数!点估计值点估计值 置信区间与置信水平均值的抽样分布均值的抽样分布(

9、1-(1- )%)%区间包含了区间包含了 %的区间未包含的区间未包含 1-1- / /2 2 / /2 2影响区间宽度的因素1.总体数据的离散程度,用 来测度2.样本容量,3.置信水平(1- ),影响z 的大小置信区间的表述(confidenceinterval)1.使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较大的样本则会得到一个较准确(较窄)的区间。直观地说,较宽的区间会有更大的可能性包含参数2.但实际应用中,过宽的区间往往没有实际意义l比如,天气预报说“在一年内会下一场雨”,虽然这很有把握,但有什么意义呢?另一方面,要求过于准确(过窄)的区间同样不一定有意义,因为过窄的区

10、间虽然看上去很准确,但把握性就会降低,除非无限制增加样本量,而现实中样本量总是有限的3.区间估计总是要给结论留点儿余地2008年8月评价估计量的标准无偏性(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数P P( ( ) )B BA A无偏无偏无偏有偏有偏有偏有效性(efficiency)有效性:对同一总体参数的两个无偏点估计量 ,有更小标准差的估计量更有效AB 的抽样分布的抽样分布的抽样分布的抽样分布P P( ( ) )一致性(consistency)一致性:随着样本量的增大,估计量的值越来越接近被估计的总体参数2008年8月AB较小的样本量较小的样本量较大的样

11、本量较大的样本量P P( ( ) )8.2一个总体参数的区间估计一.总体均值的区间估计二.总体比例的区间估计三.总体方差的区间估计一个总体参数的区间估计总体参数总体参数总体参数总体参数符号表示符号表示符号表示符号表示样本统计量样本统计量样本统计量样本统计量均值均值均值均值比例比例比例比例方差方差方差方差一、总体均值的区间估计(正态总体、已知,或非正态总体、大样本)总体均值的区间估计(正态总体、已知,或非正态总体、大样本)1.1.假定条件假定条件 总体服从正态分布总体服从正态分布, , , ,且方差且方差( ( ) ) 已知已知 如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布

12、来近似 ( (n n 30)30)2.使用正态分布统计量使用正态分布统计量3.总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为总体均值的区间估计(例题分析)【例例8.18.1】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对产产量量质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正

13、态态分分布布,且且总总体体标标准准差差为为1010克克。试试估估计计该该批批产产品品平平均均重重量量的置信区间,置信水平为的置信区间,置信水平为95%.95%.2525袋食品的重量袋食品的重量袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3(例题分析)解解:已知N( ,102),n=25,1- =95%,z /2=1.96。根据样本数据计算得:总体均值 在1- 置信水平下的置信区

14、间为有95%的概率保证程度下,该食品平均重量的置信区间为101.44克109.28克之间。总体均值的区间估计(例题分析)【例例8.28.2】一一家家保保险险公公司司收收集集到到由由3636投投保保个个人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄( (周周岁岁) )数数据据如如下下表表。试试建建立立投投保保人人年年龄龄90%90%的置信区间的置信区间 3636个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据 23353927364436424643313342534554472434283936444039493834485034394548

15、4532(例题分析)解:已知解:已知n n=36,1-=36,1- =90%=90%,z z /2/2=1.645=1.645。根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为在在90%90%的的概概率率保保证证程程度度下下,投投保保人人平平均均年年龄龄的的置置信信区间为区间为37.3737.37岁岁41.6341.63岁。岁。总体均值的区间估计(正态总体、未知、小样本)总体均值的区间估计(正态总体、未知、小样本)1.假定条件 总体服从正态分布总体服从正态分布, ,且方差且方差( ( ) ) 未知未知 小样本小样本 ( (n

16、 n30)30)2.使用t分布统计量3.总体均值 在1- 置信水平下的置信区间为总体均值的区间估计(例题分析)【例例8.38.3】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命( (小小时时) )如如下下。建建立立该该批批灯灯泡平均使用寿命泡平均使用寿命95%95%的置信区间的置信区间1616灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470(

17、例题分析)解解 : 已已 知知 NN( ( , 2 2) ),n n=16,=16, 1-1- = 95%95%,t t /2/2=2.131=2.131。根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为在在95%95%的的概概率率保保证证程程度度下下, ,该该种种灯灯泡泡平平均均使使用用寿寿命命的的置信区间为置信区间为1476.81476.8小时小时1503.21503.2小时。小时。二、总体比例的区间估计总体比例的区间估计1.1.假定条件假定条件 总体服从二项分布总体服从二项分布 可以由正态分布来近似可以由正态分布来近似

18、2.2.使用正态分布统计量使用正态分布统计量3.3.3.总体比例总体比例总体比例P P P在在在1-1-1- 置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为总体比例的区间估计(例题分析)【例例8.48.4】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机抽抽取取了了 100100个个 下下 岗岗 职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的的置信区间置信区间解解:已已知知 n n=100=100,p p65%65%, ,1 1- -

19、 =95%95%,z z /2/2=1.96=1.96即即以以95%95%的的把把握握程程度度,该该城城市市下下岗岗职职 工工 中中 女女 性性 比比 例例 的的 置置 信信 区区 间间 为为55.65%74.35%55.65%74.35%。 三、总体方差的区间估计总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差 2 2的点估计量为S2 2,且4.总体方差在1- 置信水平下的置信区间为总体方差的区间估计(图示) 1-1- 总体方差总体方差总体方差1-1-1- 的置信区间的置信区间的置信区间自由度为自由度为n n-1-1的的 总体方差的区间估计(例题分析)【例

20、例8.58.5】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表7 7所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布。以以95%95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 2525袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.61

21、05.0136.8102.8101.598.493.3(例题分析)解解: :已知已知n n2525,1-1- 95%,95%,根据样本数据计算得根据样本数据计算得s s22=93.21=93.21, 2 2置信度为置信度为95%95%的置信区间为的置信区间为即即,以以95%95%把把握握程程度度,该该企企业业生生产产的的食食品品总总体体重重量量标标准准差差的的置信区间为的的置信区间为7.547.54克克13.4313.43克。克。一个总体参数的区间估计(小结)待估参数待估参数待估参数待估参数均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2 2分布分布 2 2已知已知 2 2已知

22、已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分布2008年8月8.3两个总体参数的区间估计一.两个总体均值之差的区间估计二.两个总体比例的之差区间估计三.两个总体方差比的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值之差均值之差比例之差比例之差方差比方差比两个总体均值之差的区间估计(独立大样本)两个样本均值之差的抽样分布 m m1 1 1 1总体1 2 2 m m2 2总体2抽取简单随机样样本容量 n1计算X1抽取简单随机样样本容量 n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m

23、 m1- 1- m m抽样分布抽样分布两个总体均值之差的估计(大样本)1.假定条件 两个两个总体都服从正态分布,总体都服从正态分布, 1 1、 2 2已知已知 若若不不是是正正态态分分布布, , 可可以以用用正正态态分分布布来来近近似似( (n n1 1 3030和和n n2 2 30)30) 两个样本是独立的随机样本两个样本是独立的随机样本2.使用正态分布统计量Z两个总体均值之差的估计 (大样本大样本)1.1. 1 1、 2 2已已知知时时,两两个个总总体体均均值值之之差差 1 1- - 2 2在在1-1- 置信水平下的置信区间为置信水平下的置信区间为2. 1 1、 2 2未知时,未知时,两

24、个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下的置信区间为置信水平下的置信区间为两个总体均值之差的估计(例题分析)【例8.6】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立地抽取两个随机样本,有关数据如下表。建立两所中学高考英语平均分数之差95%的置信区间 两个样本的有关数据两个样本的有关数据两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n1=33S1=5.8 S2=7.2(例题分析)解解: :两个总体均值之差在两个总体均值之差在1-1- 置信水平下的置信区间为置信水平下的置信区间为即即,以以95%95%把把

25、握握程程度度,两两所所中中学学高高考考英英语语平平均均分分数数之之差的置信区间为差的置信区间为5.035.03分分10.9710.97分。分。两个总体均值之差的区间估计(独立小样本)两个总体均值之差的估计(小样本: 1=) 1. 1. 假定条件假定条件 两个两个总体都服从正态分布总体都服从正态分布 两个总体方差未知但相等:两个总体方差未知但相等: 1 1= = 2 2 两个独立的小样本两个独立的小样本( (n n1 1 3030和和n n2 2 30)30)2.2.总体方差的合并估计量总体方差的合并估计量3.3.估计估计量量 X X1 1 1 1- - - - X X2 2 2 2的抽样标准差

26、的抽样标准差两个总体均值之差的估计(小样本: 1=)1.两个样本均值之差的标准化两个总体均值之差的估计(例题分析)【例例8.78.7】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排1212个个工工人人,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间(分分钟钟)下下如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差相相等等。试试以以95%95%的的置置信信水水平平建建立立两两种种方方法法组组装装产产品品所所需平均时间差值的置信区间需平均时

27、间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1(例题分析)解解: :根据样本数据计算得根据样本数据计算得合并估计量为:合并估计量为:即即,95%95%的的把把握握程程度度,两两种种方方法法组组装装产产品品所所需需平平均均时间之差的置信区间为时间之差的置信区间为0.140.14分钟分钟7.267.26

28、分钟分钟。两个总体均值之差的估计(小样本: 1)1.1.假定条件假定条件 两个两个总体都服从正态分布总体都服从正态分布 两个总体方差未知且不相等:两个总体方差未知且不相等: 1 12 2 两个独立的小样本两个独立的小样本( (n n1 1 3030和和n n2 2 30)30)2.使用统计量使用统计量两个总体均值之差的估计(小样本: 1)两个总体均值之差1-2在1-置信水平下的置信区间为自由度自由度两个总体均值之差的估计(例题分析)【例例8.88.8】沿沿用用前前例例。假假定定第第一一种种方方法法随随机机安安排排1212个个工工人人,第第二二种种方方法法随随机机安安排排8 8个个工工人人,即即

29、n n1 1=12=12,n n2 2=8=8,所所得得的的有有关关数数据据如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差不不相相等等。以以95%95%的的置置信信水水平平建建立立两两种种方方法法组组装装产产品品所所需需平平均均时时间间差差值值的的置置信信区区间间 两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.03

30、0.22 21 1(例题分析)解解: :根据样本数据计算得根据样本数据计算得自由度为:自由度为:即即95%95%把把握握程程度度,两两种种方方法法组组装装产产品品所所需需平平均均时时间间之差的置信区间为之差的置信区间为0.1920.192分钟分钟9.0589.058分钟。分钟。两个总体均值之差的区间估计(匹配样本)两个总体均值之差的估计(匹配大样本)1.假定条件 两个匹配的大样本两个匹配的大样本( (n n1 1 3030和和n n22 30)30)2.两个总体均值之差 d= 1- 2在1- 置信水平下的置信区间为对应差值的均指对应差值的均指对应差值的标准差对应差值的标准差两个总体均值之差的估

31、计(匹配小样本)1.假定条件 两个匹配的小样本两个匹配的小样本( (n n1 13030和和n n2230)30) 两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布 2.两个总体均值之差 d= 1- 2在1- 置信水平下的置信区间为两个总体均值之差的估计(例题分析)【 例例 8.98.9】 由由 1010名名学学生生组组成成一一个个随随机机样样本本,让让他他们们分分别别采采用用A A和和B B两两套套试试卷卷进进行行测测试试,结结果果如如下下表表 。试试建建立立两两种种试试卷卷 分分 数数 之之 差差 d d= = 1 1- - 2 2 95%95%的的置信区间置信区间

32、 1010名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试卷试卷B差值差值d17871726344193726111489845691741754951-27685513876601698577810553916(例题分析)解解: :根据样本数据计算得根据样本数据计算得两种试卷所产生的分数之差的置信区间为两种试卷所产生的分数之差的置信区间为6.336.33分分15.6715.67分分两个总体比例之差区间的估计两个总体比例之差的区间估计1.假定条件 两个两个总体服从二项分布总体服从二项分布 可以用正态分布来近似可以用正态分布来近似 两

33、个样本是独立的两个样本是独立的2.两个总体比例之差P1-P2在1- 置信水平下的置信区间为两个总体比例之差的估计(例题分析例题分析)【例8.10】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以90%的置信水平估计城市与农村收视率差别的置信区间1 12 2(例题分析)解解: :已知已知 n n1 1=500 =500 ,n n2 2=400=400, p p1 1=45%=45%, p p2 2=32%=32%, 1-1- =95%=95%, z z /2/2=1.96=1.96 1 1 1 1- - - -

34、 2 2置信度为置信度为95%95%的置信区间为的置信区间为城市与农村收视率差值的置信区间为城市与农村收视率差值的置信区间为6.68%19.32%6.68%19.32%两个总体方差比的区间估计两个总体方差比的区间估计1.1.比较两个总体的方差比比较两个总体的方差比2.用两个样本的方差比来判断用两个样本的方差比来判断 如果如果S S1 12 2/ /S S2 22 2接近于接近于1,1,说明两个总体方差很接近说明两个总体方差很接近 如果如果S S1 12 2/ /S S2 22 2远离远离1,1,说明两个总体方差之间存在差异说明两个总体方差之间存在差异3.总体方差比在总体方差比在1-1- 置信水

35、平下的置信区间为置信水平下的置信区间为两个总体方差比的区间估计(图示)F FF F1-1-F F总体方差比总体方差比总体方差比1-1-1- 的置信区间的置信区间的置信区间方差比置信区间示意图方差比置信区间示意图两个总体方差比的区间估计(例题分析)【例8.11】为了研究男女学生在生活费支出(元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果:男学生:女学生:试以90%置信水平估计男女学生生活费支出方差比的置信区间(例题分析)解解: :根根据据自自由由度度 n n1 1=25-1=24=25-1=24,n n2 2=25-1=24=25-1=24,查查得得 F F /2/2

36、(24)=1.98(24)=1.98, F F1-1- /2/2(24)=1/1.98=0.505(24)=1/1.98=0.505 1 12 2/ / 2 22 2置信度为置信度为90%90%的置信区间为的置信区间为男男 女女 学学 生生 生生 活活 费费 支支 出出 方方 差差 比比 的的 置置 信信 区区 间间 为为0.471.840.471.84 。8.4样本容量的确定一.估计总体均值时样本容量的确定二.估计总体比例时样本容量的确定三.估计两个总体均值之差时样本容量的确定四.估计两个总体比例之差时样本容量的确定一、估计总体均值时样本容量的确定估计总体均值时样本容量的确定1.估计总体均值

37、时样本容量n为重复抽样:其中:其中:不重复抽样:确定的方法1.用以前相同或类似的样本的样本标准差来代替;2.组织试验抽样;3.对总体标准差进行判断或最优猜测.2.样本容量n与总体方差 2、抽样极限误差、可靠性系数Z或t之间的关系为与总体方差成正比与抽样极限误差成反比与可靠性系数成正比估计总体均值时样本容量的确定(例题分析)【例8.12】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?(例题分析)解:已知 =2000,=400,1- =95%, z /2=1.96把握程度为90%的置信区间为即应抽取97

38、人作为样本二、估计总体比例时样本容量的确定估计总体比例时样本容量的确定重复抽样:1.根据比例区间估计公式可得样本容量n为其中:其中:不重复抽样:确定的方法(1)用以往的资料估计(2)组织实验抽样.(3)当研究者对总体成数有很大把握时,则可用它作为替代.(4)在没有其他信息可用时,可以令估计总体比例时样本容量的确定(例题分析)【例例】根根据据以以往往的的生生产产统统计计,某某种种产产品品的的合合格格率率约约为为90%90%,现现要要求求边边际际误误差差为为5%5%,在在求求95%95%的的置置信信区区间间时时,应应抽抽取取多多少少个个产产品品作作为样本?为样本? 解解 : :已已 知知 =90%

39、=90%, =0.05=0.05, Z Z /2/2=1.96=1.96,=5%=5%应抽取的样本容量应抽取的样本容量为为应抽取应抽取139139个产品作为样本个产品作为样本估计两个总体均值之差时样本容量的确定估计两个总体均值之差时样本容量的确定1.设n1和n2为来自两个总体的样本,并假定n1=n22.根据均值之差的区间估计公式可得两个样本的容量n为其中:其中:估计两个总体均值之差时样本容量的确定(例题分析)【例】一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信水平为95%,预先估计两个班考试分数的方差分别为:试验班 12=90,普通班 22=120。如果要求估计

40、的误差范围(边际误差)不超过5分,在两个班应分别抽取多少名学生进行调查?(例题分析)解: 已知 12=90, 22=120,=5,1- =95%,z /2=1.96即应抽取33人作为样本估计两个总体比例之差时样本容量的确定估计两个总体比例之差时样本容量的确定1.设n1和n2为来自两个总体的样本,并假定n1=n22.根据比例之差的区间估计公式可得两个样本的容量n为其中:其中:估计两个总体比例之差时样本容量的确定(例题分析)【例例8.128.12】一一家家瓶瓶装装饮饮料料制制造造商商想想要要估估计计顾顾客客对对一一种种新新型型饮饮料料认认知知的的广广告告效效果果。他他在在广广告告前前和和广广告告后

41、后分分别别从从市市场场营营销销区区各各抽抽选选一一个个消消费费者者随随机机样样本本,并并询询问问这这些些消消费费者者是是否否听听说说过过这这种种新新型型饮饮料料。这这位位制制造造商商想想以以10%10%的的误误差差范范围围和和95%95%的的置置信信水水平平估估计计广广告告前前后后知知道道该该新新型型饮饮料料消消费费者者的的比比例例之之差差,他他抽抽取取的的两两个个样样本本分分别别应应包包括括多多少少人人?( (假假定两个样本容量相等定两个样本容量相等) )绿色绿色健康饮品健康饮品(例题分析)解:=10%,1-=95%,z/2=1.96,由于没有P的信息,用0.5代替即应抽取193个消费者作为

42、样本案例-练习1.从一个标准差为5的总体中抽出一个容量为40的样 本,样本均值为25。1)样本均值的抽样标准差 (抽样平均误差或抽样标准误)等于多少?2)在95%的置信水平下,边际误差(极限误差)是多少?2.从某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 1)假定总体标准差为15元,求样本均值的抽样标准误差 ; 2)在95%的置信水平下,求极限误差; 3)如果样本均值为120元,求总体均值95%的置信区间。 3.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是: 10 3 14

43、 8 6 9 12 11 7 5 10 15 9 16 13 2 求职工上班从家里到单位平均距离95%的置信区间。4.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。5.根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求极限误差不超过4%,应抽取多大的样本? 6.某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 1)求总体中赞成该项改革的户数比例的置

44、信区间,置信水平为95%。2)如果小区管理者预计赞成的比例能达到80%,极限误差不超过10%,应抽取多少户进行调查? 7.某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求极限误差不超过20元,应抽取多少个顾客作为样本?课堂作业 案例案例1 1某职业介绍所的职员从申请某一职业的1000名申请者中采用不重复抽样方式随机抽取了200名申请者,借此来估计1000名申请者考试的平均成绩。已知由200名申请者构成的样本平均分为78分,由以往经验已知总体方差为90,但该职员不知总体服从何种分布,试确定总体均值的90

45、%置信区间。案例2由120名订阅者组成的样本表明,订阅者每周使用因特网的平均时间为9小时,样本标准差为6.5小时.试问订阅者花费在因特网的平均时间的95%的置信区间. 案例案例3 3某一大公司的人事经理希望知道本公司内专业不对口的职员究竟占多大比例。于是,他从2000名具有大专以上学历的职员中随机抽取了一个由150人组成的样本进行研究,结果表明,其中有45人说他们从事的工作与所学专业不对口。试在95%的置信程度下构成出不对口人员所占真正比例的置信区间。案例案例4 4航空公司时刻表和价格显然是商务旅行者选择航班时要考虑的重要因素,但是今日中国的调查发现,商务旅行者将航空公司的常客优惠程序列为最重

46、要的因素。在一个有名商务旅行者组成的样本中,有618人将航空公司的常客优惠程序列为最重要的因素。A.求商务旅行者总体中,在选择航班时将航空公司的常客优惠程序列为重要的因素的人所占比率的点估计;B.求总体比率的95%置信区间估计;C.当置信度为95%,允许误差为0.01时,要求样本容量应为多大?你建议今日中国提供这种精度吗?为什么?案例5某公司有1000名职工,该公司管理层想了解职工上下班在路途上的平均时间,决定采用随机不重复抽出一个样本,要求计算出的样本估计值与总体均值相差1分钟的误差范围之内.假定总体管理层在正式调查前,首先组织了试验抽样,得到样本标准差是4.2分钟.试问95%置信水平下,该

47、公司管理层应该抽取一个多大容量的样本来实现研究目的.?案例6某网站需要了解上网使用者为女性的比例.该网站希望对总体成数的估计误差不超过3%,需要以95.45%的可靠程度估计应抽取多大容量的样本?案例案例7 7方达公司是一家大型加工厂的采购代理商,近期准备更新明年供应商的合同,计划从华强公司和华美公司中选择一家。对于方达公司来说,主要关心的问题是供应商订货后交货时间,因为是否能按时交货对于保证企业的正常运作和按时完成生产至关重要。公司管理层希望在调查分析报告中完成以下几个问题:1)利用适当的描述性统计将两个供应商订货后交货时间数据资料汇总,由样本资料能观察到什么异同点。2)每个供应商订货后平均交

48、货时间的95%置信区间是多少?为此公司管理层收集了目前正在营运的两个供应商订货后的交货时间数据,得到华强公司38个订货后交货时间组成的样本以及华美公司32个订货后交货时间组成的样本,如下表。3)每个供应商订货后交货时间的标准差的95%置信区间。4)从两个供应商订货后交货时间的差异,能得到什么结论?5)在决定将来确定哪个供应商之前,是否需要其他数据利用利用SPSSforWindowsSPSSforWindows实现过程实现过程已知原始资料(未整理的资料)的参数估计1.单个总体均值的区间估计选择AnalyzecompareMeansOne-SampleTTest.本章小结l参数估计的基本原理l一个总体参数的区间估计l两个总体参数的区间估计l样本量的确定2008年8月

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号