《统计学》

上传人:飞*** 文档编号:46109983 上传时间:2018-06-22 格式:PPT 页数:39 大小:936KB
返回 下载 相关 举报
《统计学》_第1页
第1页 / 共39页
《统计学》_第2页
第2页 / 共39页
《统计学》_第3页
第3页 / 共39页
《统计学》_第4页
第4页 / 共39页
《统计学》_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《《统计学》》由会员分享,可在线阅读,更多相关《《统计学》(39页珍藏版)》请在金锄头文库上搜索。

1、教学重点教学过程教学总结第七章 区间估计STAT1STAT一家食品生产企业以生产袋装食品为主,每天的产量约为8000袋左右。按规定每袋的重量应不低于100克,否则即为不合格。为对产量质量进行检测,企业设有质量检查科专门负责质量检验,并经常向企业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。由于产品的数量大,进行全面的检验是不可能的,可行的办法是抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一批食品中随机抽取了25袋,下表1是对每袋食品重量的检验结果。实践中的统计2STAT根据表1的数据,质检科估计出该天生产的食品每袋的平均重量在101.38109.34克之间,其中,

2、估计的可信程度为95%,估计误差不超过4克。产品的合格率在96.07%73.93%之间,其中,估计的可信程度为95%,估计误差不超过16%。表1 25袋食品的重量(克)112.5 102.6 100.0 116.6 136.8101.0 107.5 123.5 95.4 102.8103.0 95.0 102.0 97.8 101.5102.0 10808 101.6 108.4 98.4100.5 115.6 102.2 105.0 93.33STAT质检报告提交后,企业高层领导人提出几点意见:一是抽取的样本大小是否合适?能不能用一个更大的样本进行估计?二是能否将估计的误差在缩小一点?比如,

3、估计平均重量时估计误差不超过3克,估计合格率时误差不超过10%。三是总体平均重量的方差是多少?因为方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应对生产过程进行调整。4STAT本章重点本章重点 1、抽样误差的概率表述; 2、区间估计的基本原理; 3、小样本下的总体参数估计方法; 4、样本容量的确定方法;本章难点本章难点 1、一般正态分布标准正态分布; 2、t分布; 3、区间估计的原理; 4、分层抽样、整群抽样中总方差的分解。区 间 估 计5STAT点估计的缺点:不能反映估计的误差和精确程度区间估计:利用样本统计量和抽样分布估计总体参数的可能区 间【例1】CJW公司是一家专营体育设备

4、和附件的公司,为了监控 公司的服务质量, CJW公司每月都要随即的抽取一个顾客样本 进行调查以了解顾客的满意分数。根据以往的调查,满意分数 的标准差稳定在20分左右。最近一次对100名顾客的抽样显示, 满意分数的样本均值为82分,试建立总体满意分数的区间。8.1.1抽样误差抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。 抽样误差 = (实际未知)8.1总体均值的区间估计(大样本n30)6STAT要进行区间估计,关键是将抽样误差 求解。若 已知,则 区间可表示为:此时,可以利用样本均值的抽样分布对抽样误差的大小进行描述。上例中,已知,样本容量n=100,总体标准差 ,根据中心极限定理可知

5、,此时样本均值服从均值为 ,标准差为的正态分布。即:7STAT8.1.2抽样误差的概率表述由概率论可知,服从标准正态分布,即,有以下关系式成立:一般称,为置信度,可靠程度等,反映估计结果的可信程度。若事先给定一个置信度,则可根据标准正态分布找到其对应的临 界值 。进而计算抽样误差8STAT若,则查标准正态分布表可得,抽样误差此时抽样误差的意义可表述为:以样本均值为中心的3.92 的区间包含总体均值的概率是95%,或者说,样本均值产生的抽 样误差是3.92或更小的概率是0.95。常用的置信度还有90%,95.45%,99.73%,他们对应的临 界值分别为1.645,2和3,可以分别反映各自的估计

6、区间所对应的精确程度和把握程度。 9STAT8.1.3计算区间估计:在CJW公司的例子中,样本均值产生的抽样误差是3.92或更小 的概率是0.95。因此,可以构建总体均值的区间为,由于,从一个总体中抽取到的样本具有随机性,在一次偶然的 抽样中,根据样本均值计算所的区间并不总是可以包含总体均 值,它是与一定的概率相联系的。如下图所示:10STAT3.923.92图1 根据选择的在 、 、 位置的样本均值建立的区间11STAT上图中,有95%的样本均值落在阴影部分,这个区域的样本 均值3.92的区间能够包含总体均值。因此,总体均值的区间的含义为,我们有95%的把握认为, 以样本均值为中心的3.92

7、的区间能够包含总体均值。通常,称该区间为置信区间,其对应的置信水平为置信区间的估计包含两个部分:点估计和描述估计精确度的正负值。也将正负值称为误差边际或极限误差,反映样本估计量 与总体参数之间的最大误差范围。总结:12STAT8.1.4计算区间估计:在大多数的情况下,总体的标准差都是未知的。根据抽样 分布定理,在大样本的情况下,可用样本的标准差s作为总体标准差的点估计值,仍然采用上述区间估计的方法进行总体参数 的估计。13STAT【例2】 斯泰特怀特保险公司每年都需对人寿保险单进行审 查,现公司抽取36个寿保人作为一个简单随即样本,得到关于 、投保人年龄、保费数量、保险单的现金值、残废补偿选择

8、等 项目的资料。为了便于研究,某位经理要求了解寿险投保人总 体平均年龄的90%的区间估计。投保人年龄龄投保人年龄龄投保人年龄龄投保人年龄龄 1 2 3 4 5 6 7 8 932 50 40 24 33 44 45 48 4410 11 12 13 14 15 16 17 1847 31 36 39 46 45 39 38 4519 20 21 22 23 24 25 26 2727 43 54 36 34 48 23 36 4228 29 30 31 32 33 34 35 3634 39 34 35 42 53 28 49 39 14STAT上表是一个由36个投保人组成的简单随机样本的年龄

9、数据。现求总体的平均年龄的区间估计。分析:区间估计包括两个部分点估计和误差边际,只需分别求出即可到的总体的区间估计。解:已知(1)样本的平均年龄(2)误差边际15STAT样本标准差误差边际(3)90%的置信区间为39.5 2.13 即(37.37,41.63)岁。注意(1)置信系数一般在抽样之前确定,根据样本所建立的区间能包含总体参数的概率为(2)置信区间的长度(准确度)在置信度一定的情况下,与样本容量的大小呈反方向变动,若要提高估计准确度,可以扩大 样本容量来达到。16STAT8.2总体均值的区间估计:小样本的情况 在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分 布。我们讨论总体服从

10、正态分布的情况。t分布的图形和标准正态分布的图形类似,如下图示:17STAT0标准正态分布t分布(自由度为20)t分布(自由度为10)图2标准正态分布与t分布的比较18STAT在分布中,对于给定的置信度,同样可以通过查表找到其对 应的临界值 ,利用临界值也可计算区间估计的误差边际因此,总体均值的区间估计在总体标准差未知的小样本情况下 可采用下式进行:假定总体服从正态分布;19STAT【例3】谢尔工业公司拟采用一项计算机辅助程序来培训公司的 维修支援掌握及其维修的操作,以减少培训工人所需要的时间 。为了评价这种培训方法,生产经理需要对这种程序所需要的 平均时间进行估计。以下是利用新方对名职员进行

11、培训的 培训天数资料。根据上述资料建立置信度为的总体均值的区间估计。( 假定培训时间总体服从正态分布)。职员 时间 职员 时间 职员 时间 20STAT解:依题意,总体服从正态分布,(小样本),此时 总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值 的区间估计。 样本平均数样本标准差误差边际95%的置信区间为53.87 3.78 即(50.09,57.65)天。21STAT8.3确定样本容量误差边际其计算需要已知若我们选择了置信度由此,得到计算必要样本容量的计算公式:22STAT【例4】在以前的一项研究美国租赁汽车花费的研究中发现,租赁一辆中等大小的汽车,其花费范围为,从加利福尼

12、亚州的奥 克兰市的每天36美元到康涅狄格州的哈特福德市的每天73.50美 元不等,并且租金的标准差为9.65美元。假定进行该项研究的组织想进行一项新的研究,以估计美国当前总体平均日租赁中等 大小汽车的支出。在设计该项新的研究时,项目主管指定对总 体平均日租赁支出的估计误差边际为2美元,置信水平为95%。解:依题意, 可得将以上结果取下一个整数(90)即为必要的样本容量。23STAT说明:由于总体标准差 在大多数情况下 是未知的,可以有以下方法取得 的值。(1)使用有同样或者类似单元的以前样本的样本标准差;(2)抽取一个预备样本进行试验性研究。用实验性样本的标准差作为 的估计值。(3)运用对 值

13、的判断或者“最好的猜测”,例如,通常可用全距的作为 的近似值。24STAT8.4总体比例的区间估计8.4.1区间估计对总体比例 的区间估计在原理上与总体均值的区间估计相同。同样要利用样本比例 的抽样分布来进行估计。若, 则样本比例近似服从正态分布。同样,抽样误差类似的,利用抽样分布(正态分布)来计算抽样误差25STAT上式中, 是正待估计的总体参数,其值一般是未知,通常简单的用 替代 。即用样本方差 替代总体方差 。则, 误差边际的计算公式为:26STAT【例5】1997年菲瑞卡洛通讯公司对全国范围每内的902名女子高尔夫球手进行了调查,以了解美国女子高尔夫球手对自己如何在场上 被对待的看法。

14、调查发现,397名女子高尔夫球手对得到的球座开球次数感到满意。试在95%的置信水平下估计总体比例的区间。分解:解:依题意已知,(1)样本比例(2)误差边际27STAT(3)95%的置信区间0.44 0.0324 即(0.4076,0.4724)。结论:在置信水平为95%时,所有女子高尔夫球手中有40.76%到47.24%的人对得到的球座开球数感到满意。8.4.2 确定样本容量在建立总体比例的区间估计时,确定样本容量的原理与8.3节中使用的为估计总体均值时确定样本容量的原理相类似。28STAT【例6】在例中,该公司想在1997年结果的基础上进行一项新的调查,以重新估计女子高尔夫球手的总体中对得到

15、的球座开球此数感到满意的人数所占的比例。调查主管希望这项新的调查 在误差边际为0.025、置信水平为95%的条件下来进行,那么,样本容量应该为多大?解:依题意,可得将以上结果取下一个整数(1515)即为必要的样本容量。 29STAT说明:由于总体比例 在大多数情况下是未知的,可以有以下方法取得 的值。(1)使用有同样或者类似单元的以前样本的样本比例;(2)抽取一个预备样本进行试验性研究。用实验性样本的比例作为 的估计值。(3)运用对 值的判断或者“最好的猜测”;(4)如果上面的方法都不适用,采用 。30STAT8.5其他抽样方法下总方差的计算在第六章中学习到,除简单随机抽样方法外,在现实中还可运用分层抽样、整群抽样、系统抽样等抽样方法,每一次抽样都涉及到对总体参数的估计过

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 其它考试类文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号