吴喜之-统计学基本概念和方法-总体参数的区间估计.

上传人:最**** 文档编号:118000446 上传时间:2019-12-11 格式:PPT 页数:61 大小:1.25MB
返回 下载 相关 举报
吴喜之-统计学基本概念和方法-总体参数的区间估计._第1页
第1页 / 共61页
吴喜之-统计学基本概念和方法-总体参数的区间估计._第2页
第2页 / 共61页
吴喜之-统计学基本概念和方法-总体参数的区间估计._第3页
第3页 / 共61页
吴喜之-统计学基本概念和方法-总体参数的区间估计._第4页
第4页 / 共61页
吴喜之-统计学基本概念和方法-总体参数的区间估计._第5页
第5页 / 共61页
点击查看更多>>
资源描述

《吴喜之-统计学基本概念和方法-总体参数的区间估计.》由会员分享,可在线阅读,更多相关《吴喜之-统计学基本概念和方法-总体参数的区间估计.(61页珍藏版)》请在金锄头文库上搜索。

1、总体均值的区间估计 点估计的缺点:不能反映估计的误差和精确程度 区间估计:利用样本统计量和抽样分布估计总体参数的可能区 间 【例】CJW公司是一家专营体育设备和附件的公司,为了监控公 司的服务质量,CJW公司每月都要随即的抽取一个顾客样本进行 调查以了解顾客的满意分数。根据以往的调查,满意分数的标 准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意 分数的样本均值为82分,试建立总体满意分数的区间。 抽样误差 抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。 抽样误差 = (实际未知) 总体均值的区间估计(大样本n30) 要进行区间估计,关键是将抽样误差 求解。若 已知,则 区

2、间可表示为: 此时,可以利用样本均值的抽样分布对抽样误差的大小进行 描述。 上例中,已知,样本容量n=100,总体标准差 ,根据 中心极限定理可知,此时样本均值服从均值为 ,标准差为 的正态分布。 即: 抽样误差的概率表述 由概率论可知, 服从标准正态分布,即, 有以下关系式成立: 一般称, 为置信度,可靠程度等,反映估计结果的可信程度。若 事先给定一个置信度,则可根据标准正态分布找到其对应的临 界值 。进而计算抽样误差 若, 则查标准正态分布表可得, 抽样误差 此时抽样误差的意义可表述为:以样本均值为中心的3.92 的区间包含总体均值的概率是95%,或者说,样本均值产生的抽 样误差是3.92

3、或更小的概率是0.95。 常用的置信度还有90%,95.45%,99.73%,他们对应的临 界值分别为1.645,2和3,可以分别反映各自的估计区间所对应 的精确程度和把握程度。 计算区间估计: 在CJW公司的例子中,样本均值产生的抽样误差是3.92或更小 的概率是0.95。因此,可以构建总体均值的区间为, 由于,从一个总体中抽取到的样本具有随机性,在一次偶然的 抽样中,根据样本均值计算所的区间并不总是可以包含总体均 值,它是与一定的概率相联系的。如下图所示: 3.923.92 根据选择的在 、 、 位置的样本均值建立的区间 上图中,有95%的样本均值落在阴影部分,这个区域的样本 均值3.92

4、的区间能够包含总体均值。 因此,总体均值的区间的含义为,我们有95%的把握认为 ,以样本均值为中心的3.92的区间能够包含总体均值。 通常,称该区间为置信区间,其对应的置信水平为 置信区间的估计包含两个部分:点估计和描述估计精确度 的正负值。也将正负值称为误差边际或极限误差,反映样本估 计量与总体参数之间的最大误差范围。 总结: 计算区间估计: 在大多数的情况下,总体的标准差都是未知的。根据抽样 分布定理,在大样本的情况下,可用样本的标准差s作为总体标 准差的点估计值,仍然采用上述区间估计的方法进行总体参数 的估计。 【例 】 斯泰特怀特保险公司每年都需对人寿保险单进行审 查,现公司抽取36个

5、寿保人作为一个简单随即样本,得到关于 、投保人年龄、保费数量、保险单的现金值、残废补偿选择等 项目的资料。为了便于研究,某位经理要求了解寿险投保人总 体平均年龄的90%的区间估计。 投保人年龄投保人年龄投保人年龄投保人年龄 1 2 3 4 5 6 7 8 9 32 50 40 24 33 44 45 48 44 10 11 12 13 14 15 16 17 18 47 31 36 39 46 45 39 38 45 19 20 21 22 23 24 25 26 27 27 43 54 36 34 48 23 36 42 28 29 30 31 32 33 34 35 36 34 39 34

6、 35 42 53 28 49 39 上表是一个由36个投保人组成的简单随机样本的年龄数据。现 求总体的平均年龄的区间估计。 分析:区间估计包括两个部分点估计和误差边际,只需分 别求出即可到的总体的区间估计。 解:已知 (1)样本的平均年龄 (2)误差边际 样本标准差 误差边际 (3)90%的置信区间为39.5 2.13 即(37.37,41.63)岁。 注意 (1)置信系数一般在抽样之前确定 (2)置信区间的长度(准确度)在置信度一定的情况下,与样 本容量的大小呈反方向变动,若要提高估计准确度,可以扩大 样本容量来达到。 总体均值的区间估计:小样本的情况 在小样本的情况下,样本均值的抽样分布

7、依赖于总体的抽样分 布。我们讨论总体服从正态分布的情况。 t分布的图形和标准正态分布的图形类似,如下图示: 0 标准正态分布 t分布(自由度为20) t分布(自由度为10) 标准正态分布与t分布的比较 在分布中,对于给定的置信度,同样可以通过查表找到其对 应的临界值 ,利用临界值也可计算区间估计的误差边际 因此,总体均值的区间估计在总体标准差未知的小样本情况下 可采用下式进行: 假定总体服从正态分布; 【例 】谢尔工业公司拟采用一项计算机辅助程序来培训公司的 维修支援掌握及其维修的操作,以减少培训工人所需要的时间 。为了评价这种培训方法,生产经理需要对这种程序所需要的 平均时间进行估计。以下是

8、利用新方对名职员进行培训的 培训天数资料。 根据上述资料建立置信度为的总体均值的区间估计。( 假定培训时间总体服从正态分布)。 职员 时间 职员 时间 职员 时间 解:依题意,总体服从正态分布,(小样本),此时 总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值 的区间估计。 样本平均数 样本标准差 误差边际 95%的置信区间为 53.87 3.78 即(50.09,57.65)天。 确定样本容量 确定样本容量 误差边际 其计算需要已知 若我们选择了置信度 由此,得到计算必要样本容量的计算公式: 【例】在以前的一项研究美国租赁汽车花费的研究中发现,租 赁一辆中等大小的汽车,其花费范

9、围为,从加利福尼亚州的奥 克兰市的每天36美元到康涅狄格州的哈特福德市的每天73.50美 元不等,并且租金的标准差为9.65美元。假定进行该项研究的组 织想进行一项新的研究,以估计美国当前总体平均日租赁中等 大小汽车的支出。在设计该项新的研究时,项目主管指定对总 体平均日租赁支出的估计误差边际为2美元,置信水平为95%。 解:依题意, 可得 将以上结果取下一个整数(90)即为必要的样本容量。 说明: 由于总体标准差 在大多数情况下 是未知的,可以有以 下方法取得 的值。 (1)使用有同样或者类似单元的以前样本的样本标准差; (2)抽取一个预备样本进行试验性研究。用实验性样本的标准 差作为 的估

10、计值。 (3)运用对 值的判断或者“最好的猜测”,例如,通常可用极 差估计 的近似值。 总体比率的估计 比率的抽样分布 数据的特点 比率属于点计数据,这类数据的分布是非正 态的。 对这类数据的统计推断有两种方法,一般来 说,当事物按性质不同被划分成两类时,要用总 体比率的推断方法进行统计推断;当事物被划分 为成两类以上时,则用卡方检验法。 由于这里假设事物按性质不同分成两类, 所以其中的一类事物发生比率的抽样分布属于 二项分布。 假设有一个总体,这个总体中所包含的事 件要么具有某种属性,要么不具有某种属性, 其中具有某种属性的事件出现的概率为, 不具有某种属性的事件出现的概率为q=1- 。 比

11、率的抽样分布 现在从中随机抽取一个容量为n(n次重复 试验)的样本,算得成功事件出现的比率: p1=X1/n (X表示成功事件出现的次数) 将样本还回总体中,再从中随机抽取一个 容量为n的样本,又可以算得一个成功事件出 现的比率: p2=X2/n 比率的抽样分布 经过反复抽样,就可以计算出许多样本的 p值,这些p值就形成了一个实验性的比率的抽 样分布。这个分布的形态是二项分布。 二项概率分布是进行总体比率统计推断的 理论依据。 比率的标准误 比率抽样分布的标准差,就是比率的标准误 当总体比率已知时: p表示比率的标准误 p表示总体比率 q=1-p n表示样本容量(试验重复次数) 当总体比率未知

12、时,需要用样本比率p=X/n作 为总体比率p的点估计。所以总体比率标准误的 估计量为: Sp表示比率标准误的估计量 p表示样本的比率 q=1-p n表示样本容量(试验重复次数) 比率的标准误 总体比率的区间估计 以比率的抽样分布为理论依据,按一定的概 率要求估计总体比率的所在范围就叫做总体比率 的区间估计。 正态近似法 当样本容量n比较大,np和nq中较小的那个数 等于或大于5时,二项分布已经接近于正态分布,此 时可以按照正态分布来估计总体比率0.95和0.99的 置信区间(因为这种方法比较简便),这种方法叫 做正态近似法。 正态近似法 根据标准正态分布的规律,得知 p(-1.96Z1.96)

13、=0.95 p(-2.58Z2.58)=0.99 将 带入上式 P(-1.96 1.96)=0.95 P(p-1.96 p5 因此,总体比率0.95的置信区间为: P(0.67-1.960.0332p0.67+1.960.0332) =0.95 P(0.605p0.735)=0.95 即在去年的高考中,北京理科生英语及格率有 95%的可能在0.605至0.735之间,总体比率超出这 个范围的可能性只有5%。 同理,总体比率0.99的置信区间为: P(0.67-2.580.0332p0.67+2.580.0332) =0.99 P(0.584p0.756)=0.99 即在去年的高考中,北京理科生

14、英语及格率有99% 的可能在0.584至0.756之间,总体比率超出这个范围 的可能性只有1%。 两个总体参数的区间估计 两个总体参数的区间估计 总体参数符号表示样本统计量 均值之差 比例之差 方差比 两个总体均值之差的区间估计 (独立大样本) 两个总体均值之差的估计 (大样本) 1.假定条件 两个总体都服从正态分布,1、 2已知 若不是正态分布, 可以用正态分布来近似(n130 和n230) 两个样本是独立的随机样本 2.使用正态分布统计量 z 两个总体均值之差的估计 (大样本) 1.1, 2已知时,两个总体均值之差1-2在1- 置信水平下的置信区间为 2.1、 2未知时,两个总体均值之差1-2在1- 置信水平下的置信区间为 两个总体均值之差的估计 (例题分析) 【例】某地区教育委员 会想估计两所中学的学 生高考时的英语平均分 数之差,为此在两所中 学独立抽取两个随机样 本,有关数据如右表 。 建立两所中学高考英语 平均分数之差95%的置 信区间 两个样本的有关数据 中学1中学2 n1=46n1=33 S1=5.8 S2=57.2 两个总体均值之差的估计 (例题分析) 解: 两个总体均值之差在1-置信水平下的置信区间为 两所中学高考英语平均分数之差的置信区间为

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号