吴喜之-统计学基本概念和方法-总体参数的区间估计

上传人:pu****.1 文档编号:587838317 上传时间:2024-09-06 格式:PPT 页数:61 大小:1.25MB
返回 下载 相关 举报
吴喜之-统计学基本概念和方法-总体参数的区间估计_第1页
第1页 / 共61页
吴喜之-统计学基本概念和方法-总体参数的区间估计_第2页
第2页 / 共61页
吴喜之-统计学基本概念和方法-总体参数的区间估计_第3页
第3页 / 共61页
吴喜之-统计学基本概念和方法-总体参数的区间估计_第4页
第4页 / 共61页
吴喜之-统计学基本概念和方法-总体参数的区间估计_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《吴喜之-统计学基本概念和方法-总体参数的区间估计》由会员分享,可在线阅读,更多相关《吴喜之-统计学基本概念和方法-总体参数的区间估计(61页珍藏版)》请在金锄头文库上搜索。

1、总体均值的区间估计点估计的缺点:不能反映估计的误差和精确程度区间估计:利用样本统计量和抽样分布估计总体参数的可能区间【例】CJW公司是一家专营体育设备和附件的公司,为了监控公司的服务质量,CJW公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意分数的样本均值为82分,试建立总体满意分数的区间。 抽样误差抽样误差抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。抽样误差 = (实际未知)总体均值的区间估计(大样本n30)要进行区间估计,关键是将抽样误差 求解。若 已知,则区间可表示为: 此时

2、,可以利用样本均值的抽样分布对抽样误差的大小进行描述。 上例中,已知,样本容量n=100,总体标准差 ,根据中心极限定理可知,此时样本均值服从均值为 ,标准差为 的正态分布。即: 抽样误差的概率表述抽样误差的概率表述 由概率论可知, 服从标准正态分布,即,有以下关系式成立:一般称, 为置信度,可靠程度等,反映估计结果的可信程度。若事先给定一个置信度,则可根据标准正态分布找到其对应的临界值 。进而计算抽样误差若,则查标准正态分布表可得,抽样误差 此时抽样误差的意义可表述为:以样本均值为中心的3.92的区间包含总体均值的概率是95%,或者说,样本均值产生的抽样误差是3.92或更小的概率是0.95。

3、 常用的置信度还有90%,95.45%,99.73%,他们对应的临界值分别为1.645,2和3,可以分别反映各自的估计区间所对应的精确程度和把握程度。 计算区间估计:计算区间估计: 在CJW公司的例子中,样本均值产生的抽样误差是3.92或更小的概率是0.95。因此,可以构建总体均值的区间为,由于,从一个总体中抽取到的样本具有随机性,在一次偶然的抽样中,根据样本均值计算所的区间并不总是可以包含总体均值,它是与一定的概率相联系的。如下图所示:3.923.92 根据选择的在 、 、 位置的样本均值建立的区间 上图中,有95%的样本均值落在阴影部分,这个区域的样本均值3.92的区间能够包含总体均值。

4、因此,总体均值的区间的含义为,我们有95%的把握认为,以样本均值为中心的3.92的区间能够包含总体均值。 通常,称该区间为置信区间,其对应的置信水平为 置信区间的估计包含两个部分:点估计和描述估计精确度的正负值。也将正负值称为误差边际或极限误差,反映样本估计量与总体参数之间的最大误差范围。总结: 计算区间估计:计算区间估计: 在大多数的情况下,总体的标准差都是未知的。根据抽样分布定理,在大样本的情况下,可用样本的标准差s作为总体标准差的点估计值,仍然采用上述区间估计的方法进行总体参数的估计。【例例 】 斯泰特怀特保险公司每年都需对人寿保险单进行审查,现公司抽取36个寿保人作为一个简单随即样本,

5、得到关于、投保人年龄、保费数量、保险单的现金值、残废补偿选择等项目的资料。为了便于研究,某位经理要求了解寿险投保人总体平均年龄的90%的区间估计。投保人年龄投保人年龄投保人年龄投保人年龄12345678932504024334445484410111213141516171847313639464539384519202122232425262727435436344823364228 2930313233343536343934354253284939上表是一个由36个投保人组成的简单随机样本的年龄数据。现求总体的平均年龄的区间估计。分析:区间估计包括两个部分点估计和误差边际,只需分别求出即

6、可到的总体的区间估计。解:已知(1)样本的平均年龄(2)误差边际样本标准差误差边际(3)90%的置信区间为39.5 2.13 即(37.37,41.63)岁。 注意注意(1)置信系数一般在抽样之前确定(2)置信区间的长度(准确度)在置信度一定的情况下,与样本容量的大小呈反方向变动,若要提高估计准确度,可以扩大样本容量来达到。 总体均值的区间估计:小样本的情况在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分布。我们讨论总体服从正态分布的情况。t分布的图形和标准正态分布的图形类似,如下图示:0标准正态分布t分布(自由度为20)t分布(自由度为10)标准正态分布与t分布的比较在分布中,对于给定

7、的置信度,同样可以通过查表找到其对应的临界值 ,利用临界值也可计算区间估计的误差边际因此,总体均值的区间估计在总体标准差未知的小样本情况下可采用下式进行: 假定总体服从正态分布;【例例 】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修支援掌握及其维修的操作,以减少培训工人所需要的时间。为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方对名职员进行培训的培训天数资料。根据上述资料建立置信度为的总体均值的区间估计。(假定培训时间总体服从正态分布)。职员时间职员时间职员时间职员时间职员时间职员时间解:依题意,总体服从正态分布,(小样本),此时总体方差未知。可用

8、自由度为(n-1)=14的t分布进行总体均值的区间估计。样本平均数样本标准差误差边际95%的置信区间为53.87 3.78 即(50.09,57.65)天。确定样本容量确定样本容量误差边际其计算需要已知若我们选择了置信度由此,得到计算必要样本容量的计算公式:【例例】在以前的一项研究美国租赁汽车花费的研究中发现,租赁一辆中等大小的汽车,其花费范围为,从加利福尼亚州的奥克兰市的每天36美元到康涅狄格州的哈特福德市的每天73.50美元不等,并且租金的标准差为9.65美元。假定进行该项研究的组织想进行一项新的研究,以估计美国当前总体平均日租赁中等大小汽车的支出。在设计该项新的研究时,项目主管指定对总体

9、平均日租赁支出的估计误差边际为2美元,置信水平为95%。解:依题意,可得将以上结果取下一个整数(90)即为必要的样本容量。 说明: 由于总体标准差 在大多数情况下 是未知的,可以有以下方法取得 的值。(1)使用有同样或者类似单元的以前样本的样本标准差;(2)抽取一个预备样本进行试验性研究。用实验性样本的标准差作为 的估计值。(3)运用对 值的判断或者“最好的猜测”,例如,通常可用极差估计 的近似值。总体比率的估计比率的抽样分布数据的特点比率属于点计数据,这类数据的分布是非正态的。对这类数据的统计推断有两种方法,一般来说,当事物按性质不同被划分成两类时,要用总体比率的推断方法进行统计推断;当事物

10、被划分为成两类以上时,则用卡方检验法。由于这里假设事物按性质不同分成两类,所以其中的一类事物发生比率的抽样分布属于二项分布。假设有一个总体,这个总体中所包含的事件要么具有某种属性,要么不具有某种属性,其中具有某种属性的事件出现的概率为,不具有某种属性的事件出现的概率为q=1-。比率的抽样分布现在从中随机抽取一个容量为n(n次重复试验)的样本,算得成功事件出现的比率:p1=X1/n (X表示成功事件出现的次数)将样本还回总体中,再从中随机抽取一个容量为n的样本,又可以算得一个成功事件出现的比率: p2=X2/n比率的抽样分布经过反复抽样,就可以计算出许多样本的p值,这些p值就形成了一个实验性的比

11、率的抽样分布。这个分布的形态是二项分布。二项概率分布是进行总体比率统计推断的理论依据。比率的标准误比率抽样分布的标准差,就是比率的标准误当总体比率已知时:p表示比率的标准误p表示总体比率q=1-pn表示样本容量(试验重复次数)当总体比率未知时,需要用样本比率p=X/n作为总体比率p的点估计。所以总体比率标准误的估计量为:Sp表示比率标准误的估计量p表示样本的比率q=1-pn表示样本容量(试验重复次数)比率的标准误总体比率的区间估计以比率的抽样分布为理论依据,按一定的概率要求估计总体比率的所在范围就叫做总体比率的区间估计。正态近似法当样本容量n比较大,np和nq中较小的那个数等于或大于5时,二项

12、分布已经接近于正态分布,此时可以按照正态分布来估计总体比率0.95和0.99的置信区间(因为这种方法比较简便),这种方法叫做正态近似法。 正态近似法根据标准正态分布的规律,得知p(-1.96Z1.96)=0.95p(-2.58Z2.58)=0.99将 带入上式 P(-1.96 1.96)=0.95P(p-1.96 p5因此,总体比率0.95的置信区间为:P(0.67-1.960.0332p0.67+1.960.0332)=0.95P(0.605p0.735)=0.95 即在去年的高考中,北京理科生英语及格率有95%的可能在0.605至0.735之间,总体比率超出这个范围的可能性只有5%。同理,

13、总体比率0.99的置信区间为:P(0.67-2.580.0332p0.67+2.580.0332)=0.99P(0.584p0.756)=0.99即在去年的高考中,北京理科生英语及格率有99%的可能在0.584至0.756之间,总体比率超出这个范围的可能性只有1%。两个总体参数的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值之差比例之差方差比两个总体均值之差的区间估计(独立大样本)两个总体均值之差的估计(大样本)1.假定条件两个总体都服从正态分布,1、 2已知若不是正态分布, 可以用正态分布来近似(n130和n230)两个样本是独立的随机样本2.使用正态

14、分布统计量 z两个总体均值之差的估计 (大样本)1.1, 2已知时,两个总体均值之差1-2在1- 置信水平下的置信区间为2.1、 2未知时,两个总体均值之差1-2在1- 置信水平下的置信区间为两个总体均值之差的估计(例题分析)【例】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表 。建立两所中学高考英语平均分数之差95%的置信区间 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n1=33S1=5.8 S2=57.2两个总体均值之差的估计(例题分析)解: 两个总体均值之差在1-置信水平下的置信区间为 两所中学高

15、考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为5.035.03分分10.9710.97分分两个总体均值之差的区间估计(独立小样本)两个总体均值之差的估计(小样本: 1= )1.假定条件两个总体都服从正态分布两个总体方差未知但相等:1=2两个独立的小样本(n130和n230)2.总体方差的合并估计量3.估计量x1-x2的抽样标准差两个总体均值之差的估计(小样本: 1= )1.两个样本均值之差的标准化2.两个总体均值之差1-2在1- 置信水平下的置信区间为两个总体均值之差的估计(例题分析)【例例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名

16、工人,每个工人组装一件产品所需的时间(分钟)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1两个总体均值之差的估计(例题分析)解解: 根据样本数据计算得 合并估计量为:合并估计量为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所

17、需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟两个总体均值之差的估计(小样本: 1 )1.假定条件两个总体都服从正态分布两个总体方差未知且不相等:12两个独立的小样本(n130和n230)2.使用统计量两个总体均值之差的估计(小样本: 1 )两个总体均值之差1-2在1- 置信水平下的置信区间为自由度两个总体均值之差的估计(例题分析)【例】沿用前例。假定第一种方法随机安排12名工人,第二种方法随机安排8名工人,即n1=12,n2=8 ,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信

18、区间 两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.22 21 1两个总体均值之差的估计(例题分析)解解: 根据样本数据计算得 自由度为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.1920.192分钟分钟9.0589.058分钟分钟两个总体比例之差区间的估计1.假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的2.两个总体比例之差P1-P 2在1-

19、 置信水平下的置信区间为两个总体比例之差的区间估计两个总体比例之差的估计(例题分析)【例例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计城市与农村收视率差别的置信区间 1 12 2两个总体比例之差的估计 (例题分析)解解: 已知 n1=500 ,n2=400, p1=45%, p2=32%, 1- =95%, z/2=1.96 1- 2置信度为置信度为95%的置信区间为的置信区间为城 市 与 农 村 收 视 率 差 值 的 置 信 区 间 为6.68%19.32%两个总体方差比的区间估

20、计两个总体方差比的区间估计1. 比较两个总体的方差比2.用两个样本的方差比来判断如果S12/ S22接近于1,说明两个总体方差很接近如果S12/ S22远离1,说明两个总体方差之间存在差异3.总体方差比在1-置信水平下的置信区间为两个总体方差比的区间估计(图示)F FF F1-1- F F 总体方差比总体方差比1-1- 的置信区间的置信区间方差比置信区间示意图方差比置信区间示意图两个总体方差比的区间估计(例题分析)【例例】为了研究男女学生在生活费支出(元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果: 男学生: 女学生: 试以90%置信水平估计男女学生生活费支出方差比的置信区间 两个总体方差比的区间估计解:根据自由度 n1=25-1=24 ,n2=25-1=24,查得 F/2(24)=1.98, F1-/2(24)=1/1.98=0.505 12 /22置信度为90%的置信区间为男女学生生活费支出方差比的置信区间为0.471.84

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号