抽样区间估计与样本容量计算释疑

上传人:cn****1 文档编号:487986073 上传时间:2023-05-03 格式:DOC 页数:4 大小:51KB
返回 下载 相关 举报
抽样区间估计与样本容量计算释疑_第1页
第1页 / 共4页
抽样区间估计与样本容量计算释疑_第2页
第2页 / 共4页
抽样区间估计与样本容量计算释疑_第3页
第3页 / 共4页
抽样区间估计与样本容量计算释疑_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《抽样区间估计与样本容量计算释疑》由会员分享,可在线阅读,更多相关《抽样区间估计与样本容量计算释疑(4页珍藏版)》请在金锄头文库上搜索。

1、抽样区间估计与样本容量计算释疑 抽样推断是统计学的基本方法之一,也是统计学原理的重点学习内容之一。抽样调查特点、抽样平均误差影响因素、抽样参数估计、抽样样本容量确定等构成了这一章的重点内容,而其中的参数估计与样本容量确定则是计算的重点。本文拟通过案例与初学者谈谈如何进行抽样估计,如何确定样本容量。 例1某市统计部门为了解全市居民年消费支出情况,从全市20万户居民中随机抽取1000户居民进行调查,经计算平均每户年生活费支出为1。8万元,标准差0。9万元。 要求:以95.45%(t=2)的概率保证程度估计户均生活费支出的区间。 估计全市居民消费总支出区间。解题过程已知 户均年支出区间:1。80。0

2、56,1。8+0。056万元=1。744,1.856万元 全市居民消费总支出区间:20万户1。744,1.856万元=3。488,3.712亿元 几点说明(1)一般而言,抽样区间估计的基本步骤是:点估计、平均误差、极限误差、置信区间。本例就是标准的均值参数区间估计题型。由于样本均值与标准差是已知的,所以无需计算点估计值.(2)本题计算时,必须注意“方差”与“标准差”的区别,不要将标准差当作方差来使用。(3)社会经济问题抽样调查一般都是采用不重复抽样的,只有当总体单位总数N未知或n/N的比重很低时,才可以采用重复抽样平均误差公式来计算平均误差。(4)估计总量指标时,可直接将样本均值的区间乘上全及

3、总体单位总数N即可。 例2某企业为了解本市居民对某类保健品的看法,采用简单随机抽样方式,从全市居民户中随机抽取500人进行调查结果如下:对该类保健品的态度人数喜欢320一般性100不喜欢80合计500要求:以95%的可靠性估计全市居民中“喜欢该产品的比率(t=1。96).解题过程已知 喜欢该类保健品者的比率置信区间为: 64%4。21%,64+4.21%=59.79%,68.21%几点说明(1)本例是标准的成数区间估计题型。其基本步骤同样是:点估计、平均误差、极限误差、置信区间。(2)成数区间估计时最容易犯的错误就是:将N、n、n1相混淆.其实,若用文字表述,应该是“从N中随机抽取n个单位进行

4、观察,有n1个单位是(具有某种特征)”。并且,不要将抽样估计中提供的“可靠性水平”当作公式中的P来使用.“可靠性水平”值在计算时没有其它用途,只告诉我们概率密度t的具体取值。(3)本例没有提供全市居民总人数,所以N可视作“无穷大。所以采用重复抽样的平均误差公式计算抽样误差。 例3某企业拟采用抽样技术对当天生产的5000件电子产品的耐用时间进行测试,要求有99的可靠性(t=2.58)使耐用时间的误差范围不超过20小时。根据生产规格要求,这类电子产品耐用时数的标准差不超过150小时.问:至少应该抽取多少件产品进行质量检查(分别重复抽样与不重复抽样两种情况)。 解题过程已知N=5000,t=2.58

5、,x=20,=150几点说明(1)本例是样本容量确定的标准题型之一。样本容量确定其实是极限误差计算(参数估计)的反问题,因此其公式就是根据极限误差与平均误差之间的关系推导而来的。因为x=tx,等式两边平方,即有x2=t2x2,在简单随机抽样情况之下,x2=t22/n ,从而有上述的公式。(2)对于成数的抽样估计,是非标志的方差p2=P(1-P),故只要将上述公式中的方差改为P(1-P)即可。(3)样本容量估计时,计算结果总是取整数,小数点无论是否达到0。5均应该进位,故本列中374.4与348.3均进位,分别成为375与349。(4)在样本容量确定时,允许误差或误差范围均是指极限误差。例4某市

6、质量技术监督部门拟对市场上某类牛奶制品的质量(合格率)进行检查,要求在95的可靠性之下(t=1.96),合格率的误差范围不超过1。根据最近三次同类检查,这类产品的合格率分别为98。9%、98。2%、97。8。问至少应该抽多少件产品进行检验?若允许误差扩大1倍,则应该抽取多少件进行检验? 解题过程已知t=1。96,p=1%,P=97.8当允许误差扩大1倍时,即p=2%,于是样本容量:几点说明(1)本例是成数估计时的样本容量确定.虽然实际的质量检验肯定是采用不重复抽样的,但由于市场上该类产品数量未知,可视作无穷大,故采用重复抽样的样本容量公式。(2)本例的关键是公式中P的选择。题中提供了三次同类检

7、查的合格率资料,但一般不能用三者平均数作为P.样本容量确定时通常采取“保守原则”,因此应该取“最大方差,题中提供的三次调查合格率,其方差分别为98。9%(198.9)=0。010879、98.2(198.2)=0。011784、97。8%(197.8)=0。021516,故取P=97。8%时方差达到最大,据之计算得出的样本容量也最大,据之作出的调查估计也是“最保守”从而也是最可靠的。(3)但必须注意的是,此例表面上看是取三个合格率的最小者作为P,但切不可据之类推,以为永远是最小的那个比率。例如,本例若改为对“不合格率“的估计,则前三次调查的不合格率是1.1、1.8、2。2,若错误地认为应该取三

8、者中的小者,就会取P=1。1,但据之计算的方差却不是最大而是最小。此时取P=2.2%才可达到“方差最大”。其实,P=50%时成数方差达到最大值,因此,应该取最接近50的那个比率作为样本容量公式中的P.(4)对于例3资料,其实也存在着“最大方差”原则问题,即当资料中给出了近几次类似调查的样本方差,则也应该取其中最大者作为公式中的方差.(5)当同一次调查需要对两个以上的项目(如平均值与成数)进行估计时,应该分别计算这些项目的必要样本容量,然后取其中之大者作为最终确定的抽样单位数。例5对于简单随机重复抽样,在其它条件不变的情况之下,(1)抽样单位数(样本容量)分别增加1倍、3倍、减少25、50%,则

9、抽样平均误差分别如何变化;(2)反之,若抽样允许误差缩小20、50、扩大50%、100,则抽样单位数(样本容量)应该如何变化?解题过程(1)设改变要求之前的样本容量为n旧,平均误差记为旧,则当样本容量分别增加1倍、3倍、减少25、50%时,相应的n将分别为:n=2n旧、n=4n旧、n=0.75n旧、n=0。5n旧,相应抽样平均误差分别为: 即样本容量扩大一倍,平均误差减少29.29%。 即样本容量扩大3倍,抽样平均误差减少50. 即样本容量减少25%,抽样平均误差扩大15。47。 即样本容量减少50%,抽样平均误差扩大41。42%。(2)设改变要求之前的允许误差记为旧,相应的样本容量记为n旧,

10、则当抽样允许误差缩小20%、50%、扩大50、100%,时,相应的分别为:=0.8旧,=0。5旧,=1.5旧,=2旧,,相应样本容量为: 即允许误差减少20,样本单位数应该扩大0.5625倍. 即允许误差减少一半,样本单位数应该扩大3倍. 即允许误差扩大50,样本单位数可以减少55.56。 即允许误差扩大1倍,样本单位数可以减少75。 几点说明(1)本题是测试学生对样本容量与抽样平均误差(或极限误差)之间数量关系掌握的熟练程度。因此,本题关键是搞清楚在重复简单随机抽样情况之下,样本容量与平均误差、极限误差之间的公式关系。(2)本题还必须正确理解统计学中 “扩大了”、“减少了”的真实含义,注意与“扩大到、“减少到之间的本质差别。“扩大了一倍”等价于“是原来的二倍”,“减少了20%等价于“是原来的80%”,貌似简单,却总有不少初学者搞错,因此必须引以重视。文中如有不足,请您指教! /

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号