小样本及容量

上传人:re****.1 文档编号:569267148 上传时间:2024-07-28 格式:PPT 页数:43 大小:470.50KB
返回 下载 相关 举报
小样本及容量_第1页
第1页 / 共43页
小样本及容量_第2页
第2页 / 共43页
小样本及容量_第3页
第3页 / 共43页
小样本及容量_第4页
第4页 / 共43页
小样本及容量_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《小样本及容量》由会员分享,可在线阅读,更多相关《小样本及容量(43页珍藏版)》请在金锄头文库上搜索。

1、一只鹦鹉大摇大摆地走进酒吧,飞上吧台。一只鹦鹉大摇大摆地走进酒吧,飞上吧台。一只鹦鹉大摇大摆地走进酒吧,飞上吧台。一只鹦鹉大摇大摆地走进酒吧,飞上吧台。 “ “嘿,伙计!给我来一盘毛毛虫!嘿,伙计!给我来一盘毛毛虫!嘿,伙计!给我来一盘毛毛虫!嘿,伙计!给我来一盘毛毛虫!” ”鹦鹉嚷道。鹦鹉嚷道。鹦鹉嚷道。鹦鹉嚷道。 “ “我们这里不卖毛毛虫!我们这里不卖毛毛虫!我们这里不卖毛毛虫!我们这里不卖毛毛虫!” ”侍者有点生气。侍者有点生气。侍者有点生气。侍者有点生气。 “ “什么破酒吧?什么破酒吧?什么破酒吧?什么破酒吧?” ”鹦鹉骂了一句,一摇一摆地走了。鹦鹉骂了一句,一摇一摆地走了。鹦鹉骂了一

2、句,一摇一摆地走了。鹦鹉骂了一句,一摇一摆地走了。 第二天,鹦鹉又来了,跃上吧台。第二天,鹦鹉又来了,跃上吧台。第二天,鹦鹉又来了,跃上吧台。第二天,鹦鹉又来了,跃上吧台。 “ “喂,伙计!快给我来一盘毛毛虫!喂,伙计!快给我来一盘毛毛虫!喂,伙计!快给我来一盘毛毛虫!喂,伙计!快给我来一盘毛毛虫!” ”鹦鹉仿佛忘了昨天的事。鹦鹉仿佛忘了昨天的事。鹦鹉仿佛忘了昨天的事。鹦鹉仿佛忘了昨天的事。 “ “你是不是不长记性!我们这里不卖毛毛虫!你是不是不长记性!我们这里不卖毛毛虫!你是不是不长记性!我们这里不卖毛毛虫!你是不是不长记性!我们这里不卖毛毛虫!” ”侍者十分恼火。侍者十分恼火。侍者十分恼火

3、。侍者十分恼火。 “ “到底是不是做生意的?到底是不是做生意的?到底是不是做生意的?到底是不是做生意的?” ”鹦鹉嘟哝着走了。鹦鹉嘟哝着走了。鹦鹉嘟哝着走了。鹦鹉嘟哝着走了。 第三天,鹦鹉照旧来到酒吧,第三天,鹦鹉照旧来到酒吧,第三天,鹦鹉照旧来到酒吧,第三天,鹦鹉照旧来到酒吧,“ “扑哧扑哧扑哧扑哧” ”一声窜上吧台。一声窜上吧台。一声窜上吧台。一声窜上吧台。 “ “伙计!来一盘毛毛虫!伙计!来一盘毛毛虫!伙计!来一盘毛毛虫!伙计!来一盘毛毛虫!” ”鹦鹉依旧老一套。鹦鹉依旧老一套。鹦鹉依旧老一套。鹦鹉依旧老一套。 “ “你要是再敢要毛毛虫,我就把你的嘴壳子钉在这吧台上!你要是再敢要毛毛虫,

4、我就把你的嘴壳子钉在这吧台上!你要是再敢要毛毛虫,我就把你的嘴壳子钉在这吧台上!你要是再敢要毛毛虫,我就把你的嘴壳子钉在这吧台上!” ” 说着侍者挥了挥拳头说着侍者挥了挥拳头说着侍者挥了挥拳头说着侍者挥了挥拳头. . “ “暴脾气!暴脾气!暴脾气!暴脾气!” ” 鹦鹉埋怨了一声,急忙逃走了。鹦鹉埋怨了一声,急忙逃走了。鹦鹉埋怨了一声,急忙逃走了。鹦鹉埋怨了一声,急忙逃走了。 第四天,鹦鹉居然还是来到酒吧。第四天,鹦鹉居然还是来到酒吧。第四天,鹦鹉居然还是来到酒吧。第四天,鹦鹉居然还是来到酒吧。 它飞上吧台,它飞上吧台,它飞上吧台,它飞上吧台,“ “伙计!给我来一盘钉子伙计!给我来一盘钉子伙计!

5、给我来一盘钉子伙计!给我来一盘钉子!” !” 鹦鹉终于改了说法鹦鹉终于改了说法鹦鹉终于改了说法鹦鹉终于改了说法. . “ “滚开!我们这里没有钉子!滚开!我们这里没有钉子!滚开!我们这里没有钉子!滚开!我们这里没有钉子!” ”侍者骂道。侍者骂道。侍者骂道。侍者骂道。 “ “那么,给我来一盘毛毛虫!那么,给我来一盘毛毛虫!那么,给我来一盘毛毛虫!那么,给我来一盘毛毛虫!” ” 1 1第三节第三节 小样本情形下的区间估计小样本情形下的区间估计使使用用t分分布布的的条条件件(p129):正正态态总总体体、当当样样本本容容量量n30,总总体体标标准准差差未未知知时时,用用样样本本标标准准差差S代代替总

6、体标准差替总体标准差。T分布:2 2在讨论大样本的参数估计时,在讨论大样本的参数估计时,我们引用了中心极限定理,我们引用了中心极限定理,即把平均数的抽样分布看成即把平均数的抽样分布看成是正态分布。是正态分布。 3 3但中心极限定理是在极限意但中心极限定理是在极限意义上引上引进的。如果的。如果样本容量太小,而本容量太小,而总体方差体方差未知未知时,由于,由于样本本标准差是有偏估准差是有偏估计量,量,当我当我们用用样本本标准差代替(点估准差代替(点估计)总体体标准差准差时,就不能再,就不能再认为平平均数的抽均数的抽样分布是分布是N。即:当即:当n较小,小, 不再成立。不再成立。 4 4 所以,当我

7、们利用样本标准差来代替所以,当我们利用样本标准差来代替总体标准差时,在对参数进行估计时,就总体标准差时,在对参数进行估计时,就会会人为地引入人为地引入一个一个误差来源误差来源,而我们又使,而我们又使用小样本,更会影响我们估计的精度,为用小样本,更会影响我们估计的精度,为了保持我们需要的置信度,我们只有加宽了保持我们需要的置信度,我们只有加宽置信区间。置信区间。 从区间估计的公式中可以看到,从区间估计的公式中可以看到,s代代替替,n是我们选择的样本容量,不能再是我们选择的样本容量,不能再变,能变化的只有变,能变化的只有Z值了,而改变值了,而改变Z,除,除了改变置信度外,就要改变分布的形式,了改变

8、置信度外,就要改变分布的形式,即认为抽样分布不服从正态分布。即认为抽样分布不服从正态分布。 5 5 经过证明及推明及推导,引出在小,引出在小样本的情况下,我本的情况下,我们估估计的的临界界值服从自由度服从自由度为(n-1)的)的t分布,分布,临界界值用用表示,置信区表示,置信区间为:(),6 6 特点特点(p106、130): 关于y轴对称;随着自由度的逐渐增大,密度曲线逐渐接近于标准正态密度曲线.标准标准t t分布表示方法:分布表示方法:x xt(0, )t(0, ),其密度曲线,其密度曲线: :Xf(x)7 7 t分布的分布的 分位数分位数:Xf(x) 设Xt(n),对于给定(0)=,则称

9、为t(n)分布的水平的分位数, 记为:例如例如. 设Xt(15),求(1)=0.005的上侧分位数;解解(1)=t0.005(15),查表得 =2.947t(n)8 8估计区间估计区间:9 9例题1: 某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,如果袋装重量服从正态分布,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。1010分析: 在置信度不变的情况下,在置信度不变的情况下,相同的面积在相同的面积在t t 分布中包含分布中包含的区间更长一些。的区间更长一些。111

10、1例题2:从从大大学学一一年年级级学学生生中中随随机机抽抽取取12名名学学生生,其其阅阅读读能能力力得得分分(服服从从正正态态分分布布)为为28,32,36,22,34,30,33,25,31,33,29,26。试试评评估估一一下下大大学学一一年年级级学学生生阅阅读读能能力力的的总总体体平平均均分分数数。要要求求置置信信度度分分别别是是95%和和99%。1212步骤:步骤:步骤:步骤:(1 1)计算样本平均数:)计算样本平均数:)计算样本平均数:)计算样本平均数: (2 2)计算样本标准差)计算样本标准差)计算样本标准差)计算样本标准差(3 3)构造分布,并确定自由度)构造分布,并确定自由度)

11、构造分布,并确定自由度)构造分布,并确定自由度(4 4)计算平均误差:)计算平均误差:)计算平均误差:)计算平均误差:(5 5)估计总体平均数置信区间:)估计总体平均数置信区间:)估计总体平均数置信区间:)估计总体平均数置信区间:29.917 4.1 1.184 11 29.917 4.1 1.184 11 (27.311 27.311 32.523)32.523) 1313习题1: 为管理的需要,银行要测定在业务柜台上每笔业务平均所需的时间。假设每笔业务所需时间服从正态分布,现随机抽取样本量为16,测得平均时间为13分钟,标准差为5.6分钟,要求以99%的置信系数确定置信界限。若置信系数改为

12、90%,其置信界限有什么区别?1414 习题2:某出租汽车公司欲测定该公司汽车的每公升汽油能行驶的里程,该数据服从正态分布。随机抽取8辆车测定得数据如下:11.95,14.28,17.90,15.94,11.73,15.64,16.58,12.50。要求估计该公司所有汽车每公升汽油平均行驶里程的置信区间,置信系数为95%。1515 习题3: 随机地从一批钉子中抽取16枚,测得它们的直径(单位:厘米),并求得其样本均值为2.125,方差为0.01713 .设钉的直径服从正态分布,试求总体均值的置信系数为0.90的置信区间已知 : 1616第四节:抽样容量的确定(p141) 所谓必要的抽样数目,也

13、就是指为了使抽样误差不超过给定的允许范围至少应抽取的样本单位数目。1717影响抽样容量的因素:(1)总体方差2(或总体标准差)。其他条件不变下,总体单位的差异程度大,则应多抽,反之可少抽一些。(2)允许误差范围 或 。(书中用E表示)(3)置信度( )。(4)抽样方法(是否重复抽样)。(5)抽样组织方式。1818影响区间宽度的因素1、数据的离散程度,、数据的离散程度,用用 来测度来测度2、样本容量,、样本容量,3、置信水平、置信水平 (1 - ),影响,影响 Z 的大小的大小与总体方差成正比与总体方差成正比与允许误差成反比与允许误差成反比与可靠性系数成正比与可靠性系数成正比1919重复抽样不重

14、复抽样估计总体均值时样本容量的确定 20201.根据均值区间估计公式可得样本容量根据均值区间估计公式可得样本容量n为为因此:21211.根据比例区间估计公式可得样本容量根据比例区间估计公式可得样本容量根据比例区间估计公式可得样本容量根据比例区间估计公式可得样本容量n n为为为为估计总体比例时样本容量的确定(P143) 2.若若若若总体比例总体比例总体比例总体比例P P未知时,可用样本比例未知时,可用样本比例未知时,可用样本比例未知时,可用样本比例 来代替来代替来代替来代替 p p 2222样本量的确定(实例样本量的确定(实例1)需要多大规模的样本才能在需要多大规模的样本才能在 90% 的置的置

15、信水平上保证均值的误差在信水平上保证均值的误差在 5 之内之内? 前期研究表明总体标准差为前期研究表明总体标准差为 45.nZE=222222(1645) (45)(5)219.2 220.向上取整2323【例例例例2 2】一一家家广广告告公公想想估估计计某某类类商商店店去去年年所所花花的的平平均均广广告告费费有有多多少少。经经 验验 表表 明明 , 总总 体体 方方 差差 约约 为为18000001800000元元。如如置置信信度度取取95%95%,并并要要使使估估计计在在总总体体平平均均值值附附近近500500元元的的范范围围内内,这这家家广广告告公公司司应应抽抽多大的样本?多大的样本?2

16、424解解解解 : :已已 知知 2 2=1800000=1800000, =0.05=0.05, Z Z /2/2=1.96=1.96, =500=500 应抽取的样本容量应抽取的样本容量应抽取的样本容量应抽取的样本容量为为为为2525例题4: 某食品厂要检验本月生产的10000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?2626不重复抽样:27272828一个结论: 不重复抽样的效率高于重复抽样。2929习题4: 某超级市场欲估计每个顾客平均每次购物的金额,根据过去的经验,标准差大约为

17、160元,现要求以95%的置信度估计每个顾客的购物金额,并要求允许误差不超过20元,应抽多少顾客作样本?3030 习题5: 某养鸡专业户养了1000只小鸡,一个月后欲估计这批小鸡的总重量,要求估计误差不超过2公斤(2000克),而每只鸡重量的方差约为49 ,要求置信度为95%应抽多少只鸡作样本?31313232 习题6:某果园有1000株果树,在采摘前欲估计果园的总产量,随机抽选了10株,产量分别为161,68,45,102,38,87,100,92,76,90公斤。假设果树的产量服从正态分布,试以95%的置信水平估计该果园的总产量,若要求置信区间缩小一半,应抽多少株果树作样本?3333总体方

18、差未知时样本容量的确定(P142、143)例7:某商场经理预估计消费者每次来商场购物所花费的金额,以往经验表明,一般消费者最多花费356元,最低花费68元,如想以95%的把握,使估计的误差不大于30元,应该抽取多少样本容量?3434简单随机抽样下估计总体比例时简单随机抽样下估计总体比例时样本容量的确定样本容量的确定式中的总体比例可以通过以下方式估计:根据历史资料确定根据历史资料确定通过试验性调查估计通过试验性调查估计取为取为0.50.5。3535 【例例例例4 4】某某某某品品品品牌牌牌牌电电电电脑脑脑脑公公公公司司司司,准准准准备备备备将将将将电电电电脑脑脑脑销销销销售售售售市市市市场场场场

19、转转转转入入入入拉拉拉拉美美美美地地地地区区区区,事事事事先先先先派派派派出出出出有有有有关关关关人人人人员员员员到到到到该该该该地地地地区区区区查查查查询询询询资资资资料料料料,以以以以便便便便估估估估计计计计一一一一下下下下该该该该地地地地区区区区有有有有电电电电脑脑脑脑的的的的家家家家庭庭庭庭所所所所占占占占的的的的比比比比例例例例。公公公公司司司司希希希希望望望望这这这这一一一一比比比比例例例例的的的的估估估估计计计计允允允允许许许许误误误误差差差差不不不不超超超超过过过过0.050.050.050.05,且且且且置置置置信信信信度度度度为为为为95%95%95%95%。问问问问:要要

20、要要抽抽抽抽取取取取多多多多大大大大容容容容量量量量的的的的样本?(事先对总体一无所知)样本?(事先对总体一无所知)样本?(事先对总体一无所知)样本?(事先对总体一无所知) 。3636解解解解: : 已已知知 =0.05=0.05, =0.05=0.05,Z Z /2/2=1.96=1.96,当当p p未知时用最大方差未知时用最大方差0.250.25代替代替 应抽取的样本容量应抽取的样本容量应抽取的样本容量应抽取的样本容量应抽取的样本容量应抽取的样本容量为为为为为为3737 例题6:某企业对一批产品进行质量检查,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%、和9

21、6%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?3838例8:某调查机构想调查某市家庭拥有电脑的比率,如果客户要求的把握程度是90%,误差不大于2%,应抽取多大的样本?3939练习7:从我校新入学的名单中得知,新生中年龄最大的22岁,最小的17岁,如果想以95%的把握使估计的平均年龄不超过0.5岁,应抽取多大的样本?4040为了考察我校英语水平,某调查队想了解我校学生通过四级学生的比例,如果误差比例范围是10%,把握程度是90%应抽取多大的样本?4141样本容量有时根据科学家研样本容量有时根据科学家研究成果大致上确定:究成果大致上确定:允许误差允许误差% % 置信度置信度95%95% 1 9604 1 9604 2 3401 2 3401 3 1067 3 1067 4 600 4 600 5 384 5 384 6 267 6 267 7 196 7 1964242本章总结 判断估计量优良性三原则判断估计量优良性三原则 掌握区间估计(大样本情形,小样掌握区间估计(大样本情形,小样本情形)本情形) 样本容量的确定样本容量的确定4343

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号