文档详情

第3章-抽样与抽样分布

lil****ar
实名认证
店铺
DOC
267KB
约16页
文档ID:276713216
第3章-抽样与抽样分布_第1页
1/16

※※※※※※※※※※※●正态分布及其应用:◎引言:无论是二项分布还是泊松分布,它们都有一个共同的特点,即当n逐渐增大时,都将趋近于对称分布,进而趋近于正态分布,因此,二项分布和泊松分布的概率表,通常只列出n=20的概率,当n≥30时,两个分布都趋近于正态分布◎正态分布(高斯分布),是一种常用的典型的概率分布18世纪德国的数学家和天文学家高斯在正态分布理论发展过程中做过突出贡献,因此也被称作“高斯分布”※正态分布的重要地位:1、在实际观察到社会、经济、自然现象的数据表现上,其频率分布与正态分布十分接近;2、正态分布的固有性质,给抽样推断理论提供了必要的基础,使它在抽样分布、区间估计、假设检验中被广泛应用●正态分布的概率密度函数: 式中:x在正负无穷之间;μ、σ2为参数;e=2.7183;π=3.14159;可记为X~N(μ,σ2)◎1、正态分布曲线特征:(1)曲线为对称分布,在X=μ处达到极大值;(2)曲线两尾端趋向无穷小,但永不与横轴相交;(3)曲线的形状取决于标准差的大小;(4)曲线的位置取决于平均数的大小;(5)曲线的平均数、中位数、众数相等;(6)曲线下全部面积为1,并在一定标准差倍数范围内,所含的概率比重是相同的。

◎2、数理统计证明:1)、平均数加减一个标准差(μ±σ1)的范围,包含总体全面积的68.26%;xf(x)CAB2)、平均数加减一个标准差(μ±σ2)的范围,包含总体全面积的95.44%;3)、平均数加减一个标准差(μ±σ3)的范围,包含总体全面积的99.74%☆正态分布曲线族有两类: 平均数相等标准差不等 平均数不等标准差相等 ◎3、标准正态分布表的使用:☆怎样将各种形状的正态分布转换为标准正态分布呢?标准正态分布要求: Z值为从随机变量X到该分布平均数的距离,相当于σ的倍数Z值可以看成是σ的标准单位μ=60 σ=20 40 80 原始分布:μ=60,σ=20 μ=60 Z分布:μ=0 σ=1 -3 -2 -1 0 1 2 3 习题:▲教材P117,16 17◆习题1、假如某一学院的入学考试分数是服从平均数为450,标准差为100的正态分布,求:(1)有多少学生比率的得分在400—500之间?(2)若某一学生得分是630分,则比他更好和更差的学生其比率各为多少?解:(1) Z1=(400-450)/100= -0.5 Z2=(500-450)/100= 0.5 与Z=0.5对应的概率为0.691462 400 450 500 则:P(400≥x<500 = 0.691462-0.5 = 0.191462×2 = 0.382924 (2)Z=(630-450)/100=1.8 则:P(x<630== 0.9641P(x≥630)=1-0.9641= 0.0359◆习题2、教材P101,11(1) 95.254% 150[-Z] 200(2) 90% -Z 200 Z◆习题3、美国某大型商场牙膏销量,据信是服从每周平均数为10000盒,标准差为1500盒的正态分布。

问:(1)任意一周牙膏销量超过12000盒的概率是多少?(2)为使公司库存充裕,以满足每周需求高达95%的概率,问库存应备多少盒牙膏?解: (1) Z=(12000-10000)/1500=1.33,与1.33对应的概率=0.4082,超过12000盒的10000 12000 概率=1- 0.908241=0.091759(9.176%)0.95 (2)与0.95概率对应的Z值为1.645, (X-10000)/15000=1.645,X=12468(盒)◆习题4、某一出口产品(容器),技术资料显示,其填装量为服从标准差为0.6盎司的正态分布若填装重量少于18盎司的比率为2%,问其平均填装重量为多少?解: 与比率1-0.02=0.98,对应的Z=-2.05,绿色健康饮品0.02 (18-μ)/0.6=-2.05, μ=19.23(盎司) 18◆习题5、已知某加工厂工人日包装量为平均每人25件,从中抽取一人,其日包装量小于10件的概率为7.78%,问工人日包装量的标准差是多少?7.78% 解;因为:1-0.0778=0.9222,对应的Z=1.42 所以:与0.0778对应的Z=-1.4210 25 则;(10-25)/σ=-1.42 -Z σ=10.56(件)正态分布是推断统计的基石第四章 抽样与抽样分布抽样调查的必要性告诉人们,在许多情况下不必要或不可能进行全面调查,这时,要了解总体的情况,只能由样本统计量估计总体参数。

※常用的抽样方法※ 1、简单随机抽样 重复抽样 等概率(纯随机抽样) 不重复抽样 等可能2、分层抽样 先分组,后抽样 (分类抽样) 4个优点P106(3)3、系统抽样:有序排列 确定起点 间隔抽取 (机械抽样、等距抽样) 随机性4、整群抽样:简便前提是总体分布均匀〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖*〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗◎抽样分布与中心极限定理 ●1、抽样分布:全部可能样本统计量的概率分布叫做抽样分布总体分布、样本分布)◎的抽样形式与特征:以下是一个极端的例子:假定一个实验小组有四人N=4,其写作成绩分别为:21、20、19、18(分)(25为满分)若样本容量n=2,则全部可能样本(不重复抽样)是6个,6个样本及它们的平均数、准差如下表:样本容量n=2,则全部可能样本(重复抽样)是16个: 频数 频率(%) 18.0 1 0.06 18.5 2 0.1319.0 3 0.19 19.5 4 0.25 20.0 3 0.19 20.5 2 0.1321.0 1 0.06 合计 16 1.00 =? = ? 对比不重复抽样的、有何启示?平均数抽样分布图:接近正态分布。

18 18.5 19 19.5 20 20.5 21 =19.5; =0.79;= = 重复抽样●2、中心极限定理:数理统计证明:(1)当总体很大时,无论它呈现何种分布,只要样本容量n足够大,那么样本平均数的抽样分布,必定趋近于正态分布;(2)从正态总体中抽取的全部可能样本,无论样本容量有多大,样本平均数的抽样分布必定遵从于正态分布;即使是非正态总体,只要n≥30,其抽样分布必定趋近于正态分布;见书P102图3.25(3)抽样分布的平均数等于总体平均数:= ;(4) 抽样分布的标准差比总体标准差小,且随着样本容量的增加,随之减小:= ;见书P109图3.28见书P102图3.25★也称为“抽样平均误差”在区间估计中,样本容量n越大,样本平均数围绕总体平均数摆动的幅度越小,样本平均数的分布曲线变得又窄又高,它意味着样本平均数落在总体平均数附近的概率也相应增大◆极限定理在区间估计中的作用:可以确定从总体中抽取一个随机样本,其平均数出现在一个指定值域内的概率●3、平均数的抽样分布及应用:(见PPT)▲例题:假定某大型公司全部推销员个人营业额(月)的总体分布如下图1,现从中抽取一个包括30人的随机样本,其样本平均数大于15750元的概率是多少?图1:总体分布:σ=2000 图2:抽样分布 P? 15000 X 15000 解:由于n≥30,是容量为30的所有可能样本之一,15750是所有样本平均数随机变量之一,见图2。

根据中心极限定理作适当变换,下列关系式成立:所以:Z=2.05,查表,对应概率为0.4798,故大于15750元的概率为0.5-0.4798=0.02▲教材P118,18(1)20;2;(2)正态;(3)-2.25;(4)1.5▲教材P118,18(1)1-0.97725=0.02275; (2)1-0.933193=0.0668;(3)1-0.99379=0.00621; (4)(0.97725 -0.5)+(0.841345-0.5)=0.818595;(5)1-0.99865=0.00135▲教材P118,19(1)0.8944;(2)0.0228;(3)0.1292;(4)0.9699※教材P118,20(1)(2)1;(3)不一定▲教材P118,22趋于正态分布※教材P118,23(1)n=49≥30,正态分布; =213(美元);=4.5918 (2)0.5;大于217的概率是1-0.969258=0.030742; 在P(209—217)=(0.969258-0.5)×2 = 0.938516※教材P119,(1)=406克;=1.68333;正态分布。

2)1-0.998999=0.001001(3)是因为Z=-3.09,超出了±3Z,出现了小概率▲教材P18(1)增加;(2)减少※教材P119(1)n=50≥30,正态2)P(≤830)≈0;(因为Z=-4.7);(3)生产过程不正常;(4)仍是正态; P(≤830)=0.0582),(Z=1.57)※教材P119,(3)由(1)可知【【【【【【【【【【【【【【【【【【【【【【◎。

下载提示
相似文档
正为您匹配相似的精品文档