《应用统计学》幻灯片课件

上传人:W**** 文档编号:150831673 上传时间:2020-11-09 格式:PPT 页数:124 大小:9.62MB
返回 下载 相关 举报
《应用统计学》幻灯片课件_第1页
第1页 / 共124页
《应用统计学》幻灯片课件_第2页
第2页 / 共124页
《应用统计学》幻灯片课件_第3页
第3页 / 共124页
《应用统计学》幻灯片课件_第4页
第4页 / 共124页
《应用统计学》幻灯片课件_第5页
第5页 / 共124页
点击查看更多>>
资源描述

《《应用统计学》幻灯片课件》由会员分享,可在线阅读,更多相关《《应用统计学》幻灯片课件(124页珍藏版)》请在金锄头文库上搜索。

1、1,应用统计学-6,2,3,4,P102(107): 例5.1;例5.2例5.3,5,6,7,8,样本,个体哪个大?,9,定义5.1,抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。,定义5.2,定义5.3,定义5.4,从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样,也称纯随机抽样。,从总体中抽取一个元素后,把这个元素放回总体中再抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为重复抽样。,一个元素后被抽中后不再放回总体,然后再从剩

2、下的元素中抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为不重复抽样。,10,参考定义5.5,5.6,5.7(P103104)。,见P109,分层抽样就是类型抽样或分类抽样。,分层抽样与整群抽样的区别在那里?,等距抽样就是系统抽样,整群抽样就是分区抽样,11,某大学的商学院相对今年的毕业生进行一次调查,以便了解他们的就业倾向。该学院有5个专业:会计、金融、市场营销、经营管理、信息系统。今年有1500名毕业生,其中会计专业500名,金融专业350名,市场营销专业300名,经营管理专业150名,信息系统专业200名。假定要选取180人作为样本,各专业应抽取人数:,会计专业 名,金融专业名,

3、市场营销专业名,经营管理专业名,信息系统专业名。,分层抽样还是整群抽样?,12,分层抽样与整群抽样的区别在那里?,(1)非随机分层,层内随机抽样;随机分群,群内全面调查(非随机)。 (2)层间差异大于层内差异;群内差异大于群间差异。 所以,事先对总体结构又一定认识时,可以用分层抽样;在总体没有原始资料可利用时,可以用整群抽样。,见 P109,13,例:各种概率抽样的区别,非随机分层,层内随机抽样,(测量地层),14,例:各种概率抽样的区别,40m,随机,随机分群,群内全面调查(非随机),(计算植物样方),240m,10m,15,例:各种概率抽样的区别,16,17,什么是样本指标的分布?,什么是

4、容量相同的所有可能的样本?,为何样本统计量是随机变量?,18,这是一个均匀分布,即每个元素出现的机会(概率)是一样的。,Y轴和x轴分别代表什么?,见P105(110),均值在那里?,1.25,为何概率为0.25?,19,20,21,例5.4(P105;p109),M是什么? n是什么? N是什么?,n变大的结果如何?,所有容量为n的样本数.,22,从这两张图中要明白: (1)为什么样本统计量是随机变量。 (2)什么是样本均值的均值。,n变大,抽样分布方差越小。,23,样本均值的数学期望就是样本均值的均值。,图中那条曲线的均值更接近总体的均值?,24,在这张图中总体均值在那里?,25,26,27

5、,用什么估计总体均值?,28,总体元素个数、样本容量、样本(组)所有可能取值,总体元素个数N (总体的所有个体),样本容量n (每一次取样的数量),容量为n的样本的所有可能取值 (所有的N n种可能都出现为止),重复抽样,29,修正系数 (当N很大时修正系数趋于1),P109,30,注意标准差与标准误差的区别。,31,表5.1(P106),例5.4(P105;P109),32,33,样本均值的抽样分布、样本方差的抽样分布,总体的均值、方差,方差的样本分布 均值的样本分布,方差抽样分布(均值、方差),均值抽样分布(均值、方差),.,f,D,D,D,D,D,D,D,D,D,D,D,34,注意:服从

6、正态分布和服从卡方布分布的区别,35,n 是什么?,此处红色曲线分布形成的均值是什么?,由样本标准差计算出来的卡方X2,36,由样本标准差0.0014mm计算出来的卡方值X2,37,样本均值的抽样分布、样本方差的抽样分布,总体的均值、方差,方差的样本分布 均值的样本分布,方差抽样分布(均值、方差),均值抽样分布(均值、方差),.,f,D,D,D,D,D,D,D,D,D,D,D,38,样本均值的抽样分布、样本方差的抽样分布、,样本均值的抽样分布,样本方差的抽样分布,样本其他参数的抽样分布,39,40,41,42, N0 / N,43,44,45,46,mk=E(Xk) 原点矩,Ck=EX-E(X

7、)k 中心矩,47,48,定义5.9,定义5.10,定义5.11,定义5.12,用来估计总体参数时计算出来的估计量的具体数值,称为估计值。,在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。,49,50,第2点是什么意思?,51,这是什么意思?,52,53,54,55,n时, x 与总体参数的真值间的误差趋于0;如果一个估计量不是一致性的, 即便n,x 仍然不能等于总体参数的真值,56,总体均值,1=(n-a)/(n-b),用某个x估计总体参数时,x不一定等于总体参数真值,但多个x的平均值一定等于总体参数的真值,57,无偏估计,58,误差| x - x|,为何只用一个样本估计

8、,而不是用抽样分布估计?,59,定义5.13,定义5.15,定义5.14,随着样本容量的增大,点估计量的值越来越接近总体的参数。,60,A=总体参数,61,62,定义5.16,由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。,定义5.17,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平或置信系数。,63,置信水平1-,/2,/2,置信区间是统计量的取值范围;置信水平是概率。,64,Za/2是什么?,65,什么是将构造置信区间的步骤重复多次?,66,如果将构造置信区间的步骤重复多次,置信区间中包含

9、总体参数真值的次数所占的比率,称为置信水平或置信系数。,67,这是什么意思?,68,置信水平是概率,是曲线下包含的面积。95%的置信水平就是有95%的区间包含了总体参数的真值。,69,点估计与抽样分布的关系,.,总体分布,抽样分布,以一定的概率出现,根据中心极限定理当n越大,样本(参数)的抽样分布越接近总体(参数)的真值。,误差,?,样本分布,70,区间估计与抽样分布的关系,71,抽样分布区间,72,x,抽样分布,x,f,.,总体分布,样本分布,z,标准正态分布,x,0,f,x,x,73,此处是总体的标准差,还是样本的标准差?,Z/2是什么? P117(125),74,置信下(上)限,风险值,

10、置信水平,边际误差,误差范围,可靠性系数,临界值,这是什么?,P125,75,76,77,78,此处为总体标准差,未知时以样本标准差s代替。,79,1. 求产品平均重量的范围,而不是平均重量. 2.需要多大的范围.才能以概率为95% (0.95)的准确率包含真正的平均重量。,80,/20.025, 查(1-0.025), (0.975-0.5),81,/20.025, 查(1-0.025), (0.975-0.5),反查正态概率分布表,82,和上题的差别:没有总体标准差.,83,总体标准差未 知,以样本标 准差代替。,查0.95,84,查0.95,85,86,自由度为 n1 的 t 分布,87

11、,88,89,90,查 t0.025,91,92,X B ( n, p ),二项分布, p为成功率、比例等。,N(, 2),93,94,95,自由度为 n1 的卡方 分布,置信下限,置信上限,96,/ 2,/ 2,置信下限,置信上限,97,98,0,99,/ 2,/ 2,置信下限,置信上限,100,101,102,0,103,104,样本容量与抽样分布的关系,.,总体分布,样本分布,抽样分布,只用一个样本估计,而不是用抽样分布估计。, ,105,置信区间,置信水平1-,(1)如果确定了置信区间,就可以确定估计误差(边际误差) 。,(2)如果确定了置信水平,就可以确定Z/2。,(3)如果确定了估

12、计误差和置信水平,再知道总体标准差,就可以求一定误差范围内和一定置信水平下所需要的样本容量n。,如果只知道置信区间,能否确定Z/2 ?,此处是非标准正态分布的置信区间,106,不重复抽样时求样本容量n的公式(P123)。,3.,107,样本容量n与总体方差2之间的关系,=,x1=x2=x3=x4=x5=x,总体方差越小,需要的样本容量越小。,总体分布,样本分布,抽样分布,108,样本容量n与边际(估计)误差E的关系,x,x,x,x,误差越大,落入误差范围的样本(参数)越多,如果缩小误差,只有加大样本容量,使抽样分布变窄,才能使同样多的样本落入误差范围内 。,1-,1-,1-,1-,n = n

13、x x 1- 1-,n x 1-= 1-,x,x,x,x,误差越大,置信水平越大,同样的置信水平,要减少误差,就要加大样本容量误差,109,样本容量n与可靠性系数(Z或t)的关系,估计误差x,x Z/2(/ n ),置信上(下)限,置信区间,置信水平1-,x,x,/2,/2,x = x /2 /2 Z/2 Z/2 n n,查正态分布表或t分布表可知,Z或 t 越大,越小。 若置信区间(误差范围)不变,加大Z,则/n 变小(或 变小), n 就要变大,抽样分布曲线就要变窄。,实际上是n和或1-的关系。n越大,可靠性越大。,110,同样的值或误差范围边界(115),变成标准正态分布后是不一样的z值

14、。,均值=100,标准差分别为16和20,求 x = 115时的Z,nn,zz,111,112,113,114,115,116,117,例1:某零件加工企业生产一种螺丝钉,对某天加工的零件每隔一定时间抽出一个,共抽出12个,测得长度(单位:mm)数据见Excel中A2:A13。假定零件长度服从正态分布,试以95%的置信水平估计该企业生产的螺丝钉平均长度的置信区间。,样本抽样分布的标准差,118,119,如果总体标准差已知,计算可直接使用,B8改为Z值;C8改为“NORMSINY(1-C6/2)”,C5改为“= /SQRT(C2)”.,样本均值抽样分布的标准差,120,例2:某厂对一批产品的质量进行抽样检查,采用重复抽样抽取样本200只,样本优质品率为85%,试计算当把握度(置信水平)为90%时优质品率的允许误差。,121,CONFIDENCE(,n ),122,例3:从某车间加工的同类零件中抽取16件,测得零件平均长度为12.8cm,方差为0.0023。假定零件长度服从正态分布,试求总体方差及标准差的置信区间(置信度为95%)。,CHIINV ( probability , deg _freedom),123,124,A=-x,B=x, x(-x) x,(x- x) (x+x),

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号