大学应用统计学经典课件06——抽样和参数估计

上传人:n**** 文档编号:50764805 上传时间:2018-08-10 格式:PPTX 页数:117 大小:11.72MB
返回 下载 相关 举报
大学应用统计学经典课件06——抽样和参数估计_第1页
第1页 / 共117页
大学应用统计学经典课件06——抽样和参数估计_第2页
第2页 / 共117页
大学应用统计学经典课件06——抽样和参数估计_第3页
第3页 / 共117页
大学应用统计学经典课件06——抽样和参数估计_第4页
第4页 / 共117页
大学应用统计学经典课件06——抽样和参数估计_第5页
第5页 / 共117页
点击查看更多>>
资源描述

《大学应用统计学经典课件06——抽样和参数估计》由会员分享,可在线阅读,更多相关《大学应用统计学经典课件06——抽样和参数估计(117页珍藏版)》请在金锄头文库上搜索。

1、应用统计学应用统计学-6-6P102(107):P102(107): 例例5.1;5.1;例例5.25.2例例5.35.3样本,个体样本,个体 哪个大?哪个大?定义定义5.15.1抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行 调查,并根据样本数据所提供的信息来推断总体的数量特征。定义定义5.25.2定义定义5.35.3定义定义5.45.4从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本 都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样,也称纯 随机抽样。从总体中抽取一个元素后,把这个元素放回总体中再抽取第二个元素,直至抽 取n个元素为止

2、。这样的抽样方法称为重复抽样。一个元素后被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元 素,直至抽取n个元素为止。这样的抽样方法称为不重复抽样。参考定义参考定义5.55.5,5.65.6 ,5.75.7(P103P103 104104)。)。见见P109P109, 分层抽样分层抽样 就是类型就是类型 抽样抽样分层抽样与整分层抽样与整 群抽样的区别群抽样的区别 在那里?在那里?分层抽样与整分层抽样与整 群抽样的区别群抽样的区别 在那里?在那里?(1 1)非随机分层,层内随机抽样;)非随机分层,层内随机抽样; 随机分群,群内全面调查(非随机随机分群,群内全面调查(非随机 )。)。(2 2)

3、层间差异大于层内差异;群内)层间差异大于层内差异;群内 差异大于群间差异。差异大于群间差异。所以,事先对总体结构又一定认识时所以,事先对总体结构又一定认识时 ,可以用分层抽样;在总体没有原始,可以用分层抽样;在总体没有原始 资料可利用时,可以用整群抽样。资料可利用时,可以用整群抽样。例:分层抽样与整群抽样的区别:例:分层抽样与整群抽样的区别:分专业抽样(分层抽样分专业抽样(分层抽样 / / 分类型抽样)分类型抽样)分班抽样(整群抽样)分班抽样(整群抽样)见见 P109P109例:各种概率抽样的区别例:各种概率抽样的区别非随机分层,层内随机抽样非随机分层,层内随机抽样(测量地层)(测量地层)例:

4、各种概率抽样的区别例:各种概率抽样的区别40m40m随机随机 随机分群,群内全面调查(非随机)随机分群,群内全面调查(非随机)(计算植物样方)(计算植物样方)240m240m10m10m例:各种概率抽样的区别例:各种概率抽样的区别什么是样本什么是样本 指标的分布指标的分布 ?什么是容量什么是容量 相同的所有相同的所有 可能的样本可能的样本 ?为何样本统为何样本统 计量是随机计量是随机 变量?变量?这是一个均匀分布,即每个元素这是一个均匀分布,即每个元素 出现的机会(概率)是一样的出现的机会(概率)是一样的。Y Y轴和轴和x x轴轴 分别代表分别代表 什么?什么?见见P105P105(11011

5、0)均值在均值在 那里?那里?1.251.25为何概为何概 率为率为 0.250.25?例例5.45.4(P105P105;p109p109)MM是什么是什么 ?n n是什么?是什么?n n变大的变大的 结果如何结果如何 ?从这两张图中从这两张图中 要明白:要明白: (1 1)为什么)为什么 样本统计量是样本统计量是 随机变量。随机变量。 (2 2)什么是)什么是 样本均值的均样本均值的均 值。值。n n变大,抽变大,抽 样分布方样分布方 差越小。差越小。样本均值的数学样本均值的数学 期望就是样本均值期望就是样本均值 的均值。的均值。图中那条曲线图中那条曲线 的均值更接近的均值更接近 总体的均

6、值?总体的均值?在这张图中在这张图中 总体均值在总体均值在 那里?那里?用什么估用什么估 计总体均计总体均 值?值?总体分布,样本分布,(总体的)抽样分布的关系总体分布,样本分布,(总体的)抽样分布的关系. x xx xx xx xx xx xx x x xf f总体分布总体分布样本分布样本分布抽样分布抽样分布 x xx x总体元素个数、样本容量、样本(组)所有可能取值总体元素个数、样本容量、样本(组)所有可能取值总体元素个数总体元素个数N N (总体的所有个体)(总体的所有个体)样本容量样本容量n n (每一次取样的数量)(每一次取样的数量)容量为容量为n n的样本的所有可能取值的样本的所有

7、可能取值 (所有的(所有的N N n n种可能都出现为止)种可能都出现为止)重复抽样重复抽样. x xx xx xx xx x x x x x x xf fx x修正系数修正系数 (当N很大时修 正系数趋于1)P109P109注意标准差与标注意标准差与标 准误差的区别。准误差的区别。表表5.15.1(P106)P106),例,例5.45.4(P105P105;P109P109)样本均值的抽样分布、样本方差的抽样分布样本均值的抽样分布、样本方差的抽样分布总体的均值、方差总体的均值、方差方差的样本分布方差的样本分布 均值的样本分布均值的样本分布方差抽样分布(均值、方差)方差抽样分布(均值、方差)均

8、值抽样分布(均值、方差)均值抽样分布(均值、方差). x xx xx xx xx x x xx x x xf f D DD DD DD DD DD DD DD D D D D DD DX X注意:服从正态注意:服从正态 分布和服从卡方分布和服从卡方 帆布分布的区别帆布分布的区别n n 是什么?是什么?此处红色曲线此处红色曲线 分布形成的均分布形成的均 值是什么?是值是什么?是 总体的总体的 还是还是 ?样本均值的抽样分布、样本方差的抽样分布、样本均值的抽样分布、样本方差的抽样分布、样本均值的抽样分布样本均值的抽样分布均值均值 方差方差 样本方差的抽样分布样本方差的抽样分布均值均值 方差方差 样

9、本其他参数的抽样分布样本其他参数的抽样分布均值均值 方差方差 N N0 0 / N/ N定义定义5.95.9用来估计总体参数的统计量的具体数值用来估计总体参数的统计量的具体数值, ,称为估计量称为估计量, ,用符号用符号表示。表示。定义定义5.105.10定义定义5.115.11定义定义5.125.12用来估计总体参数时计算出来的估计量的具体数值,称为估计值。用来估计总体参数时计算出来的估计量的具体数值,称为估计值。在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。用样本估计量用样本估计量的值直接作为总体参数

10、的值直接作为总体参数的估计值,称为参数的点估计。的估计值,称为参数的点估计。第第2 2点是什点是什 么意思?么意思?这是什么这是什么 意思?意思?点估计与抽样分布的关系点估计与抽样分布的关系. x xx xx xx xx xx xx x x xx xf f总体分布总体分布样本分布样本分布抽样分布抽样分布误差误差| | x x- - x x| |n nn n 根据中心极限定理当根据中心极限定理当 n n越大,样本(参数越大,样本(参数 )的抽样分布越接近)的抽样分布越接近 总体(参数)的真总体(参数)的真 值。值。为何只用一个样为何只用一个样 本估计,而不是本估计,而不是 用抽样分布估计用抽样分

11、布估计 ?x x定义定义5.135.13估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为,所选择,所选择 的估计量为的估计量为,如果,如果E(E()=)=, ,称称为为的无偏估计。的无偏估计。定义定义5.155.15定义定义5.145.14对同一总体参数的两个无偏估计量对同一总体参数的两个无偏估计量1 1和和2 2,若,若D D(1 1) 以一定的概率出现以一定的概率出现根据中心极限定理当根据中心极限定理当n n越越 大,样本(参数)的抽大,样本(参数)的抽 样分布越接近总体(参样分布越接近总体(参 数)的真值。数)的真值。|

12、 | x x x x | | xx误差误差? x x = =x x区间估计与抽样分布的关系区间估计与抽样分布的关系以一定的概率(以一定的概率(1 1) )出现出现P P(x xx x x x x xx x)= 1-= 1-xxxx抽样分布抽样分布 x xx xf f. 总体分布总体分布样本分布样本分布x xx xxxx xxxP P( x xx x x x x xx x)= 1-= 1-| | x x - x- x| | xx误差误差x xx x X X x + x + x x x xx x区间区间x xx x此处此处 是总是总 体的标准差体的标准差 ,还是样本,还是样本 的标准差?的标准差?

13、Z Z /2/2是什么?是什么? P117(125)P117(125)Z Z /2/2 N N (0,1(0,1)Z Z可靠性系数可靠性系数( (临界值临界值) ) x x Z Z/2/2(/ n / n )估计误差估计误差xx置信上(下)限置信上(下)限Z =Z =/ n / n x x - - N(0,1)N(0,1) 置信下(上)限风险值置信水平边际误差误差范围可靠性系数临界值这是什么?P125P125此处此处 为总体标准差,为总体标准差, 未知时以样本标准差未知时以样本标准差 s s代替。代替。1. 1. 求产品平均重求产品平均重 量的范围量的范围, ,而不是而不是 平均重量平均重量.

14、 .2.2.需要多大的范需要多大的范 围围. .才能以概率为才能以概率为 95% (0.95)95% (0.95)的准确的准确 率包含真正的平均率包含真正的平均 重量。重量。/2/20.0250.025, 查(查(1-0.0251-0.025),), (0.975-0.5)(0.975-0.5)/2/20.0250.025, 查(查(1-0.0251-0.025),), (0.975-0.5)(0.975-0.5)反查正态概率分布表反查正态概率分布表和上题的差别和上题的差别: :没没 有总体标准差有总体标准差. .总体标准差未总体标准差未 知,以样本标知,以样本标 准差代替。准差代替。查查0.

15、950.95查查0.950.95自由度为自由度为 n n1 1 的的 t t 分布分布查查 t t0.0250.025X X B ( n, p ) B ( n, p )p p N ( p , p ( 1 p ) ) N ( p , p ( 1 p ) )1 1 n n二项分布, p为成 功率、比例等。N N( , 2 2)Z Z N N(0,10,1) X - X - 自由度为自由度为 n n1 1 的卡方的卡方 分布分布置信下限置信下限置信上限置信上限 / 2/ 2 / 2/ 2置信下限置信下限置信上限置信上限样本容量与抽样分布的关系样本容量与抽样分布的关系. x x x xx xf f总体分布总体分布样本分布样本分布抽样分布抽样分布误差误差|x|x x x| |n nn n 根据中心极限定理当根据中心极限定理当 n n越大,样本(参数越大,样本(参数 )的抽样分布越接近)的抽样

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 电子/通信 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号