参数估计基础2013课件

上传人:F****n 文档编号:88138710 上传时间:2019-04-19 格式:PPT 页数:67 大小:3.64MB
返回 下载 相关 举报
参数估计基础2013课件_第1页
第1页 / 共67页
参数估计基础2013课件_第2页
第2页 / 共67页
参数估计基础2013课件_第3页
第3页 / 共67页
参数估计基础2013课件_第4页
第4页 / 共67页
参数估计基础2013课件_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《参数估计基础2013课件》由会员分享,可在线阅读,更多相关《参数估计基础2013课件(67页珍藏版)》请在金锄头文库上搜索。

1、第五章 参数估计基础,Estimation of parameter,参数估计的定义,根据样本的统计量估计总体参数的过程,称为参数估计。 Ann landers:“如果可以重新选择,你还要孩子吗?” 结果:近1万份读者来信:70%的父母后悔! Newsday:开展了全美范围专业调查 结果:1373对随机样本,91%的父母无怨无悔!,2019/4/19,2,海南医学院卫生统计学教研室,案例:,Ann landers: 自发性回应的便利样本,高度偏差。 Newsday: 简单随机样本(simple random sample ) 统计推断中,关心的不是统计量本身,而是随机化的实现、样本的代表性和统

2、计推断技术。,2019/4/19,3,海南医学院卫生统计学教研室,Contents,第一节 抽样分布与抽样误差,第二节 t分布,第三节 总体均数及总体概率的估计,2019/4/19,4,海南医学院卫生统计学教研室,第一节 抽样分布与抽样误差,1,2,100,n=30 x1=156.7,n=30 x2=158.1,n=30 x100=156.6,13岁女学生身高,一、样本均数的抽样分布与抽样误差,2019/4/19,5,海南医学院卫生统计学教研室,2019/4/19,6,海南医学院卫生统计学教研室,从正态总体N(155.4,5.32) 抽样得到的100个样本均数的频数分布,100个样本均数的频数

3、分布图 (直方图),2019/4/19,7,海南医学院卫生统计学教研室,样本均数的抽样分布特点,1、样本均数恰好等于总体均数及其罕见; 2、样本均数之间存在差异; 3、样本均数围绕总体均数,中间多、两边少,左右基本对称,呈近似正态分布; 4、样本均数之间的变异明显小于原始变量值之间的变异。,2019/4/19,8,海南医学院卫生统计学教研室,一、抽样误差的概念 由于抽样造成的样本统计量与总体参数的差异及样本统计量之间的差异称为抽样误差。 对于抽样研究, 抽样误差不可避免,但有规律可循。,2019/4/19,9,海南医学院卫生统计学教研室,2019/4/19,10,海南医学院卫生统计学教研室,2

4、019/4/19,11,海南医学院卫生统计学教研室,数理统计的中心极限定理,从正态分布N(,2)中,以固定n抽取样本,样本均数的分布仍服从正态分布; 样本均数的总体均数仍为,样本均数的标准差为 。 即使是从偏态分布总体抽样,只要n足够大(n 50),样本均数的分布也近似正态分布N(,2/n) ;,2019/4/19,12,海南医学院卫生统计学教研室,均数的标准误,均数的标准误(standard error of mean,SEM或SE) : 样本均数的标准差,通称为均数的标准误。 符号: 计算: 意义:反映均数抽样误差大小; 它反映了样本均数之间的离散程度。 (区别于标准差),2019/4/1

5、9,13,海南医学院卫生统计学教研室,1、均数标准误的大小与原变量的标准差成正比; 说明当总体中观测值变异较小时,抽到的样本均数与总体均数可能相差较小,估计总体均数可靠程度高。,影响均数标准误大小的因素,2、与样本含量n的平方根成反比; 在同一总体中随机抽样,样本含量n越大,抽样误差越小。所以可通过增加样本含量n来减小样本均数的标准误,从而降低抽样误差。,2019/4/19,14,海南医学院卫生统计学教研室,例 2000年某研究者调查某地健康成年男子27人,得到血红蛋白的平均数为X=125g/L,标准差为S=15g/L。试估计该样本平均数的抽样误差。,2019/4/19,15,海南医学院卫生统

6、计学教研室,二、样本频率的抽样分布与抽样误差 统计实验5-3:口袋中装有黑、白两种小球。其中黑球的比例为20%。每次有返回的摸出50个球作为一个样本,计算黑球的百分比即样本频率p p =黑球数/50 每次摸出黑球的比例p服从二项分布,表示为: p B(n,), 给定n=50, =0.20. 共抽取100个样本,计算黑球的比例,p1,p2,p100.结果见表5-3。,2019/4/19,16,海南医学院卫生统计学教研室,100个样本的黑球频率的频数分布(直方图),(%),2019/4/19,17,海南医学院卫生统计学教研室,样本频率p=X/n的理论值为总体概率 样本频率的标准差即标准误:,总体概

7、率 未知时,由样本率p近似代替,2019/4/19,18,海南医学院卫生统计学教研室,例5-1 某研究组随机调查了50岁以上中老年妇女776人,其中患骨质疏松症者322人。患病率为p=41.5%. 试估计:该样本频率的抽样误差。 已知:p=41.5%,n=776,代入公式(5-4)得到标准误估计值:,标准误的估计值较小,说明用样本患病率41.5%估计总体患病率的可靠性较好。,2019/4/19,19,海南医学院卫生统计学教研室,标准差与均数标准误的区别,2019/4/19,20,海南医学院卫生统计学教研室,第二节 t 分布,总体,样本均数,中心极限定理,标准正态分布,变量变换,未知,原因:是一

8、个固定值,而S是随样本而变动,Z,Z,已知,2019/4/19,21,海南医学院卫生统计学教研室,t 分布的由来,英国统计学家W.S.Gosset于1908年以“Student”笔名发表论文,证明在正态总体中抽样, 服 从自由度 = n1的t分布,即 t 分布, =n1 又称Student t分布(Students t-distribution)。 t分布是总体均数的区间估计和假设检验的理论基础。,2019/4/19,22,海南医学院卫生统计学教研室,从13岁女学生身高这个正态总体中分别做样本量为n=3和n=50的随机抽样. 各抽取1000份样本,并分别得到1000个样本均数、与之对应的100

9、0个标准误。 对其分别作t变换,得到1000个t值。用t值绘制的直方图。,二、t分布的图形:,t,t,2019/4/19,23,海南医学院卫生统计学教研室,t 分布图形不是一条曲线,而是一簇曲线。 t 分布只有一个参数,即,2019/4/19,24,海南医学院卫生统计学教研室,t 分布图形的特征,单峰分布,以0为中心,左右对称 越小,t值越分散,曲线越低平,尾部越高,两侧越分散; 随着 逐渐增大,t分布逐渐逼近标准正态分布;当 趋于时,t分布就完全成为标准正态分布。,2019/4/19,25,海南医学院卫生统计学教研室,t,尾侧概率P=0.05,尾侧概率P=0.05,一般而言,t值相同时,t

10、分布的尾侧部分的面积大于标准正态分布的尾侧部分的面积。,0,-t,+t,2019/4/19,26,海南医学院卫生统计学教研室,2019/4/19,27,海南医学院卫生统计学教研室,t界值表(附表2-p459)的应用,横标目:自由度 纵标目:概率P(尾部面积)。 t 临界值:表中数字表示当 和P 确定时,对应的t值。 附表2只列出正值,若计算的t值为负值时,可用其绝对值查表 。 单侧概率临界值 :用t,表示(one-tailed probability) 双侧概率临界值 :用t/2,表示(two-tailed probability),2019/4/19,28,海南医学院卫生统计学教研室,当=1

11、6、P=0.05时: 单侧概率临界t值为:t0.05, 16= 1.746, 双侧概率临界t值为:t0.05/2, 16= 2.120,练习,2019/4/19,29,海南医学院卫生统计学教研室,t分布,更一般的表示方法如图 6-5(a)和(b)中阴影部分所示为: 单侧:P(t t, )= 和 P(t t, )= 双侧:P(t t/2, )P(t t/2, )=,单侧,双侧,2019/4/19,30,海南医学院卫生统计学教研室,t分布尾部面积的特点,自由度相同时,t值越大,尾部概率P越小; 一定, t值相同时,双侧尾部概率是单侧尾部概率的2倍;t0.10/2,16 = t0.05,16 =1.

12、746;,2019/4/19,31,海南医学院卫生统计学教研室,t分布与标准正态分布相比有以下特征: 1、两者都是单峰分布,以0为中心,左右对称。 2、t分布的峰部较矮而尾部翘得较高,随着自由度的增加,t分布逐渐逼近正态分布,当=时,t分布就完全等于标准正态分布。 3、标准正态分布有两个固定常数(0,1),t分布只有一个参数 。,2019/4/19,32,海南医学院卫生统计学教研室,练习: 1、10,双侧尾部面积为0.05的t界值是? 2、100,单侧尾部面积为0.05的t界值是? 3、,双测尾部面积和单侧尾部面积分别为0.05的界值是?,2019/4/19,33,海南医学院卫生统计学教研室,

13、1、t 0.05/2,102.228 2、t 0.05,1001.660 3、t 0.05/2, 1.96, t 0.05, 1.645,2019/4/19,34,海南医学院卫生统计学教研室,第三节 总体均数及总体概率的估计,统计推断 参数估计 (样本统计量推断总体参数 ) 假设检验 一、参数估计 常用的估计方式有两种: 1、 点估计(point estimation) 2、 区间估计(interval estimation),2019/4/19,35,海南医学院卫生统计学教研室,点估计(point estimation),点估计:直接利用样本统计量的一个数值来估计总体参数。(如s估计 ) 例

14、:在某地随机抽查成年男子140人,计算得红细胞均数4.771012/L,(假设总体均数为4.751012/L ) 标准差0.38 1012/L , 试估计该地成年男子红细胞的总体均数? 答:该地成年男子红细胞的总体均数为4.771012/L 。 优点:思维朴素、方法简单; 缺点:没有考虑抽样误差,难以反映参数的估计值对其真值的代表性(即两者之间差距),无法评价参数估计的准确程度。 特点:估计的精度高但可信度低,2019/4/19,36,海南医学院卫生统计学教研室,(二)区间估计(interval estimation),区间估计:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参

15、数的范围,这种估计方法叫做区间估计。 置信度:预先给定的概率(1)称为可信度或置信度(confidence level),常取95%或99%。 记为100(1)%或(1), 值由研究者预先规定,一般取0.1,0.05,0.01,常取0.05; 置信区间(confidence interval,CI):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的可信区间或置信区间; (上限,下限)开区间,2019/4/19,37,海南医学院卫生统计学教研室,实际工作中,如无特殊说明,一般作双侧置信区间的估计。 必要时,也可进行单侧区间估计。 在报告参数估计的结果

16、时,应同时给出点估计值和置信区间。,2019/4/19,38,海南医学院卫生统计学教研室,例 试计算例中该地成年男子红细胞总体均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计算可信区间。因为 ,则95%可信区间为: 估计该地成年男子红细胞的总体均数的95%可信区间为( 4.711012/ L , 4.831012/ L )。,下限:,上限:,举例,2019/4/19,39,海南医学院卫生统计学教研室,可信区间的构成:(可信下限,可信上限) 总体均数估计的95%置信区间的含义: 如果重复100次抽样,每次样本含量均为n,算得100个置信区间,则平均有95个可信区间包括 (估计正确),只有5个区间不包括 (估计

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号