最新医学统计学李琳琳9参数估计ppt课件

上传人:新** 文档编号:571497639 上传时间:2024-08-11 格式:PPT 页数:58 大小:1.08MB
返回 下载 相关 举报
最新医学统计学李琳琳9参数估计ppt课件_第1页
第1页 / 共58页
最新医学统计学李琳琳9参数估计ppt课件_第2页
第2页 / 共58页
最新医学统计学李琳琳9参数估计ppt课件_第3页
第3页 / 共58页
最新医学统计学李琳琳9参数估计ppt课件_第4页
第4页 / 共58页
最新医学统计学李琳琳9参数估计ppt课件_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《最新医学统计学李琳琳9参数估计ppt课件》由会员分享,可在线阅读,更多相关《最新医学统计学李琳琳9参数估计ppt课件(58页珍藏版)》请在金锄头文库上搜索。

1、医学统计学(李琳琳)医学统计学(李琳琳)2014-9 2014-9 参数估计参数估计 统计推断是统计学学习的主要任务之一,期间,经常会采用抽样调查的方法。抽样调查的目的不在于了解部分单位的情况,只是作为一种手段,从而认识总体的数量特征。引 言 借助于电脑模拟实验,研究样本均数的抽样分布。以样本均数作为一个新的变量,借助于频数分布图来看看样本均数的分布特征。【抽样分布】图5-1 100个样本均数的频数分布图以样本均数作为随机变量,有以下特点:(1)各样本均数未必等于总体均数。(2)样本均数之间存在差异。(3)样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称。(4)样本均数的变

2、异范围较之原变量的变异范围大大缩小。 数理统计研究表明,抽样误差具有一定的规律性,可以用特定的指标来描述。样本均数的标准差(简称标准误标准误,standard error, SE)是描述均数的抽样误差大小的指标。 标准误的概念标准误的理论值标准误的理论值的估计值标准误的计算s抽样误差抽样误差n抽样误差抽样误差 前提前提: :无限总体完全随机抽样【例5-1】随机抽取了60名成年男性,得到其脉搏均数为72次/分,标准差为5.8次/分,试计算其抽样误差。=0.75(次/分)中心极限定理中心极限定理 . 从正态分布资料中,随机抽取例数n的样本,其样本均数也服从正态分布;当n足够大时(n50),从偏态总

3、体中抽样,其均数也近似于正态分布。 2. 从正态分布资料中,随机抽取例数n的样本,其样本均数的总体均数也为,其标准差为。 = 50= 50= 50 =10=10=10总体分布总体分布总体分布总体分布总体分布总体分布n n = 4 = 4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布Xn n =16 =16当样本含量足够当样本含量足够大时大时( (n n 550) 0) ,样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布偏态分偏态分布总体布总体X X标准误的用途标准误的用途1.衡量样本均数的可靠性 由于均数标准误越小,均数的抽样误差越小,样本均数就越可靠。2.估计总体均数的

4、置信区间。3.用于均数的假设检验。标准误和标准差的区别与联系 t t分布的概念分布的概念 对于正态变量X N(, 2)N(0, 1)抽出无数个样本含量为n的样本随机抽样均数均数标准差为标准差为 如果我们从一个总体中抽取无数个样本含量n足够大的样本,样本均数的分布服从正态分布:均数均数标准差为标准差为 若未知,人们只能用S代替,从而以 代替 ,显然 ,它不再服从标准正态分布。 W.S.Gosett于1908年用笔名student研究了它的分布规律,称之为t分布。 n-1Z分布t分布图2 不同自由度的t分布曲线 1. t分布是一簇曲线。 t分布有一个参数 。2. t分布曲线以0为中心,左右对称;

5、越小,曲线越扁平。3. t分布曲线较标准正态曲线要扁平些, 逐渐增大, t分布曲线逐渐的逼近于标准正态曲线,若,则t分布曲线和标准正态曲线完全吻合。4. t分布曲线下的面积分布有一定规律(P380)。 t t分布图形的特点分布图形的特点图5-3 自由度等于20时的t分布曲线2.086-2.086单侧概率的单侧概率的t t 临界值临界值,记作,记作t t( (, ) )双侧概率的双侧概率的t t 临界值临界值,记作,记作t t( (/2, ) ) 参数估计:用样本统计量来估计总体参数。 点值估计点值估计:不计抽样误差,直接用样本均数来估计。 区间估计区间估计:根据抽样误差的规律,按一定的概率估计

6、总体均数的所在范围。统计上习惯用95%或99%可信区间表示总体均数可能所在范围。置信区间样本统计量样本统计量样本统计量样本统计量 ( (点估计点估计点估计点估计) )置信区间置信区间置信区间置信区间下限下限下限下限上限上限上限上限置信限与置信区间 置信限是指置信区间的下限和上限,即可置信区间的两个端点值。 置信区间指以上、下可信限为界的一个范围。如的1-可信区间指一个范围,该范围包含在内的可能性为1-,不包含在内的可能性为。常用的可信区间为95%和99% 。 总体均数的95%置信区间表示的实际涵义是:如果从同一总体中重复抽取100份样本含量相同的独立样本,每份样本分别计算1个置信区间,在100

7、个置信区间中,将大约有95个置信区间覆盖总体均数,5个置信区间不覆盖总体均数。 通常情况下,我们只进行一次抽样,对于某一次估计的置信区间,我们总是宣称这个区间覆盖了总体均数,但不一定是真的覆盖了总体均数,于是,我们补充一句:置信水平为95%。 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1- )%)%区间包含了区间包含了区间包含了区间包含了 %的区间未包含的区间未包含的区间未包含的区间未包含 1-1-a a a aa a a a/ /2 2a a a a/ /2 2 总体均数总体均数的区间估计:的区间估计:正态分布法正态分布法1. 1. 已知已知2. 2. 未知,但未知,但

8、n5050时时 t t 分布法分布法未知,且未知,且n5050时:时:Z Z分布:分布:置信区间:置信区间:t t = =t t分布:分布:置信区间:置信区间:(一)正态分布法(一)正态分布法适用条件:已知或未知但n较大时(n50) x_X95%95%的样本的样本的样本的样本99%99%的样本的样本的样本的样本 例 在郑州市随机抽取了100名成年男性,测得其血清胆固醇含量为192.5mg/dl,标准差为28.6mg/dl,试估计郑州市成年男性血清胆固醇总体均数的95%置信区间。郑州市成年男性血清胆固醇总体均数的95%置信区间为(186.9,198.1)mg/dl。(二)t分布法 适用条件:未知

9、且n较小时(n 50 50 ) 【例5-3】已知某地25名成年女性腰围均数为77.8cm,标准差为9.2 cm,试计算该地成年女性腰围均数的95%和99%置信区间。区别点区别点 均数的置信区间 参考值范围意义 包含总体均数的可 “正常人”的解剖、生理 能范围 生化指标的波动范围计算公式用途 估计总体均数 判断观察对象的某 项指标是否正常置信区间与医学参考值范围不同置信区间与医学参考值范围不同 率的抽样误差:从同一总体中随机抽取样本含量相同的若干个样本,各样本率之间不完全相同,这些样本率间的差异,同时反映了样本率与总体率之间的差异,这种由抽样造这种由抽样造成的样本率与总体率的差异称为成的样本率与

10、总体率的差异称为率的抽样误率的抽样误差差。 标准误:衡量率的抽样误差大小的指标是率的标准误(率的标准误( p p ) )。率的标准误越小,率的抽样误差越小,用样本率估计总体率的可靠性越好,反之亦然。 3 率的标准误的计算: 实际工作中,由于往往是未知的,可用样本率p作的估计值,计算率的标准误的估计值。 4 率的标准误的用途(1)衡量样本率的抽样误差的大小;(2)估计总体率的可信区间;(3)检验样本率间差异的显著性。 总体率的估计有点(值)估计和区间估计,点估计是简单地用样本率来估计总体率;区间估计是求出总体率的可能范围。样本率的理论分布和样本含量n、阳性率p的大小有关,所以需要根据n和p的大小

11、不同,分别选用下列两种方法: 查表法:当样本含量n较小,如n50,特别是p很接近于0或1时,可直接根据样本含量n和阳性数X查出总体率的可信区间。 例 2003年4-6月某医院重症监护病房收治重症SARS患者38人,其中死亡12人,求SARS病死率的95%置信区间。 查百分率的可信区间(P393),在n=38和X=12的交叉点处下、上限界值为18和49。 SARS病死率的95%置信区间18%49%。 由于附表百分率的可信区间中X值只列出了Xn/2的部分,当Xn/2时,应以n-X 查表,再从100中减去查得的数值即为所求置信区间。 正态分布法: n50 np5 n(1- p) 5 【例5-7】为了解中老年人高血压的患病情况,某研究人员在某市随机调查了年龄在40岁以上的居民共2500人,检查出高血压患者800人,估计该市中老年人高血压患病率的95%置信区间。即该市中老年人高血压患病率的95%置信区间为(30.2%,33.8%)。THANKYOU!结束语结束语谢谢大家聆听!谢谢大家聆听!58

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号