第二章 正态分布课件

上传人:我*** 文档编号:141069624 上传时间:2020-08-04 格式:PPT 页数:65 大小:724.50KB
返回 下载 相关 举报
第二章 正态分布课件_第1页
第1页 / 共65页
第二章 正态分布课件_第2页
第2页 / 共65页
第二章 正态分布课件_第3页
第3页 / 共65页
第二章 正态分布课件_第4页
第4页 / 共65页
第二章 正态分布课件_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《第二章 正态分布课件》由会员分享,可在线阅读,更多相关《第二章 正态分布课件(65页珍藏版)》请在金锄头文库上搜索。

1、医学统计方法 Medical Statistics,第 二 章 数值变量资料的统计描述 公共卫生学系 田玉慧,复习,总体与样本 平均数与标准差 各种平均数的应用条件 离散指标 标准差的应用,一、正态分布的概念和特征 二、正态分布曲线下面积分布规律 三、标准正态分布 四、正态分布的应用 (一)制定医学参考值范围 (二)正态分布是许多统计方法的理论基础 (三)质量控制,9.正态分布及其应用,一、正态分布(normal distribution),图2-4 频数分布与正态分布曲线示意图,f(X),一、正态分布(normal distribution),正态分布是数理统计学中最重要的理论分布。医学中许

2、多现象如身高、体重、血压、红细胞数等的频数分布服从正态分布,或近似于正态分布,或经过数据转换可使其符合正态分布。即使是偏态分布的资料,当样本量很大时,也可以近似地用正态分布来处理。,一、正态分布(normal distribution),正态分布以均数所在处频数最多,两侧逐渐减少,但永不为零,左右完全对称。其图形为近似钟形。 正态分布的表示方法为N(,2)。其中为均数,是正态分布的位置参数;2是方差,反映了正态分布的形态。有了这两个参数,即可绘制出正态分布的图形。,一、正态分布(normal distribution),如果以总频数为1,当变量值为x时的频数可用下式求得:,一、正态分布(nor

3、mal distribution),例 设某地成年男性身高的均数为170cm,标准差为7cm,成年女性身高的均数为165cm,标准差为5cm,均符合正态分布。试绘制频数分布图并比较二者的异同。 按上式计算x取不同值时的理论频数,结果见下表。,正态分布频数计算表,一、正态分布(normal distribution),将表中频数绘制成频数分布图,图2-5 正态分布参数位置变化示意图,实例,例1:中国成年人平均身高() 男性=1.7米,女性=1.59米 例2:正常人平均舒张压值 =80(mmhg) 高血压病平均舒张压值 =100 (mmhg ),图2-6 正态分布变异度不同变化示意图,一、正态分布

4、(normal distribution),男女身高的频数分布图形的比较: 1.共同点: 男女在不同身高的频数分布均为完全对称的钟形分布,以均数所在处频数最多,两侧逐渐减少。 2.不同点: 位置不同,男性身高的均数大于女性,故图形靠右; 高低不同,男性身高的方差大于女性,故变量值更分散,图形更低平。,医学上脑血管疾病的问题,临床发现脑中风病人在脑血流图(CBF)指标偏低,正常人的CBF平均为75,标准差为17,如CBF低于40,认为有中风的危险。 如用CBF低于40为界限,问一个脑血流图正常(无中风)被错误诊断中风的概率为多少? 求:p(x40)的概率。,二、正态分布曲线下的面积,如果以曲线下

5、的总面积为1,则从-至x的面积可用下列积分公式求得: 按上式求得的F(x)即当随机变量X取值范围为-x时所对应的正态曲线下的面积占总面积的比例,F(x)实际上反映了随机变量X取值范围为-x的概率大小,因此,称该正态分布为随机变量X的概率分布。,二、正态分布曲线下的面积,例 设某地成年男性身高的均数为170cm,标准差为7cm,假设该地共有成年男性10 000人,求该地身高不超过160cm者有多少人?又该地身高在160cm180cm之间者共有多少人?,正态分布曲线下面积的计算,二、正态分布曲线下的面积,即: 身高不超过160cm的人数为: 10 0000.0764=764(人) 身高在160cm

6、180cm之间的人数为: 10 000(0.9236-0.0764) = 10 0000.8472= 8 472(人),三、标准正态分布,由于不同随机变量的概率分布不同,要求得随机变量X取值范围为-至x的概率需要经过繁琐的计算,从而给实际应用带来困难。 如果将任一正态分布转化为同一个分布,则使问题大大简化。不同正态分布的差别在于其均数和标准差不同,如果把原来的随机变量值用相对数值表示,就可以解决这一问题。,三、标准正态分布,将各变量值的离均差与标准差比较,即离均差是标准差的多少倍,此值称标准单位(u),即该变量值在平均数之上或之下多少个标准差。 例如,如果某成年男性的身高为177cm,则离均差

7、=177-170=7(cm),恰好等于标准差,其标准单位值为1,即超过均数1个标准差。又如某成年男性的身高为156cm,其标准单位值为-2,即低于均数2个标准差。,三、标准正态分布,对于任一正态分布N(,2)作下列u变换: 则u值的分布为均数为0,标准差为1的正态分布,即标准正态分布(standard normal distribution)。 由于正态分布以均数所在处频数最多,两侧逐渐减少,左右完全对称,故u值的均数为0。又由于以原变量值的标准差为单位,故u值的标准差为1,三、标准正态分布,u值的分布图形为近似钟形。如果以总频数为1,不同u值时的频数(相当于概率)可用下式求得: 如果以曲线下

8、的总面积为1,则从-至u的面积可用下列积分公式求得:,标准正态分布u 值所对应的概率和曲线下的面积,三、标准正态分布,由于标准正态分布只有唯一的1条曲线,我们可以把从-至u取不同值时所对应的曲线的面积求出,列成表格(见表9-8 标准正态分布曲线下的面积),这样我们就不需要面积的积分公式,避免了繁琐的计算过程,从而能够比较轻松地解决正态分布的问题。,三、标准正态分布,例 设某地成年男性身高的均数为170cm,标准差为7cm,假设该地共有成年男性10 000人,求该地身高不超过160cm者有多少人?又该地身高在160cm180cm之间者共有多少人? 对于本例的问题,采用标准正态分布来解决就简单多了

9、。 首先,计算x1=160cm和x2=180cm时的u值:,标准正态分布曲线下面积的计算,三、标准正态分布,查表9-8(标准正态分布曲线下的面积)得: (-1.43)=0.0764 身高不超过160cm的人数=10 0000.0764=764(人) 由于标准正态分布左右完全对称,因此: (u)=1-(-u) (1.43)=1-0.0764=0.9236 从u1至u2所对应的曲线下的面积=1-2(-u) 故身高在160cm180cm之间的人数为: 10 000(1-20.0764)=8472(人),正态分布的特征,正态曲线在横轴上方,且以均数所在处最高;越远离中心,曲线越接近X轴,曲线下的面积越

10、小。 正态分布以均数为中心,左右对称;X取值范围为-X, X离越远, f(X)越小,但不会等于0。,正态分布的特征,正态分布有两个参数: (位置参数):决定曲线在X轴上的位置(见图3-3)。 (变异参数):决定曲线的形态(见图3-4)。,正态分布的特征,正态分布曲线下的面积有一定规律 (见图3-2)。,占95%的面积,即包含95% 的变量值,占99%的面积,即包含99% 的变量值,占68.27%的面积,即包含68.27%的变量值,u= ( -1.96,1.96)区间内面积,同理:u=(-2.58,2.58)区间的面积为0.99 例3:如规定尾部面积各为5%时,其对应的u值为多少? 解: u=1

11、.65,u0.05/2=1.96 (双侧) u0.01/2=2.58(双侧) u0.05=1.64 (单侧) u0.01=2.33(单侧),统计中常用尾部面积为的u值,记 ,称为u界值。,表2-7 u界值表,变量值分布 单侧 双侧 范围(%) u值 u值 80 0.84 1.28 90 1.28 1.64 95 1.64 1.96 99 2.33 2.58,变量值分布的范围表达,X占的百分比(%),68.27,95.00,99.00,任意正态分布变量值(X)理论上分布规律,医学常用的三个X 分布范围及u界值,(1)X值分布范围,四、正态分布的应用,(一)估计频数分布 (二)制定参考值范围 (三

12、)质量控制 (四)正态分布是许多统计方法的理论基础,四、正态分布的应用,(三)利用正态分布进行质量控制 由于随机测量误差的分布符合以0为中心的正态分布,假如对同一份样品采用同样的方法多次重复测定同一个指标,则所有测量值的分布符合以真实值为中心的正态分布。,实验室检测质量控制,在实验室检测质量控制中,通常以 作为上下警戒值,以 作为上下控制值。这里2s和3s分别作为1.96s和2.58s的近似值。如果某个测量值超出了警戒值,该值与真实值之差仅由随机测量误差所致的可能性小于5%,这时需要对仪器、试剂等进行检查和校正,以消除可能导致系统误差的因素。如果某个测量值超出了控制线,该值与真实值之差仅由随机

13、测量误差所致的可能性小于1%(具体地说是0.26%),可以认为存在系统误差,该测量值应当舍弃。,实验室检测质量控制,质量控制图 (示意),实验室检测质量控制,临床实验室检测的质量控制也可以采用正常值均数质控图来进行。以血糖测定为例,根据大量正常血糖测量值计算得: =5.10 mmol/L,s =0.51 mmol/L,并绘制质控图。然后,在每天工作结束时,从当天测量结果在正常范围内的测量值中连续抄录510个值并计算均数,观察该均数是否超出警戒线或控制线。,实验室检测质量控制,血糖测定的正常值均数质控图,四、正态分布的应用,(四)正态分布是许多统计方法的理论基础 1.其它一些分布在一定条件下也可

14、以按正态分布做近似计算。如二项分布、泊松分布的极限形式就是正态分布。 2.统计学中一些分布就是由正态分布推导出的,如统计学中常用的三大分布2分布、t 分布、F分布等。 3.许多资料都可经过转换成近似正态分布,10、正常值范围,一、正常值的意义和制定步骤 正常参考值范围(normal reference ranges)是指正常人群中一些解剖、生理、生化指标及组织代谢产物含量等数据的正常波动范围 。 个体差异 生理变异,二、医学参考值制定时注意问题 1.确定诊断指标为“定性”或“定量” 2.计量数据要确定其分布(正态或偏态) 3.计量资料考虑制定单侧诊断界值还是双侧诊断界值 4.有足够的样本例数(

15、一般不低于100例),1.从正常人总体中随机抽样 这里的“正常人”并非是指没有任何疾病的人,只要排除那些对所研究指标有影响的疾病或有关因素的人即可。例如,制定血压正常值范围时,应将高血压病人及相关疾病的患者排除于研究对象之外,同时,研究对象在研究期间内不能有对血压有影响的因素,如情绪激动、大量运动等,也不能服用对血压有影响的药物。 另外,样本量要足够,每个人群组在100例以上。,2.控制测量误差 测量方法、仪器、试剂、精密度、操作熟练程度等应统一。 一般应选用测量结果准确、可靠,并能为大多数医疗单位采用的检测仪器或方法。,3.明确所研究指标的总体分布: (1)是否正态分布:正态检验 (2)是否

16、通过数据转换后成为近似正态分布 (3)是否需要分组制定参考值范围,如男女红细胞分布不同, (4)再考虑其它方法:偏态时,用百分位数,4.确定采用单侧界值还是双侧界值 如果该指标升高或降低均有病理学意义,则需要制定双侧界值,如红细胞数、白细胞数等; 如果该指标升高时有病理学意义,而降低时无意义,只需要制定一个正常值上限,如尿铅值; 如果该指标降低时有病理学意义,而升高时无意义,只需要制定一个正常值下限,如肺活量。,5.选定适当的百分界限 即确定发生错误的概率()。一般取=0.05,即95%正常值范围,该范围将包含95%的正常观察值,也就是说有5%的正常观察值将被排除于该范围之外。 如果临床上要求尽量减少误诊,则应取较高的百分界限,如95%或99%;如果临床上要求尽量减少漏诊,则应取较低的百分界限,如90%或80%。,三、正常值

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号