05正态分布教学案例

上传人:yulij****0329 文档编号:141364643 上传时间:2020-08-07 格式:PPT 页数:37 大小:876KB
返回 下载 相关 举报
05正态分布教学案例_第1页
第1页 / 共37页
05正态分布教学案例_第2页
第2页 / 共37页
05正态分布教学案例_第3页
第3页 / 共37页
05正态分布教学案例_第4页
第4页 / 共37页
05正态分布教学案例_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《05正态分布教学案例》由会员分享,可在线阅读,更多相关《05正态分布教学案例(37页珍藏版)》请在金锄头文库上搜索。

1、正态分布及其应用,Normal distribution and its applications 统计学中最重要的理论分布之一,主要内容(Content),正态分布的概念及图形 正态分布的特征 正态分布曲线下面积的规律 标准正态分布 正态分布的应用,正态曲线,正态曲线是由德国的机会数学家 Abraham de Moivre 在 1733 年时提出的。 正态曲线的形状像一个古式的座钟,中间 高,两端低平,无限延伸与横轴相近而不相 交。,正态分布,在1870 年时,德国数学家 Gauss 发现,许多 频数表资料用频数分布图表示时有正态曲线的 形状。,图3-1 某地成年男子红细胞数的频数分布图,正

2、态分布,图3-1 某地成年男子红细胞数的分布逐渐接近正态分布示意图,正态分布,因而人们将频数分布图的形状是正态曲线的 随机变量称为是服从正态分布的随机变量。 也就是说,某地成年男子的红细胞数是服从 正态分布的。以x表示红细胞数量,则x是服从 正态分布的随机变量。,正态分布,正态曲线的特征,(1)以 为中心左右完全对称的单峰钟形曲线; (2)曲线最高峰处对应横轴上的数值是 ,曲 线两尾沿 X 轴左右延伸,越远离 的 x ,y 值越小; (3)整条正态分布曲线与横轴所围成的面积等 于1;,(4)正态分布在横轴上的位置由 决定; 例如,当1 0时,对应于 1的正态分布必定在对应于0的正态分布右边:,

3、正态曲线的特征,(5)决定分布的形状,当大时,整个分布在横轴 上拉得很开,曲线是“矮胖”型,当小时,整个分布 在横轴上比较收缩,曲线是“瘦高”型; 例如, 相同而不同的两个正态分布 ( 0 1 ),正态分布的特征,方差相等、均数不等的正态分布图示,均数相等、方差不等的正态分布图示,1,二、正态曲线下面积的分布规律,对任意一个服从正态分布的随机变量,可作如下标准化变换, 经此变换, Z服从总体均数为0,总体标准差为1的正态分布。 记为N(0,1)。 标准正态分布是一条曲线。,(- u +),正态曲线下的面积规律,X轴与正态曲线所夹面积恒等于1 。 对称区域面积相等。,S(-, -X),S( +X

4、,)S(-, -X),正态曲线下的面积规律,对称区域面积相等。,S( -x1, -x2),-x1 -x2 +x2 + x1,S( -x1, -x2)= S( +x1, +x2),正态曲线下的面积规律,正态曲线下面积总和为1; 正态曲线关于均数对称;对称的区域内面积相等; -1.64 +1.64内面积为90%; -1.96 +1.96内面积为95%; -2.58 +2.58内面积为99%。,例:某地1986年120名8岁男孩身高均数123.02cm, 标准差为4.79cm,试估计: 1)该地8岁男孩身高在130cm以上者占该地8岁男孩 总数的百分比; 2)身高在120-128cm者占该地8岁男孩

5、总数的百分 比; 3) 该地80%的男孩身高集中在哪个位置?,总结,正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一; 正态分布是一簇分布,由两个参数决定:均数和标准差; 正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应。,二、正态分布的应用,估计变量值的频数分布 制定参考值范围 质量控制 正态分布是很多统计方法的基础,估计频数分布,某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。 首先标准正态变换: 查标准正态分布表: (-1.86)=0.0314 结果:估计低体重儿的比例为3.

6、14%.,基本概念 通常指特定的“正常人群”(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化、免疫及组织代谢产物含量等数据中大多数个体的取值所在范围。,医学参考值范围,确定95%参考值范围示意图,参考值范围的确定,参考值范围: (1)大多数“正常人”的取值范围 “大多数”:90%、95% or 99% “正常人”:必须明确定义 (2)由大样本来确定(一般要求n100) (3)可以用作诊断标准吗?,例如,制定SGPT(谷丙转氨酶)正常值范围,“正常人”的条件是: a. 无肝、肾、心、脑、肌肉等疾患; b. 近期无服用损肝的药物(如氯丙嗪,异烟肼) c. 测定前未做剧烈运动

7、。,1、若变量服从正态分布 根据正态分布的性质,1.96覆盖95%的“正常人” 然而, 、通常是未知的,我们经常用x、s代替 因此,参考值范围: X1.96s,2、若变量不服从正态分布 采用百分位数法:找出百分位数P2.5和百分位数P97.5 因此双侧参考值范围: ( P2.5 , P97.5 ) -该法适用于任何分布类型的资料。,决定取单侧范围还是双侧范围值 有些指标如白细胞数过高或过低均属异常(a) ,故 其参考值范围需要分别确定下限和上限,称作双侧。有些 指标如24小时尿糖含量仅在过高(b)、肺活量仅在过低时 为异常(c),只需确定其上限或下限,称作单侧参考值范 围。,(a)白细胞数参考

8、值范围,(b)24小时尿糖参考值范围,(c)肺活量参考值范围,某地调查了200名成年女子的平均血清总蛋白为73.5(g/L),标准差3.9(g/L),试估计该地成年女子血清总蛋白95的参考值范围。 由得95参考值范围: 下限: 1.96s=73.51.963.9=65.9(g/L) 上限: 1.96s=73.51.963.9=81.1(g/L) 此可作为判断该地区成年女子血清总蛋白含量正常与否的参考值。,注意 1、95%参考值范围只告诉我们:95%健康人的数值在此范围内; 2、若某人的数值在此范围内,我们能宣布其为“正常”吗? 3、若某人的数值在此范围外,我们能宣布其为“不正常”吗? -参考值

9、范围不可以作诊断指标!,4、选定适当的百分范围:绝大多数人,一般80%、90%、95%、99%等。,结合正常人和异常人分布,根据应用目的: 减少误诊:取较大范围; 减少漏诊:取较小范围;,如主要目的是减少假阳性(如用于确诊病人或选定科研病例),宁取99%。 如主要目的是减少假阴性(如用于初筛搜查病人),宁取80%或90%。,5. 选用适当的方法进行估计- 根据分布类型 正态分布法:(近似)正态分布或对数正态分布资料 百分位数法:偏态分布资料; 分布类型不清资料; 开口资料,双侧95%参考值范围: X 1.96S 单侧95%参考值范围: X - 1.645S (下限),(1)正态分布法,双侧95

10、%正常值范围为P2.5P97.5, 单侧95%正常值为 P5(下限)。,(2)百分位数法:,例:计算340名7岁以下男童血铅的95%参考值范围。 由于340名男童的血铅值属于偏态分布,可用百分位数法计算参考值范围; 由于血铅过高属异常,应采用单侧上限作为制定的界限; 应计算P95 。 P95 =2.54 (umol/L),所以该市7岁以下男童血铅的95%参考值范围为(0-2.54) (umol/L)。,3. 质量控制,血清尿酸测定值,4. 正态分布是很多统计方法的基础,后面各章讨论的许多统计方法都要求服从正态分布; 非正态分布的资料 变量变换,使得近似服从正态分布;,小结:,参考值范围的含义 选择适当的方法计算参考值范围,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号