常用概率分布年版课件

上传人:des****85 文档编号:324064151 上传时间:2022-07-12 格式:PPT 页数:62 大小:973.50KB
返回 下载 相关 举报
常用概率分布年版课件_第1页
第1页 / 共62页
常用概率分布年版课件_第2页
第2页 / 共62页
常用概率分布年版课件_第3页
第3页 / 共62页
常用概率分布年版课件_第4页
第4页 / 共62页
常用概率分布年版课件_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《常用概率分布年版课件》由会员分享,可在线阅读,更多相关《常用概率分布年版课件(62页珍藏版)》请在金锄头文库上搜索。

1、2022/7/81中山大学公共卫生学院中山大学公共卫生学院医学统计与流行病学系医学统计与流行病学系张晋昕张晋昕2012.11.27第五章第五章常用概率分布常用概率分布2022/7/822022/7/83一、正态分布的概念一、正态分布的概念第四章第四章常用概率分布常用概率分布第三节第三节正态分布正态分布正态分布是自然界最常见的一种分布,正态分布是自然界最常见的一种分布,若指标若指标X的频率分布曲线对应于数学上的正态分布曲线,的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。则称该指标服从正态分布。2022/7/842022/7/852022/7/86正态分布的概率密度函数(即纵向

2、的曲线高度)正态分布的概率密度函数(即纵向的曲线高度)-X+2022/7/87均数为均数为0,标准差为,标准差为1的正态分布,这种正态分布的正态分布,这种正态分布称为称为标准正态分布标准正态分布。-Z+标准正态分布的密度函数:标准正态分布的密度函数:对于任意一个服从正态分布对于任意一个服从正态分布N(,2)的随机变量,的随机变量,可作如下的可作如下的标准化变换标准化变换,也称,也称Z变换变换,2022/7/88正态分布的特征正态分布的特征 1.关于关于对称。即正态分布以均数为中对称。即正态分布以均数为中心,左右对称。心,左右对称。2.在在处取得概率密度函数的最大值,处取得概率密度函数的最大值,

3、在在处有处有拐点拐点,表现为,表现为钟形曲线。即正钟形曲线。即正态曲线在横轴上方均数处最高。态曲线在横轴上方均数处最高。2022/7/893.正态分布有两个参数,即均数正态分布有两个参数,即均数和标准差和标准差。是是位置参数位置参数,是是变异度参数变异度参数(形状参数形状参数)。常用。常用N(,2)表示均数为表示均数为,标准差为,标准差为的正态分布;用的正态分布;用N(0,1)表示标准正态分布。表示标准正态分布。4.正态曲线下面积分布有一定规律。横轴上正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于正态曲线下的面积等于1(也常写作也常写作100%)。2022/7/810二、正态概率密度

4、曲线下的面积二、正态概率密度曲线下的面积正态方程的积分式正态方程的积分式(分布函数分布函数):F(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自到X的面积,即下侧累计面积。标准正态分布方程积分式标准正态分布方程积分式(分布函数分布函数):(Z)为标准正态变量 Z的累计分布函数,反映标准正态曲线下,横轴尺度自到Z的面积,即下侧累计面积。2022/7/8112022/7/812 用查表代替计算必须注意:1)表中曲线下面积为)表中曲线下面积为到到Z的面积。的面积。2)当当,和和X已知时已知时,先求出,先求出Z值,值,再用再用Z值查表,得所求区间占总面积的比例。值查表,得所求区间占总面积的

5、比例。当当和和未知时未知时,要用样本均数和样本标准差,要用样本均数和样本标准差S来估计来估计Z值。值。3)曲线下对称于)曲线下对称于0的区间,面积相等。的区间,面积相等。4)曲线下横轴上的面积为)曲线下横轴上的面积为1(即(即100%)。)。标准正态分布表标准正态分布表2022/7/813正态分布是一种对称分布,其对称轴为直线正态分布是一种对称分布,其对称轴为直线X=,即均数,即均数位置,理论上:位置,理论上:1范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的95%2.58范围内曲线下的面积占总面积的范围内曲线

6、下的面积占总面积的99%实际应用中实际应用中:1S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的95%2.58S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的99%2022/7/8142022/7/815标准正态分布的标准正态分布的=0,=1,则,则相当于区间相当于区间(-1,1),1.96相当于区间相当于区间(-1.96,1.96),2.58的区间相当于区间的区间相当于区间(-2.58,2.58)。区间区间(-1,1)的面积:的面积:1-2(-1)=1-20.1587=0.6826=68.26%

7、区间区间(-1.96,1.96)的面积:的面积:1-2(-1.96)=1-20.0250=0.9500=95.00%区间区间(-2.58,2.58)的面积:的面积:1-2(-2.58)=1-20.0049=0.9902=99.02%2022/7/816正态曲线下面积对称,则区间(正态曲线下面积对称,则区间(1.96,)的面积也是)的面积也是0.025。Z取值于(取值于(-1.96,1.96)的概率为)的概率为1-20.025=0.95,即,即X取值在区间取值在区间上的概率为上的概率为95%。例例4-11X服从均数为服从均数为,标准差为,标准差为的正态分的正态分布,试估计布,试估计(1)X取值在

8、区间取值在区间上的概率;上的概率;(2)X取值在区间取值在区间上的概率;上的概率;先做标准化变换:2022/7/817例例4-12已知某地已知某地1986年年120名名8岁男童身高均数岁男童身高均数,S=4.79cm,估计,估计(1)该地该地8岁男孩身高在岁男孩身高在130cm以上者占该地以上者占该地8岁岁男孩总数的百分比;男孩总数的百分比;(2)身高界于身高界于120cm128cm者占该地者占该地8岁男孩岁男孩总数的比例;总数的比例;(3)该地该地80%男孩身高集中在哪个范围?男孩身高集中在哪个范围?先做标准化变化先做标准化变化:理论上该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的

9、7.21%。2022/7/818(2)2022/7/819(3)查附表查附表1,标准正态分布曲线下左侧面积为,标准正态分布曲线下左侧面积为0.10所对应所对应的的Z值为值为-1.28,所以,所以80%的的8岁男孩身高值集中在岁男孩身高值集中在区间内,即区间内,即116.9cm129.2cm2022/7/8201.确定医学参考值范围确定医学参考值范围v参考值范围:指特定的参考值范围:指特定的“正常正常”人群的解剖、生理、生化、免人群的解剖、生理、生化、免疫等各种数据的波动范围。疫等各种数据的波动范围。v制定参考值范围的步骤:制定参考值范围的步骤:1.选择足够数量的正常人作为调查对象。选择足够数量

10、的正常人作为调查对象。2.样本含量足够大。样本含量足够大。3.确定取单侧还是取双侧正常值范围。确定取单侧还是取双侧正常值范围。4.选择适当的百分界限。选择适当的百分界限。5.选择适当的计算方法。选择适当的计算方法。三、三、正态分布的应用正态分布的应用2022/7/821v估计医学参考值范围的方法:估计医学参考值范围的方法:1.正态近似法正态近似法:适用于正态分布或近似正态分布的资料。:适用于正态分布或近似正态分布的资料。2.百分位数法百分位数法:适用于偏态分布资料。:适用于偏态分布资料。过低异常过低异常过低异常过低异常过低异常过低异常过低异常过低异常过高异常过高异常过高异常过高异常过高异常过高

11、异常过高异常过高异常2022/7/822例例4-13某地调查某地调查120名健康女性血红蛋白,直方图名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为显示,其分布近似于正态分布,得均数为117.4g/L,标,标准差为准差为10.2g/L,试估计该地正常女性血红蛋白的,试估计该地正常女性血红蛋白的95%医学参考值范围。医学参考值范围。分析:分析:正常人的血红蛋白过高过低均为异常,要制正常人的血红蛋白过高过低均为异常,要制定双侧正常值范围。定双侧正常值范围。该指标的该指标的95%医学参考值范围为医学参考值范围为2022/7/823例例4.13-A某年某市调查了某年某市调查了200例正常

12、成人血铅例正常成人血铅含量(含量(g/100g)如下,试估计该市成人血铅含量的如下,试估计该市成人血铅含量的95%医学参考值范围。医学参考值范围。2022/7/824 分析:血铅的分布为偏峰分布,且血铅含量只以分析:血铅的分布为偏峰分布,且血铅含量只以过高为异常,要用百分位数法制定单侧上限。过高为异常,要用百分位数法制定单侧上限。2022/7/8252、质量控制图、质量控制图 为了控制实验中的检测误差,常用 2S作上下警戒线,以 3S作为上下控制线。这里的2S和3S可视为1.96S 和2.58S的约数。其依据是正常情况下检测误差是服从正态分布的。2022/7/826第三节第三节 正态分布及其应

13、用正态分布及其应用判断异常的判断异常的8 8种情况是:种情况是:v有一个点距中心线的距离超过有一个点距中心线的距离超过3 3个标准差(控制限以外)个标准差(控制限以外)v在中心线的一侧连续有在中心线的一侧连续有9 9个点个点v连续连续6 6个点稳定地增加或减少个点稳定地增加或减少v连续连续1414个点交替上下个点交替上下v连连续续3 3个个点点中中有有两两个个点点距距中中心心线线距距离离超超过过2 2个个标标准准差差(警警戒戒限限以外)以外)2022/7/827第三节第三节 正态分布及其应用正态分布及其应用v连续连续5 5个点中有个点中有4 4个点距中心线距离超过个点距中心线距离超过1 1个标

14、准差个标准差v中中心心线线一一侧侧或或两两侧侧连连续续1515个个点点距距中中心心线线距距离离都都在在1 1个个标标准准差差以以内内v中中心心线线一一侧侧或或两两侧侧连连续续8 8个个点点距距中中心心线线距距离离都都超超出出1 1个个标标准准差差范围。范围。2022/7/8283、统计处理方法的理论基础、统计处理方法的理论基础如如统计描述中计算算术平均数、标准差、统计描述中计算算术平均数、标准差、统计推断中进行总体均数置信区间估计、统计推断中进行总体均数置信区间估计、t检验、检验、F检验、相关与回归等分析检验、相关与回归等分析二项分布、二项分布、Poisson分布在一定条件下可以当作正态分布在

15、一定条件下可以当作正态分布。分布。2022/7/829 成败型实验成败型实验(BernoulliBernoulli实验)实验)在医学卫生领域的许多实验或观察中,人们感兴在医学卫生领域的许多实验或观察中,人们感兴趣的是某事件是否发生。如用白鼠做某药物的毒性实趣的是某事件是否发生。如用白鼠做某药物的毒性实验,关心的是白鼠是否死亡;某种新疗法临床实验观验,关心的是白鼠是否死亡;某种新疗法临床实验观察患者是否治愈;观察某指标的化验结果是否呈阳性察患者是否治愈;观察某指标的化验结果是否呈阳性等等。将我们关心的事件将我们关心的事件A A出现称为成功,不出现称为失出现称为成功,不出现称为失败,这类试验就称为

16、成败,这类试验就称为成-败型实验。指定性资料中的二败型实验。指定性资料中的二项分类实验。项分类实验。第一节第一节二项分布二项分布一、二项分布的概念与特征一、二项分布的概念与特征2022/7/830 成成-败型败型(BernoulliBernoulli)实验序列:实验序列:满足以下三个条件的满足以下三个条件的n n次实验构成的序列称为成次实验构成的序列称为成-败型实败型实验序列。验序列。1 1)每次实验结果,只能是两个互斥的结果之一()每次实验结果,只能是两个互斥的结果之一(A A或或非非A A)。)。2)2)相同的实验条件下,每次实验中事件相同的实验条件下,每次实验中事件A A的发生具有的发生具有相同的概率相同的概率。(非。(非A A的概率为的概率为1-1-)。)。实际工作中要求实际工作中要求是从大量观察中获得的较稳定的是从大量观察中获得的较稳定的数值。数值。3)3)各次实验独立。各次的实验结果互不影响。各次实验独立。各次的实验结果互不影响。2022/7/831(一)二项分布的概念(一)二项分布的概念 二项分布是指在只能产生两种可能结果(如二项分布是指在只能产生两种可能结果(如“阳阳性

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号