常用概率分布(nxpowerlite)

上传人:bin****86 文档编号:57662451 上传时间:2018-10-23 格式:PPT 页数:64 大小:624KB
返回 下载 相关 举报
常用概率分布(nxpowerlite)_第1页
第1页 / 共64页
常用概率分布(nxpowerlite)_第2页
第2页 / 共64页
常用概率分布(nxpowerlite)_第3页
第3页 / 共64页
常用概率分布(nxpowerlite)_第4页
第4页 / 共64页
常用概率分布(nxpowerlite)_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《常用概率分布(nxpowerlite)》由会员分享,可在线阅读,更多相关《常用概率分布(nxpowerlite)(64页珍藏版)》请在金锄头文库上搜索。

1、2018/10/23,1,中山大学医学统计与流行病学系张晋昕2008.09.16,第五章 常用概率分布,2018/10/23,2,2018/10/23,3,一、正态分布的概念,第五章 常用概率分布第一节 正态分布,正态分布是自然界最常见的一种分布,若指标 X的频率分布曲线对应于数学上的正态分布曲线, 则称该指标服从正态分布。,2018/10/23,4,2018/10/23,5,2018/10/23,6,正态分布的概率密度函数(即纵轴的高度),-X+,2018/10/23,9,3. 正态分布有两个参数,即均数和标准差。 是位置参数,是变异度参数(形状参数)。常用N(,2)表示均数为 ,标准差为的

2、正态分布;用N(0,1)表示标准正态分布。 4. 正态曲线下面积分布有一定规律。横轴上 正态曲线下的面积等于1( 也常写作100% ) 。,2018/10/23,10,二、正态曲线下面积的分布规律 正态方程的积分式(分布函数):,F(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自到X的面积,即下侧累计面积 。,标准正态分布方程积分式(分布函数):,(Z)为标准正态变量 Z的累计分布函数,反映标准正态曲线下,横轴尺度自到Z的面积,即下侧累计面积 。,2018/10/23,11,2018/10/23,12,用查表代替计算必须注意: 1)表中曲线下面积为到Z的面积。 2)当,和X已知时,

3、先求出Z值, 再用Z值查表,得所求区间占总面积的比例。 当和未知时,要用样本均数和样本标准差S来估计Z值。 3)曲线下对称于0的区间,面积相等。 4)曲线下横轴上的面积为1 (即100% )。,三、标准正态分布表,2018/10/23,13,正态分布是一种对称分布,其对称轴为直线X=,即均数位置,理论上: 1范围内曲线下的面积占总面积的68.27% 1.96范围内曲线下的面积占总面积的95% 2.58范围内曲线下的面积占总面积的99% 实际应用中: 1 S范围内曲线下的面积占总面积的68.27% 1.96 S范围内曲线下的面积占总面积的95% 2.58 S范围内曲线下的面积占总面积的99%,2

4、018/10/23,14,2018/10/23,15,标准正态分布的=0,=1,则 相当于区间(-1,1), 1.96相当于区间(-1.96,1.96), 2.58的区间相当于区间(-2.58,2.58)。区间(-1,1)的面积:1-2(-1)=1-20.1587=0.6826=68.26% 区间(-1.96,1.96)的面积:1-2(-1.96)=1-20.0250=0.9500=95.00% 区间(-2.58,2.58)的面积:1-2(-2.58)=1-20.0049=0.9902=99.02%,2018/10/23,16,正态曲线下面积对称,则区间(1.96,)的面积也是0.025。Z取

5、值于(-1.96,1.96)的概率为1-20.025=0.95,即X取值在区间 上的概率为95%。,例 5-11 X服从均数为 ,标准差为 的正态分布,试估计(1)X取值在区间 上的概率;(2)X取值在区间 上的概率;,先做标准化变换:,2018/10/23,17,例 5-12 已知某地1986年120名8岁男童身高均数 ,S=4.79 cm ,估计(1)该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的百分比;(2)身高界于120cm128cm者占该地8岁男孩总数的比例;(3)该地80%男孩身高集中在哪个范围?先做标准化变化:,理论上该地8岁男孩身高在130 cm以上者占该地8岁男孩

6、总数的7.21%。,2018/10/23,18,(2),2018/10/23,19,(3),查附表1,标准正态分布曲线下左侧面积为0.10所对应的Z值为-1.28,所以80%的8岁男孩身高值集中在区间内,即116.9cm129.2cm,2018/10/23,20,(一)制定医学参考值范围 参考值范围:指特定的“正常”人群的解剖、生理、生化、免疫等各种数据的波动范围。 制定参考值范围的步骤: 1. 选择足够数量的正常人作为调查对象。 2. 样本含量足够大。 3. 确定取单侧还是取双侧正常值范围。 4. 选择适当的百分界限。 5. 选择适当的计算方法。,四、 正态分布的应用,2018/10/23,

7、21,估计医学参考值范围的方法: 1. 正态近似法:适用于正态分布或近似正态分布的资料。 2. 百分位数法:适用于偏态分布资料。,2018/10/23,22,例5-13 某地调查120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为117.4g/L,标准差为10.2g/L ,试估计该地正常女性血红蛋白的95%医学参考值范围。,分析:正常人的血红蛋白过高过低均为异常,要制定双侧正常值范围。,该指标的95%医学参考值范围为,2018/10/23,23,例5.14 某地调查110名正常成年男子的第一秒肺通气量,得均数为4.2 L,标准差为0.7 L ,试估计该地正常成年男子第一秒肺通气

8、量的95%参考值范围。,该地正常成年男子第一秒肺通气量的95%参考值范围为:不低于3.052L。,分析:正常人的第一秒肺通气量近似正态分布,且只以过低为异常,要制定单侧下限。,2018/10/23,24,例 5.15 某年某市调查了 200例正常成人血铅含量(g/100g)如下,试估计该市成人血铅含量的95%医学参考值范围。,2018/10/23,25,分析:血铅的分布为偏峰分布,且血铅含量只以过高为异常,要用百分位数法制定单侧上限。,2018/10/23,26,二、质量控制 为了控制实验中的检测误差,常用 2S作上下警戒线,以 3S作为上下控制线。这里的2S和3S可视为1.96S 和2.58

9、S的约数。其依据是正常情况下检测误差是服从正态分布的。,2018/10/23,27,第三节 正态分布及其应用,判断异常的8种情况是: 有一个点距中心线的距离超过3个标准差(控制限以外) 在中心线的一侧连续有9个点 连续6个点稳定地增加或减少 连续14个点交替上下 连续3个点中有两个点距中心线距离超过2个标准差(警戒限以外),2018/10/23,28,第三节 正态分布及其应用,连续5个点中有4个点距中心线距离超过1个标准差 中心线一侧或两侧连续15个点距中心线距离都在1个标准差以内 中心线一侧或两侧连续8个点距中心线距离都超出1个标准差范围。,2018/10/23,29,三、统计处理方法的理论

10、基础,如 统计描述中计算算术平均数、标准差、统计推断中进行总体均数置信区间估计、t 检验、F 检验、相关与回归等分析,2018/10/23,30,(一)成败型实验(Bernoulli实验) 在医学卫生领域的许多实验或观察中,人们感兴趣的是某事件是否发生。如用白鼠做某药物的毒性实验,关心的是白鼠是否死亡;某种新疗法临床实验观察患者是否治愈;观察某指标的化验结果是否呈阳性等。将我们关心的事件A出现称为成功,不出现称为失败,这类试验就称为成-败型实验。指定性资料中的二项分类实验。,第二节 二项分布,一、二项分布的概念与特征,2018/10/23,31,成-败型(Bernoulli)实验序列: 满足以

11、下三个条件的n次实验构成的序列称为成-败型实验序列。1)每次实验结果,只能是两个互斥的结果之一(A或非A)。2) 相同的实验条件下,每次实验中事件A的发生具有相同的概率。(非A的概率为1-)。 实际工作中要求是从大量观察中获得的较稳定的数值。3) 各次实验独立。各次的实验结果互不影响。,2018/10/23,32,(二)二项分布的概率函数二项分布是指在只能产生两种可能结果(如“阳性”或“阴性”)之一的n次独立重复实验中,当每次试验的“阳性”概率保持不变时,出现“阳性”的次数X=0,1,2,n的一种概率分布。若从阳性率为的总体中随机抽取大小为n的样本,则出现“阳性”数为X的概率分布即呈现二项分布

12、,记作 B(n,)。,2018/10/23,33,举例 设实验白鼠共3只,要求它们同种属、同性别、体重相近,且他们有相同的死亡概率,即事件“白鼠用药后死亡”为A,相应死亡概率为。记事件“白鼠用药后不死亡”为 ,相应不死亡概率为1-。设实验后3只白鼠中死亡的白鼠数为X,则X的可能取值为0,1,2和3,则死亡鼠数为X的概率分布即表现为二项分布。,2018/10/23,34,互不相容事件的加法定理,2018/10/23,35,2018/10/23,36,构成成-败型实验序列的n次实验中,事件A出现的次数X的概率分布为:,其中X=0,1,2,n。 n,是二项分布的两个参数 。,对于任何二项分布,总有,

13、2018/10/23,37,例5-2 临床上用针灸治疗某型头疼,有效的概率为60%,现以该疗法治疗3例,其中2例有效的概率是多大?分析:治疗结果为有限和无效两类,每个患者是否有效不受其他病例的影响,有效概率均为0.6,符合二项分布的条件。,2例有效的概率是0.432,2018/10/23,38,一例以上有效的概率为:,或,2018/10/23,39,(三)二项分布的特征 1. 二项分布的图形特征n,是二项分布的两个参数,所以二项分布的形状取决于n,。可以看出,当 =0.5时分布对称,近似对称分布。当 0.5时,分布呈偏态,特别是n较小时, 偏离0.5越远,分布的对称性越差,但只要不接近1和0时

14、,随着n 的增大,分布逐渐逼近正态。因此, 或1- 不太小,而n足够大,我们常用正态近似的原理来处理二项分布的问题。,2018/10/23,40,2018/10/23,41,2018/10/23,42,2018/10/23,43,例 实验白鼠3只,白鼠用药后死亡的死亡概率=0.6,则3只白鼠中死亡鼠数X的总体均数 =30.6=1.8(只) 方差为 标准差为,2018/10/23,44,如果以率表示,将阳性结果的频率记为 , 则p的总体均数总体方差为总体标准差为 式中 是频率p的标准误,反映阳性频率的抽样误差的大小。,2018/10/23,45,例5-4 如果某地钩虫感染率为6.7%,随机观察当

15、地150人,样本钩虫感染率为p,求p的抽样误差 。,2018/10/23,46,二、二项分布的应用 (一) 概率估计,例5-5 如果某地钩虫感染率为13%,随机观察当地150人,其中有10人感染钩虫的概率有多大?,2018/10/23,47,(二)单侧累计概率计算二项分布出现阳性次数至少为k次的概率为阳性次数至多为k次的概率为,2018/10/23,48,例5-6 如果某地钩虫感染率为13%,随机观察当地150人,其中至多有2人感染钩虫的概率有多大?至少有2人感染钩虫的概率有多大?至少有20人感染钩虫的概率有多大?,至多有2名感染的概率为:,2018/10/23,49,至少有2名感染的概率为:,至少有20名感染的概率为:,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > 其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号