统计学概率分布

上传人:m**** 文档编号:571724238 上传时间:2024-08-12 格式:PPT 页数:105 大小:2.85MB
返回 下载 相关 举报
统计学概率分布_第1页
第1页 / 共105页
统计学概率分布_第2页
第2页 / 共105页
统计学概率分布_第3页
第3页 / 共105页
统计学概率分布_第4页
第4页 / 共105页
统计学概率分布_第5页
第5页 / 共105页
点击查看更多>>
资源描述

《统计学概率分布》由会员分享,可在线阅读,更多相关《统计学概率分布(105页珍藏版)》请在金锄头文库上搜索。

1、3.1 3.1 正态分布正态分布 n正态分布的图形正态分布的图形n正态分布的特征正态分布的特征n正态曲线下面积分布的规律正态曲线下面积分布的规律n标准正态分布标准正态分布n正态分布的应用正态分布的应用2024/8/12一、一、 正态分布曲线正态分布曲线(normal distribution curve)1.1.正态分布的图形正态分布的图形2024/8/12频数分布逐渐接近正态分布示意图频数分布逐渐接近正态分布示意图 2024/8/12图图 体模体模“骨密度骨密度”测量值的分布接近正态分布示意图测量值的分布接近正态分布示意图(频率密度(频率密度= =频率频率/ /组距)组距)面积的意义2024

2、/8/12正态分布曲线图示正态分布曲线图示2024/8/12n n该曲线表现为中间高,两边低,左右对称,略该曲线表现为中间高,两边低,左右对称,略显钟形,类似于数学上的正态分布曲线。因而显钟形,类似于数学上的正态分布曲线。因而这种分布也称为正态分布。这种分布也称为正态分布。n n正态曲线正态曲线(normal curve)(normal curve)是一条高峰位于中央,是一条高峰位于中央,两侧完全对称,而且逐渐降低,两端在无穷远两侧完全对称,而且逐渐降低,两端在无穷远处与底线相靠,但永远不与横轴相交的钟型曲处与底线相靠,但永远不与横轴相交的钟型曲线。线。n n正态曲线是有固定函数式的一条曲线。

3、因为频正态曲线是有固定函数式的一条曲线。因为频率的总和等于率的总和等于1 1,因此横轴上曲线下的总面积,因此横轴上曲线下的总面积为为100100或或1 1,其面积分布有一定的规律性,其面积分布有一定的规律性。2024/8/12正态分布又称正态分布又称Gauss分布,是医学上分布,是医学上和生物界常见的分布形式。和生物界常见的分布形式。 是指变量值以均数为中心,左右两是指变量值以均数为中心,左右两侧完全对称,靠近均数两侧的频数侧完全对称,靠近均数两侧的频数较多,而远离均数两侧的频数逐渐较多,而远离均数两侧的频数逐渐减少。减少。2024/8/12 2.2.正态分布的概率密度函数正态分布的概率密度函

4、数2024/8/12二、正态分布的特征二、正态分布的特征n n正态分布以均数为中心(正态分布以均数为中心( = = ),左右对称),左右对称;n n正态分布有两个参数,即均数正态分布有两个参数,即均数和标准差和标准差,正,正态分布记作态分布记作XN(,2), 决定曲线在横轴决定曲线在横轴上的位置上的位置,决定曲线的形状。决定曲线的形状。n n正态曲线在横轴上方均数处最高正态曲线在横轴上方均数处最高(在在= =处取得处取得密度函数的最大值密度函数的最大值) ),表现为钟型曲线表现为钟型曲线n n正态正态曲线下总面积为曲线下总面积为1 1,正态曲线下的面积分正态曲线下的面积分布有一定规律。布有一定

5、规律。三、面积规律2024/8/12正态分布正态分布 1 2 3 不同不同均数均数2024/8/12正态分布正态分布不同标准差2024/8/12a.尖峭峰尖峭峰b.正态峰正态峰c.平阔峰平阔峰正态分布的特征2024/8/12三、正态曲线下面积分布规律三、正态曲线下面积分布规律1.1.正态曲线下面积的意义:正态曲线下面积的意义:表示该区间(表示该区间(x x1 1,x x2 2)包含的观察例)包含的观察例数占总例数的百分数或变量值落在数占总例数的百分数或变量值落在该区间的概率。该区间的概率。频数分布图示2024/8/12正态曲线下面积示意图正态曲线下面积示意图x1 x22024/8/122024

6、/8/12图图图图3-3 3-3 正态分布的概率密度函数与分布函数正态分布的概率密度函数与分布函数正态分布的概率密度函数与分布函数正态分布的概率密度函数与分布函数2024/8/12图图3-4 正态分布的概率正态分布的概率2024/8/122.正态正态曲线下面积的分布规律曲线下面积的分布规律2024/8/122024/8/122024/8/12四、标准正态分布四、标准正态分布 (standard normal distribution)n n标准正态分布变换标准正态分布变换n n标准正态分布曲线下面积的分布规律标准正态分布曲线下面积的分布规律n n标准正态分布表的使用标准正态分布表的使用2024

7、/8/121、标准正态分布变换、标准正态分布变换n n一般正态分布为一个分布族一般正态分布为一个分布族: :N N( (, ,2 2) )。 为为了应用方便,可以进行变量变换,正态分布了应用方便,可以进行变量变换,正态分布就变换为标准正态分布。就变换为标准正态分布。n n标准正态分布的标准正态分布的=0, =1,记为记为 N N(0,1)(0,1) 2024/8/12n n2024/8/12z (z)2024/8/12 (z)2024/8/12z(z) (z)02024/8/121.961.960.0250.0252024/8/122 2、标准正态曲线下面积分布规律、标准正态曲线下面积分布规律

8、0-11-1.961.96-2.582.5868.27%95.00%99.00%2024/8/12正态曲线与标准正态曲线的面积分布规律正态曲线与标准正态曲线的面积分布规律 2024/8/122024/8/123、标准正态分布表的使用、标准正态分布表的使用附表附表c1c1标准正态分布表标准正态分布表p559p559查表求面积时注意:查表求面积时注意: 表中曲线下面积为表中曲线下面积为-到到z的面积;的面积; 当当、已知时,先进行变量变换求得已知时,先进行变量变换求得z值,再值,再 查表;查表; 当当、未知且样本含量足够大时,可用未知且样本含量足够大时,可用 和和S S 分别代替分别代替和和,求得

9、,求得z的估计值,再查表。的估计值,再查表。 曲线下对称于曲线下对称于0 0的区间面积相等;的区间面积相等; 曲线下横轴上的总面积为曲线下横轴上的总面积为100%100%或或1 1。2024/8/12五、正态分布的应用五、正态分布的应用(一)(一)确定医学参考值(正常值)范围确定医学参考值(正常值)范围(二)(二)质量控制图。警戒限质量控制图。警戒限 ,控制限,控制限(三)统计方法的理论基础。(三)统计方法的理论基础。二项分布2024/8/12vv医学研究中的某些观察指标服从或近似服从正态分布;医学研究中的某些观察指标服从或近似服从正态分布;医学研究中的某些观察指标服从或近似服从正态分布;医学

10、研究中的某些观察指标服从或近似服从正态分布;vv很多统计方法是建立在正态分布的基础之上的,很多统计方法是建立在正态分布的基础之上的,很多统计方法是建立在正态分布的基础之上的,很多统计方法是建立在正态分布的基础之上的,如如如如t t分布、分布、分布、分布、 2 2分布、分布、分布、分布、F F分布都是在正态分布的基础上推演分布都是在正态分布的基础上推演分布都是在正态分布的基础上推演分布都是在正态分布的基础上推演出来的。出来的。出来的。出来的。vv很多其他分布的极限为正态分布。很多其他分布的极限为正态分布。很多其他分布的极限为正态分布。很多其他分布的极限为正态分布。二项分布和二项分布和二项分布和二

11、项分布和PoissionPoission分布样本含量足够大时近似正态分布。分布样本含量足够大时近似正态分布。分布样本含量足够大时近似正态分布。分布样本含量足够大时近似正态分布。2024/8/12医学参考值范围医学参考值范围n1. 1. 正态分布法正态分布法n2. 2. 百分位数法百分位数法 3. 3. 对数正态分布法对数正态分布法2024/8/121.1.医学参考值概念医学参考值概念是指大多数处于相同生理状态下的是指大多数处于相同生理状态下的“正常人正常人” 的某项指标(形态、机能及代谢产物等)的某项指标(形态、机能及代谢产物等)数值变化波动的范围。数值变化波动的范围。由于正常个体间存由于正常

12、个体间存在变异、机体内外环境改变,时间、地点、在变异、机体内外环境改变,时间、地点、条件的不同,使这些生理指标有一定的波条件的不同,使这些生理指标有一定的波动范围,因此,实际应用中,一般采用正动范围,因此,实际应用中,一般采用正常值范围常值范围.2024/8/122.用途用途1.划分正常与异常的界限。划分正常与异常的界限。如作诊断如作诊断指标。指标。2.反映某人群的某项指标的动态变化。反映某人群的某项指标的动态变化。如某地不同时期发汞值的正常范围如某地不同时期发汞值的正常范围可反映环境污染的变化或环境保护可反映环境污染的变化或环境保护的效果。的效果。2024/8/123.确定医学参考值范围的方

13、法确定一批样本含量足够大(确定一批样本含量足够大(n100n100)的)的“正常人正常人”或动物作为研究对象。或动物作为研究对象。 “正常人正常人”不是指机体任何器官、组织的不是指机体任何器官、组织的形态及机能都正常的人形态及机能都正常的人,而是指排除了影,而是指排除了影响所研究指标的疾病和有关因素对所研究响所研究指标的疾病和有关因素对所研究指标的影响的同质人群。指标的影响的同质人群。2024/8/12根据指标的实际用途确定单、双侧。根据指标的实际用途确定单、双侧。确定百分数范围。确定百分数范围。根据资料的分布特点,选用恰当的界根据资料的分布特点,选用恰当的界值计算方法。值计算方法。2024/

14、8/124.常用参考值范围估计方法常用参考值范围估计方法95%95%正常值范围:正常值范围:同质总体中包含同质总体中包含95%95%的个体的个体值所在的范围。值所在的范围。. .正态分布法正态分布法. .百分位数法百分位数法. 对数正态分布法对数正态分布法2024/8/121) 正态分布法适应资料:适应资料:正态或近似正态分布资料。正态或近似正态分布资料。计算:计算: 以以95%95%正常值范围为例正常值范围为例n n双侧双侧:n n单侧单侧:2024/8/122 2) 百分位数法百分位数法适用资料:适用资料:适用于任意分布类型的资料,适用于任意分布类型的资料,主要用于偏态分布或分布类型不清楚

15、的资主要用于偏态分布或分布类型不清楚的资料。料。计算:计算: 以以95%95%正常值范围为例正常值范围为例n n双侧:双侧: P2.5P97.5n n单侧:单侧: P5(下限)(下限) 正态分布应用正态分布应用正态分布应用正态分布应用2024/8/12 200200例血铅值频数表及例血铅值频数表及Px计算表计算表 2024/8/122024/8/123 3)对数正态分布法)对数正态分布法适用资料:适用资料:适用于对数正态分布适用于对数正态分布资料。资料。计算:计算:n双侧:双侧:n单侧:单侧:2024/8/12 200200例血铅值对数变换后的频数计算表例血铅值对数变换后的频数计算表 2024

16、/8/122024/8/123.2 3.2 二项分布二项分布n二项分布的概念二项分布的概念n二项分布的概率二项分布的概率n二项分布的条件二项分布的条件 n二项分布的均数与标准差二项分布的均数与标准差n二项分布的图形二项分布的图形 n二项分布应用实例二项分布应用实例2024/8/12一、二项分布的概念一、二项分布的概念u一个袋子里有一个袋子里有5个乒乓球,其中个乒乓球,其中2个黄球,个黄球,3个白球,我们进行摸球游戏,每一次摸到个白球,我们进行摸球游戏,每一次摸到黄球的概率是黄球的概率是0.4,摸到白球的概率是,摸到白球的概率是0.6。u三个特点:三个特点:1.各次摸球是彼此独立的;各次摸球是彼

17、此独立的;2.每每次摸球只有二种可能的结果,或黄球或白次摸球只有二种可能的结果,或黄球或白球;球;3.每次摸到黄球(或摸到白球)的概率每次摸到黄球(或摸到白球)的概率是固定的。是固定的。un次中摸到次中摸到x次黄球(或白球)的概率分布次黄球(或白球)的概率分布就是二项分布。就是二项分布。 2024/8/12 医学研究中很多现象观察结果是以两分医学研究中很多现象观察结果是以两分类变量来表示的,如阳性与阴性、治愈与类变量来表示的,如阳性与阴性、治愈与未愈、生存与死亡等等。如果每个观察对未愈、生存与死亡等等。如果每个观察对象阳性结果的发生概率均为象阳性结果的发生概率均为 ,阴性结果的,阴性结果的发生

18、概率均为(发生概率均为(1 );而且各个观察对象);而且各个观察对象的结果是相互独立的,那么,重复观察的结果是相互独立的,那么,重复观察n个个人,发生阳性结果的人数人,发生阳性结果的人数x的概率分布为二的概率分布为二项分布。项分布。 2024/8/12n例例 设小白鼠接受某种毒物一定剂量时,其设小白鼠接受某种毒物一定剂量时,其死亡率为死亡率为80,对于每只小白鼠来说,其,对于每只小白鼠来说,其死死亡概率为亡概率为0.8,生存概率为,生存概率为0.2,若每组各用,若每组各用甲乙丙三只小白鼠甲乙丙三只小白鼠做实验,观察每只小白做实验,观察每只小白鼠存亡情况,如果计算生与死的顺序,则鼠存亡情况,如果

19、计算生与死的顺序,则共有共有8种排列方式种排列方式,如果只计生与死的数目,如果只计生与死的数目,则只有则只有四种组合方式四种组合方式,如下表,如下表表2024/8/122024/8/12概率的乘法法则概率的乘法法则 和加法法则和加法法则n乘法法则乘法法则 : : 几个独立事件同时发生的概率,等于各几个独立事件同时发生的概率,等于各独立事件的概率之积。独立事件的概率之积。 n加法法则加法法则 : : 互不相容事件和的概率等于各事件的概互不相容事件和的概率等于各事件的概率之和率之和2024/8/123 3只小白鼠均生存的概率:只小白鼠均生存的概率:P=0.2P=0.2 0.20.2 0.2=0.0

20、080.2=0.0083 3只小白鼠只小白鼠2 2生生1 1死的概率:死的概率:P1=0.2P1=0.2 0.20.2 0.8=0.0320.8=0.032(甲生乙生丙死)(甲生乙生丙死)P2=0.2P2=0.2 0.80.8 0.2=0.0320.2=0.032(甲生乙死丙生)(甲生乙死丙生)P3=0.8P3=0.8 0.20.2 0.2=0.0320.2=0.032(甲死乙生丙生)(甲死乙生丙生)P=0.096P=0.0962024/8/123 3只小白鼠只小白鼠1 1生生2 2死的概率:死的概率:P P1 1=0.2=0.2 0.80.8 0.8=0.1280.8=0.128(甲生乙死丙

21、死)(甲生乙死丙死)P P2 2=0.8=0.8 0.20.2 0.8=0.1280.8=0.128(甲死乙生丙死)(甲死乙生丙死)P P3 3=0.8=0.8 0.80.8 0.2=0.1280.2=0.128(甲死乙死丙生)(甲死乙死丙生)P=0.384P=0.3843 3只小白鼠均死亡的概率:只小白鼠均死亡的概率:P=0.8P=0.8 0.80.8 0.8=0.5120.8=0.5122024/8/122024/8/12n由于实验是逐只进行,因此实验结果是互由于实验是逐只进行,因此实验结果是互相独立的,如病人的治愈或死亡,性别的相独立的,如病人的治愈或死亡,性别的雌雄,生存死亡,阳性或阴

22、性。雌雄,生存死亡,阳性或阴性。n根据根据概率的乘法法则概率的乘法法则(几个独立事件发生(几个独立事件发生的概率,等于各独立事件发生的概率之和)的概率,等于各独立事件发生的概率之和),可以算出,可以算出每种排列方式的概率每种排列方式的概率,也可以,也可以得到得到每种组合的概率每种组合的概率,它可以用二项式加,它可以用二项式加以概括,二项式展开的各项就是每种组合以概括,二项式展开的各项就是每种组合的概率。的概率。2024/8/12二项展开式:2024/8/122024/8/12n二项分布的定义二项分布的定义 :n从阳性率为从阳性率为的总体中随机抽取观察单位的总体中随机抽取观察单位数为数为n的样本

23、,其中出现阳性结果的次数的样本,其中出现阳性结果的次数为为X,则,则X=0,1,2,n的概率的概率服从参数服从参数为为n和和 的二项分布,记为:的二项分布,记为:XB(n, )。n此分布的概率函数符合前述二项式展开式此分布的概率函数符合前述二项式展开式中的各展开项,故此分布称二项分布中的各展开项,故此分布称二项分布n又称又称Bernoulli分布(瑞士数学家和统计学分布(瑞士数学家和统计学家)。家)。2024/8/12二、二项分布的概率二、二项分布的概率1.二项分布的概率函数:二项分布的概率函数: X=0,1,2,n 如已知如已知n=3, =0.8,则恰有例阳性的概率则恰有例阳性的概率P(1)

24、P(1)为:为: 2024/8/12例例 临床上用针灸治疗某型头痛,有效的概率临床上用针灸治疗某型头痛,有效的概率为为60%,现以该法治疗,现以该法治疗3例,其中两例有效例,其中两例有效的概率是多大?的概率是多大? 2024/8/12表表 治疗治疗3例可能的有效例数及其概率例可能的有效例数及其概率有效人数有效人数有效人数有效人数(x)(x) x x(1 (1 ) )n-xn-x出现该结果概率出现该结果概率出现该结果概率出现该结果概率P P( (x x) )0 01 10.60.60 0=1=10.40.4 0.40.4 0.40.40.0640.0641 13 30.60.60.40.4 0.

25、40.40.2880.2882 23 30.60.6 0.60.60.40.40.4320.4323 31 10.60.6 0.60.6 0.60.60.40.40 00.2160.2162024/8/12由表可知由表可知,各种可能结果出现的概率合计为各种可能结果出现的概率合计为1,即即 P(X)=1(X=0,1,n)。因此)。因此,如果欲求如果欲求1例及以上有效的概率可以是例及以上有效的概率可以是P(x1)=P(1)+P(2)+P(3)=0.288+0.432+0.216 =0.936也可以是也可以是P(x1)=1P(0)=10.064=0.9362024/8/122.二项分布的累积概率二项

26、分布的累积概率n n单侧累积概率计算单侧累积概率计算n最多有最多有k 例阳性例阳性的概率的概率(下侧累积概率)(下侧累积概率)n最少有最少有k 例阳性例阳性的概率(上侧累积概率)的概率(上侧累积概率)2024/8/12递推公式递推公式2024/8/12n例例 某地钩虫感染率为某地钩虫感染率为13%,随机抽查当地,随机抽查当地150人,其中至多有人,其中至多有2名感染钩虫的概率有多名感染钩虫的概率有多大?至少有大?至少有2名感染钩虫的概率有多大?至名感染钩虫的概率有多大?至少有少有20名感染钩虫的概率有多大?名感染钩虫的概率有多大?2024/8/12n n至多有至多有2名感染钩虫的概率为名感染钩

27、虫的概率为n n至少有至少有2名感染钩虫的概率为名感染钩虫的概率为 2024/8/12n n至少有至少有20名感染钩虫的概率为名感染钩虫的概率为 2024/8/12三、三、 二项分布的条件二项分布的条件 n n各观察单位只具有互相对立的一种结果,各观察单位只具有互相对立的一种结果,如阳性或阴性,属于二项分类资料。如阳性或阴性,属于二项分类资料。n n已知发生某一结果已知发生某一结果( (如阳性如阳性) )的概率为的概率为 ,其其对立结果对立结果( (如阳性如阳性) )的概率则为的概率则为1-1- 。n nn个观察单位的结果互相独立。个观察单位的结果互相独立。即每个观察单即每个观察单即每个观察单

28、即每个观察单位的结果,不会影响其它观察单位的结果。位的结果,不会影响其它观察单位的结果。位的结果,不会影响其它观察单位的结果。位的结果,不会影响其它观察单位的结果。2024/8/12四、二项分布的均数与标准差四、二项分布的均数与标准差 n n观察单位数为观察单位数为n时,其时,其阳性结果发生数阳性结果发生数X的均的均数与标准差:数与标准差:2024/8/12n n如果将出现阳性结果的频率记为如果将出现阳性结果的频率记为n n总体均数:总体均数:n n标准差:标准差: 2024/8/12二项分布二项分布n n例例4-4 研究者随机抽查某地研究者随机抽查某地150人,其中有人,其中有10人感染了钩

29、虫,钩虫感染率为人感染了钩虫,钩虫感染率为6.7%,求此,求此率的标准差。率的标准差。2024/8/12五、二项分布的图形五、二项分布的图形n已知已知 ,n,计算计算x=0,1,2,n时时的的P(x),以,以x 为横坐标,以为横坐标,以P(x)为纵坐标,为纵坐标,在方格坐标纸上绘图,即可绘出二项在方格坐标纸上绘图,即可绘出二项分布的图形,其形状取决于分布的图形,其形状取决于 和和n的大的大小。小。2024/8/1200.50.40.30.20.10.0123P(X)X(0.2+0.8)3 二项分布示意图二项分布示意图2024/8/12图图 =0.5时时,不同不同n值对应的二项分布值对应的二项分

30、布2024/8/12 图图图图 =0.3=0.3时时时时, , 不同不同不同不同n n值对应的二项分布值对应的二项分布值对应的二项分布值对应的二项分布 2024/8/122024/8/122024/8/12n =0.5时,分布对称,近似正态分布;时,分布对称,近似正态分布;n0.5时,分布呈偏态,特别是时,分布呈偏态,特别是n 值不值不大时,大时, 偏离偏离0.5越远,分布越偏。特越远,分布越偏。特别是别是 1%或或99%时,非常偏,但随时,非常偏,但随着着n的增大,分布逐渐逼近正态分布。的增大,分布逐渐逼近正态分布。2024/8/12二项分布趋近正态分布的条件:二项分布趋近正态分布的条件:n

31、当当n 与与n(1- )均均5时,二项分布趋近正时,二项分布趋近正态分布。态分布。n当当n 时,二项分布的极限形式即是正时,二项分布的极限形式即是正态分布,其总体均数态分布,其总体均数 = n ,总体方差,总体方差为为 2= n (1- )。)。2024/8/12六、二项分布的应用六、二项分布的应用(一)概率估计(一)概率估计n n例例4-6 某地钩虫感染率为某地钩虫感染率为13%,随机抽,随机抽查当地查当地150人,其中至多有人,其中至多有2名感染钩虫名感染钩虫的概率有多大?至少有的概率有多大?至少有2名感染钩虫的名感染钩虫的概率有多大?至少有概率有多大?至少有20名感染钩虫的名感染钩虫的概

32、率有多大?概率有多大?2024/8/12n n可以得出可以得出150人中有人中有10人感染钩虫的概率为人感染钩虫的概率为2024/8/12150人中无感染、有人中无感染、有1人、人、2人感染钩人感染钩虫的概率为:虫的概率为:2024/8/12(二)单侧累积概率计算(二)单侧累积概率计算二项分布出现阳性的次数二项分布出现阳性的次数至多为至多为k次次的概率为的概率为出现阳性的次数出现阳性的次数至少为至少为k次次的概率为的概率为2024/8/12n n据以往经验,用某药治疗小儿上呼吸据以往经验,用某药治疗小儿上呼吸道感染、支气管炎,有效率为道感染、支气管炎,有效率为8585,今有今有5 5个患者用该

33、药治疗,问:个患者用该药治疗,问:n n 至少至少3 3人有效的概率为多少?人有效的概率为多少?n n 最多最多1 1人有效的概率为多少?人有效的概率为多少? 2024/8/12n n 至少至少至少至少3 3 3 3人有效的概率:人有效的概率:人有效的概率:人有效的概率:n nP P(X3)=(X3)=P P(3)+(3)+P P(4)+(4)+P P(5(5) )P(X3)=0.1381781250.3915046880.443705313 =0.973388126 2024/8/12n 最多最多1 1人有效的概率为:人有效的概率为:n P(X 1)=P(0)+P(1)2024/8/123.

34、3 Poisson 3.3 Poisson 分布分布一、一、PoissonPoisson分布的概念分布的概念二、二、PiossonPiosson分布的概率分布的概率三、三、PiossonPiosson分布的条件分布的条件四、四、PiossonPiosson分布的图形分布的图形五、五、PoissonPoisson分布的特征分布的特征 六、六、PoissonPoisson分布的应用分布的应用 2024/8/12n医学上人群中出生缺陷、多胞胎、染色体医学上人群中出生缺陷、多胞胎、染色体异常、恶性肿瘤等事件都是罕见的,而可异常、恶性肿瘤等事件都是罕见的,而可能发生这些事件的观察例数能发生这些事件的观察

35、例数n常常很大常常很大 ,但,但实际上发生类似事件的数目实际上发生类似事件的数目x却很小很小却很小很小。2024/8/12lPoisson分布可用来描述这种罕见事件发生次数分布可用来描述这种罕见事件发生次数的概率分布。的概率分布。lPoisson分布是二项分布的特例。分布是二项分布的特例。lPoisson分布可以看作某种现象发生的概率分布可以看作某种现象发生的概率 (或未发生的概率(或未发生的概率1 )很小(如)很小(如 0.001) ,而观察例数而观察例数n很大时的二项分布。很大时的二项分布。l l除二项分布的三个基本条以外,除二项分布的三个基本条以外,Poisson分布还分布还要求要求 或

36、(或(1 )接近于)接近于0或或1(例如(例如0.999)。)。2024/8/12一、一、Poisson Poisson 分布的概念分布的概念n nPoisson分布专用于研究分布专用于研究单位时间、单位体积、单位时间、单位体积、单位面积或单位人群(较大)中某事件的发单位面积或单位人群(较大)中某事件的发生数,若发生数生数,若发生数X服从参数为服从参数为 的的PoissonPoisson分分布,记为布,记为X X ( ( ) )。n n取名于法国数学家取名于法国数学家SD Poisson(1781-1840)SD Poisson(1781-1840)n n例如例如: :放射性物质每分钟放射的脉

37、冲数、每放射性物质每分钟放射的脉冲数、每ml水中大肠菌群数、每升空气中粉尘数、每水中大肠菌群数、每升空气中粉尘数、每1 1万万个细胞中有多少个发生突变、某地每天的交个细胞中有多少个发生突变、某地每天的交通事故数、某工矿企业每天的工伤人数、一通事故数、某工矿企业每天的工伤人数、一定人群中某种患病率很低的非传染性疾病患定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布等。病数或死亡数的分布等。 2024/8/12二、二、Poisson分布的概率分布的概率1、Poisson分布的概率函数分布的概率函数n nX为为观察单位观察单位内某稀有事件的发生次数;内某稀有事件的发生次数; P(X)为事件发

38、生数为为事件发生数为X时的概率,参数时的概率,参数 =n 为为Poisson分布的分布的总体均数总体均数, 表示表示观察单位观察单位内内事件平均发生的次数,又称强度参数。事件平均发生的次数,又称强度参数。e为自为自然对数的底。然对数的底。2024/8/12n n例例如果某地新生儿先天性心脏病的发病概率如果某地新生儿先天性心脏病的发病概率为为8 8,那么该地,那么该地120120名新生儿中有名新生儿中有4 4人患先天人患先天性心脏病的概率有多大?性心脏病的概率有多大?n nn=120,=0.008, = n =1200.08=0.962024/8/122 2、PoissonPoisson分布的累

39、计概率函数分布的累计概率函数n最多为最多为k k次的概率(下侧累积):次的概率(下侧累积):n n最少为最少为k k次的概率(上侧累积):次的概率(上侧累积):n n n n递推公式:递推公式:递推公式:递推公式: 2024/8/12 实例实例n n至多有至多有4 4人患先天性心脏病的概率有多大?人患先天性心脏病的概率有多大?2024/8/12 实例实例n至少有至少有5 5人患心脏病的概率有多大?人患心脏病的概率有多大?2024/8/12n n例例实验显示某实验显示某100100cm2 2的培养皿菌落数为的培养皿菌落数为6 6个,个,试估计该培养皿菌落数小于试估计该培养皿菌落数小于3 3个的概

40、率,大于个的概率,大于1 1个的概率。个的概率。n n =6=6,该培养皿菌落数小于该培养皿菌落数小于3 3个的概率个的概率2024/8/12n n该培养皿菌落数大于该培养皿菌落数大于1 1个的概率个的概率2024/8/12三、三、PiossonPiosson分布的应用条件分布的应用条件 n nPiossonPiosson分布是二项分布的特例,因此分布是二项分布的特例,因此二二项分布的三个条件项分布的三个条件也是也是PiossonPiosson分布的应分布的应用条件。用条件。n n某事件发生概率某事件发生概率 很小(如很小(如 0.001 ),),而观察例数而观察例数n很大;很大;n n单位时

41、间、面积、容积、人群中观察事件单位时间、面积、容积、人群中观察事件的分布均匀。的分布均匀。2024/8/12四、四、 PiossonPiosson分布的图形分布的图形n n已知已知 ,计算计算x=0,1,2,时的,时的P(X),以,以X为横坐标,以为横坐标,以P(X)为纵坐标,在方为纵坐标,在方格坐标纸上绘图,即可绘出格坐标纸上绘图,即可绘出PiossonPiosson分布分布的图形,其形状取决于的图形,其形状取决于 的大小。的大小。2024/8/12图图 取不同值时的取不同值时的Poisson分布图分布图 =1 =3 =6 =102024/8/12n nPoissonPoisson分布为正偏

42、态分布,且分布为正偏态分布,且 愈小分愈小分布愈偏;随着布愈偏;随着 的增大,分布逐渐趋于的增大,分布逐渐趋于对称。对称。n n =20=20时,基本接近正态分布;时,基本接近正态分布;n n = 50= 50时,时,PoissonPoisson分布呈正态分布分布呈正态分布nPiossonPiosson分布近似正态分布的条件分布近似正态分布的条件n 2020时可按正态分布原理处理时可按正态分布原理处理PiossonPiosson分布的问题。分布的问题。2024/8/12五、五、PoissonPoisson分布的特征分布的特征 n nPiossonPiosson分布是二项分布的特例。某现象分布是

43、二项分布的特例。某现象的发生率的发生率 很小,而样本例数很小,而样本例数n很大时,二很大时,二项分布趋近于项分布趋近于PiossonPiosson分布。分布。 n (应用:(应用: PiossonPiosson分布替代二项分布);分布替代二项分布); n nPoissonPoisson分布的方差分布的方差 2 2与均数与均数 相等,即:相等,即: 2 2= = ;n nPoissonPoisson分布在分布在 2020时近似呈正态分布;时近似呈正态分布;n nPoissonPoisson分布具有可加性。分布具有可加性。2024/8/12n n以较小的度量单位,观察某一现象的发生数时,以较小的度

44、量单位,观察某一现象的发生数时,如果它呈如果它呈PoissonPoisson分布,那么把若干个小单位分布,那么把若干个小单位合并为一个大单位后,其总计数亦呈合并为一个大单位后,其总计数亦呈PoissonPoisson分布。因此分布。因此 PoissonPoisson分布资料可利用可加性分布资料可利用可加性原理使原理使 2020,然后用正态近似法处理。,然后用正态近似法处理。n n例如例如,已知某放射性物质每,已知某放射性物质每1010分钟放射脉冲数分钟放射脉冲数呈呈PoissonPoisson分布,分布,5 5次测量的结果,分别为次测量的结果,分别为1515、1414、1616、1818、14

45、14次,那么每次,那么每5050分钟放射脉冲分钟放射脉冲数数( (总计为总计为7777次次) )亦呈亦呈PoissonPoisson分布。分布。 2024/8/12六、六、PoissonPoisson分布的应用分布的应用 n n一般人群食管癌的发生率为一般人群食管癌的发生率为一般人群食管癌的发生率为一般人群食管癌的发生率为8/100008/100008/100008/10000。某研究者在当地随机抽取。某研究者在当地随机抽取。某研究者在当地随机抽取。某研究者在当地随机抽取500500500500人,结果人,结果人,结果人,结果6 6 6 6人患食管癌。请问当地食管癌是否高于一般?人患食管癌。请问当地食管癌是否高于一般?人患食管癌。请问当地食管癌是否高于一般?人患食管癌。请问当地食管癌是否高于一般?n n二项分布计算方法:二项分布计算方法:二项分布计算方法:二项分布计算方法:n nPiossonPiossonPiossonPiosson分布的计算方法:分布的计算方法:分布的计算方法:分布的计算方法:n n 2024/8/12

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号