方积乾《卫生统计学》第四章 常用概率分布-双语

上传人:tia****nde 文档编号:70805997 上传时间:2019-01-18 格式:PPT 页数:53 大小:3.79MB
返回 下载 相关 举报
方积乾《卫生统计学》第四章 常用概率分布-双语_第1页
第1页 / 共53页
方积乾《卫生统计学》第四章 常用概率分布-双语_第2页
第2页 / 共53页
方积乾《卫生统计学》第四章 常用概率分布-双语_第3页
第3页 / 共53页
方积乾《卫生统计学》第四章 常用概率分布-双语_第4页
第4页 / 共53页
方积乾《卫生统计学》第四章 常用概率分布-双语_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《方积乾《卫生统计学》第四章 常用概率分布-双语》由会员分享,可在线阅读,更多相关《方积乾《卫生统计学》第四章 常用概率分布-双语(53页珍藏版)》请在金锄头文库上搜索。

1、,Chapter 4 Probability Distributions 常用概率分布,Binomial Distribution 二项分布,1.1 Concept and feature (概念与特征) 例4-2 临床上用针灸治疗某型头痛,有效的概 率为60%,现以该法治疗3例,其中0例有效的 概率是多大?1例有效的概率是多大?2例有效 的概率是多大?3例有效的概率是多大?,Urn Model 瓮模型,一个袋子里有5个乒乓球,其中2个黄球,3个白 球,我们进行摸球游戏,每次摸1球,然后放回再摸。 先后摸100次,请问摸到零次黄球的概率有多大? (1)每次摸到白球的概率 = 0.6 (2)第1

2、次摸到白球的概率 = 0.6 第2次摸到白球的概率 = 0.6 第100次摸到白球的概率 = 0.6 (3) 100次摸到零次黄球的概率 =(0.6)(0.6)(0.6) = (0.6)100,Urn Model,先后100次,摸到3次黄球的概率有多大? (1)每次摸到黄球的概率= 0.4 (2)黄黄黄白白白白白白白 概率= (0.4)3(0.6)97 黄白黄黄白白白白白白 概率= (0.4)3(0.6)97 黄白黄白黄白白白白白 概率= (0.4)3(0.6)97 (3) 100次摸到3次黄球的概率 = (0.4)3(0.6)97 +(0.4)3(0.6)97 + = (0.4)3(0.6)

3、97 先后100次,摸到x次黄球的概率 =,n times, result in x events,Binary (二分类):每次摸球只有二种可能的结果,或黄球或白球; Independent (独立): 各次摸球是彼此独立的; Repeat (重复):每次摸到黄球或白球的概率是 和 1- 先后 n 次,摸到x 次黄球的概率 =,一般地,若随机变量取值 x 的概率为 其中, 则称此随机变量服从二项分布。 称为二项分布的概率函数。 二分类、独立、重复试验,若每次出现某事物的概 率为,则 n 次中有X 次出现该事物的概率服从二 项分布。,Binomial Distribution,Newtons

4、Binomial Expansion,The general term of the Binomial Expansion:,例4-2 临床上用针灸治疗某型头痛,有效的概率为60%,现以该法治疗3例,其中2例有效的概率是多大?2例以上有效的概率是多大? 3例 都无效的概率是多大?,图4-1 =0.5时,不同n值对应的二项分布,图4-2 =0.3时, 不同n值对应的二项分布,1.2 Features of Binomial Distribution,1.2.1Plots of Binomial distribution B(n,) 取决于 与 n 均数在 = n 处 接近0.5时,图形是对称的;

5、 离0.5愈远,对称性愈差 随着n的增大,分布趋于对称 n时,只要 不太靠近0或1,二项分布 近似于正态分布(n 和 n(1) 都大于5时),1.2. Mean and standard deviation of B(n,) 出现阳性结果的次数 X 总体均数 总体方差 总体标准差 出现阳性结果的频率 总体均数 总体标准差,1.2.1 Estimation of the probability 例4-5 如果某地钩虫感染率为13%,随机观察当地 150人,其中有10人感染钩虫的概率有多大? 分析:二分类 (感染、不感染) 独立 (假定互不影响) 重复( n= 150人),每人钩虫感染率均为 (=

6、13%) 感染钩虫的人数X 服从二项分布 B(150,0.13),1.2 Application of Binomial Distribution,单侧累积概率计算 单纯计算二项分布X 恰好取某值的概率没有太大意义 经常需要计算的是二项分布的累积概率,例4-6 某地钩虫感染率为13%,随机抽查当地150人, 其中至多有2名感染钩虫的概率有多大?,至少有20名感染钩虫的概率有多大?,2. Poisson distribution 泊松分布,2. 1 Concept of Poisson Poisson distribution: 描述罕见事件发生次数的概率分布。 例:出生缺陷、多胞胎、染色体异常

7、、癌症患病数或死亡数的分布。 Poisson distribution可以看作是二项分布的特例: 独立、重复的次数n很大很大 每次出现某事件的概率 很小 (或未出现某事件的概率1 很小),可以证明,当 , 时 , 定义:若随机变量X的的概率函数为 则称此变量服从Poisson分布,记为 ,其中 参数 是总体均数。,例: 1毫升水样品中大肠杆菌数目X的分布.,将1毫升水等分为n 个微小体积,这里n 很大; 每一个微小体积中大肠杆菌是否出现,互相独立; 每一个微小体积中大肠杆菌出现的概率都是,且 很小 每毫升水中大肠杆菌数目的分布服从Poisson分布,例:放射性物质一定时间内放射出质点数的分布,

8、时间 “n 很大、独立、概率都是 且很小”的二项分布 -Poisson分布,若每次观察互不独立、发生概率不等,则不能看作Poisson分布 !,观察结果不独立: 例如,传染性疾病首例出现后便成为传染源, 会增加后续病例出现的概率; 又如,污染的牛奶中细菌成集落存在、 钉螺在繁殖期一窝一窝地散布等等 这些现象均不能用Poisson分布处理。,2.2 Plot and feature,图4-3 取不同值时的Poisson分布图,Properties of Poisson distribution: (1)总体均数 = 总体方差 = (2)观察结果有可加性 If X1 and X2 are inde

9、pendent each other, then,例: 从同一水源独立地取水样5次,进行细菌培养。,第一次水样中的菌落数 X1 (1) 第二次水样中的菌落数 X2 (2) . 第五次水样中的菌落数 X5 (5) 把5份水样混合,合计菌落数也服从Poisson分布 X1+ X2+ X5 (1 + 2 +5) 医学研究中常利用其可加性,将小的观察单位 合并,来增大发生次数X,以便用后面讲到的正 态近似法作统计推断。,2.3 Application of Poisson distribution,2.3.1 Estimation of the probability 例4-8 如果某地居民脑血管疾病

10、的患病率为150/10万, 那么,该地1000名居民中, 2人患脑血管疾病的概率多大? = 150/10万,n=1000,则患病人数X服从二项分布。 因为150/10万较小,n=1000较大,将1000名居民看作 是一个观察单位,平均有1000150/10万1.5个患者。 可以认为1000名居民中患脑血管疾病的人数近似地 服从Poisson分布, =n=10000.0015=1.5,2.3.2 Calculation of cumulative probability 与二项分布问题相同, Poisson分布也经常需 要计算累积概率。 稀有事件发生次数至多为k次的概率为 发生次数至少为k次的概

11、率为,例4-9 实验显示某100cm2的培养皿平均菌落数为6个,试 估计该培养皿菌落数小于3个的概率;大于1个的概率。,该培养皿菌落数小于3个的概率为 菌落数大于1个的概率为,3. Normal Distribution 正态分布,3.1 Concept of Normal distribution 正态分布是自然界最常见的一种分布 测量的误差、人体的尺寸、许多生化指标 等等都近似服从正态分布。 许多其它分布可用正态分布近似 共同点: 变量的数值,中间多,两边渐少,近似对称。,图4-4 体模“骨密度”测量值的分布 - 接近正态分布(频率密度=频率/组距) 正态分布概率密度函数,频率密度,1,2

12、,3,正态概率密度曲线的位置与形状具有如下特点: (1) 关于X= 对称。 (2) 钟形曲线, X=处最大值 处有拐点 (3) 曲线下面积为1。 (4) 决定曲线在横轴上的位置 (5) 决定曲线的形状 N(, 2) 表示均数为 、标准差为 的正态分布。,图4-6 正态分布曲线下的面积分布,若X服从正态分布 N(, 2) , 可作如下的标准化变换(称Z变换) 则Z服从正态分布 N(0, 1) ,称为标准正态分布 统计学家编制了标准正态分布曲线下面积表(附表1)。,标准正态分布 N(0, 1) (standard normal distribution),例4-11 某地1986年120名8岁男孩

13、身高 均数=123.02cm ,标准差=4.79cm 试估计 (1)该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比; (2)身高在120cm128cm者占该地8岁男孩总数的百分比; (3)该地80%的男孩身高集中在哪个范围?,(1)计算130对应的Z值后查表,(2)身高在120cm128cm者的百分比: 先计算120 和128所对应的Z值: 120 对应的Z值为 128对应的Z值为 正态曲线下区间(-0.63,1.04)上的面积等于 (3)80%的8岁男孩身高集中在哪个范围? 标准正态分布曲线下左侧面积为0.10所对应的 Z值为-1.28,所以80%的8岁男孩身高集中在,3. 3

14、 Additive property,不论 X1和X2是否独立, X1+X2 仍服从正态分布 当X1和X2独立时,3.4 Application of Normal distribution,3.4.1 Determine the reference ranges (参考值范围) 特定的“正常”人群中大多数个体的取值范围。 “大多数个体”: 习惯上指95%的个体 1. 若变量服从正态分布 正态分布变量X在区间 上取值的概率为0.95,例4-12 调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布, 试估计该地健康女性血红蛋白的95%参考值范围。,双侧95%参考值范围:,2. 若

15、变量不服从正态分布 找出 和 双侧95%参考值范围:,0.025,0.025,P2.5,P97.5,必须注意: 1)医学参考值范围在临床上只能作为参考, 不 能作为诊断标准。 2)确定医学参考值范围必须抽取足够例数的样 本。 3)若测定值在性别间或年龄组间差别明显,应 分“层”确定参考值范围。,3.4.2 Control chart (控制图) 质量控制的一种重要工具 基本原理:如果某一波动仅仅由个体差异或 随机测量误差所致,那么观察结果服从正态分布。 例4-13 骨密度测量的质量控制。 通常在每天开机后首先对固定在机器内的“体模” 进行测量,将每天的“体模”测定值点在控制图上:,一旦出现8种情形之一,说明仪器需要调整:,(1)有一个点距中心线的距离超过3个标准差(位于控制限以外)。 (2)在中心线的一侧连续有9个点。 (3)连续6个点稳定地增加或减少。 (4)连续14个点交替上下。 (5)连续3个点中有两个点距中心线距离超过2个标准差。 (6)连续5个点中有4个点距中心线距离超过1个标准差。 (7)中心线一侧或两侧连续15个点距中心线距离都在1个标准差以内。 (8)中心线一侧或两侧连续8个点距中心线距离都超出1个标准差范围。,1,2,6,3,7,8,4,有一个点距中心线的距离超过3个标准差 5. 连续3个点

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号