02 概率与分布幻灯片

上传人:m****5 文档编号:51945282 上传时间:2018-08-17 格式:PPT 页数:47 大小:1.94MB
返回 下载 相关 举报
02 概率与分布幻灯片_第1页
第1页 / 共47页
02 概率与分布幻灯片_第2页
第2页 / 共47页
02 概率与分布幻灯片_第3页
第3页 / 共47页
02 概率与分布幻灯片_第4页
第4页 / 共47页
02 概率与分布幻灯片_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《02 概率与分布幻灯片》由会员分享,可在线阅读,更多相关《02 概率与分布幻灯片(47页珍藏版)》请在金锄头文库上搜索。

1、 第第 2 2 章章概率与分布概率与分布统计学结论两部分 : 结论概率2.1 概率和有关概念2.1.1 概率(Probability)l 掷骰子可能结局: 1, 2, , 6 “1” 的概率 = 1/6l 色盲检查可能结局: 正常、异常异常的概率 = ? - 未知!随机选择 n 位学生, 若其中m 位色盲, 则异常的概率 一般地, 事件: 可能的结局 ,l 事件 E 的概率 : P(E) - 0 和 1 之间l条件概率:在 出现的条件下, 事件 的概率例如, P( 鼻咽癌EB病毒 +)2.1.2 优势(Odds) 对立事件: 如果只有两种互相对立的、可能的结局,记为 和优势: 优势比: A、B

2、两个不同条件下,优势OddsA 和 OddsB 之比例. 若 A ,B 和 C 三个班级学生感冒的概率为 60% , 50% 和 40% ,则 2.1.3 Bayes 公式肺癌 (B) 与吸烟 (A) 理想情形: 将对象随机分成两组, 邀请一组吸烟,另一组禁止吸烟; 随访若干年,得到患肺 癌的人数 然而, 不可行! 但是,我们可以这样做:利用Bayes 公式计算 Example 2.1 结论: 吸烟者的肺癌风险是一般人肺癌风险 的5 倍。2.3 二项分布 (binomial Distribution)一般地, 若一次试验中某事件出现的概率为 , n 次独立、重复试验后,该事件出现的总次数 X

3、是一个随机变量,则 X=x 的 1 概率可以这样计算:我们称变量 X 服从二项分布, 记为 为什麼称为二项分布? 请看下面的展开式: 2.3.2 二项分布的图形2.3.3 总体均数和总体方差例2.3 已知某种动物关于某毒物的50%致死剂量 (LD50), 现有5只这样的动物注射了该剂量, 试分别计算死亡动物数X0, 1, 2, 3, 4, 5的概率。 l每个动物 将要死或生, 0 或 1 ; l每个动物 死于注射毒物的概率为 ;l独立、重复 5 次可能的死亡数 ;lX 服从二项分布2.4 Poisson 分布l罕见 “颗粒” 的分布二项分布的特例: 大 n, 小 例 同位素脉冲计数.l 大 n

4、 , 0-1: 将事件轴分成n 个小段, 小到每一段时 间内脉冲个数 = 0 或 1l罕见事件:l脉冲数的平均值为: l独立:时间段内脉冲发生与否是互相独立的当 n, 将趋于一般地, 若随机变量 X 的概率函数形如上式 , 我们就说 该随机变量服从 参数为 的 Poisson 分布, 记为 例:玻片上红细胞计数.(1) 将玻片分成 n 个小方格 - 0 或 1, 大 n (2) P (小方格 中出现1个红细胞) = - 小概率(3)小方格间,是否有红细胞 - 独立 因此, 红细胞总数 Poisson 分布注意: “独立” 和 “重复” 很重要, 否则,红细胞 总 数不服从Poisson 分布。

5、例:l罕见传染病, 患者总人数不服从 Poisson 分布. 为什麼?l细菌在牛奶中“扎堆”, 细菌总数并不服从 Poisson 分布. 为什麼?2.4.2 概率函数的图形, 正偏峰; , 近似对称Poisson 分布的性质 l总体均数 =总体方差 =l可加性 l若 和 互相独立, 则l若 则注意: 为什麼?l 若 , 则 2X 并不服从并不服从例: 从河中取出5份样品, 检查大肠杆菌数 目 第1份样品, X1 (1) 第2份样品, X2 (2) . . 第5份样品, X5 (5) 将5份样品混合起来,大肠杆菌总数也服从 Poisson分布X1+ X2+ X5 (1 + 2 +5) 可加性的应

6、用: 将小单位合并,使得观察单位放大,这样,增 大 了参数值, 分布就变得接近对称,数据处理方便 。2.5 正态分布 (Normal Distribution)实践中,许多频率分布形状如此: 中间高, 两侧低、对称123正态分布有两个参数: 总体均数 总体方差记为标准正态分布 , , 任何正态分布变量 , 经过标准化变换后,Z 称为 标准正态离差 (standardized normal deviate)或 Z-值, 或 Z-得分2.5.2 正态概率密度曲线下面积多数统计教科书都附有标准正态分布表:根据Z值查下侧尾部面积(概率), 或 根据下侧尾部面积(概率)查Z值z0l 区间上方的面积对应于

7、 1.96, 单侧尾部面积为 0.025, 双侧尾部面积为 0.05 l 区间上方的面积对应于 2.58, 单侧尾部面积为 0.005双侧尾部面积为 0.010 临界值 : 双侧临界值: 单侧临界值的分布X1+X2 还是服从正态分布当 X1 和 X2 互相独立, 2.5.3 参考值范围的确定l参考值范围或“正常值范围”: (1) 大多数 “健康人” 的取值范围. “大多数” : 95% or 99% “健康人”: 必须明确定义 (2) 由大样本来确定 (3) 可以用作诊断标准吗?1. 若变量服从正态分布则 覆盖 95% 的“健康人”.然而, 通常是未知的! 它们用 代替 (只有大样本是才能代替

8、!)因此, 参考值范围: 2.若变量不服从正态分布找出 百分位数 和百分位数 因此, 参考值范围:例 基于120 名健康妇女的血色素资料, ; 直方图显 示, 接近正态分布. 请估计妇女血色素的双侧 95% 参考值范围.注意l95% 参考值范围只告诉我们: 95% 健康人的 数值在此范围内; l若某人的数值在此范围内, 我们能宣布其为 “ 正常” 吗?l若某人的数值在此范围外, 我们能宣布其为 “ 不正常” 吗?- - 参考值范围不能作为诊断标准!参考值范围不能作为诊断标准!2.5.4 二项分布和 Poisson 分布的正 态近似l当 n 足够大 (n 5, n(1-) 5) , 二项分布 近

9、似于正态分布 l当足够大 ( 20 ) , Poisson 分布近似于正态分布 连续性校正Example The infectious rate of hookworm(钩虫) is 13%,if randomly select 150 people,what is the probability that at least 20 of them being infected?The probability that at leastThe probability that at least 20 of them being 20 of them being infected is 50%in

10、fected is 50%。 Area of the rectangles on 例 0.5 小时内同位素脉冲服从Poisson分布请估计脉冲数超过 400 的概率. 小结 三种分布:离散型变量: 二项分布Poisson 分布连续型变量: 正态分布 1. 二项分布一次试验结果: 0 或 1一次试验阳性结果的概率= ,一次试验阴性结果的概率= 1- ,独立重复 n 次试验,阳性结果出现的总次 数2. Poisson 分布当 或 ( 1- )非常小,n 非常大,二项分布 近似于 Poisson 分布3. 正态分布 - 极其重要许多现象服从正态分布; 统计学理论的基础l两个参数:均数 标准差 lZ- 变换l正态分布密度曲线下面积4. 正态近似当 n 很大 (n and n(1- ) 5),近似于当 很大 (20 ) , 近似于Thank you

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号