几种离散型变量的分布及其应用 2010-10-20(4学时)

上传人:101****457 文档编号:50610184 上传时间:2018-08-09 格式:PPT 页数:79 大小:629.50KB
返回 下载 相关 举报
几种离散型变量的分布及其应用 2010-10-20(4学时)_第1页
第1页 / 共79页
几种离散型变量的分布及其应用 2010-10-20(4学时)_第2页
第2页 / 共79页
几种离散型变量的分布及其应用 2010-10-20(4学时)_第3页
第3页 / 共79页
几种离散型变量的分布及其应用 2010-10-20(4学时)_第4页
第4页 / 共79页
几种离散型变量的分布及其应用 2010-10-20(4学时)_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《几种离散型变量的分布及其应用 2010-10-20(4学时)》由会员分享,可在线阅读,更多相关《几种离散型变量的分布及其应用 2010-10-20(4学时)(79页珍藏版)》请在金锄头文库上搜索。

1、第六章 几种离散型变量的分布及其 应用第一节 二项分布(Binomial distribution)第二节 Poisson分布第三节 负二项分布(不讲)176276第一节 二项分布Binomial distribution376例6-1 某种药物治疗某种非传染性疾病的有效率为0.70。今用该药治疗该疾病患者10人,试分别计算这10人中有6人、7人、8人有效的概率。每个人出现结果是独立的,互不影响,对每个个体发生的可能性是相同的。(而且每个人出现的结果是两种可能的结果中的一种。)476X为k=0、1、2、3的概率: 恰好等于 展开式中的各项, =0.027+0.189+0.441+0.343=1

2、, 称这种概率分布为二项分布。当n=3时,3人中出现阳性的人数(X),可能为0、或1、或2、或3, 则有:576规律:二项分布 二项式 展开的通项式中且总有:676样本:含量: 某类个体数 非某类个体数 样本率(构成比)776分类资料:分类个体数。最简单分 两类 总体:总个体数 某类个体数 非某类个体数 总体率(构成比) 统计推断:由样本信息(p)推断876二项分布有两个参数:总体率样本含量记作:XB(n,) 976例6-1 某种药物治疗某种非传染性疾病的有效率为0.70。今用该药治疗该疾病患者10人,试分别计算这10人中有6人、7人、8人有效的概率。本例n=10,=0.70,X=6,7,8。

3、按公式(6-1)计算相应的概率为0.2001210761176二项分布的适用条件和性质:(一) 二项分布的适用条件 1. 每次试验只会发生两种对立的可能结果之一,即分别发生两种结果的概率之 和恒等于1; 2. 每次试验产生某种结果(如“阳性”) 的概率固定不变; 3. 重复试验是相互独立的,即任何一次试验结果的出现不会影响其它试验结果 出现的概率。1276在上面的例6-1中,对这10名非传染性疾病患者的治疗,可看作10次独立的重复试验,其疗效分为有效与无效,且每一名患者治疗有效的概率(=0.70)是恒定的。这样,10人中发生有效(+)的人数X 符合XB(10,0.70)。1376(二) 二项分

4、布的性质1. 二项分布的均数与标准差(1)在n次独立重复试验中,出现“阳性” 次数X 的n总体均数为n总体方差为n总体标准差为 1476(2)若以率表示,则样本率p的n总体均数为n总体方差为 n总体标准差为 1576n样本率的标准差也称为率的标准误,可用来描述样本率的抽样误差,率的标准误越小,则率的抽样误差就越小。n在一般情形下,总体率往往并不知道。此时若用样本资料计算样本率p=X/n 作为的估计值,则 的估计为:16762.二项分布的图形 对于二项分布而言 , (1)当=0.5时,分布是对称的,见图6-1 ; 1776(2)当 0.5时,分布是偏态的,但随着n的增大,分 布趋于对称。当n 时

5、,只要不太靠近0或1,二项 分布则接近正态分布,见图6-2。1876二项分布接近正态分布的条件:n与n(1-)都大于5(或np与n(1-p)都大于5)1976二项分布的应用: (一)总体率的区间估计(二)样本率与总体率的比较(三)两样本率的比较(四)研究非遗传性疾病的家族 集聚性 (五)群检验2076(一)总体率的区间估计 1. 查表法 对于n 50的小样本资料,直 接查附表6百分率的95%或99%可信区间 表,即可得到其总体率的可信区间。例6-2 在对13名输卵管结扎的育龄妇女经壶腹部-壶腹部吻合术后,观察其受孕情况,发现有6人受孕,据此资料估计该吻合术妇女受孕率的95%可信区间。2176本

6、例n=13,X=6。查附表6,取0.05时,在n=13(横行)与X=6(纵列)的交叉处数值为1975,即该吻合术妇女受孕率的95%可信区间为(19%,75%)。附表6只列出 的部分。当 时,可先按“阴性”数n-X查得总体阴性率的 可信区间QLQU,再用下面的公式转换成所需的阳性率的 可信区间。 PL=1-QU, PU=1-QL 22762. 正态近似法 根据数理统计学的中心极限定理可得,当n较大、不接近0也不接近1时,二项分布B(n,)近似正态分布 ,而相应的样本率p的分布也近似 正态分布。为此,当n较大、p和1-p均不太小如np和n(1-p)均大于5时,可利用样本率p的分布近似正态分布来估计

7、总体率的可信区间。 2376的 可信区间为:如: 的95%可信区间为的99%可信区间为2476例6-3 在观测一种药物对某种非传染性疾病 的治疗效果时,用该药治疗了此种非传染性 疾病患者100人,发现55人有效,试据此估 计该药物治疗有效率的95%可信区间。2576(二)样本率与总体率的比较1.直接法 在诸如疗效评价中,利用二项分布直接计算有关概率,对样本率与总体率的差异进行有无统计学意义的比较。比较 时,经常遇到单侧检验,即“优”或“劣”的问题。那么,在总体阳性率为的n次独立重复试验中,下面两种情形的概率计算是不可少的。 2676(1)出现“阳性”的次数至多为k次的概 率为:(2)出现“阳性

8、”的次数至少为k次的概 率为27762876例6-4 据报道,对输卵管结扎了的育龄妇女实施壶腹部-壶腹部吻合术后,受孕率为0.55。今对10名输卵管结扎了的育龄妇女实施峡部-峡部吻合术,结果有9人受孕。问实施峡部-峡部吻合术妇女的受孕率是否高于壶腹部-壶腹部吻合术?显然,这是单侧检验的问题,其假设检验为H0:=0.55H1:0.55=0.052976对这10名实施峡部-峡部吻合术的妇女,按0.55的受孕率,若出现至少9人受孕的概率大于0.05,则不拒绝H0;否则,拒绝H0,接受H1。本例n=10,=0.55,k=9。按公式(6-12)有:按=0.05水准,拒绝H0,接受H1,即认为实施峡部-

9、峡部吻合术妇女的受孕率要高于壶腹部-壶腹部吻合术。3076317632762.正态近似法 当n较大、p和1-p均不太小,如np和n(1-p)均大于5时,利用样本率的分布近似正态分布的原理,可作样本率p与已知总体率0的比较。检验统计量u值的计算公式为: 3376例6-6 对某疾病采用常规治疗,其治愈率为45%。 现改用新的治疗方法,并随机抽取180名该疾病患者 进行了新疗法的治疗,治愈117人。问新治疗方法是否比常规疗法的效果好?本例是单侧检验,记新治疗方法的治愈率为,而 0=0.45。其假设检验为H0:=0.45H1:0.45=0.053476本例n=180,p=117/180=0.65查u界

10、值表(t界值表中 为 的一行)得单侧 。按 =0.05水准,拒绝H0,接受H1,即新的治疗方法比常规疗法的效果好。3576(三)两样本率的比较n两样本率的比较,目的在于对相应的两总体率进行统计推断。n设两样本率分别为p1和p2,当n1与n2均较大,且p1、1-p1及p2、1-p2均不太小,如n1p1、n1(1-p1)及n2p2、n2(1-p2)均大于5时,可利用样本率的分布近似正态分布,以及独立的两个正态变量之差也服从正态分布的性质,采用正态近似法对两总体率作统计推断。 3676n检验统计量u的计算公式为:3776例6-7 为研究某职业人群颈椎病发病的性别差异,今随机抽查了该职业人群男性120

11、人和女性110人,发现男性中有36人患有颈椎病,女性中有22人患有颈椎病。试作统计推断。记该职业人群颈椎病的患病率男性为1,女性为2,其检验假设为H0:1=2H1:12=0.053876本例n1=120,X1=36,p1=X1/n1=36/120=0.30;n2=110,X2=22,p2=X2/n2=22/110=0.20查u界值表得0.0550时,可采用正态近似法估计总体均数的 可信区间,计算公式为:如: 的95%可信区间为:上式用于最小单位数 n=1时的情况。当n=2时时,计计算公式为为:P134, 练习题的“一、 最佳选择题”的第3题 ,答案是“E”。6176例6-11 某研究者对某社区

12、12000名居民进行了健康检查,发现其中有68名胃癌患者。估计该社区胃癌患病数的95%和99%可信区间。6276(二) 样本均数与总体均数的比较对于Poisson分布资料而言,进行样本均数与总体均数的比较有两种方法。1. 直接法 当总体均数 20时,可采用直接计算概率的方式对样本均数与已知总体均数间的差别进行有无统计学意义的比较,这实质上是对以样本计数X为代表的总体率与已知的总体率0是否有差别进行推断。6376例6-12 一般人群先天性心脏病的发病率为8,某研究者为探讨母亲吸烟是否会增大其小孩的先天性心脏病的发病危 险,对一群2025岁有吸烟嗜好的孕妇进行了生育观察,在她们生育的120名小孩中

13、,经筛查有4人患了先天性心脏病。试作统计推断。 6476对于这样一种低发病率的样本计数资料可看作服从Poisson分布。在120名被调查的小孩中,按0=0.008的发病水平,若有4名及以上的小孩患先天性心脏病的概率大于0.05,则尚不能认为母亲吸烟会增大其小孩的先天性心脏病的发病危险;否则,即说明母亲吸烟会增大其小孩的先天性心脏病的发病危险。为此,本例可作如下的假设检验。657666762. 正态近似法 根据 Poisson 分布的性质,当l20 时,可用正 态分布来近似。样本计数X 与已知总体均数l的比较,采用下式计算标准正态检验统计量 6776n例6-13 有研究表明,一般人群精神发育不全

14、的发生率为3,今调查了有亲缘血统婚配关系的后代25000人,发现123人精神发育不全,问有亲缘血统婚配关系的后代其精神发育不全的发生率是否要高于一般人群?n可以认为人群中精神发育不全的发生数服 从Poisson分布。本例n=25000,X=123,0=0.003, =n0=250000.003=75。68766976(三) 两个样本均数的比较n对服从Poisson分布的样本,其样本计数可看作是样本均数。两个样本均数的 比较,目的在于推断两样本所代表的两总 体均数是否有差别。n设两个样本计数分别为X1和X2,可利用正态近似法进行比较。70761. 两个样本的观察单位数相等,即n1=n2 。717

15、62. 两个样本的观察单位数不相等,即n1 n2 。7276例6-14 某卫生检疫机构对两种纯净水各抽验了1ml水样,分别培养出大肠杆菌4个和7个,试比较这两种纯净水中平均每毫升所含大肠杆菌数有无差别?n本例水样中的大肠杆菌数服从Poisson分布,两种水样的观察单位数相等,即均为1ml。两样本计数分别记为X1=4和X2=7,X1+X2=7+4=11。选择公式(6-21)来计算检验统计量。73767476n例6-15 某研究者为了分析一种罕见的非传染性疾病发病的地域差异,对甲地 区连续观察了四年,发现有32人发病;对乙地区连续观察了三年,发现有12人发病。假定甲、乙两地区在观察期内的人口构成相同,人口基数相近且基本不变,试作统计推断。7576n本例中疾病的发病人数服从Poisson分布,但对甲地区连续观察了四年(n1=4),而对乙地区只连续观察了三年(n2=3),即两个样本的观察时间单位数不相等。甲、乙两地区在观察期内 的发病人数分别记为X1=32和X2=12,X1+X2=32+12=44。选择公式(6-22)来计算检验统计量。76767776练习题P134 一、最佳选择题全做三、计算分析题1、2、3、478767

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号