率与构成比的假设检验

上传人:206****923 文档编号:50946552 上传时间:2018-08-11 格式:PPT 页数:94 大小:1.46MB
返回 下载 相关 举报
率与构成比的假设检验_第1页
第1页 / 共94页
率与构成比的假设检验_第2页
第2页 / 共94页
率与构成比的假设检验_第3页
第3页 / 共94页
率与构成比的假设检验_第4页
第4页 / 共94页
率与构成比的假设检验_第5页
第5页 / 共94页
点击查看更多>>
资源描述

《率与构成比的假设检验》由会员分享,可在线阅读,更多相关《率与构成比的假设检验(94页珍藏版)》请在金锄头文库上搜索。

1、第六节率与构成比的假设检验学 习 目 标v能够进行两个或多个率(或构成比 )差别的 检验v能够根据资料的性质正确选择 检 验方法。2检验v2检验是一种用途较广的假设检验方法 。它常用于分类计数资料的分析,如两 个或多个率或构成比的比较、计数资料 的相关分析等。(1)2分布是一种连续型随机变量 的概率分布v2分布的形状依赖于自由度v的大小, A:当自由度v 2时,曲线呈L型; B:当自由度v 2时,随着v的增加,曲线逐渐 趋于对称;C:当自由度v趋于时, 2分布逼近正态分布(2) 2分布的基本性质可加性v如果两个独立的随机变量X1和X2分 别服从自由度为v1和v2的 2 分布, 那么它们的和(X

2、1+X2)服从( V1+V2)的 2 分布。称为自由度为k的2分布。与标准正 态分布不同,2 分布的随机变量取 值在 o ,十 )。图 14 一 4 描述 了不同自由度2分布的概率密度曲线 。从附表 13 ( 22 分布界值表)可以查 到不同自由度的2分布的各种临界值 。设有k个相互独立的标准正态分布变量,则(二)分布的2检验v我们已经知道,频率是概率的反映 。当样本量足够大时,频率在概率 附近波动。根据这一事实,可用下 面的统计量来推断频率与概率差异 的状况 。v计算2值的基本公式2为卡方值,A为实际数,为观察所得数据;T= nPi为理论数,是按照假设或理论推算出来的数据2统计量是度量实际计

3、数与理论计数之间偏差的 统计量,该式定义的统计量对理论分布没有特殊的要 求,所以应用较广。vK . Pearson ( 1899 )证明了,如果零假设“ H0 :样本来自某理论分布”成立而且当大样 本时, ( 14 一 37 )式服从自由度为v的 2 分布。其中,vk一 1 一(计算 T 时利用样 本估计的总体参数的个数)。2统计量的意义,可通过下列例子说明:v例如:母豚鼠所产的幼豚鼠的性别分为雌雄两组, 在某次实验中,若干只母豚鼠所产的幼豚鼠中有70 只为雌性,54只为雄性,而在大量的调查资料中, 雌雄豚鼠的性比例一般为1:1。v如果观察频数与理论频数相吻合,则其性比例符合 1:1;如果相差

4、很大,即需要研究某种实验条件是 否影响母豚鼠所产幼豚鼠的性比例,这就需要研究 观察频数与理论频数相差的程度。由每组的观察频数(A)减去相应的理论频数(T), 即得每组A与T的差异,如果将各组A-T的频数相加 ,其总和数常等于零,这种关系可用下式表示:故用不能反映实际观察频数与理论观 察频数相差的程度v如果将A-T平方,并将各组 相加,得总 数 。观察频数与理论频数相差越大v,则 的数值越大,反之则越小。v尚有不足之处,因为绝对差异数还不能完全 反映相差的程度:v某一资料的观察频数为204,理论频数为200v另一资料的观察频数为19,理论频数为15v故需把 的数值变为相对数,即 分母为什么是T而

5、不是A,因为:v1.当理论数的数值极小时,由于抽样误差可 使实际观察例数为零;v2.理论数是大量的经验和自然规律推算出来 的,论据较广,而观察例数来自有限的样本 ,变动较大。二、完全随机设计两个样本率 比较的四格表2检验v这里的两个样本可以是完全随机分 组的两份样本,也可以是从两个总 体(例如男性与女性)分别独立抽 取的两份样本。例 14 一 21v为观察替硝哇治疗急性冠周炎的效 果,以甲硝唑为对照,某口腔科医 生收集了如下资料。试间两药疗效 是否相同。a bc d是该表的基本数据,其余数据都是由这四 个数据推算出来的,称为四格表资料。1、建立假设2、计算检验统计量(1)计算每个格子理论频数的

6、公式:R :表示行号,n R 是格子所在行的频数合计 ;C: 表示列号, n C是格子所在列的频数合计 。n :总频数。 于是格子 a 的理论频数(2)计算其余三个格子的理论频数为:(3)计算2统计量3、计算P值并作统计结论v查附表 13:故 0 . 01 P 0 . 025在a= 0 . 05 水平上拒绝 H0 ,接受 H1 。 可认为两药疗效不同,替硝哗疗效较好。四格表专用公式:常用的2检验成组(四格表)资料的2检验 n40,T5时时+-合计 甲aba+b 乙cdc+d 合计a+cb+d n=a+b+c+dP149n40,1 0 . 05 。v按a 0 . 05 水准,不能拒绝 H0 。所

7、以尚不 能认为甲地的感染率高于乙地。如果是双侧检验vH 0:v H1 :v则应将 IA 一 Tl 大于等于原表的所有四格表 (它们更支持 H1 )的概率相加作为检验的P 值。v双侧检验:vP=0.05, 2 =3.86vP=0.01, 2 =6.63五、 R xC 表分析v把表达构成比或多个样本率资料的统计表 统称为 R ( Row ) x C ( Column )表。v行列表2常用于多个样本构成比或多个样 本率的比较。(3)行列表资料的2检验经推导,行列表:A为实际数;为与某实际数(A)同行的合计数;为与某实际数(A)同列的合计数;n为总例数例 14 一 24v为了解立克次体病在某省存在的

8、情况, 1997 年对 23 个县(市) 进行了血清流行病学调查,结果 如下,试问不同年龄人群的立克 次体感染率是否不同?(1)建立假设,确定检验水准(2)计算检验统计量(3)求P值,做统计结论例 14 一 25v为探讨青少年吸烟行为与心理特质的关 系,南方某市调查到如下资料。试问, 吸烟与不吸烟的中学生心理特质构成是 否相同?(1)建立假设,确定检验水准(2)计算检验统计量(3)求P值,做统计结论在=0.05的水平上拒绝H0,接受 H1 , 可认为吸烟与不吸烟的中学生心理特质构成不同。(4) 作统计结论注 意 事 项:1.总样本量不能太小,至少50例;2.如有1/5以上格子的理论数小于5或

9、有一个格子的理论数小于1;应考虑a.条件允许时增加样本含量以增大 理论数;b.将理论数太小的行或列与相邻的行或列 的观察值合并,以增大理论数,但合并 时应考虑资料的性质合理合并,不能把 不同性质的实际频数合并,否则会导致 错误的结论。v2 如果行或列的变量是有序的(等级 分组的),不要仅作率或构成比的比较 。根据资料特点或研究目的还应考虑作 秩和检验或趋势检验分析。六、 2 x 2 列联表分析v对一份随机样本按两个二项分类的特征 进行交叉分类的结果,可归纳成双向分 类表,称为 2 x2 列联表。v这种表虽然在形式上与两个率比较的四 格表类似,但是分析的角度却有不同。 对 2 x2列联表一般可作

10、两个方面的分析 。1.两种特征分布间独立性检验v检验的目的:是判断两种特征分 类间是否存在关联 。如果一种特 征的概率分布与另一种特征的概 率分布无关,则认为这两种特征 相互独立。例 14 一 26v某医院从正常体检人员血清标本获得如 下结果,试问,乙肝表面抗原( HbsAg )与乙肝核心抗体(-HBc )检测结果之 间是否存在联系?分析v在表 14 17 中,如果 HbsAg 为阳性的151 人中一 HBc 的阳性率与 HbsAg 为阴性的 1911 人中一 HBe 的阳性率没有统计差异, 则可认为 HbsAg 与一 HBc 检测结果之间没 有关联,即相互独立。若将 HbsAg 与- HBc

11、 位置互换进行分析,道理是一样的。因此可 应用两个率比较的 X2 检验处理本例的问题。(1)建立假设,确定检验水准(2)计算检验统计量在 a = 0 . 05 水平上拒绝 H0,接受 H1 , 可认为两种检测结果有关联。(3)确定P值,作统计结论所以P 0 . 005 ,2. 两种检测结果比率比较v在本章前部已经对配对设计有所了 解。如果这种设计的反应变量为二 项分类,其观察结果可以整理成 2 x2 表(如表 1418 )。对这种资料分 析的目的之一是比较两种方法的阳 性率 。或当bc 40 时:检验统计量采用( 1444 )式:例 14-27v快速全血凝集试剂盒( JKD ) )与酶免疫分

12、析试验( EIA )检测 HbsAg ;结果如表 14 一 l8 ,试问两种方法检测结果是否相同?(2)计算检验统计量(1)建立假设,确定检验水准七、二项分布的 u 检验(一)完全随机设计的样本率与一 个数值的比较v如果二项分布的或1- 不太小,则当n足 够大时,近似有v于是对于检验假设:v H 0: vHI :v可应用检验统计量 u 进行推断式中: n:样本容量, X:样本阳性数, 样本率 :p = X n0.5 是连续性校正数,n较大时可略去。例 14 一 28v某医院称治疗声带白斑的有效率为 80 。今 统计来求医的此类患者60例,其中 45 例有 效。试问该医院宣称的疗效是否客观?(1

13、)建立假设,确定检验水准(2)计算检验统计量(3)求P值,做统计结论(二)完全随机设计的两个样本率比较例 1429v用硝苯毗咤治疗高血压急症患者 75 例,有效 者 57 例;用硝苯吡啶卡托普利治疗同类患 者 69 例, 66 例有效。试问两疗法疗效是否 相同?(1)建立假设,确定检验水准(2)计算检验统计量(3)求P值 (双侧) u0.001 = 3.2905 ,所以 P 20 时,依据 Poisson 分布近 似正态分布的原理,可以对其总体均数进行 推断。(一)样本均数与总体均数的比较v检验统计量为:例 14 一 30v某地 10 年前计划到 2000 年把孕产妇死亡率 降到 25 / l

14、0 万以下 。2000 年监测资料显示 ,该地区平均相对于每 10 万例活产儿孕产妇 死亡 31 人。问该地区降低孕产妇死亡的目标 是否到达到?(1)建立假设,确定检验水准(2)计算检验统计量(3)求P值,作统计结论(二)完全随机设计的两样本均数比较v当两总体均数均大于 20 时,依据 Poisson 分布近似正态分布的原理,可以应用 u 检验 对其总体均数进行推断,当两样本取样次数 相同时用。当两样本取样次数不同时用:其中 分别为两样本均数, n1与 n2是取样次数其中 :x1 与 x2 分别为两样本计数例 1431v甲、乙两检验师分别观察15名正常人末梢血 嗜碱性自细胞数量。每张血片均观察

15、 200 个 视野。结果甲计数到嗜碱性白细胞 26 个乙 计数到 29 个。试问两位检验师检查结果是否 一致 ?按 v= 查附表 6 ( t 界位表), 知双侧U0.50. 6745 ,所以P0. 5 。 按 a =0.05 水准不能拒绝 H0,不能认为两检 验师检查结果有差异。(1)建立假设,确定检验水准(2)计算检验统计量(3)求P值,作统计结论例 某医师研究血型与胃、十二指肠溃疡间的关联性 ,比较胃溃疡病人与十二指肠溃疡病人的血型分 布,结果见下表。胃溃疡与十二指肠溃疡病人的血型分布 疾病血型分布合计计OABAB胃溃疡溃疡251113 4 53十二指 肠溃疡肠溃疡637157 9200合计计88827013253地域 淋巴上皮癌 未分化癌 鳞癌 其它 合计 南方四省 71 6 16 18 111 东北三省 89 18 22 51 180 合计 160 24 38

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号