格表的确切概率法

上传人:宝路 文档编号:47928131 上传时间:2018-07-06 格式:PPT 页数:30 大小:2.02MB
返回 下载 相关 举报
格表的确切概率法_第1页
第1页 / 共30页
格表的确切概率法_第2页
第2页 / 共30页
格表的确切概率法_第3页
第3页 / 共30页
格表的确切概率法_第4页
第4页 / 共30页
格表的确切概率法_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《格表的确切概率法》由会员分享,可在线阅读,更多相关《格表的确切概率法(30页珍藏版)》请在金锄头文库上搜索。

1、卫生统计学(第五版)卫生统计学与数学学教研室检验水准调整: 第四节 配对设计下两组频数分布的卡方检验一、二分类情形列联表 计数资料的配对设计常用于两种检验方法,培养方法、诊断方法的比较。其特点是对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果。 甲培养基乙培养基合计阳性 阴性 阳性 阴性22 (a)2 (c)18 (b)14 (d)4016合计 24 32 56(固定值)表7-10 两种培养基白喉杆菌生长情况例7-6 设有56份咽喉涂抹标本,把每一份标本一分为二,依同样的条件分别接种于甲、乙两种白 喉杆菌培养基上,观察白喉杆菌的生长情况,结果 如表7-10,问

2、两种培养基上白喉杆菌的生长概率有 无差别? 本例是以每份标本一分为二,分别同时接种于两种培养基上,属于配对设计;两份样本实质上是一样 的,不是互相独立的,观察白喉杆菌生长与否,指标 为二分类的定性变量;目的是通过样本资料来推断两 方法的阳性概率有无差别。 观察结果甲培养基的阳性率等于40/56,乙培养基的阳性率等于24/56,比较总体阳性概率不能用前 面第二节的办法,原因是前面的办法针对的是“两组 独立样本”,而现在我们遇到的实质上是一组样本, 即使分成了两份,也是“两份互不独立的样本”需要 另想方法。 变量1变量2合计阳性 阴性 阳性 阴性acbdn1n2合计 m1 m2 n(固定值)表7-

3、11 两个变量阳性率比较的一般形式和符号这类问题的原始数据可以表示为表7-11所示的四格表形式。表7-11和表7-3的区别仅在设计上,前面是 两个独立样本,行合计是事先固定的;而这里的“两 份样本”互不独立,样本量都是n,固定的,而行合计 与列合计却是事先不确定的。 由表7-11不难看出, 变量1的阳性率 变量2的阳性率 变量1的阳性率变量2的阳性率 可见,两个变量阳性率的比较只和b、c有关,而 与a、d无关。 回到表7-10,两种培养基白喉杆菌生长状况一致的两个格子频数分别为 其中,a,d,为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。当两种处理方法无差别时,对总体有B

4、=C。由于在抽样研究中,抽样误差是不可避免的,样本中的b和c往往不相等。为此,需进行假设检验 。该法一般用于样本含量不太大的资料。 这两个频数的大小显示不出两种培养基上白喉杆菌生长状况的差别。比较两种培养基的阳性概率 是否有差别,需要考察白喉杆菌生长状况不一致的 两个格子,我们只对其中的频数 两种培养基上白喉杆菌生长的阳性概率相等 两种培养基上白喉杆菌生长的阳性概率不相等 检验检验 水准若 成立, 白喉杆菌生长状况不一致的两个格 子理论频数都应该是 由检验 基本公式(7-1)有化简后不难得到, 统计量的计算公式为(7-12) 若 公式(7-14)校正公式为(7-13) 对于例7-6数据,因为

5、按式(7-15)计算由 临界值表, 按 水准拒绝 , 差别有统计学意义, 可以认为,两种培养基上白喉杆菌生长的阳性概率不相等。鉴于甲培养基阳性频率为 40/56=71.4%,乙培养基为24/56=42.9%,可以认为 ,甲培养基阳性概率高于乙培养基。 我们将两个变量不一致的总例数(b+c)视为固定值,在此条件下进行推断无需考虑两变量一致的总例数a和d的大小。这类方法在统计学中称为条件推断方法。当然,也有文献报道对此类问题进行非条件推断的方法,这时a和d的信息都能用上,但十分复杂,超出了本书的范围。以上检验称为 检验。 二、多分类的情形RR列联表 例7-7 对150名冠心病患者用两种方法检 查室

6、壁收缩运动的情况,检测结果见表7-12 。试比较两种方法测定结果的概率分布有无 差别。 甲法测定结果乙法测定结果合计正常 减弱 异常 正常 减弱 异常60083 2 42 9 9 17655134 合计 6854 28 150(固定值)表7-12 两种方法检查室壁收缩运动情况类似于例7-6,这里是配对设计,只是定性变量有3种可能的“取值”;甲方法的测定结果 是一组频数分布;乙方法的测定结果 是另 一组频数分布。 需要检验的是 两种测定方法的检查结果的概率分布相同 两种测定方法的检查结果的概率分布不相同 检验检验 水准变量1变量2合计1 2 R 1 2 RA11 A12 A1cA21 A22 A

7、2c AR1 AR2 ARRn1(固定值)n2(固定值) nR(固定值) 合计 m1 m2 mR n(固定值)表7-13 配对设计下多分类资料的RR列联表配对设计下多分类资料一般可表示为表7-13的形式。表7-13是表7-11的推广,这里的定性变量1和变 量2都有R个可能的“取值”,R2。 现在的问题是: 基于一份配对的多分类样本,我们得到了两组频数分布, 要了解它们的总体 概率分布是否相同,即两变量的概率分布相同 两变量的概率分布不相同 检验检验 水准我们采用的检验统计量为(7-14) 其中k为类别数, 分别为第i行合计和第i列合计。 成立时(7-14)式中统计量服从自由度为k-1的 分布。

8、 当k=2时,(7-14)式便回到(7-12)式,这说明本 节的方法 是检验的推广。 例7-7, 故尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同。 =1.60搜集n对同胞,每一对中必须有一位是某疾病的患者,另一位未患该疾病;变量1为该病患者在某位点的等位基因类别,变量2为未患者在该点的等位基因类别。要检验的是:同胞对中患病者与未患病者在该位点上等位基因的概率分布是否相同。如果两个概率分布不同,则该基因位点可能与该疾病有关。 将上述方法用于多等位基因传递不平衡检验 第五节 检验要注意的问题 1. 理论数不宜太小,一般不宜有1/5以上格子的 理论频数小于5,或有一个理论频数小于1。

9、对理 论数太小有三种处理方法: 最好增加样本含量以增大理论频数;根本的方 法。 删去理论频数太小的行和列;此法不好。 将理论频数较小的行或列与邻行或邻列合并以 增大理论频数。但后两法可能会损失信息, 2.当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相等。若要比较彼此间的差别,可用行列表的分割法。 3.对于行列表单向等级资料(单向有序资料)组间的比较,宜用第八章秩和检验,如作卡方检验法只说明各处理组的效应在构成比上有无差异,而不能说明组间整体效应的差异。 假设检验基础一、二分类情形列联表一、二分类情形列联表end第六节

10、* 四格表的确切概率法 前已述及,四格表若有理论频数T小于1,或n40时 ,尤其是用其他检验方法所得概率接近检验水准时 ,宜用四格表的确切概率法(exact probabilities in 22 table),即四格表概率的直接计算法。 本法的基本思想是:在四格表周边合计不变的情况 下,获得某个四格表的概率为 :end例7-14 抽查两批食品的卫生状况,作大肠杆菌检 查,检查结果见表6-10。问两批食品的卫生状况有 无差别?表7-14 甲乙两批食品大肠杆菌检查结果 组 别阳性数 阴性数合计阳性率 ()甲批26(28. 8) 7(4.2) 3341.67乙批36(33. 2) 2(4.8) 3

11、810.00合 计 62 97127.27end计算 P 值 表7-14中甲批食品阳性率P1=0.4167,乙批食品阳性率P2=0.1000,两者之差| p1p2 |=0.3167。在周边合计数不变的条件下,可能还有其它组合的四格表,其阳性率之差0.3167,所有这些比当前四格表更极端的情况都应考虑进去,因为这些极端情况在H0条件下都有可能发生。 endv 表7-11中| p1p2 |0.3167的四格表为序 号(0)、(1)、(5)、(6)的情形,按公式 求得序号(1)的概率为end表7-11 确切概率计算表(四格表周边合计数不变) endv余仿此,P(0)=0.0124, P(5)=0.0405, P(6)=0.0028, 因此所求概率为: v 推断结论 按=0.05的水准,不拒绝H0,差异无统计学意义。还不能认为两批食品卫生状况有差别。P =P(0)+P(1)+P(5)+P(6)=0.0124+0.1061 +0.0405+0.0028=0.1618

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号