文档详情

[医学]定性资料比较

tia****nde
实名认证
店铺
PPT
2.23MB
约79页
文档ID:71661021
[医学]定性资料比较_第1页
1/79

定性资料的比较,定性资料为以下两类分类变量的观察资料: 1)无序分类变量:如血型(A、B、O、AB)、性别(男、女)等 适用: 检验 2)有序分类变量:如疗效( 治愈、显效、好转、无效、死亡)、使用的药物剂量(高剂量 、中剂量 、低剂量)等 适用:秩和检验一、定性资料案例及比较原理 二、两组二分类资料比较 1. 独立的两组二分类资料比较- 检验 2. 配对的两组二分类资料比较- 检验 三、独立的多组二分类资料比较- 检验 四、独立的多组多分类资料比较 1. 无序多分类资料比较- 检验 2. 有序多分类资料比较- 秩和检验,一、定性资料案例及比较原理 (一)案例,例1 某医生欲比较万拉法新与氟西汀治疗老年期抑郁症的疗效,将病情相近的60名患者随机分成两组,分别用两种药物进行治疗,结果见表1解析 : 研究变量:为单个定性变量,即治疗效果,取值为痊愈和未愈 研究组为:万拉法新组和氟西汀组 万拉法新组痊愈率P1=63.33% 氟西汀组痊愈率P2=50.00% (两组两分类资料) 解决的问题:两种药物治疗所代表的总体的痊愈率是否相同 本类问题通常选用 检验来解决通过观察我们发现,表1中最基本的数据只有4个:19、11、15、15,其余数据都可以用这4个数据推算出来。

称为四格表(fourfold table)其一般形式见表2例2 采末梢血与静脉血检查乙型肝炎抗原,结果见表3解析 每个患者分别采取末梢血与静脉血进行乙型肝炎抗原检查的结果,属于配对设计,末梢血的结果和静脉血的结果虽然分属两份样本,但它们不是相互独立的 资料的表达形式也是一个2×2表,但其含义完全不同于表2 目的:比较两个样本血液检验结果的总体阳性率有无差异我们将这样的数据形式称为配对四格表,其一般形式见表4在对配对设计资料进行总体率的差异性检验时,由于设计方法与完全随机设计不同,检验假设 统计量的计算也有相应的专用 检验公式例3 用磷霉素的三种制剂治疗皮肤软组织感染,其疗效结果见表5解析 : 研究变量:为一个定性变量,其可能取值有两个,痊愈和未愈 研究组:有三个,软膏组、油膏组和粉剂组 目的: 解决这三组频数分布所对应的总体痊愈率是否相同的问题 (多组两分类资料)其一般形式见表6 应用 检验本类问题通常进行检验进行各组间的比较,有差异的情况下再根据具体情况进行适当的两两比较例4 某研究者欲研究汉族、回族和满族居民的职业分布情况,按3个民族分别抽样,分别调查了145、97和99人,共341人,调查结果见表7。

解析: 研究变量:为一个定性变量 “职业”有4个取值:干部、工人、农民和其他 研究组:有三个,汉族、回族和满族三个组 目的: 解决这三组样本频数分布所对应的总体频数分布是否相同的问题 (多组多分类资料)称为R×C列联表 其一般形式见表8按照R×C表中分组变量的类型,以及分析的目的可以分为: 无序列联表、有序列联表 不同类型的资料或不同的分析目的,应当采用不同的分析方法 无序列联表- 检验 有序列联表-秩和检验,(二)Pearson 检验基本思想与 分布,检验是1899年统计学家Pearson提出 样本资料服从某个已知的概率分布 样本资料不服从某个已知的概率分布 用 统计量来度量实际观察频数与 成立条件 下的理论频数之间的偏差 其中, 表示理论分布的k个类别, 表示第i个类别的实际频数, 表示第i个类别的理论频数当H0为非真时,实际频数与理论频数之间的差异应较大,因此Pearson 统计量也较大;当H0为真时,实际频数与理论频数之间的差异应较小,因此Pearson 统计量也较小 可以证明, H0为真时,Pearson 统计量近似服从 分布分布是一种连续型随机变量 的概率函数。

如果随机变量相互独立且服从标准正态分布,则随机变量 所服从的分布是自由度为n的 分布,记作 分布的形状依赖于自由度 的大小自由度为 的 分布右侧尾部面积为 的临界值记为 ,列于附表中二、两组二分类资料比较 (一)独立的两组二分类资料比较,1、 检验的步骤: 表2是两个样本频率的数据 ①建立检验假设,确定检验水准 H0: ,即两药的总体有效率相同 H1: ,即两药的总体有效率不同 ②计算检验统计量,,,,,,在H0假设下,两组的总体概率应近似地等于合并估计的频率 ≈m1/n 第i组的阳性期望人数:Ti1=ni =ni m1/n 阴性期望人数:Ti2=ni(1-)=ni m2/n 亦称理论频数(theoretical frequency) ,理论频数的计算公式可归结为:,,,,,自由度:,* 检验的基本公式:,*自由度的公式=(行数-1)(列数-1),③确定P值,做出推断结论 查附表,自由度1对应的临界值 , 由于 值越大,概率P值越小,本例 =1.086,查表得到0.25P0.50。

在0.05检验水准下,不能拒绝H0,差别无统计学意义因此,尚不能认为万拉法新与氟西汀治疗老年期抑郁症的有效率不同四格表资料检验的专用公式: 例8-1用四格表专用公式计算得 要求:四格表资料满足总例数n≥40且所有理论频数Tij≥52. 检验的连续性校正: 例5 研究两种药物治疗冠心病病人的实验室指标改善效果,观察了52例病人,结果见表9问两种药物的改善效果是否相同?,,在四格表资料中n≥40,但是有一个格子的理论频数1≤Tij5时,利用四格表检验公式计算出来的统计量偏大,必须加以校正 连续性校正的基本公式为: 四格表专用检验连续性校正公式为:,,,例5的检验步骤如下: ①建立检验假设,确定检验水准 H0: ,即两种药物对实验室指标的改善情况相同 H1: ,即两种药物对实验室指标的改善情况不同②计算检验统计量 本例有一个理论频数T22=4.5,即有一个格子的理论频数140,因此检验需使用连续性校正公式 本例用式(8-4)计算得:,③确定P值,做出推断结论 查附表,自由度1对应的临界值 本例 =4.078 ,因此,P0.05 在0.05检验水准下,拒绝H0,接受H1,差别有统计学意义。

从具体资料来看,A药的改善率为PA=29/34=85.29%,B药的改善率为PB=10/18=55.56%,可以认为A药对实验室指标的改善情况好于B药3. Fisher确切概率法: 例6 研究脑卒中患者康复治疗效果,观察了病情近似的22例患者,结果见表10问脑卒中患者参加康复治疗与否是否影响其身体恢复?,当四格表资料中出现n40,或至少存在一个Tij1时,需用R .A .Fisher借助超几何分布提出的直接计算概率的方法,此方法称为Fisher确切概率法(Fisher’s exact probabilities)此方法不属于 检验的范畴,但可作为四格表 检验应用的补充例6采用确切概率法计算如下: ① 建立检验假设,确定检验水准 H0:π1=π2,即脑卒中患者参加康复治疗与否其身体恢复的概率相等; H1:π1≠π2,即脑卒中患者参加康复治疗与否其身体恢复的概率不等 α=0.05,② 四格表的四周合计数固定的情况下的各种随机事件及其概率 在四周合计数固定的情况下,对于随机抽样而言,四格表的四个元素a,b,c,d仍是随机的对于本例,由表11的第1列可见,四格表的四周合计数固定的情况下,随机抽样可能出现9种四格表,表10只是随机抽样可能出现的某一种情况,即表11中的第2号四格表。

当H0为真时,在四格表周边合计不变的条件下,可以证明,获得某个四格表的概率为: 可以得到H0为真的情况下各种可能的随机事件所对应的概率值,见表11的最后一列对于Fisher确切概率法的检验,P值就是“出现目前状况和更极端状况的概率”,其计算办法就是将小于或等于“样本观察值概率”的所有可能结局的概率求和本例的P值就是将表11中小于或等于0.02477的所有可能结局的概率求和 本例的具体计算如下 表10中样本观察值出现的概率为: 在周边合计不变的条件下,计算所有组合四格表的概率Pi,见表11③确定P值,做出推断结论 本例样本观察值的概率=0.02477,表10显示,概率小于或等于0.02477的四格表有第1个四格表、第2个四格表、第8个四格表和第9个四格表 因此对于双侧检验,其概率只需将此四个四格表对应的样本概率相加即可得到P值 P=P1+P2+P8+P9=0.00155 +0.02477+0.00450 +0.00014 =0.030960.05,所以在0.05检验水准下,拒绝H0,接受H1,差别有统计学意义可以认为脑卒中患者参加康复治疗的恢复效果好于不参加康复治疗患者 本例在临床上若有理由认为患者参加康复治疗的恢复效果只会好于或等于不参加康复治疗患者,不会差于不参加康复治疗患者,则可以采取单侧检验。

本例单侧检验 H0:1=2,H1:12,则只需计算样本观察值点更不利于H0的所有结局的概率之和 P=P1+P2=0.00155+0.02477 =0.02632,(二)配对的两组二分类资料比较,例2 得到了采末梢血与静脉血检查乙型肝炎抗原的结果,属于配对设计欲分析采末梢血与静脉血检查乙型肝炎抗原的总体阳性率是否有差异,应采用配对检验 下面借助例2说明配对设计2×2列联表资料总体率差异性检验的方法和过程①建立检验假设,确定检验水准 从表4可以看出,a和d两个位置的频数是两个检测样本的检验结果一致数,b与c两个位置的频数是两个检测样本的检验结果不一致数因此,在检验两个检测样本检测结果代表的总体阳性率有无差异时,只要比较b与c两个位置即可H0:两总体B=C,即末梢血与静脉血检查的阳性率相同; H1:两总体B≠C,即末梢血与静脉血检查的阳性率不同 α=0.05,②计算检验统计量 配对设计2×2列联表资料总体率差异性检验 统计量的计算公式因只考虑b、c两个位置,当H0为真时,其理论频数均为 ,因此用下式计算: 若b+c≥40时应用公式 称McNemar检验若b+c40时,应用连续校正公式: 表3中的b=8, c=4,b+c=3+4=740, 自由度:,,,③确定P值,做出推断结论 查附表,自由度1对应的临界值 。

本例 =0.90,查表得到 0.25P0.50 在0.05检验水准下,不能拒绝H0,差别无统计学意义尚不能认为采末梢血与静脉血检查乙型肝炎抗原的阳性率有差异三、独立的多组二分类资料比较,例3中资料得到了用磷霉素的三种制剂治疗皮肤软组织感染的治疗结果(表5)试分析三种制剂治疗皮肤软组织感染的效果是否相同?这类问题通常进行检验进行各组间的比较,有差异的情况下再根据具体情况进行适当的两两比较现借助例3介绍这类问题的一般检验步骤 ①建立检验假设,确定检验水准 H0: ,即三种制剂的总体痊愈率相同; H1: 不等或不全相等,即三种制剂的总体痊愈率不同或不全相同 α =0.05②计算检验统计量 H0成立时,各组总体痊愈率相同,均应近似的等于合并计算的频率分布 可用基本公式: 也可用简化公式:,,其中n为总例数,Aij为每个格子的实际频数,ni为第i行的合计数,mj为第j列的合计数,R为列联表的行数对应的自由度的计算可归结为:,,,,例3计算理论数分别为 51.6, 14.4,19.6,5.4,158.8和44.2,计算统计量为: 自由度:,③确定P值,做出推断结论 查附表,自由度为2对应的临界值 。

下载提示
相似文档
正为您匹配相似的精品文档