队列研究相关指标－金锄头文库

资源描述

《队列研究相关指标》由会员分享，可在线阅读，更多相关《队列研究相关指标（8页珍藏版）》请在金锄头文库上搜索。

1、队列研究相关指标RR、AR、OR、HR一、相对危险度（relative risk , RR）队列研究中分析暴露因素与发病的关联程度相对危险度 RR（Relative Risk）是前瞻性研究（队列研究）中常用的指标，它是暴露组的发病率与非暴露组的发病率之比，用于说明前者是后者的多少倍，是用来表示暴露与疾病联系强度的指标。RR 也叫危险比（risk ratio）或率比（rate ratio），适用于队列研究或随机对照试验。RR 值越大，表明暴露的效应越大，暴露与结局关联的强度越大。即暴露组发病率或死亡率与非暴露组发病率或死亡率之比。当它有统计学意义时：RR=1，说明暴露因素与疾病之间无关联。RR1

2、，说明暴露因素是疾病的危险因素（正相关）。认为暴露与疾病呈“正“关联，即暴露因素是疾病的危险因素。RR1，说明暴露因素是疾病的保护因素（负相关）。认为暴露与疾病呈“负“关联，即暴露因素是保护因素。临床研究文献中，相对危险度应该是指治疗组发生不良反应（adverse outcome）的危险度除以对照组的危险度（治疗组发生该不良反应是对照组的多少倍）。二、归因危险度（attributable risk , AR）归因危险度（AR）是暴露组发病率与对照组发病率相差的绝对值。又叫特异危险度、率差（rate difference, RD）和超额危险度（excess risk），是暴露组发病率与对照组发病

3、率相差的绝对值，它表示危险特异地归因于暴露因素的程度，即由于暴露因素的存在使暴露组人群发病率增加或减少的部分。与 RR 的区别：RR 与 AR 都是表示关联强度的指标，但其流行病学意义不同。RR 说明暴露者与非暴露者比较相应疾病的危险增加的倍数；AR 则是暴露人群与非暴露人群比较，所增加的疾病发生数量，如果暴露因素消除，就可减少这个数量的疾病发生。前者具有病因学意义，后者具有疾病预防和公共卫生学上的意义。三、比值比（odds ratio , OR）病例对照研究中暴露因素与疾病的关联强度比值比（OR）也称优势比、比数比、交叉乘积比，是病例对照研究中表示暴露与疾病之间关联强度的指标，比值（odds

4、）是指某事物发生的概率与不发生的概率之比。比值比指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。与 RR 的区别和联系：在回顾性研究（病例对照研究）中，由于无法计算发病率、死亡率等指标，也就无法计算RR。但是可计算病例组的暴露率和非暴露率之比，当所研究疾病的发病率较低时 OR 近似于 RR，故在回顾性研究中可用 OR 估计 RR。OR 值的解释与 RR 相同，指暴露组的疾病危险度为非暴露组的多少倍。当 OR1 时，说明暴露使疾病的危险度增加，是疾病的危险因素，叫做“正关联”；当 OR1 时，说明暴露使疾病的危险度减少，叫做“负关联”，暴露因素对疾病有保护作用；当 O

5、R=1 时，表示暴露与疾病无关联。四、风险比（hazard ratio , HR）HR 风险比/危害比,HR=暴露组的风险函数 h1(t)/非暴露组的风险函数 h2(t),t 指在相同的时间点上。而风险函数指危险率函数、条件死亡率、瞬时死亡率。Cox 比例风险模型可以得到 HR。资料的类型通常是临床治疗性研究，也可以是流行病学的队列观察性研究。与 RR 之间的区别和联系：1、多数认为 HR 与 RR 意思一样，但 HR 有时间因素在内，换句话说，包含了时间效应的RR 就是 HR；2、可以这样理解，生存资料中，RR 考虑了终点事件的差异，而 HR 不仅考虑了终点事件的有无，还考虑了到达终点所用的

6、时间及截尾数据；P 值值记得上研究生期间学习医学统计学，统计学老师十分幽默地对我们说：统计学就是个 P！因 P 与虽然“屁”同音，但意思大相径庭，所以在课堂上引发了哄堂大笑。的确，在医学统计学的所有名词术语中，大家最熟悉的莫过于“P 值”了。然而，P 值到底是什么意思？笔者曾试探性地接触了一些同行，能准确说出 P 值含义的人不敢说是凤毛麟角，但是个人经验应该不超过 30%。因此，笔者在此撰写短文一篇，浅谈自己的 P 值的理解。1. 如果没有了统计学，这个世界会咋样？我们假定在一个没有统计学的世界里，路人甲做了一个关于帕洛西汀治疗抑郁症的研究。他起早贪黑、废寝忘食地收集了 100 个抑郁者患者，

7、其中 50 个接受帕洛西汀的治疗，另外 50 个病人接受安慰剂的治疗（为便于说明问题，此处暂且不考虑医学伦理学问题）。在治疗了 1 年以后，路人甲发现接受帕洛西汀治疗的 50 名抑郁症患者中，有 40 名患者完全康复了，治愈率达 80%。而接受安慰剂治疗的患者中，仅有 5 例康复，治愈率仅为 10%。这个结果看起来十分令人兴奋，于是路人甲赶紧将这些结果写成论文，投给了某本学术杂志。杂志邀请了路人乙作为审稿人，路人乙看了文章后就提了一个意见：无法排除治愈率之间的差异可能是抽样误差造成的！帕洛西汀和安慰剂的疗效可能是一样的，都是 10%。作者之所以得到 80%的治愈率，完全是运气，不信您再做一遍！

8、做上十万个病人试试？这样一个审稿意见恐怕会令这个星球上任何有血有肉的作者欲哭无泪。虽然大多数读者都会认为这不可能是抽样误差，但是问题在于，科学不能靠直觉，必须拿客观证据说事！这就是没有统计学的世界，人们总没有办法排除抽样误差的可能性。如果有了统计学，结果就不一样了。路人甲完全可以说，我经过统计学分析（Fisher 确切概率法），发现 P 值是小于 0.001 的。如果路人乙也懂统计学，他就不会再发出任何不和谐的声音了。2. P 值的含义P 值的含义，简单地说就是差异的来源是有抽样误差（随机误差）的可能性。在上述案例中，P 值小于 0.0001 的意思就是：帕洛西汀治疗组和安慰剂治疗组在有效率（

9、80%和 10%）上的差异当然可能是由抽样误差造成的，但是这种事情的可能性不到万分之一（0.0001）。我们通常定义 P 小于 0.05 表示有统计学意义，实际上就是说：当差异可以用抽样误差来解释的可能性不足 5%时，我们就会认为这事跟抽样误差无关的，而是由试验因素造成的了。再用一句通俗的话来描述这个问题：假定有人闲着无聊用相同的研究方案（研究对象，研究方法，样本量等都相同）去重复了路人甲的研究，理论上讲，每次得出的结果不可能与路人甲完全相同，但是研究结果显示安慰剂的疗效好于帕洛西汀的可能性不足万分之一。3. 应用 P 值时需要注意的几个问题3.1部分学者可能会错误地认为 P0.05 表示差异

10、很显著；P0.01 表示差异十分显著。实际上，P 值只是表示结果可以由抽样误差解释的可能性，与差异大小无关，更与差异是否有专业价值无关。打个极端的比方，为研究某降糖药的降糖效果，研究人员招募了 10 例患者进行研究。这些患者服药前的血糖都是 7mmo/L，服药后都变成了 6.9mmol/L，如果做统计学分析，服药前后血糖值之间的差异是有统计学意义的（P0.001），但是问题在于：服药前后血糖值的差异仅有 0.1mmo/L，显然谈不上十分显著。更重要的是，在临床上，如果只能把血糖降低 0.1mmo/L 的话，这种药可以说是一无是处。因此，有统计学意义不见得有专业意义。3.2P 值固然重要，可以直

11、观地告诉我们结果属于抽样误差的可能性，但是也不要忽视科研设计的作用。科研设计已经错了，再高明的统计学手段也是无济于事。可能有的同行已经看出来了，血糖本身有一定的波动性，所以不能采用前后对照的方式进行研究，应该同时设立平行对照。我们假定再设立一组安慰剂对照组，让 10 名患者接受安慰剂治疗，然后检测这十名患者服药前后的血糖值，发现这些患者服用安慰剂前的血糖浓度都是是7mmol/，服用安慰剂后却都变成了 6mmo/L。安慰剂的降糖作用还可能大于降糖药，那岂不是说这种降糖药不仅不能降血糖，反而还会升高血糖？3.3P 值大于 0.05 的解释不是试验因素没有作用，而是目前还不能认定试验因素有作用。这句

12、话听起来很拗口，不妨举个例子来说明。路人甲研究帕洛西汀治疗抑郁症，他收集了 80 例男性抑郁症患者，其中 40 例接受了帕洛西汀治疗，另外 40 例接受安慰剂治疗。得到如下结果：有效（例）总体（例）帕洛西汀3540安慰剂2040经卡方检验后作者发现 P=0.08，因此路人甲认为：帕洛西汀对治疗男性抑郁症无效。路人乙也在研究这个课题，不过他研究的是女性抑郁症患者，他的研究结果与路人甲出奇地相似（详见上表，在此就不赘述了）。统计结果也表明 P=0.08，因此路人乙认为：帕洛西汀对治疗女性抑郁症无效。路人丙闲着无聊把路人甲和路人乙的结果拿来进行了分析，得出下表：有效（例）总体（例）帕洛西汀7080安

13、慰剂4080经卡方检验后，P=0.01，因此路人丙认为：帕洛西汀对治疗人类抑郁症有效。问题来了：这药咋回事？对男性无效，对女性也无效，对人类却有效？这不是滑天下之大稽吗?出现这种自相矛盾的结果，其根源就在于路人甲和路人乙没有正确理解 P 值的含义，给出了错误的结论。在男性患者和女性患者中开展的研究均得到 P=0.08，其确切的含义是：目前还不能认为帕洛西汀对治疗男/女性抑郁症有效，而不是帕洛西汀对治疗男/女性抑郁症无效。实际上，路人甲和路人乙之所以没有在统计学上观察到帕洛西汀有效，主要是因为样本量太小，统计效率低下。这里面牵涉到一个 I 类误差和 II 类误差的概念，以及样本量估计等问题，限于

14、篇幅所限，在此不再赘述。3.4P 值多见于两组或者多组数据的比较，但某些比较很隐秘，不容易被人看出来。笔者一位朋友曾投给国内某杂志一篇论文，其中有一个统计学分析步骤是计算受试者工作特征（ROC）曲线的面积。作者的表述是：曲线下面积为 0.88（P0.01）。审稿专家立即质疑：一个曲线下面积，也没有和其他数据相比，何来 P 值？审稿专家之所以犯这种错误，实际上是没有理解 ROC 分析以及 P 值的含义。实际上，这个 P 值也是经过“比较”得出来的，只不过是这种比较很隐秘，不容易被发现而已。ROC 的曲线下面积（AUC）是介于0.5-1.0 之间的，AUC 越大，表示诊断效率越高，若 AUC 为

15、0.50，则表示该诊断手段无任何诊断价值。AUC 本身有一定的抽样误差，本研究得出 AUC 为 0.88，但无法排除这是抽样误差所致，真实的 AUC 可能是 0.50（即毫无诊断价值）。因此需要比较 0.88 和 0.5之间的差异有无统计学意义。P0.01 的含义其实是：AUC 等于 0.50 的可能性不足 1%，因此我们认为该指标是有诊断价值的。4. 总结本文主要阐述了统计学 P 值的含义，简而言之，P 值表示结果可以由抽样误差解释的可能性。在医学统计分析中，我们不仅需要看 P 值的大小，更需要关注差异是否足够大，是否有专业意义。任何脱离了专业解释的统计学结果都是没有价值的。类错误、类错误、类错误类错误H0:一个真心爱你的男生H1:一个不是真心爱你的男生如果 H0 实际上成立，而你凭经验拒绝了 H0，也就是说，你拒绝了一个你认为不爱你而实际上真心爱你的男生，那么你就犯了第类错误；如果 H0 实际上不成立，而你接受了 H0，同样的道理，你接受了一个你感觉爱你而实际上并不爱你的男生，那么你就犯了第类错误。如果要同时减小犯第类错误和第类错误的概率，那就只能增加恋爱的次数 n，比如一个经历过 n=100 次恋爱的女生，第 101 次恋爱犯第类错误和第类错误的概率就会小很多了。

展开阅读全文