医学统计方法常见错误

上传人:cl****1 文档编号:568528651 上传时间:2024-07-25 格式:PPT 页数:42 大小:469KB
返回 下载 相关 举报
医学统计方法常见错误_第1页
第1页 / 共42页
医学统计方法常见错误_第2页
第2页 / 共42页
医学统计方法常见错误_第3页
第3页 / 共42页
医学统计方法常见错误_第4页
第4页 / 共42页
医学统计方法常见错误_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《医学统计方法常见错误》由会员分享,可在线阅读,更多相关《医学统计方法常见错误(42页珍藏版)》请在金锄头文库上搜索。

1、医学统计学方法常见错误分析医学统计学方法常见错误分析2021/6/161统计分析思路统计分析思路先统计描述后统计学推断先统计描述后统计学推断先单因素分析后多因素分析先单因素分析后多因素分析先计量资料后计数、等级资料先计量资料后计数、等级资料2021/6/162一、统计描述中的常见错误:一、统计描述中的常见错误:1. 频数表频数表分类变量与有序分类变量直接列表分类变量与有序分类变量直接列表比较各类别频数分布的均匀性比较各类别频数分布的均匀性比较各组间分布形态的一致性比较各组间分布形态的一致性数值变量数值变量 最小值、最大值、分组数、组距、频数表最小值、最大值、分组数、组距、频数表观察频数分布的对

2、称性观察频数分布的对称性比较两组分布的一致性比较两组分布的一致性2021/6/1632. 统计量统计量分类变量与有序分类变量分类变量与有序分类变量构成比、率、比构成比、率、比数值变量数值变量均数、标准差、最小值、最大值、中位数均数、标准差、最小值、最大值、中位数2021/6/164 在资料的表达和描述中,常见的错误有:在资料的表达和描述中,常见的错误有:1.编编制制统统计计表表时时,分分组组标标志志(横横标标目目)与与观观测测指指标标(纵纵标标目目)位位置置颠颠倒倒、线线条条过过多多或或过过少少、数数字字的的小小数数点点位位数数不不一一致致或或单单位位重重复复出出现现在在数数字字之之后后,最最

3、严严重重的的问问题题是是表表中中数数据据的的含含义义未未表表达达清清楚楚,令令人费解。人费解。2.绘绘制制统统计计图图时时,坐坐标标轴轴上上的的刻刻度度值值标标得得不不符符合合数数学原则、资料与所选用的统计图类型不匹配。学原则、资料与所选用的统计图类型不匹配。3.选选用用统统计计指指标标来来描描述述平平均均水水平平和和离离散散趋趋势势时时,使使用用正正态态分分布布方方法法表表达达呈呈偏偏态态分分布布的的资资料料;运运用用相相对数来描述计数资料时,比与率混淆。对数来描述计数资料时,比与率混淆。2021/6/165 表表1 两组褥疮愈合时间指数对比(两组褥疮愈合时间指数对比( )资料描述有无问题?

4、资料描述有无问题?2021/6/166应用相对数应注意的问题应用相对数应注意的问题 1. 计算相对数的分母一般不宜过小:观察单位计算相对数的分母一般不宜过小:观察单位足够多时,计算出的相对数比较稳定,一般要足够多时,计算出的相对数比较稳定,一般要求观察单位数不小于求观察单位数不小于 30。 2. 分析时不能以构成比代替率。分析时不能以构成比代替率。 3. 在比较相对数时应注意可比性。影响率与构在比较相对数时应注意可比性。影响率与构成比变化的因素很多,除了研究因素外,其余成比变化的因素很多,除了研究因素外,其余的影响因素应尽可能相同或相近。的影响因素应尽可能相同或相近。 4. 两个样本率比较时应

5、该进行假设检验。两个样本率比较时应该进行假设检验。2021/6/167率与比的区别率与比的区别率是指某种事物发生的频率或强度,是事物实际发率是指某种事物发生的频率或强度,是事物实际发生的例数与可能发生某事物总人口数之比。生的例数与可能发生某事物总人口数之比。比(构成比):说明某一事物内部组成部分所占的比(构成比):说明某一事物内部组成部分所占的比重。比重。将构成比错误地当作率来使用,这是临床科研中最将构成比错误地当作率来使用,这是临床科研中最常见的错误之一。由于医院中资料的局限性,所得常见的错误之一。由于医院中资料的局限性,所得的数据一般只能计算构成比。由于构成比通常不能的数据一般只能计算构成

6、比。由于构成比通常不能说明事物发生的强度,而且某一类别的构成比的大说明事物发生的强度,而且某一类别的构成比的大小受到其他类别数量变化的影响,因而其应用有较小受到其他类别数量变化的影响,因而其应用有较大的局限性。大的局限性。2021/6/168 表表2是某医院统计门诊沙眼病人年龄构成的数据。是某医院统计门诊沙眼病人年龄构成的数据。作者由此得出了作者由此得出了20岁组人口最易患沙眼的结论。岁组人口最易患沙眼的结论。 表表2 某医院门诊沙眼病人的年龄构成某医院门诊沙眼病人的年龄构成 2021/6/169表表3 两种方法治愈率的比较两种方法治愈率的比较 需要标准化需要标准化2021/6/1610二、统

7、计学推断常见错误二、统计学推断常见错误单因素分析(处理因素为分类变量)单因素分析(处理因素为分类变量) (1)结果变量为数值变量)结果变量为数值变量:注意应用条件:注意应用条件 t检验或方差分析、秩和检验检验或方差分析、秩和检验 (2)结果变量为有序分类变量)结果变量为有序分类变量:秩和检验:秩和检验 (3)结果变量为分类变量)结果变量为分类变量:卡方检验:卡方检验 2021/6/1611两个定性变量资料的统计分析两个定性变量资料的统计分析 RC表资料表资料 2检验检验 单向有序单向有序RC表资料表资料 秩和检验秩和检验 双向有序且属性不同双向有序且属性不同 等级相关分析等级相关分析 双相有序

8、且属性相同双相有序且属性相同 Kappa检验检验2021/6/1612 1.t检验应用时常见的错误检验应用时常见的错误t检验是目前医学研究中使用频率最高,医学论文检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因:检验得到如此广泛的应用,究其原因:现有的医学期刊多在统计学方面作出了要求,现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持。研究结论需要统计学支持。传统的医学统计教学都把传统的医学统计教学都把t检验作为假设检验的检验作为假设检验的入门方法进行介绍。入门方法进行介绍。

9、t检验方法简单,其结果便于解释。检验方法简单,其结果便于解释。2021/6/1613由于有些人对该方法理解不全面,导致在应由于有些人对该方法理解不全面,导致在应用过程中出现不少问题,有些甚至是非常严用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。重的错误,直接影响到结论的可靠性。可大致概括为以下可大致概括为以下两种情况两种情况:1)不考虑)不考虑t检验的应用前提,对两组的比较一律检验的应用前提,对两组的比较一律用用t检验;检验;2)对多组的资料的比较,多次用)对多组的资料的比较,多次用t检验进行均值检验进行均值之间的两两比较。之间的两两比较。2021/6/1614 实例

10、实例 : 为确定老年人围手术期头孢唑啉钠为确定老年人围手术期头孢唑啉钠的合理用法和用量,某研究小组对的合理用法和用量,某研究小组对60岁以岁以上与上与60岁以下者的头孢唑啉钠药物动力学岁以下者的头孢唑啉钠药物动力学特征分别进行了测量,并进行了比较,部特征分别进行了测量,并进行了比较,部分结果见表分结果见表4。2021/6/1615 表表4 两组患者头孢唑啉钠药物动力学参数比较两组患者头孢唑啉钠药物动力学参数比较忽视忽视t检验的前提条件。检验的前提条件。研究者依据研究者依据P值认为两组在值认为两组在,k10两项指两项指标上差异无统计学意义。标上差异无统计学意义。 2021/6/1616实例实例

11、研究单味中药对小鼠细胞免疫机能的影响,把研究单味中药对小鼠细胞免疫机能的影响,把40只小鼠随机均分为只小鼠随机均分为4组,每组组,每组10只,雌雄各半,用药只,雌雄各半,用药15d后测定后测定E-玫瑰结形成率(玫瑰结形成率(%),结果如下,试比较),结果如下,试比较各组总体均值之间的差别有无统计学意义?各组总体均值之间的差别有无统计学意义? 常见的错误做法是:重复运用成组设计资常见的错误做法是:重复运用成组设计资料的料的t检验对检验对4个组的均值进行个组的均值进行6次两两比较。次两两比较。2021/6/1617而正确的做法是,先进行单因素而正确的做法是,先进行单因素4水平设水平设计资料的方差分

12、析,若计资料的方差分析,若4个总体均值之间个总体均值之间的差别有统计学意义,再用的差别有统计学意义,再用q检验等方法检验等方法进行多个均值之间的两两比较。进行多个均值之间的两两比较。 2021/6/1618实例:研究大豆黄酮对实例:研究大豆黄酮对sp2/0肿瘤细胞肿瘤细胞DNA合成影响,在大合成影响,在大豆黄酮组中,加入豆黄酮组中,加入3HTdR后后0.5h,1h,2h,4h分别测分别测Cpm值。每次试验均设空白对照,每个大豆黄酮剂量均设值。每次试验均设空白对照,每个大豆黄酮剂量均设一式一式3份,结果取平均值。数据均以平均值份,结果取平均值。数据均以平均值标准差表示。标准差表示。 表表5 大豆

13、黄酮大豆黄酮sp2/0肿瘤细胞肿瘤细胞DNA合成影响的时间合成影响的时间-效应关系效应关系 注:注: *P0.05, *P0.012021/6/1619结结论论:用用t检检验验,P5,故可用一般故可用一般 2检验。得:检验。得: 2=40.000 2021/6/1627原作者未作任何统计处理,只是从其痊愈率上看原作者未作任何统计处理,只是从其痊愈率上看治疗组大于对照组(治疗组大于对照组(73%55%),从而得出),从而得出“治疗组的痊愈率明显高于对照组治疗组的痊愈率明显高于对照组”的结论来。的结论来。 表表12 针灸偏历治疗网球肘针灸偏历治疗网球肘116例与对照组比较例与对照组比较2021/6

14、/1628 表表13 产次与新生儿低体重率产次与新生儿低体重率 原作者采用一般的原作者采用一般的 2检验方法,得检验方法,得 2=6.99, P0.05,结论为结论为“不同产次的低体重发生率差异不同产次的低体重发生率差异有统计学意义,第二产低体重率最低体重率最低,有统计学意义,第二产低体重率最低体重率最低,大于等于第三产低体重率及相对危险度上升大于等于第三产低体重率及相对危险度上升” 。2021/6/1629差错分析差错分析 该资料的该资料的2值仅仅说明总体上不同的产次值仅仅说明总体上不同的产次间低体重发生率至少有两组间的差别有统计学意义,间低体重发生率至少有两组间的差别有统计学意义,并不意味

15、每两组间的差异都有统计学意义,要比较任并不意味每两组间的差异都有统计学意义,要比较任何两种产次间的差别,应进行何两种产次间的差别,应进行两两比较两两比较。解决方法解决方法 需降低每次检验的检验水平数值,若需降低每次检验的检验水平数值,若=0.05,可令可令=0.05/C,其中其中C等于比较的次数,本例等于比较的次数,本例C=3采用采用 2分割法(要求分表的自由度等于总表的自由度、分割法(要求分表的自由度等于总表的自由度、分表的分表的 2值之和等于总表的值之和等于总表的 2值)进一步分析。值)进一步分析。2021/6/16303.四格表资料分析方法的选用标准。四格表资料分析方法的选用标准。 当当

16、总总样样本本含含量量n40,且且理理论论频频数数T均均大大于于5时,一般的时,一般的 2检验检验 。当当总总样样本本含含量量n40,但但有有理理论论频频数数满满足足1T5时,连续性校正的时,连续性校正的 2检验检验 。当当总总样样本本含含量量n40或或有有理理论论频频数数小小于于1时时,Fisher的精确检验。的精确检验。2021/6/1631 表表14 不同分娩方式与重症肝炎孕妇的结局不同分娩方式与重症肝炎孕妇的结局 误用一般误用一般2检验取代检验取代Fisher精确检验,精确检验,本例:本例:P=0.011。 2021/6/16321.区分统计区分统计“有统计学意义有统计学意义”与医学与医

17、学/临临床床/生物学生物学“有实际意义有实际意义”。统计统计“有统计学意义有统计学意义”对应于统计结论,医学对应于统计结论,医学/临床临床/生物学生物学“有实际意义有实际意义”对应于专业结论。对应于专业结论。假设检验是为各专业服务的,统计的结论必须假设检验是为各专业服务的,统计的结论必须和专业结论有机的相结合,才能得出恰如其分、和专业结论有机的相结合,才能得出恰如其分、符合客观实际的最终结论。符合客观实际的最终结论。三、统计学结论注意事项:三、统计学结论注意事项:2021/6/16332. 误误解解了了“P0.01”与与“P0.05”的的真真正正含义。含义。 解释解释“P0.01”与与“P0.

18、05”含义时常犯的错误含义时常犯的错误有有些些人人在在解解释释具具有有统统计计学学意意义义的的统统计计结结果果时时,常常根根据据P值值是是“0.05”还还是是“0.01”作作出出肯肯定定程程度度不同的专业结论。不同的专业结论。 例例如如,当当比比较较甲甲、乙乙两两种种药药物物的的疗疗效效时时(假假定定甲甲药药优优于于乙乙药药),若若得得到到“P0.001”,则则认认为为甲甲药药极极显显著著地地优优于于乙乙药药;若若得得到到“P0.01”,则则认认为为甲甲药药非非常常显显著著地地优优于于乙乙药药;若若得得到到“P0.05”,则认为甲药显著地优于乙药。则认为甲药显著地优于乙药。2021/6/163

19、4差差错错分分析析 统统计计学学上上根根据据假假设设检检验验原原理理推推算算出出来来的的P值值,表表示示拒拒绝绝特特定定的的零零假假设设可可能能犯犯假假阳阳性性错错误误的的概概率率的的理理论论值值,它它的的大大小小不不反反映映对对比比的的两两者者之之间间实实际际值值差差别别的程度大小。的程度大小。 2021/6/16353. 统计检验结果不完善的表达方式。统计检验结果不完善的表达方式。 多种多样表达统计检验结果的方式多种多样表达统计检验结果的方式 :资料未经过任何统计处理,资料未经过任何统计处理,仅根据实际数据的大仅根据实际数据的大小,凭经验作出某组与另一组之间的差别有统计小,凭经验作出某组与

20、另一组之间的差别有统计学意义的结论学意义的结论;作了统计处理,但作了统计处理,但未交代选用的是何种统计分析未交代选用的是何种统计分析方法,仅给出方法,仅给出P值值;作了统计处理,也交代了所选用的统计分析方法,作了统计处理,也交代了所选用的统计分析方法,并给出了并给出了P值,但值,但未给出统计量的具体值未给出统计量的具体值。2021/6/1636释疑释疑 :所选用的统计分析方法;所选用的统计分析方法;统计量的具体取值;统计量的具体取值;假设检验的具体假设检验的具体P值;值;有关总体参数的有关总体参数的95%可信区间。可信区间。2021/6/1637 4. 关于多重线性回归的结果表达:关于多重线性

21、回归的结果表达:常常采用一个表格将分析的结果进行总结常常采用一个表格将分析的结果进行总结归纳。归纳。表格中包括如下主要的统计量:表格中包括如下主要的统计量:偏回归系偏回归系数的估计值数的估计值、偏回归系数的标准误偏回归系数的标准误、标准标准偏回归系数偏回归系数、t值值、P值值,有时还包括,有时还包括偏回偏回归系数的归系数的95置信区间置信区间。方差分析结果和方差分析结果和确定系数确定系数一般可作为备注列在表的下方。一般可作为备注列在表的下方。2021/6/16382021/6/1639 分析的目的分析的目的 资料的类型资料的类型 资料的分布资料的分布 设计方案设计方案 样本含量大小样本含量大小 2021/6/1640谢谢!谢谢!2021/6/1641 结束语结束语若有不当之处,请指正,谢谢!若有不当之处,请指正,谢谢!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号