《最新如何正确选择统计方法》由会员分享,可在线阅读,更多相关《最新如何正确选择统计方法(32页珍藏版)》请在金锄头文库上搜索。
1、如何正确选择统计方法如何正确选择统计方法如何正确选择统计方法资料类型资料类型设计方案设计方案实验分组实验分组检验条件检验条件如何正确选择统计方法表表1 1 单变量资料差异比较的分析方法小结单变量资料差异比较的分析方法小结资资资资料料料料类类类类型型型型数据数据数据数据特征特征特征特征单组单组单组单组设计设计设计设计完全随机设计完全随机设计完全随机设计完全随机设计配对或配伍设计配对或配伍设计配对或配伍设计配对或配伍设计两组两组两组两组多组多组多组多组两组两组两组两组多组多组多组多组定定定定量量量量资资资资料料料料正态、正态、正态、正态、方差齐方差齐方差齐方差齐样本与总体样本与总体样本与总体样本与
2、总体均数比较的均数比较的均数比较的均数比较的t t检验检验检验检验两样本两样本两样本两样本t t检验检验检验检验单因素方差分析单因素方差分析单因素方差分析单因素方差分析配对配对配对配对t t检验检验检验检验随机区组设计随机区组设计随机区组设计随机区组设计方差分析方差分析方差分析方差分析非正态非正态非正态非正态和和和和/ /或方或方或方或方差不齐差不齐差不齐差不齐WilcoxonWilcoxon符符符符号秩和检验号秩和检验号秩和检验号秩和检验t t 检验、检验、检验、检验、WilcoxonWilcoxon秩和秩和秩和秩和检验检验检验检验Kruskal-Wallis Kruskal-Wallis
3、HH秩和检验秩和检验秩和检验秩和检验WilcoxonWilcoxon符号秩和符号秩和符号秩和符号秩和检验检验检验检验Friedman Friedman MM秩秩秩秩和检验和检验和检验和检验定定定定性性性性资资资资料料料料无序无序无序无序二项分布直二项分布直二项分布直二项分布直接计算概率接计算概率接计算概率接计算概率法、正态近法、正态近法、正态近法、正态近似法似法似法似法( (Z Z检验检验检验检验) ) 检验、检验、检验、检验、FisherFisher确切概确切概确切概确切概率法率法率法率法 表资料表资料表资料表资料 检检检检验、验、验、验、FisherFisher确切概确切概确切概确切概率法
4、率法率法率法配对四格表配对四格表配对四格表配对四格表 检验检验检验检验 列联表列联表列联表列联表配对配对配对配对 检验检验检验检验有序有序有序有序_WilcoxonWilcoxon秩和秩和秩和秩和检验检验检验检验Kruskal-Wallis Kruskal-Wallis HH秩和检验秩和检验秩和检验秩和检验WilcoxonWilcoxon符号秩和符号秩和符号秩和符号秩和检验检验检验检验如何正确选择统计方法1111种形式的列联表种形式的列联表2222表表有序(配对)有序(配对)无序(成组)无序(成组)2C2C表表有序有序无序无序R2R2表表有序有序无序无序多维列联表多维列联表单向有序单向有序RC
5、RC表表有序有序无序无序双向有序双向有序属性相同属性相同属性不同属性不同分组变量有序分组变量有序指标变量有序指标变量有序如何正确选择统计方法数据特征数据特征数据特征数据特征分析方法分析方法分析方法分析方法相相相相关关关关分分分分析析析析 定量资料定量资料定量资料定量资料x x、y y服从双变量正态分布服从双变量正态分布服从双变量正态分布服从双变量正态分布pearsonpearson直线相关分析直线相关分析直线相关分析直线相关分析x x、y y不服从双变量正态分布不服从双变量正态分布不服从双变量正态分布不服从双变量正态分布SpearmanSpearman秩相关秩相关秩相关秩相关 定性资料(定性资
6、料(定性资料(定性资料( 表)表)表)表)双向无序双向无序双向无序双向无序 检验,计算列联系数检验,计算列联系数检验,计算列联系数检验,计算列联系数双向有序、属性不同双向有序、属性不同双向有序、属性不同双向有序、属性不同SpearmanSpearman秩相关、线性趋势检验秩相关、线性趋势检验秩相关、线性趋势检验秩相关、线性趋势检验双向有序、属性相同双向有序、属性相同双向有序、属性相同双向有序、属性相同一致性检验一致性检验一致性检验一致性检验(kappa(kappa系数的假设检验系数的假设检验系数的假设检验系数的假设检验) )回回回回归归归归分分分分析析析析应变量为连续型定量变量,服从正态分布应
7、变量为连续型定量变量,服从正态分布应变量为连续型定量变量,服从正态分布应变量为连续型定量变量,服从正态分布一个应变量,一个自变量:直线回归分析一个应变量,一个自变量:直线回归分析一个应变量,一个自变量:直线回归分析一个应变量,一个自变量:直线回归分析一个应变量,多个自变量:多重线性回归分一个应变量,多个自变量:多重线性回归分一个应变量,多个自变量:多重线性回归分一个应变量,多个自变量:多重线性回归分析析析析应变量为定性变量应变量为定性变量应变量为定性变量应变量为定性变量LogisticLogistic回归分析回归分析回归分析回归分析应变量为含有截尾数据的生存时间应变量为含有截尾数据的生存时间应
8、变量为含有截尾数据的生存时间应变量为含有截尾数据的生存时间CoxCox比例风险回归分析比例风险回归分析比例风险回归分析比例风险回归分析表表2 双变量双变量(多变量多变量)资料的关联性分析方法小结资料的关联性分析方法小结如何正确选择统计方法二、计量资料分析常见的统计问题二、计量资料分析常见的统计问题2.1 2.1 忽视忽视t t检验的前提条件检验的前提条件2.2 2.2 误用成组设计资料的误用成组设计资料的t t检验分析配对设计资料检验分析配对设计资料2.3 2.3 忽视方差分析的前提条件忽视方差分析的前提条件2.4 2.4 误用误用t t检验分析等级资料检验分析等级资料2.5 2.5 误用误用
9、t t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计2.6 2.6 误用配对设计资料的误用配对设计资料的t t检验处理单因素检验处理单因素k(k3)k(k3)水平设计的资料水平设计的资料如何正确选择统计方法2.1 2.1 忽视忽视t t检验的前提条件检验的前提条件 文题:文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表表5 5。原文作者用。原文作者用t t检验分析此资料。检验分析此资料。请问:这样做正确吗请问:这样做正确吗? ?辨析:辨析:1.1.对表对表5 5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指
10、标不数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用能满足方差齐性的要求,故不能采用t t检验进行分析。检验进行分析。正确的做法:正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行采用变量变换使数据服从正态分布且方差齐,然后进行t t检验,检验,否则,采用非参数检验。否则,采用非参数检验。2.2.给出确切的统计量和给出确切的统计量和P P值。值。如何正确选择统计方法2.2 2.2 误用成组设计资料的误用成组设计资料的t t检验分析配对设计资料检验分析配对设计资料如何正确选择统计方法辩析:辩析:1.1.考虑到对数据进行变换是正确的。但是如果采
11、用成组考虑到对数据进行变换是正确的。但是如果采用成组t t检验,检验,还需要两总体方差齐性。还需要两总体方差齐性。 但本研究是配对设计,如果采用成组但本研究是配对设计,如果采用成组t t检验,会降低检验效检验,会降低检验效率。率。应该采用配对应该采用配对t t检验进行分析。注意配对检验进行分析。注意配对t t检验的条件:要检验的条件:要对每对数据的差值(对每对数据的差值(d d)进行正态性检验。如果不满足,改用)进行正态性检验。如果不满足,改用WilcoxonWilcoxon符号秩检验。符号秩检验。2.2.应给出确切的统计量和应给出确切的统计量和P P值。值。2.2 2.2 误用成组设计资料的
12、误用成组设计资料的t t检验分析配对设计资料检验分析配对设计资料如何正确选择统计方法2.3 2.3 忽视方差分析的前提条件忽视方差分析的前提条件确切的统计量和确切的统计量和P P值值文题:文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。养,取第三代细胞进行实验。实验分实验分3 3组:组:空白对照组、模型组、姜黄素组,每组设空白对照组、模型组、姜黄素组,每组设6 6个样本。个样本。请问:请问
13、:采用方差分析正确吗采用方差分析正确吗? ?均数均数标准差标准差?如何正确选择统计方法辨析:辨析:此实验分此实验分3 3组,应为单因素三水平设计定量资料,应首先进行组,应为单因素三水平设计定量资料,应首先进行“独立性独立性”、“正态性正态性”和和“方差齐性方差齐性”检验,如果满足方检验,如果满足方差分析的差分析的3 3个前提条件则用方差分析;如果不满足,则采用变个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果量变换或秩和检验。如果P0.05P0.05P0.05,组间差异无统计学意义,组间差异无统计学意义;: :与治疗前比较,与治疗前比较,P0.05P0.05,组内,组内差异有
14、统计学意义;差异有统计学意义;: :与对照组(与对照组(G G2 2)比较,)比较,P0.05P0.05P0.05,组间差异无统计学意义,不必在备注中表,组间差异无统计学意义,不必在备注中表示。示。应写出确切的统计量和应写出确切的统计量和P P值。值。2.4 2.4 误用误用t t检验分析等级资料检验分析等级资料如何正确选择统计方法2.5 2.5 误用误用t t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计1 1文文题:题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成益气活血法预防老年患者髋部术后下肢深静脉血栓形成统计学处理统计学处理:采用采用SPSS10SPSS10.
15、.0 0统计软件,两组间计量资料比较用统计软件,两组间计量资料比较用t t检验。检验。 辨析辨析:本研究本研究设计类型为设计类型为:两因素(处理和时间)重复测量设计资料。:两因素(处理和时间)重复测量设计资料。 在在资料满足资料满足“独立性独立性”、“正态性正态性”和和“方差齐性方差齐性”的前提条件下,及的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析进行球对称检验,应选用两因素设计的重复测量的方差分析,选用,选用t t检验分析检验分析该资料该资料是不妥的是不妥的。如何正确选择统计方法v文题:文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后复方苦参注射液对恶性肿瘤患者伽玛
16、刀放射治疗后T T淋巴细胞亚群的影淋巴细胞亚群的影响。响。v设计:作者选取设计:作者选取6060例恶性肿瘤患者,随机分成例恶性肿瘤患者,随机分成2 2组。组。试验组在伽玛刀放射治疗试验组在伽玛刀放射治疗的同时给予复方苦参注射液的同时给予复方苦参注射液20ml20ml加入生理盐水加入生理盐水500ml500ml,静脉滴注,静脉滴注,1 1次次d d,10d10d为为1 1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7 7。v请问:统计分析方法选用请问:统计分析方法选用t t检验正确吗检验正确吗? ?2.5 2.5 误用误用t t检验处理重复测量
17、的两因素试验设计检验处理重复测量的两因素试验设计2 2确切的统计量和确切的统计量和P P值。值。如何正确选择统计方法辨析:辨析:1.1.统计分析错误统计分析错误 本试验中,每位受试者在试验前、后两个不同的时间点上被重复本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用量有关的试验因素。原作者用t t检验进行两两比较,则割裂了整
18、体设检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。计,不能准确地估计和控制误差,因而不能得到可靠的结论。正确的做法:正确的做法:应将表应将表7 7的形式改成重复测量试验设计的标准形式,采用的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。与之对应的方差分析进行数据处理。2.5 2.5 误用误用t t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计2 2如何正确选择统计方法原文题目:原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观,文章为观察莪术水煎剂对
19、未孕大鼠子宫肌电活动的影响,察莪术水煎剂对未孕大鼠子宫肌电活动的影响,4040只大鼠被随机分成只大鼠被随机分成4 4组,对照组,对照组:按组:按10ml10mlkgkg鼠重灌服生理盐水,莪术组:按鼠重灌服生理盐水,莪术组:按10ml10mlkgkg鼠重分别灌服鼠重分别灌服2525 、5050 、100100莪术水煎液分成莪术水煎液分成3 3组。观察每个大鼠子宫肌电爆发波的峰面积、持组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的续时间和个数。原作者应用配对设计定量资料的t t检验进行统计处理,资料见表检验进行统计处理,资料见表4 4。剂量剂量(g(gkg)k
20、g)峰面积峰面积(mWms)(mWms)持续时间持续时间(s)(s)爆发波个数爆发波个数0 0142.6534.64142.6534.643.501.323.501.320.540.100.540.102.52.5337.74250.91337.74250.918.822.788.822.781.060.341.060.345.05.0449.50154.45449.50154.459.822.899.822.891.420.471.420.477.57.5651.0898.20651.0898.2013.071.8813.071.881.400.251.400.25表表 莪术水煎剂对大鼠子宫
21、肌电活动的影响(均数莪术水煎剂对大鼠子宫肌电活动的影响(均数标准差)标准差)2.6 2.6 误用误用t t检验处理单因素检验处理单因素k(k3)k(k3) 设计的资料设计的资料如何正确选择统计方法辨析:辨析:v没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。v本资料有四个剂量,属于本资料有四个剂量,属于单因素四水平设计单因素四水平设计的定量资料,不可以用成组设的定量资料,不可以用成组设计或配对设计的计或配对设计的t t检验。检验。v措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计措施:如果满足正态性
22、和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用DunnettDunnett t t检验或检验或LSDLSD检验。检验。v如果在专业上有必要对如果在专业上有必要对3 3项指标同时进行考察,还应选用该设计的定量资料项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。的三元方差分析对资料进行处理。2.6 2.6 误用配对设计资料的误用配对设计资料的t t检验检验处理单因素处理单因素k(k3)k(k3)水平设计的资料水平设计的资料如何正确选择统计方法3.1 3
23、.1 计算相对数时分母太小计算相对数时分母太小3.2 3.2 误用误用2 2 检验分析结果变量为有序变量的资料检验分析结果变量为有序变量的资料3.3 3.3 误用误用2 2检验回答相关性问题检验回答相关性问题3.4 3.4 多值有序变量的高维列联表资料多值有序变量的高维列联表资料3.5 3.5 不满足连续性不满足连续性2 2检验条件时未做校正检验条件时未做校正3.6 3.6 十一种形式的列联表十一种形式的列联表3.7 3.7 误用误用2 2检验取代检验取代FisherFisher精确检验精确检验3.8 3.8 对对RCRC表直接分割进行两两比较表直接分割进行两两比较三、计数资料分析方法的常见问
24、题三、计数资料分析方法的常见问题如何正确选择统计方法 文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4 4。请问:在表达资料方面有何不妥之处请问:在表达资料方面有何不妥之处? ?3.1 3.1 计算相对数时分母太小计算相对数时分母太小辨析:辨析:计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。实真相,还往往会造成错觉。在表在表4 4中,各组样本例数都小于中,各组样本例数都小于2020,样本例数偏小,不宜计算率,直
25、接给出例,样本例数偏小,不宜计算率,直接给出例数就可以。数就可以。确切的统计量和确切的统计量和P P值。值。如何正确选择统计方法3.2 3.2 误用误用2 2 检验分析结果变量为有序变量的资料检验分析结果变量为有序变量的资料某医生用某医生用A A、B B两药治疗某病各两药治疗某病各240240例例, ,其疗效分为四个等级:痊愈、显效、其疗效分为四个等级:痊愈、显效、好转、无效好转、无效, ,见表见表4 4。经。经RCRC表表2 2检验检验, ,2 2=53.33 ,=53.33 ,P P 0.01 ,0.01 ,认为两组疗认为两组疗效之间的差异有统计学意义。效之间的差异有统计学意义。辨析:辨析
26、:u本资料属于单项有序的本资料属于单项有序的RCRC表,临床疗效有等级之分,对于等级资料可采用表,临床疗效有等级之分,对于等级资料可采用RiditRidit分析或秩和检验。而不应用分析或秩和检验。而不应用RCRC的的2 2检验,检验,RCRC表表2 2 检验只能检验两检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表看出,若对表4 4资料任意两列数字进行对换资料任意两列数字进行对换, ,可以清楚地发现可以清楚地发现, ,2 2值仍为值仍为53.33,53.33,不会有改变。不会有改变。确
27、切的统计量确切的统计量P P值。值。如何正确选择统计方法3.3 3.3 误用误用2 2检验回答相关性问题检验回答相关性问题l上述资料上述资料用用2 2检验得:检验得:2 2 =163 =163. .0101,P P 0 0. .005005,结论为:可认为,结论为:可认为冠状动冠状动脉硬化的程度脉硬化的程度与与年龄年龄有关,结合本资料可见有关,结合本资料可见冠状动脉硬化等级冠状动脉硬化等级有随有随年龄年龄增高而增加的趋势。增高而增加的趋势。l问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处? ?年龄年龄冠状动脉硬化等级冠状
28、动脉硬化等级正常正常轻度轻度中度中度高度高度50504343188188141424524560601 19696727216916970706 6171755557878合计合计5050301301141141492492表表 不同年龄冠状动脉粥样硬化程度的分布不同年龄冠状动脉粥样硬化程度的分布如何正确选择统计方法辨析辨析1 1:本资料为本资料为“双向有序且属性不同的二维列联表资料双向有序且属性不同的二维列联表资料”,处理这种资料有,处理这种资料有3 3个个目的,因此,就对应着目的,因此,就对应着3 3套不同的统计分析方法。套不同的统计分析方法。分析不同年龄组患者冠状动脉硬化等级之间有无差别
29、:看作单向有序资分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。料,选用秩和检验。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析两者间是否存在线性变化趋势则应用线性趋势检验。分析两者间是否存在线性变化趋势则应用线性趋势检验。作者欲考察作者欲考察“两个有序变量之间是否呈相关关系两个有序变量之间是否呈相关关系”,而,而2 2检验结果是检验结果是P0.05P0.05,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。事实上,若将表中任何两行的频数互换或
30、将任何两列的频数互换,所得的事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的2 2检验的统计量数值是不会变化的,说明检验的统计量数值是不会变化的,说明2 2检验用于处理有序变量形成的检验用于处理有序变量形成的二维列联表资料是不合适的。二维列联表资料是不合适的。3.3 3.3 误用误用2 2检验回答相关性问题检验回答相关性问题如何正确选择统计方法辨析辨析2 2:欲考察欲考察“两个有序变量之间是否呈相关关系两个有序变量之间是否呈相关关系”,应选用分析定性,应选用分析定性资料的相关分析方法,如:资料的相关分析方法,如:SpearmanSpearman秩相关分析,秩相关分析,Kenda
31、llKendall秩相秩相关分析或典型相关分析。关分析或典型相关分析。本例采用本例采用SpearmanSpearman秩相关分析,得:秩相关分析,得:r rs s=0.53215=0.53215,P0.0001P0.050.05或或P P0.05 0.05 、P P0.010.01便称结果无显著差异,或结果非常显著。便称结果无显著差异,或结果非常显著。四、统计分析方法表述问题四、统计分析方法表述问题5 5u假设检验结果正确的表达方法是:假设检验结果正确的表达方法是: 应写出描述性统计量,如样本均数、率、相关系数、回应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统归系数、相对危险度、半数效量等,及其可信区间、检验统计量,如计量,如2 2、t t、u u、F F 值等值等) )、P P值;然后根据值;然后根据P P值大小作出统值大小作出统计学推断,并作出相应的医学专业结论。计学推断,并作出相应的医学专业结论。如何正确选择统计方法如何正确选择统计方法