统计方法的选择与统计方法的选择与SPSS结果解释结果解释一、一、t 检验检验·单样本单样本 t 检验检验·配对配对 t 检验检验·两样本两样本 t 检验检验1. 单样本单样本 t 检验检验·例例1 为研究口服避孕药是否会增高血糖测量为研究口服避孕药是否会增高血糖测量值,某研究人员随机抽取值,某研究人员随机抽取9名一直口服避孕名一直口服避孕药至少药至少6个月的妇女,测量她们的空腹血糖个月的妇女,测量她们的空腹血糖值,结果如下所示已知不服用避孕药妇值,结果如下所示已知不服用避孕药妇女的空腹血糖值均值为女的空腹血糖值均值为3.8 mmol/L 根据该样本提供的信息,是否有证据表明口服该样本提供的信息,是否有证据表明口服避孕药可以提高空腹血糖值?避孕药可以提高空腹血糖值?·4.71 3.61 4.92 4.85 4.66 3.92 5.10 3.55 4.78Compare MeansOne Sample T TestOne Sample t Test对话框对话框结果解释结果解释·单样本单样本 t 检验结果显示:检验结果显示:(统计方法)(统计方法)·服用避孕药与不服用避孕药妇女空腹血糖值的差别服用避孕药与不服用避孕药妇女空腹血糖值的差别有统计学意义(有统计学意义(t =3.31,,P==0.011 ))(统计结论)(统计结论)·口服避孕药可以增加血糖水平,平均增加口服避孕药可以增加血糖水平,平均增加0.66 ((95% CI ::0.20~1.11 ))mmol/L(专业结论)(专业结论)2. 配对配对 t 检验(检验(paired t-test)) 配对设计:配对设计:·同一受试对象处理前后同一受试对象处理前后·两个同质受试对象分别接受两种不同的处两个同质受试对象分别接受两种不同的处理理·同一受试对象分别接受两种不同的处理同一受试对象分别接受两种不同的处理( (1) ) 同一受试对象处理前后同一受试对象处理前后·例例2 用家兔用家兔10只实验某批注射液对体温的影只实验某批注射液对体温的影响。
体温在注射前每隔响体温在注射前每隔1小时测定小时测定1次,连续次,连续2次;在注射后次;在注射后1小时和小时和2小时分别各测定小时分别各测定1次,次,得到每只家兔注射前后体温的均数问该批得到每只家兔注射前后体温的均数问该批注射液是否能引起家兔体温升高?注射液是否能引起家兔体温升高?表表1 某批注射液对家兔体温(某批注射液对家兔体温(℃)的影响)的影响家兔编号家兔编号12345678910注射前体温注射前体温37.838.238.037.637.938.138.237.538.537.9注射后体温注射后体温37.939.038.938.437.939.039.538.638.839.0( (2) ) 两个两个同质受同质受试对象分别接受试对象分别接受两种不同的处理两种不同的处理·例例3 为研究某种抗癌新药对小白鼠移植性肉瘤为研究某种抗癌新药对小白鼠移植性肉瘤S180的的抑瘤效果抑瘤效果 ,将,将20只小白鼠按性别、体重、窝别配成只小白鼠按性别、体重、窝别配成对子每对中随机抽取对子每对中随机抽取1只服用抗癌新药只服用抗癌新药“扶正消瘤扶正消瘤汤汤”,另,另1只作为阴性对照,服用生理盐水,观察其只作为阴性对照,服用生理盐水,观察其对小白鼠移植性肉瘤对小白鼠移植性肉瘤S180的抑瘤效果。
经过一定时间,的抑瘤效果经过一定时间,测得小白鼠瘤重如表所示问小白鼠服用抗癌新药测得小白鼠瘤重如表所示问小白鼠服用抗癌新药和生理盐水后平均瘤重有无不同?和生理盐水后平均瘤重有无不同?表表2 抗癌新药抗癌新药“扶正消瘤汤扶正消瘤汤”对小白鼠移植性肉瘤对小白鼠移植性肉瘤S180的抑瘤效果(瘤重的抑瘤效果(瘤重/g)) 家兔编号家兔编号12345678910对照组对照组0.800.740.310.480.760.650.720.680.390.53新药组新药组0.470.420.380.440.380.430.390.710.320.41( (3) )同一受同一受试对象分别接受试对象分别接受两种不同的处理两种不同的处理·取取20份样品,每份一分为二,分别用容量法和份样品,每份一分为二,分别用容量法和仪器分析测定试判断容量法的测量结果是否仪器分析测定试判断容量法的测量结果是否低于仪器分析结果?低于仪器分析结果?·某医院用某医院用A、、B两种血红蛋白测定仪器检测了两种血红蛋白测定仪器检测了16名健康男青年的血红蛋白含量(名健康男青年的血红蛋白含量(g/L)),问两问两种血红蛋白测定仪器的检测结果是否有差别?种血红蛋白测定仪器的检测结果是否有差别?·某研究者为比较耳垂血和手指血的白细胞数,某研究者为比较耳垂血和手指血的白细胞数,调查了调查了12名成年人,同时采取耳垂血和手指血,名成年人,同时采取耳垂血和手指血,试比较两者的白细胞数有无不同?试比较两者的白细胞数有无不同? ·有有12名接种卡介苗的儿童,名接种卡介苗的儿童,8周后用两批不同的结周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应直径(皮肤浸润反应直径(mm)如表所示。
问两种结)如表所示问两种结核菌素的反应性有无差别?核菌素的反应性有无差别?表表3 12名儿童分别用两种结核菌素皮肤浸润反应结果名儿童分别用两种结核菌素皮肤浸润反应结果(mm)编号编号标准品标准品新制品新制品 差值差值112.010.02.0214.510.04.5315.512.53.0412.013.0-1.0513.010.03.0612.05.56.5710.58.52.087.56.51.099.05.53.51015.08.07.01113.06.56.51210.59.51.0AnalyzeCompare MeansPaired-Samples T test将变量将变量标准品标准品和和新制品新制品成对选入成对选入Paired Variables栏;单击栏;单击OK ·配对配对 t 检验结果显示:检验结果显示:新制品新制品结核菌素结核菌素皮肤浸润反应的直径均数低于标准品皮肤浸润反应的直径均数低于标准品((t = 4.52, P = 0.001)),,均数差值为均数差值为3.25 ((95% CI:: 1.67~4.83 ))mm3. 两样本两样本 t 检验检验·分别从两个研究总体中随机抽取样本,分别从两个研究总体中随机抽取样本,然后比较两样本某指标的均数;然后比较两样本某指标的均数;·随机抽取实验对象,将其随机分成两组,随机抽取实验对象,将其随机分成两组,分别接受两种不同处理,然后比较两组分别接受两种不同处理,然后比较两组的平均效应。
的平均效应((1)分别从两个研究总体中随机抽取)分别从两个研究总体中随机抽取样本,然后比较两样本某指标的均数样本,然后比较两样本某指标的均数·例例4 4 从从两两个个品品种种的的家家兔兔分分别别测测定定其其停停食食18小小时时后后正正常常血血糖糖值值,,问问这这两两个个品品种种家家兔的正常血糖值有无差别?兔的正常血糖值有无差别?表表4 两个不同品种家兔的正常血糖值两个不同品种家兔的正常血糖值 家兔品种家兔品种正常血糖值(正常血糖值(mg/100ml))大耳白大耳白57 120101137119117104735368118青紫蓝青紫蓝8936825039325782963188((2)随机抽取实验对象,将其随机分)随机抽取实验对象,将其随机分成两组,分别接受两种不同处理,然成两组,分别接受两种不同处理,然后比较两组的平均效应后比较两组的平均效应·例例5 25例糖尿病患者随机分成两组,甲例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗组单纯用药物治疗,乙组采用药物治疗合并饮食治疗法,两个月后再次测空腹合并饮食治疗法,两个月后再次测空腹血糖,问两组患者血糖值是否相同?血糖,问两组患者血糖值是否相同?SPSS操作:两样本操作:两样本t检验检验·例例5.3 25例糖尿病患者随机分成两组,甲组单例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食治纯用药物治疗,乙组采用药物治疗合并饮食治疗法,两个月后再次测空腹血糖,问两组患者疗法,两个月后再次测空腹血糖,问两组患者血糖值是否相同?血糖值是否相同?表表5 25例糖尿病患者两种疗法后两个月血糖值(例糖尿病患者两种疗法后两个月血糖值(mmol/L))甲组血糖值甲组血糖值X1乙组血糖值乙组血糖值X28.45.410.56.4……21.114.815.215.618.7AnalyzeCompare MeansIndependent-Samples T test将变量将变量血糖值血糖值选入选入Test栏;将栏;将组别组别选入选入grouping栏,栏,单击单击Define Groups按钮,定义两个组的变量值,本按钮,定义两个组的变量值,本例为例为1和和2,单击,单击Continue按钮;单击按钮;单击OK按钮。
按钮 ·经方差齐性检验,经方差齐性检验,F=0.28,,P==0.60按 ==0.10水准,水准,可认为两总体方差齐性(如不齐用第可认为两总体方差齐性(如不齐用第2行数据)行数据)·两样本两样本 t 检验结果显示:单纯药物治疗的血糖值均数检验结果显示:单纯药物治疗的血糖值均数高于药物合并饮食治疗(高于药物合并饮食治疗(t =2.64,,P=0.015),均数),均数差值为差值为4.36((95% CI::0.94~7.78))mmol/L4. t 检验的应用条件检验的应用条件·n较小时(如较小时(如n1或或n2<60),理论上要求),理论上要求样本取自正态总体样本取自正态总体·两小样本均数比较时,要求两总体方差两小样本均数比较时,要求两总体方差相等二、二、 方方 差差 分分 析析 1. 完全随机设计的方差分析完全随机设计的方差分析·例例6 为评价为评价4种不同饲料对肝脏的影响,将种不同饲料对肝脏的影响,将16只体只体重相近的大鼠完全随机等分为重相近的大鼠完全随机等分为4组,每组组,每组4只用种不同的饲料喂养大白鼠,然后测其肝重占体重种不同的饲料喂养大白鼠,然后测其肝重占体重的比值(的比值(%)。
试比较四组均数间有无差异?)试比较四组均数间有无差异? 建立数据文件;选用建立数据文件;选用One-Way将变量将变量x选入选入Dependent栏,将变量栏,将变量group选入选入Factor栏;分别单击栏;分别单击Post Hoc和和Options按钮按钮 用于多个均数间的两两比较:用于多个均数间的两两比较:方差齐时:方差齐时: S-N-K方差不齐时:方差不齐时:Tamhan’s T2计算各组的均数和标准差:计算各组的均数和标准差:Descriptive进行方差齐性检验:进行方差齐性检验:Homogeneity…单击单击OK各组均数和标准差各组均数和标准差方差齐性检验方差齐性检验·P==0.257,方差齐吗?,方差齐吗?完全随机设计的方差分析结果完全随机设计的方差分析结果·完全随机设计资料的方差分析结果显示:完全随机设计资料的方差分析结果显示:四种不同饲料喂养大白鼠肝四种不同饲料喂养大白鼠肝/体比值的均体比值的均数不同(数不同(F=10.24,,P=0.001) 多个样本均数的两两比较多个样本均数的两两比较·显示了两个均衡子集,均衡子集显示了两个均衡子集,均衡子集内内的各组均数差的各组均数差别无统计学意义,均衡子集别无统计学意义,均衡子集间间的各组均数差别有的各组均数差别有统计学意义。
统计学意义·经多个样本均数两两比较的经多个样本均数两两比较的SNK检验,按检验,按 =0.05水准,可认为水准,可认为C与与D饲料肝饲料肝/体比值的均数高于体比值的均数高于A与与B饲料,但尚不能认为饲料,但尚不能认为A与与B饲料,饲料,C与与D饲料饲料肝肝/体比值的均数不同体比值的均数不同如何阅读如何阅读SNK法法的结果的结果2. 随机区组设计的方差分析随机区组设计的方差分析·例例7 某单位欲研究某单位欲研究3种药物对小白鼠肉瘤的种药物对小白鼠肉瘤的抑制作用,将性别相同、体重相近的同一抑制作用,将性别相同、体重相近的同一配伍组的配伍组的3只小白鼠分别用只小白鼠分别用3种药物抑癌,种药物抑癌,共共5个配伍组实验结果得瘤重(克)如个配伍组实验结果得瘤重(克)如下试比较下试比较3种药物的抑癌作用有无差别种药物的抑癌作用有无差别?? AnalyzeGeneral LinearModelUnivariate分别单击分别单击Model和和Post Hoc按钮按钮将变量将变量x选入选入Dependent Variable栏,将栏,将group选选入入Fixed Factor(固定因素)栏,将(固定因素)栏,将block选入选入Random Factor(随机因素)栏。
分别单击(随机因素)栏分别单击Model按钮和按钮和Post Hoc按钮按钮 将变量将变量group和和block选入选入Model栏中单击单击Continue按钮返回按钮返回 将变量将变量group选入选入Post Hoc Tests for栏,选栏,选择择SNK法进行多个均数两两比较,单击法进行多个均数两两比较,单击Continue按钮返回按钮返回单击单击OK按钮按钮·随机区组设计资料的方差分析结果显示:随机区组设计资料的方差分析结果显示: 3种药物的抑癌作用有差别(种药物的抑癌作用有差别(F=16.43,,P = 0.001) ·多个样本均数间两两比较的多个样本均数间两两比较的SNK检验结检验结果显示:按果显示:按 =0.05水准,可认为水准,可认为B和和C药药的抑抑癌作用大于的抑抑癌作用大于A药,但尚不能认为药,但尚不能认为B和和C药的抑癌作用有差别药的抑癌作用有差别三、秩和检验三、秩和检验 1. 非参数统计的适用情况非参数统计的适用情况·等级资料等级资料·偏态分布或分布不明(尤其偏态分布或分布不明(尤其n < 30))·个别数据偏过大,或某一端无确定值个别数据偏过大,或某一端无确定值·各组方差明显不齐(不重要,为什么?)各组方差明显不齐(不重要,为什么?)2. 判断计量资料是否服从正态分布的方法判断计量资料是否服从正态分布的方法·据文献或以往经验:身高,血压,红细胞数据文献或以往经验:身高,血压,红细胞数为正态分布;尿铅,潜伏期,生存时间,住为正态分布;尿铅,潜伏期,生存时间,住院天数为偏态分布。
院天数为偏态分布·若无文献可参考,则根据样本提供的信息判若无文献可参考,则根据样本提供的信息判断以下情况提示样本来自明显偏态分布:断以下情况提示样本来自明显偏态分布:¨有离群值;或最大值为最小值的有离群值;或最大值为最小值的5倍甚至倍甚至10倍以倍以上;上;¨变异系数(变异系数(CV=标准差标准差/均数均数 100%))超过超过50%甚至甚至100%(测量值为正;根据:(测量值为正;根据: )3.配对样本比较的配对样本比较的Wilcoxon符号秩检验符号秩检验 Wilcoxon Signed Ranks Test·例例8 8:临床某医生研究白癜风病人的白介:临床某医生研究白癜风病人的白介素素IL-6IL-6水平(水平(u/mlu/ml)在白斑部位与正常)在白斑部位与正常部位有无差异,调查的资料如表所示:部位有无差异,调查的资料如表所示:表表8 白癜风病人的不同部位白癜风病人的不同部位白介素白介素IL-6IL-6指标(指标(u/mlu/ml))病人病人编号编号白癜白癜部位部位正常正常部位部位差值差值=正常-白斑正常-白斑秩次秩次140.0388.5748.546297.1388.00-17.13- 3380.32123.7243.404425.3239.0313.712519.6124.374.761614.5092.7578.258749.63121.5771.947844.5689.7645.205合计合计 33, --3配对样本比较的配对样本比较的Wilcoxon符号秩检验符号秩检验 Wilcoxon Signed Ranks TestSPSS结果解释结果解释AnalyzeNonparametric Tests 2 Related Samples 将变量将变量白斑部位白斑部位和和正常部位正常部位成对选入成对选入Test Pair(s) List 栏,其余用默认选择项,单击栏,其余用默认选择项,单击OK 按钮按钮 结果:负秩和结果:负秩和 =3,正秩和,正秩和 =33,有,有0例例相同秩次(相同秩次(Ties)。
配对样本比较的配对样本比较的Wilcoxon符号秩检验结果显符号秩检验结果显示:白癜风病人正常部位白介素水平高于白示:白癜风病人正常部位白介素水平高于白斑部位斑部位((Z=2.1,,P=0.036))4.两个独立样本比较的两个独立样本比较的Wilcoxon秩和检验秩和检验 Mann-Whitney U Test·例例10 试检验两组小鼠存活日数有无差别?试检验两组小鼠存活日数有无差别?表10 两组小鼠存活日数实验组 101215 15161718202390对照组 2 3 4 5 6 7 8 910111213两个独立样本比较的两个独立样本比较的Wilcoxon秩和检验秩和检验 SPSS结果解释结果解释AnalyzeNonparametric Tests2 Independent Samples 将变量将变量day选入选入Test Variable List栏,将分组变量栏,将分组变量group选入选入Grouping Variable栏,单击栏,单击Define Group按钮,定义分组按钮,定义分组变量值为变量值为1和和2,单击,单击Continue按钮返回;其余用默认选择按钮返回;其余用默认选择项,单击项,单击OK 按钮按钮 平均秩:平均秩:1 实验组实验组=17.0,, 2 对照组对照组=6.9两独立样本比较的秩和检验结果显示:实验两独立样本比较的秩和检验结果显示:实验组生存日数(平均秩为组生存日数(平均秩为17.0)较对照组(平均)较对照组(平均秩秩6.9)长()长(Z=3.63,,P=0.000)。
5. 频数表等级资料频数表等级资料·例例11 44例健康人与例健康人与24例慢性气管炎病人例慢性气管炎病人痰液嗜酸性粒细胞数的测量值痰液嗜酸性粒细胞数的测量值((×106/L)如表所示,问健康人与慢性)如表所示,问健康人与慢性气管炎病人痰液嗜酸性粒细胞数有无差气管炎病人痰液嗜酸性粒细胞数有无差别?别?表表11 两组人痰嗜酸性粒细胞两组人痰嗜酸性粒细胞嗜酸性嗜酸性粒细胞数粒细胞数健康人健康人 ((1)) 病人病人 ((2))合计合计-(-(1))51116+(+(2))181028++(++(3))16319+++(+++(4))505合计合计442468数据工作表(频数数据工作表(频数0可以不输入)可以不输入)不要忘记:先加权不要忘记:先加权Weight, 频数频数嗜酸性嗜酸性粒细胞数粒细胞数健康人健康人 ((1)) 病人病人 ((2))合计合计-(-(1))51116+(+(2))181028++(++(3))16319++++++((4))505合计合计442468平均秩和平均秩和 提示提示健康人的痰嗜酸性粒细胞数高于病人健康人的痰嗜酸性粒细胞数高于病人 ·Exact sig. 没有显示,为什么?没有显示,为什么?n足够大足够大·两独立样本比较的秩和检验结果显示:两独立样本比较的秩和检验结果显示:健康人与慢性气管炎病人痰液嗜酸性粒健康人与慢性气管炎病人痰液嗜酸性粒细胞数无差别(细胞数无差别(Z=3.63,,P=0.000)。
6.多个独立样本比较的多个独立样本比较的Kruskal-Wallis H 检验检验 Kruskal-Wallis H 检验检验例例12 试问三种不同手术方法治疗肝癌的效试问三种不同手术方法治疗肝癌的效果有无差别?果有无差别? 表12 三种不同手术方法治疗肝癌术后的生存时间(月)甲法3 7 762乙法9121185丙法1 2 647AnalyzeNonparametric TestsK Independent Samples 结果解释:平均秩结果解释:平均秩多个独立样本比较的秩和检验结果显示:多个独立样本比较的秩和检验结果显示:三种手术方法治疗肝癌术后生存月数不同三种手术方法治疗肝癌术后生存月数不同(( 2=6.39,,P = 0.041),其中乙法术后),其中乙法术后生存月数最长生存月数最长四、四、 2检验检验·四格表资料的卡方检验四格表资料的卡方检验·配对四格表资料的卡方检验配对四格表资料的卡方检验·行行 列表资料的卡方检验列表资料的卡方检验¨多个样本率比较的多个样本率比较的 2 检验检验¨两个或多个样本构成比的比较两个或多个样本构成比的比较1. 四格表资料的卡方检验四格表资料的卡方检验·例例13 某医师欲比较胞磷胆碱与神经节苷某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将酯治疗脑血管疾病的疗效,将78例脑血例脑血管疾病患者随机分为两组。
结果如下:管疾病患者随机分为两组结果如下:胞磷胆碱组胞磷胆碱组52例,有效例,有效46例,有效率为例,有效率为88.5%;神经节苷酯组;神经节苷酯组26例,有效例,有效18例,例,有效率为有效率为69.2%问两种药物治疗脑血管问两种药物治疗脑血管疾病的有效率有无差别?疾病的有效率有无差别? 表表13两种药物治疗脑血管疾病有效率两种药物治疗脑血管疾病有效率((%))的比较的比较组别组别有效有效无效无效合计合计有效率有效率胞磷胆碱组胞磷胆碱组 46 65288.46神经节苷酯组神经节苷酯组 18 8 (4.67)2669.23合计合计64147882.05用变量用变量“频数频数”加权:从菜单选择加权:从菜单选择Data Weight cases,打开,打开Weight cases对话框,选择对话框,选择Weight cases by,将,将“频数频数”选入选入Frequency栏,单击栏,单击OK 按钮按钮 AnalyzeDescriptive StatisticsCrosstabs 将行变量将行变量“分组分组”选入选入Row(s)栏,栏,将列变量将列变量“疗效疗效”选入选入Column栏,栏,分别单击分别单击Statistics,,Cell (格子格子)选择选择 Chi-square 选择显示选择显示行百分数行百分数 Row 2检验结果显示:检验结果显示:两种药物治疗脑血管疾病两种药物治疗脑血管疾病有效率的差别无统计学意义(有效率的差别无统计学意义( 2 = 3.14,,P=0.076 )。
·例例14 14 某实验室分别用乳胶凝集法和免疫某实验室分别用乳胶凝集法和免疫荧光法对荧光法对5858名可疑系统红斑狼疮患者血清名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表问两种中抗核抗体进行测定,结果见表问两种方法的检测结果有无差别?方法的检测结果有无差别? 表表14 14 两种方法的检测结果两种方法的检测结果 免疫荧光免疫荧光法法 乳胶凝集法乳胶凝集法 合计合计+--+11((a))12((b))23--2((c))33((d))35合计合计134558免疫:免疫:23/ 58= 0.397乳胶:乳胶:13 /58= 0.2242. 配对四格表资料的卡方检验配对四格表资料的卡方检验配对四格表资料的配对四格表资料的 2检验,如在检验,如在Crosstabs过程过程中进行,中进行,不显示配对不显示配对 2检验的检验的 2值值,只显示四,只显示四格表资料格表资料 2检验的检验的 2值配对四格表资料的配对四格表资料的 2检验结果显示:检验结果显示:两种方法的检两种方法的检测结果有差别,即免疫荧光法的检出率(测结果有差别,即免疫荧光法的检出率(39.7%))高于乳胶凝集法(高于乳胶凝集法(22.4%)()(P=0.013))McNemar:麦克尼马尔检验:麦克尼马尔检验 3. 行行 列表资料的卡方检验列表资料的卡方检验(多个样本率比较的(多个样本率比较的 2 检验)检验)·例例1515:某医师研究物理疗法、药物治疗和外:某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗用膏药三种疗法治疗周围性面神经麻痹的疗效。
问三种疗法的有效率有无差别?效问三种疗法的有效率有无差别?表表15 15 三种疗法有效率的比较三种疗法有效率的比较 疗法疗法有效有效无效无效合计合计有效率(有效率(% %))物理疗法组物理疗法组199720696.60药物治疗组药物治疗组1641818290.11外用膏药组外用膏药组1182614481.94合计合计4815153290.41SPSS数据数据结果解释结果解释· 2检验结果显示:三种疗法治疗周围性检验结果显示:三种疗法治疗周围性面神经麻痹的有效率有差别(面神经麻痹的有效率有差别( 2=21.04,,P = 0.000) 行行 列表资料的卡方检验列表资料的卡方检验(两个或多个样本构成比的比较(两个或多个样本构成比的比较 ))·例例16 某医师在研究血管紧张素某医师在研究血管紧张素I转化酶转化酶((ACE)基因)基因I/D多态与多态与 II 型糖尿病肾病型糖尿病肾病((DN)的关系时,将)的关系时,将249例例 II 型糖尿病患者按型糖尿病患者按有无糖尿病肾病分为两组,资料见表有无糖尿病肾病分为两组,资料见表6-9问两组组 II 型糖尿病患者的型糖尿病患者的ACE基因型分布有无差别基因型分布有无差别?? 结果解释结果解释· 2检验结果显示:检验结果显示:DN组与无组与无DN组的组的II型型糖尿病患者的糖尿病患者的ACE基因型分布不同基因型分布不同(( 2=7.91,,P = 0.019)。
五、线性回归与相关五、线性回归与相关 1. . 线性回归分析线性回归分析·a为常数项为常数项((constant),是直线的截距;),是直线的截距;·b为回归系数为回归系数((regression coefficient),是),是直线的斜率它的统计学意义是:直线的斜率它的统计学意义是:X 每增每增(减)一个单位,(减)一个单位,Y平均改变平均改变b个单位· 为给定为给定X时时Y的估计值的估计值 ·例例17 某地方病研究所调查了某地方病研究所调查了8名正常儿童名正常儿童的尿肌酐含量(的尿肌酐含量(mmol/24h)估计正常)估计正常儿童的尿肌酐含量(儿童的尿肌酐含量(mmol/24h)对其年)对其年龄(岁)的线性回归方程龄(岁)的线性回归方程绘制散点图:绘制散点图:GraphsScatter 散点图显示:散点图显示:8 8名儿童的尿肌酐名儿童的尿肌酐含量随年龄增大含量随年龄增大而增高,呈直线而增高,呈直线趋势SPSS操作和结果解释操作和结果解释 AnalyzeRegressionLinear;选择;选择Y作为因变量进入作为因变量进入Dependent栏,选择栏,选择X作作为自变量进入为自变量进入Independent(s);其余用默;其余用默认选择项;单击认选择项;单击OK。
结果解释结果解释·复相关系数(复相关系数(R))=0.882·决定系数(决定系数(R Square,, R2))=0.778·剩余标准差(剩余标准差(Std. Error of the Estimate))=0.1970 ·线性回归分析结果显示:正常儿童的尿线性回归分析结果显示:正常儿童的尿肌酐含量与年龄之间存性回归关系肌酐含量与年龄之间存性回归关系((t = 4.58,,P = 0.004);线性回归方程);线性回归方程为:为: ;决定系数为;决定系数为0.778,表示年龄可解释尿肌酐含量变异,表示年龄可解释尿肌酐含量变异的的77.8% 2. 线性相关分析线性相关分析·例例18 某地方病研究所调查了某地方病研究所调查了8名正常儿童名正常儿童的尿肌酐含量(的尿肌酐含量(mmol/24h)问尿肌酐)问尿肌酐含量与年龄是否有直线相关关系?含量与年龄是否有直线相关关系? AnalyzeCorrelate Bivariate,打开对话,打开对话框,将框,将X和和Y选入选入Variables栏,单击栏,单击OK 直线相关系数的假设检验直线相关系数的假设检验·直线相关分析结果显示:正常儿童的尿直线相关分析结果显示:正常儿童的尿肌酐含量与年龄之间呈线性正相关关系肌酐含量与年龄之间呈线性正相关关系((r = 0.882,,P = 0.004 )。
六、析因设计的方差分析六、析因设计的方差分析·多因素实验:安排多因素实验:安排2个及以上处理因素的实验个及以上处理因素的实验·处理因素:研究者根据研究目的施加于受试对处理因素:研究者根据研究目的施加于受试对象,在实验中需要观察并阐明其效应的因素象,在实验中需要观察并阐明其效应的因素如比较三种抗癌药物对小白鼠肉瘤的抑瘤效果,如比较三种抗癌药物对小白鼠肉瘤的抑瘤效果,处理因素是抗癌药物,能控制的非处理因素可处理因素是抗癌药物,能控制的非处理因素可能是小鼠体重能是小鼠体重·只有一个处理因素的方差分析:只有一个处理因素的方差分析:¨完全随机设计资料的方差分析:完全随机设计资料的方差分析:x drug¨随机区组设计资料的方差分析随机区组设计资料的方差分析: x drug block·研究研究A药和药和B药联合使用对患者血脂的影响药联合使用对患者血脂的影响 变量设置:变量设置: x drugA drugB例题例题·欲观察甲、乙两药治疗高血脂的疗效,以及甲乙欲观察甲、乙两药治疗高血脂的疗效,以及甲乙两药疗效有无交互作用,研究者将甲药和乙药均两药疗效有无交互作用,研究者将甲药和乙药均定为定为“不用不用”和和“用用”两个水平,有两个水平,有4种试验组种试验组合(合(4种处理):种处理):((1)甲药和乙药均不用,只用)甲药和乙药均不用,只用一般疗法一般疗法;;((2)甲药和)甲药和一般疗法一般疗法;;((3)乙药和)乙药和一般疗法一般疗法((4)甲药、乙药和)甲药、乙药和一般疗法一般疗法。
·研究者将研究者将32名高脂血症患者,采用完全随机的方名高脂血症患者,采用完全随机的方法分配到以上法分配到以上4种不同处理组中,每组种不同处理组中,每组8人,治疗人,治疗前及治疗前及治疗1个月后测量各组患者的血清胆固醇个月后测量各组患者的血清胆固醇((mg/dl),疗效指标为血清胆固醇下降值疗效指标为血清胆固醇下降值 接受四种不同疗法患者血清胆固醇下降值(接受四种不同疗法患者血清胆固醇下降值(mg/dl))第第1组组两药都不用两药都不用第第2组组甲药甲药第第3组组乙药乙药第第4组组两药都用两药都用9202146111228526101739792347162214401718381214224651512338.2512.3820.2543.132×2析因设计因素和水平的组合析因设计因素和水平的组合甲药甲药甲甲 药药单独效应单独效应不用不用用用乙药乙药不用不用8.2512.384.13用用20.2543.1322.88乙乙 药药单独效应单独效应12.0030.75甲药的主效应=(甲药的主效应=(甲药的主效应=(甲药的主效应=(22.88+4.13)/2=13.5122.88+4.13)/2=13.51乙药的主效应=(乙药的主效应=(乙药的主效应=(乙药的主效应=(30.75+12.00)/2=21.3730.75+12.00)/2=21.37交互作用=(交互作用=(交互作用=(交互作用=(22.8822.88----4.13)/2=4.13)/2=((((30.7530.75----12.0012.00))))/2/2====9.379.37单独效应单独效应·单独效应:指其它因素的水平固定时,同单独效应:指其它因素的水平固定时,同一因素不同水平间的差别。
一因素不同水平间的差别·主效应:指某一因素各水平间的平均差别主效应:指某一因素各水平间的平均差别·交互作用:当某因素的各个单独效应随另交互作用:当某因素的各个单独效应随另一因素水平的变化而变化,且相互间的差一因素水平的变化而变化,且相互间的差别超出随机波动范围时即某因素的效应别超出随机波动范围时即某因素的效应大小与另一因素有关大小与另一因素有关·两因素的交互作用称为一阶交互作用两因素的交互作用称为一阶交互作用2×2析因设计资料的方差分析析因设计资料的方差分析·两个处理因素,每个因素分两个处理因素,每个因素分“不用不用”和和“用用” 两个水平,即两个水平,即A药药(不用,用不用,用)和和B药药(不用,不用,用用)接受四种不同疗法患者血清胆固醇下降值(接受四种不同疗法患者血清胆固醇下降值(mg/dl))第第1组组两药都不用两药都不用第第2组组甲药甲药第第3组组乙药乙药第第4组组两药都用两药都用 920214611122852 6101739 7 9234716 22144 017183812142246 51512338.2512.3820.2543.13数据文件数据文件AnalyzeGeneral Linear Model Univariate 单击单击Options、、Plots按钮按钮Options:选择:选择Des和和HomogeneityPlots:单击:单击Add各组均数各组均数方差齐方差齐甲药的主效应有统计学意义(甲药的主效应有统计学意义(F=51.4, P=0.000))乙药的主效应有统计学意义(乙药的主效应有统计学意义(F=128.9, P=0.000))甲药和乙药的交互作用有统计学意义(甲药和乙药的交互作用有统计学意义( F=24.8, P=0.000 ))甲药和乙药降血清胆固醇(甲药和乙药降血清胆固醇(mg/dl)的交互作用图)的交互作用图对交互作用的解释对交互作用的解释·析因设计方差分析结果显示:甲药和乙析因设计方差分析结果显示:甲药和乙药的交互作用有统计学意义药的交互作用有统计学意义((F=24.80,P=0.000F=24.80,P=0.000)), ,即乙药的效果与甲药是否即乙药的效果与甲药是否使用有关使用有关或或甲药的效果与乙药是否使用甲药的效果与乙药是否使用有关,有关,用甲药使乙药的疗效增加,平均用甲药使乙药的疗效增加,平均增加增加 9.37((mg/dl))。
故甲药对乙药有故甲药对乙药有协同作用(如果测量值越高代表效果越协同作用(如果测量值越高代表效果越好,交互作用大于好,交互作用大于0 0且有统计学意义;反且有统计学意义;反之,则有拮抗作用)之,则有拮抗作用) ·析因设计主要是寻找处理因素不同水平析因设计主要是寻找处理因素不同水平间一种较好的组合,或分析交互作用间一种较好的组合,或分析交互作用·如果经析因设计资料的方差分析,交互如果经析因设计资料的方差分析,交互作用无统计学意义,只分析主效应即可作用无统计学意义,只分析主效应即可·如果存在交互作用,说明处理因素间的如果存在交互作用,说明处理因素间的作用相互影响,主效应中包括了交互作作用相互影响,主效应中包括了交互作用七、重复测量设计资料的方差分析七、重复测量设计资料的方差分析·概念:对同一观察对象(病人,受试者、概念:对同一观察对象(病人,受试者、动物、标本,等)的同一观察指标在不动物、标本,等)的同一观察指标在不同时间点上进行的多次测量同时间点上进行的多次测量·数据特征数据特征¨前后测量设计前后测量设计¨设立对照的前后测量设计设立对照的前后测量设计¨重复测量设计重复测量设计¨设立对照的重复测量设计设立对照的重复测量设计1. 前后测量设计前后测量设计高血压患者治疗前后的舒张压(高血压患者治疗前后的舒张压(mmHg))编号编号治疗前治疗前治疗后治疗后差值差值1130114162124110143136126104128116125122102206118100187116981881381221691261081810124106182. 设立对照的前后测量设计设立对照的前后测量设计高血压患者治疗前后的舒张压(高血压患者治疗前后的舒张压(mmHg))处理组处理组对照组对照组编号编号前前后后差值差值编号编号前前后后差值差值113011411118124212411012132122313612613134132412811614114965122102151181246118100161281187116981711811681381221813212291261081912012410124106201341283. 设立对照的重复测量设计设立对照的重复测量设计·将手术要求基本相同的将手术要求基本相同的15名患者随机分名患者随机分3组,在手术过程中分别采用组,在手术过程中分别采用A,,B,,C三三种麻醉诱导方法,在种麻醉诱导方法,在T0(诱导前)、(诱导前)、T1、、T2、、T3,,T4 五个时相测量患者的收缩压,五个时相测量患者的收缩压,数据记录见表。
数据记录见表4. 未设立对照的重复测量数据未设立对照的重复测量数据表表12-3 受试者血糖浓度(受试者血糖浓度(mmol/L))受试者受试者编号编号放置时间(分)放置时间(分)0459013515.325.324.984.6525.325.264.934.7035.945.885.435.0445.495.435.325.0455.715.495.434.9366.276.275.665.2675.885.775.434.9385.325.155.044.48越是相邻的点,相关系数越大还是越小?越是相邻的点,相关系数越大还是越小?越是相邻的时间点,数据之间的越是相邻的时间点,数据之间的相关性越大相关性越大·各列数据处理之间存在不同程度的相关各列数据处理之间存在不同程度的相关性,而且越是相邻的时间点,数据之间性,而且越是相邻的时间点,数据之间的相关性越大的相关性越大·理论上讲,当重复测量数据之间相关,理论上讲,当重复测量数据之间相关,用随机区组设计方差分析考察各时间点用随机区组设计方差分析考察各时间点之间的差别,会增加之间的差别,会增加I类错误的概率类错误的概率·如果只重复如果只重复2次,不涉及多重比较,故不次,不涉及多重比较,故不涉及该问题。
涉及该问题重复测量数据与随机区组设计的区别重复测量数据与随机区组设计的区别重复测量设计重复测量设计随机区组设计随机区组设计处理(有对照的重复测处理(有对照的重复测量)是在受试者间随机量)是在受试者间随机分配,区组内的各时间分配,区组内的各时间点是固定的,不能随机点是固定的,不能随机分配分配处理只能在区组内随处理只能在区组内随机分配,每个试验单机分配,每个试验单位接受的处理是不相位接受的处理是不相同的区组内试验单位彼此不区组内试验单位彼此不独立,同一受试者的测独立,同一受试者的测量结果可能高度相关量结果可能高度相关区组内试验单位彼此区组内试验单位彼此独立独立上机考试:设立对照的前后测量设计上机考试:设立对照的前后测量设计高血压患者治疗前后的舒张压(高血压患者治疗前后的舒张压(mmHg))处理组处理组对照组对照组编号编号前前后后编号编号前前后后11301141111812421241101213212231361261313413241281161411496512210215118124611810016128118711698171181168138122181321229126108191201241012410620134128均数均数126.2110.2124.8120.6AnalyzeGeneral Linear ModelRepeated Measures 将将“治疗前治疗前”,“治疗后治疗后”选入选入…将将“分组分组”选入选入…分别分别 单击单击Plots 、、Options将将分组分组和和time选入,单击选入,单击Add,单击,单击Continue选择选择“Descriptive statistics”单击单击Continue单击单击OK结果解释结果解释SPSS结果解释结果解释·这是多变量方差分析结果,不是本章讨论内容这是多变量方差分析结果,不是本章讨论内容 ·“球对称球对称”检验结果:因只重复两次测量,检验结果:因只重复两次测量,不能进行不能进行“球对称球对称”检验。
检验“球对称球对称”假设假设·球对称假设:球对称假设:各时间点数据的两两相关系各时间点数据的两两相关系数数 为常数为常数·两个时间点的重复测量,两个时间点的重复测量,不进行不进行“球对称球对称”检验 ·治疗前后舒张压均数有差别治疗前后舒张压均数有差别( F =55.01, P=0.000);;·组间的舒张压均数差异随时间改变,组间的舒张压均数差异随时间改变,处理组舒张压处理组舒张压均数的下降幅度大于对照组均数的下降幅度大于对照组( F =18.78, P =0.000) ·处理组与对照组舒张压均数的差别无统计处理组与对照组舒张压均数的差别无统计学意义(学意义(F = 1.57, P = 0.226)上机考试:设立对照的重复测量设计上机考试:设立对照的重复测量设计·例例12-3::将手术要求基本相同的将手术要求基本相同的1515名患者名患者随机分随机分3 3组,在手术过程中分别采用组,在手术过程中分别采用A A,,B B,,C C三种麻醉诱导方法,在三种麻醉诱导方法,在T T0 0(诱导前)、(诱导前)、T T1 1、、T T2 2、、T T3 3,,T T4 4 五个时相测量患者的收缩五个时相测量患者的收缩压,数据记录见表。
试进行方差分析压,数据记录见表试进行方差分析 数据文件数据文件Analyze General Linear Model Repeated Measures 结果解释结果解释 ·“球对称球对称”假设成立(假设成立( P=0.178 ),可选),可选择择Sphericity Assumed法法 ·不同麻醉诱导方法患者收缩压均数的差不同麻醉诱导方法患者收缩压均数的差别有统计学意义(别有统计学意义(F = 5.78, P =0.017) ·不同诱导方法患者收缩压均数的差别随时相改不同诱导方法患者收缩压均数的差别随时相改变(变(F = 19.10, P = 0.000),其中),其中A组不同诱导组不同诱导时相的收缩压较为稳定时相的收缩压较为稳定(见图见图) ;;·不同麻醉诱导时相间的收缩压均数存在差别不同麻醉诱导时相间的收缩压均数存在差别((F = 106.56, P = 0.000) ·A A组不同诱导时相的收缩压较为稳定组不同诱导时相的收缩压较为稳定统计图的文字说明最好用英文,不仅可以统计图的文字说明最好用英文,不仅可以在在SPSS中进行各种编辑,而且著名的医学中进行各种编辑,而且著名的医学期刊一般都要求统计图用全英文说明。
期刊一般都要求统计图用全英文说明每个患者的收缩压变化:单击每个患者的收缩压变化:单击Plots单击单击Add,返回,返回((1 1)哪一组的收缩)哪一组的收缩压变化较为稳定?压变化较为稳定?((2 2)为什么要比较)为什么要比较个体的变化情况个体的变化情况重复测量的间隔时间不等时,重复测量的间隔时间不等时,统计图的绘制统计图的绘制P217,表,表12-5 患者手术前后症状评分患者手术前后症状评分注意:时间间隔显示的是等距注意:时间间隔显示的是等距先用先用Mean求出各组均值求出各组均值AnalyzeCompare MeansMean各组均值各组均值数据文件数据文件测量测量时间时间天天术前术前010d102M604M1206M1809M270散点图散点图单击单击OK需要编辑该图需要编辑该图先编辑先编辑“点点”,再编辑,再编辑“线条线条”图图1 两种处理方法患者手术前后症状评分两种处理方法患者手术前后症状评分两组儿童横纹肌肉瘤治疗后复发时间两组儿童横纹肌肉瘤治疗后复发时间(月数,(月数,“+ +”表示未复发)表示未复发)八、八、log-rank test对对照照组组 239101012+1515+1618+24+3036+ 40+ 45+ 处处理理组组 912+161919+ 20+ 20+ 24+ 24+30+31+ 34+ 42+ 44+ 53+ 59+ 62+ 建立数据文件建立数据文件从菜单选择从菜单选择Analyze Survival Kaplan-Meier选择选择time变量进入变量进入Time栏中栏中,分组变量或因素变分组变量或因素变量(如量(如group)进入)进入Factor栏中,栏中,status变量进变量进入入Status栏中。
栏中单击单击Define Event 按钮,打开定义完按钮,打开定义完全数据对话框全数据对话框在在Single value栏填入栏填入 1 表示完全数据表示完全数据单击单击Continue返回返回单击单击Compare Factor按钮,打开因按钮,打开因素各水平间比较对话框素各水平间比较对话框两组生存率曲线的比较:选择两组生存率曲线的比较:选择Log-rank单击单击Options 按钮按钮Survival table(s)(( 默认选择项)默认选择项)Mean and median survival(( 默认选择项)默认选择项):平均平均生存期生存期(mean)和半数生存期和半数生存期(median)Median表表示治疗后示治疗后50%的病人能存活到的时间的病人能存活到的时间Survival:生存函数曲线:生存函数曲线单击单击OK按钮按钮·Log–rank检验结果显示:检验结果显示:两组缓解率曲线的差两组缓解率曲线的差别有统计学意义(别有统计学意义( 2=5.61,,P=0.018),故可),故可认为附加放疗(认为附加放疗(处理组)可提高病人的缓解率处理组)可提高病人的缓解率。
图图1 Kaplan-Meier 生存率曲线生存率曲线经过编辑的经过编辑的Kaplan-Meier曲线曲线常用无事件生存率(常用无事件生存率( Event-free survival,, EFS)表示缓解率)表示缓解率。