《spss在医学统计中应用》由会员分享,可在线阅读,更多相关《spss在医学统计中应用(180页珍藏版)》请在金锄头文库上搜索。
1、医学统计分析与SPSS应用,内容安排,第一讲 医学统计分析概述 第二讲 定量资料组间比较的统计分析 第三讲 分类资料组间比较的统计分析 第四讲 相关性分析与线性回归分析 第五讲 logistic回归分析 第六讲 诊断试验的评价与ROC分析 第七讲 生存分析,第一讲 医学统计分析概述,一、医学统计学的主要内容包括研究设计、资料收集、数据整理、 数据分析等一系列过程。二、医学统计学的主要功能帮助我们透过现象认识本质,从一堆看似杂乱无章的数据中发现规律,阐明事物的本质。,三、数据统计分析的一般思路1. 确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,在医学统计中,常见的研究目的主
2、要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、卡方检验、秩和检验等;二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析;三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、cox回归等。,2. 明确数据类型,根据数据类型进一步确定方法 定量数据可用的方法:t检验、方差分析、非参数检验、相关分析、线性回归等;分类资料(定性数据)可用的方法:卡方检验、秩和检验、对数线性模型、logistic回归等。3. 选定统计方法后,利用统计软件具体实现统计分析过程。4. 针对分析结果,结合实际做出合理的专业结论。,四
3、、统计学应用的几个误区1. 研究目的大而全2. 方法一味追求新颖3. 统计学方法盲目套用,数据的类型,统计分析的基础是数据,而数据的类型可以分为:1.定量数据又分为连续型数据和离散型数据。连续性数据可以取任意值,比如,身高,体重,化验值等等;离散型数据只能取整数,如发病人数等。 2. 定性数据(分类资料)又可分为无序分类资料和有序分类资料两类。 无序分类资料是指所分类别或属性之间无程度和顺序的差别,例如二项分类,性别(男、女),药物反应(阴性、阳性)等。例如多项分类,血型( O、A、B、AB等。 有序分类资料是指各类别之间有程度的差别。如尿糖化验结果按、+、+、+分类;疗效按治愈、显效、好转、
4、无效分类。,数据的类型,数 据 资 料,定量数据,定性数据 (分类资料),连续型变量 (如:身高、体重等),离散型变量 (如:发病人数等),无序分类资料 (如:性别、血型等),有序分类资料 (如:疗效等),差异性研究方法,组间差异性比较研究方法,1. t 检验主要用于两组定量资料的比较。要求数据满足三个前提条件:独立性、正态性、方差齐性。独立性即各研究对象的观测值是相互独立的,互不影响;正态性即要求两组数据均服从正态分布;方差齐性即两组样本数据所代表的总体方差相等。2. 方差分析主要用于多组连续变量的比较。要求数据满足独立性、正态性、方差齐性的条件。,3. 秩和检验(1)可用于不服从正态分布的
5、定量资料的组间比较;(2)可用于有序分类资料的组间比较;(3)对于不符合正态分布的数据,两组定量数据比较一般用Wilcoxon秩和检验,多组定量数据一般用kruskal-wallis秩和检验,随机区组定量数据一般用friedman秩和检验。 4、 2 检验用于无序分类资料的组间比较。可用于两组或多组率的比较、两组或多组构成比的比较、两个分类变量之间的关联性分析,还可用于特定分布的拟合优度检验等。,相关性分析研究方法,影响性分析研究方法,SPSS简介,SPSS(Statistics Product and Service Solutions) ,是目前世界上最优秀的统计分析软件之一。SPSS是众
6、多统计软件当中比较简单易懂的软件之一;绝大多数操作过程仅靠点击鼠标即可完成。SPSS功能齐全,一般的数据分析和图形处理都可以应付自如。,第二讲 定量资料组间比较的统计分析,定量数据组间差异比较常用统计方法,1. t 检验主要用于两组定量数据的比较。要求数据满足三个前提条件:独立性、正态性、方差齐性。独立性即各研究对象的观测值是相互独立的,互不影响;正态性即要求两组数据均服从正态分布;方差齐性即两组样本数据所代表的总体方差相等。2. 方差分析主要用于多组连续变量的比较。要求数据满足独立性、正态性、方差齐性的条件。,3. 秩和检验(1)主要用于不服从正态分布的定量资料的组间比较;(2)对于不符合正
7、态分布的数据,两组定量数据比较一般用Wilcoxon秩和检验,多组定量数据一般用kruskal-wallis秩和检验,随机区组定量数据一般用friedman秩和检验。,分析思路,1. 确定分析方法该研究目的是比较两组人群的血磷值,属于差异性检验。分析变量是血磷值,为连续性变量。结合研究目的,可以考虑的分析方法有独立样本的t检验或wilcoxon秩和检验,具体还应进一步看数据是否服从正态分布。 2.建立数据文件EG0201。共 2个变量:(1)group(分组):1=急性克山病患者,2=健康者;(2)p(血磷数值)。 3. 数据的正态性检验“分析”“描述统计” “探索” 打开“探索”对话框 因变
8、量列表:血磷数值(glu) 因子列表:分组group 绘制 : 带检验的正态图,从Shapiro-Wilk检验结果可以看到,group1的正态性检验P=0.835,group2的正态性检验P=0.316,都可以认为近似服从正态分布。 4. 独立样本t检验“分析”“比较均值” “独立样本T检验” ,打开“独立样本T检验”对话框 检验变量:p 分组变量:group 定义组:1 2 5.结果及解释本例数据满足方差齐性(P=0.791),t检验统计量=2.576,P=0.017,故两组人群的差异是有统计学意义的。,二、两组非正态分布资料的比较例2.2 某医生为研究幽门螺杆菌与血清胃泌素-17之间的关系
9、,在某地随机抽取幽门螺杆菌阳性和阴性对象各30例,测量两组人群的血清胃泌素-17水平。数据如表EX0202.欲比较两组人群的血清胃泌素-17水平是否有统计学差异。,分析思路,1. 确定分析方法该研究目的是比较两组人群的血清胃泌素-17是否有差异,属于差异性检验。分析变量为连续性变量。结合研究目的,可以考虑的分析方法有独立样本的t检验或wilcoxon秩和检验,具体还应进一步看数据是否服从正态分布。 2.建立数据文件EX0202。共 2个变量:(1)group(分组):1=阴性,2=阳性;(2)g(血清胃泌素-17水平)。 3. 数据的正态性检验“分析”“描述统计” “探索” 打开“探索”对话框
10、 因变量列表:血清胃泌素-17水平(g) 因子列表:分组group 绘制 : 带检验的正态图,从Shapiro-Wilk检验结果可以看到,阴性组不符合正态分布( P0.0001 ),阳性组也不符合正态分布( P=0.006 ),故需要采用非参数wilcoxon秩和检验。 4. wilcoxon秩和检验“分析”“非参数检验” “旧对话框” “两个独立样本” 检验变量列表:g 分组变量:group 定义组:1 2 5.结果及解释两组人群的差异有统计学意义(Z=-2.321,P=0.02),结合具体数据来看,幽门螺杆菌阳性人群的血清胃泌素-17水平要高于阴性人群,提示幽门螺杆菌与血清胃泌素-17水平
11、有一定关系。,关于数据正态性检验的一些小提示 (1)对于多组数据比较,只有每组数据均符合正态分布,才算符合正态分布。只要有一组不符合正态分布,就算不符合正态分布; (2)正态性检验方法,常用的是Shapiro-Wilk检验和Kolmogorov-Smirnov检验。当数据个数小于2000时,选用Shapiro-Wilk检验,当数据个数大于2000时,选用Kolmogorov-Smirnov检验; (3)正态性检验方法通常比较敏感,即使数据略偏离正态也会给出一个较小的P值。而大多数统计方法对轻微的正态性偏离都有一定的“抗性”,数据略偏离正态时,其结果仍是稳健的。因此对正态性检验结果不必太苛刻,也
12、不能太死板。,三、多组正态分布资料的比较例2.3 某药厂研发一种新的降糖药,将试验药分为大剂量组和小剂量组,并采用某公认的阳性药物为对照。试验方法采用完全随机设计,按照一定的纳入和排除标准共选择90例研究对象,将研究对象随机分为3组,分别服用相应的药物。治疗12周后,观察其餐后2小时的血糖降低值,数据存于EX0203中。欲比较三组的血糖降低值是否有统计学差异。,分析思路,1.确定分析方法该研究目的是比较对照药组、试验药大剂量组、小剂量组的血糖降低值是否有差异,属于差异性检验。该研究为完全随机设计,分析变量为连续性变量。因此可以考虑方差分析或kruskal-wallis秩和检验,具体还应进一步看
13、数据是否服从正态分布。 2.建立数据文件EX0203。共 2个变量: (1)group(分组):1=对照组,2=小剂量组,3=大剂量组; (2)glu(血糖变化值)。 3. 数据的正态性检验(1) “分析”“描述统计” “探索” 打开“探索”对话框 因变量列表:血糖变化值(glu) 因子列表:组别group 绘制 : 带检验的正态图,结果显示,三组数据均符合正态分布( P分别为0.638、0.971、0.987 ),因此可以采用方差分析进行组间比较。4. 方差分析“分析” “比较均值” “单因素ANOVA” ,打开“单因素方差分析”对话框 因变量列表:glu 因子:group选项 描述性 方差
14、同质性检验(方差齐性检验)两两比较 LSD S-N-K,5.结果及解释根据方差分析的结果,三组人群的血糖降低值差异有统计学意义(F=3.917,P=0.024),两两比较结果显示,主要是对照药与试验药的大剂量组差异有统计学意义(P=011),对照药与试验药的小剂量组差异也有一定的统计学意义(P=033),大剂量组与小剂量组的差异无统计学意义。,四、多组非正态分布资料的比较例2.4 某医学生欲研究胃不同部位与Ki-67水平的关系,分别选择了胃体、胃角、胃窦三个部位各24份样本,检测它们的Ki-67水平,数据存放于EX0204,部分数据如表2.4所示。欲比较不同部位的Ki-67水平是否有差异。表2
15、.4 胃不同部位的Ki-67水平胃体 0.140 0.116 0.162 0.236胃角 0.484 0.152 0.340 0.202胃窦 0.138 0.218 0.148 0.100,分析思路 1:确定分析方法该研究目的是通过比较样本标本的Ki-67,推断胃不同部位的Ki-67水平是否有差异,属于差异性检验。该研究共分三组,分析指标是Ki-67水平,为连续型变量。分析方法可以考虑方差分析或Kruskal-Wallis秩和检验,具体还应进一步看资料是否符合正态分布。 2:数据的正态性检验(1) “分析”“描述统计” “探索” 打开“探索”对话框 因变量列表:KI67(ki67) 因子列表:
16、分组group 绘制 : 带检验的正态图,根据S-W检验结果,group1和group2都不服从正态分布(p值分别为0.007、0.002)。因此不宜采用方差分析,而采用多组秩和检验的Kruskal-Wallis法。 3、Kruskal-Wallis秩和检验“分析”“非参数检验” “旧对话框” “k个独立样本” 检验变量列表:Ki67 分组变量:group 最小值:1 最大:3 Kruskal-Wallis H(K),4、 结果分析结果显示,三组总的差异有统计学意义(P=0.014)。上述结果只是给出了总的组间比较结果,显示三组总的差异有统计学意义,但并未说明具体是哪两组之间有差异。从秩和来看,胃角的Ki-67水平最高,胃窦水平最低,但具体哪两组有差别还需要进一步做组间两两比较。,