5-相关和回归剖析

上传人:今*** 文档编号:107175796 上传时间:2019-10-18 格式:PPT 页数:52 大小:1.67MB
返回 下载 相关 举报
5-相关和回归剖析_第1页
第1页 / 共52页
5-相关和回归剖析_第2页
第2页 / 共52页
5-相关和回归剖析_第3页
第3页 / 共52页
5-相关和回归剖析_第4页
第4页 / 共52页
5-相关和回归剖析_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《5-相关和回归剖析》由会员分享,可在线阅读,更多相关《5-相关和回归剖析(52页珍藏版)》请在金锄头文库上搜索。

1、秩和检验、相关及回归,卫生学教研室,秩和检验,总体分布形式未知或分布类型不明; 偏态分布的资料: 等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示; 不满足参数检验条件的资料:各组方差明显不齐。 数据的一端或两端是不确定数值,如“50mg”等。,应用条件:,SPSS中秩和检验操作过程,例题一 已知某地正常人尿氟含量的中位数为2.15mmol/L。现在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如下: 2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 3.00 3.18 3.87 5.67 试问该厂工人的尿氟含量是否高于当地正常人?,该资

2、料为定量资料,属于单一样本与总体中位数比较,可采用Wilcoxon符号秩和检验。具体SPSS操作过程如下: 数据录入:打开SPSS Data Editor 窗口,点击Variable View标签,定义要输入的变量,Flourine表示工人尿氟含量,median表示中位数;再点击Data View标签,录入数据,Variable View 窗口定义要输入的变量,Data View 窗口录入数据,分析:Analyze Nonparametric Tests 2 Related Samples Test pairs list 框: Flourine median Test Type 框: Wilc

3、oxon 然后点击OK,结果:,Ranks 表中第一行, Negative ranks 表示中位数减去工人尿氟的负秩有9个,平均秩次为6.94,负秩和为62.50,同理第二行为正秩的相关数值,第三行为Ties 为相同秩。Test Statistics 表中 Asymp.Sig 即为P值,本题P=0.009,按检验水准=0.05差异有统计学意义,说明该厂工人的尿氟含量高于当地正常人。,例题二,按照年龄、性别、病情严重程度将32例扁平足患者配成16对,每对患者其中之一接受甲法治疗,另一患者接受乙法治疗,两种方法治疗效果见下表,试比较两种方法治疗效果优劣。,SPSS中操作过程: 数据录入:打开SPS

4、S Data Editor 窗口,点击Variable View标签,定义要输入的变量,X1表示甲法,X2表示乙法(Values框里定义-1为差,0为中,1为好);再点击Data View标签,录入数据,该资料为等级资料配对设计,可采用配对设计符号秩和检验,Analyze Nonparametric Tests 2 Related Samples Test pairs 框:X1 X2 Test Type:Wilcoxon 点击OK,分析:,结果:,本题P=0.008 按检验水准=0.05差异有统计学意义,说明甲法治疗扁平足的效果优于乙法。,例题三,测得某工厂铅作业工人与非铅作业工人的血铅含量(

5、mol/L)见下表,请问该厂铅作业工人的血铅含量是否高于非铅作业工人,数据录入:打开SPSS Data Editor 窗口,点击Variable View标签,定义要输入的变量,group表示分组变量(1=铅作业工人 ,2=非铅作业工人)X表示血铅含量;再点击Data View标签,录入数据,本题可采用成组设计两样本比较的Wilcoxon秩和检验,SPSS操作过程如下:,分析: Analyze nonparametric tests 2 independent samples Test variable :x Group variable:group Define group :group1填

6、1,group2填2。 Continue Type test : Mann-Whitney U OK,结果:,铅作业工人平均秩次为13.36大于非铅作业工人平均秩次5.95,且P 0.05,故可认为铅作业工人的血铅含量高于非铅作业工人。,例题四,7名血吸虫病患者用某药连续治疗3周,治疗前后SGPT含量(U/L)的变化如下表所示,问治疗前后不同周次的SGPT含量有无差别?,该题为随机区组设计的秩和检验,SPSS操作过程如下: 数据录入:打开SPSS Data Editor 窗口,点击Variable View标签,定义要输入的变量,before表示治疗前,after1表示治疗后一周,after2

7、表示治疗后两周,after3表示治疗后三周。再点击Data View标签,录入数据,分析:,Analyze nonparametric tests K relate samples Test variables :before、after1、after2、after3 Test Type: Friedman OK,结果:,P=0.0010.05,差异有统计学意义,故可认为治疗前后不同周次的SGPT含量不全相同,例题五,某医生研究盐酸地尔硫卓缓释片治疗心绞痛的效果,采用该药普通片作为对照,服用后观察其疗效,结果见下表,试问两组疗效有无差别?,该资料为等级资料,属于成组设计,可采用成组设计两样本比

8、较的秩和检验,SPSS操作步骤如下: 数据录入:打开SPSS Data Editor 窗口,点击Variable View标签,定义要输入的变量,result表示疗效(1=显效,2=有效,3=无效,4=加重)、group表示分组变量(1=缓释片,2=普通片),f 表示频数;再点击Data View标签,录入数据,分析:,Data weight cases weight cases by Frequency variable 框:f OK Analyze nonparametric tests 2 independent samples Test variable 框:result Groupi

9、ng variable :group Define group :group1输1,group2输2 continue Type test : Mann-Whitney U,结果:,缓释片组平均秩次为74.10小于普通片组99.49 ,且P0.01 可以认为缓释片组的治疗效果好于普通片组,在前面章节中我们学习了单一数值变量的统计分析方法,但在医学科学研究中,常常要分析变量间的关系,如年龄与血压、药物剂量和动物死亡率、环境介质中污染物浓度与污染源距离等,回归与相关就是研究这种关系的统计方法,属于双变量分析范畴。,双变量关联性分析,一、直线相关 例题一 随机抽取15名健康成人,测定血液的凝血酶浓度

10、(单位/毫升)及凝固时间(秒),数据如下表所示。据此资料如何判断这两项指标间有否相关?,SPSS操作过程: 数据录入:打开SPSS Data Editor 窗口,点击Variable View标签,定义要输入的变量,no表示受试者号,x表示凝血酶浓度,y表示凝血时间;再点击Data View标签,录入数据,分析:1.制作散点图,Simple Scatter,OK,2.X,Y的正态性检验,通过对X,Y的正态性检验可见,两者P值均0.05 故可认为两变量都服从正态分布,3.关联性分析,两两相关,偏相关,距离相关,由上表可见,凝血酶浓度与凝血时间的相关系数为-0.949,P0.001,故可认为健康成

11、人凝血酶浓度与凝血时间呈负相关关系。,结果:,为研究某病成年男性患者血浆清蛋白含量与血红蛋白含量的关系,某医生测得10名患者血浆清蛋白含量(g/L)如下表所示,试分析二者有无关联。,例题二,SPSS中操作过程同例题一,结果如下,二、秩相关,秩相关,又称为等级相关,适用于: (1)不服从双变量正态分布即偏态资料 (2)总体分布型未知 (3)等级资料 (4)开口资料 最常用的等级相关:Spearman等级相关,例题三,某地研究27岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见下表,试用秩相关分析,SPSS过程:,数据录入:打开SPSS Data Editor 窗口,点击Variabl

12、e View标签,定义要输入的变量,x表示血小板数,y表示出血症状(0=“-”,1=“+”,2=“+”,3=“+”,4=“+”);再点击Data View标签,录入数据,分析:,结果:,P=0.1090.05 ,故认为急性白血病患儿的出血症状与血小板间无相关关系,例题四,为探讨流行性出血热的早期分度和最后定型之间的关系某研究对404例该病患者的病情资料进行分析,如下表所示,据此回答:是否早期分度越高,最后定型越重?,本题为等级资料,采用Spearman 秩相关分析,SPSS具体过程:,数据录入:打开SPSS Data Editor 窗口,点击Variable View标签,定义要输入的变量,f

13、表示每个格子实际例数,x表示早期分度(1=轻度,2=中度,3=重度),y表示最后定型(1=轻型,2=中型,3=重型);再点击Data View标签,录入数据,分析:,结果:,相关系数=0.8910, P0.001,因此可以认为流行性出血热的早期分度和最后定型存在正相关关系,随着早期分度的增高其最后定型加重,三、分类变量关联性分析,某医院用两种方法对已经确诊的50名乳腺癌患者进行检查,结果如下表所示。两种方法是否有关联?,SPSS操作过程:,数据录入:打开SPSS Data Editor 窗口,点击Variable View标签,定义要输入的变量,f表示四格表每个格子的实际频数,r表示“行变量”

14、乙法检查结果(1=阳性,0=阴性),c表示“列变量”甲法检查结果(1=阳性,0=阴性);再点击Data View标签,录入数据,分析:,结果:,卡方值为5.059,P值为0.0250.05,可以认为甲法和乙法之间互相关联,pearson 列联系数为0.303,直线回归分析,线形趋势:自变量与因变量的关系是线形的,如果不是,则不能采用线性回归来分析。 独立性:可表述为因变量y的取值相互独立,它们之间没有联系。反映到模型中,实际上就是要求残差间相互独立,不存在自相关。 正态性:自变量x的任何一个线形组合,因变量y均服从正态分布,反映到模型中,实际上就是要求残差服从正态分布。 方差齐性:自变量的任何

15、一个线形组合,因变量y的方差均齐性,实质就是要求残差的方差齐。,适用条件:,例题一,为了研究女大学生胸围(cm)与肺活量(L)的关系,随机抽取某高校一年级女生15名,测得其胸围与肺活量数据如下表所示,请建立肺活量y与胸围x的回归方程,并对回归系数进行假设检验。,数据录入:打开SPSS Data Editor 窗口,点击Variable View标签,定义要输入的胸围x、肺活量y;再点击Data View标签,录入数据,分析:,OK,结果:,复相关系数R为0.899 决定系数R2为0.808,经方差分析F值为54.601 ,P0.001,回归方程有效,回归方程为Y=0.092X-4.678,例题二,为研究肺癌患者肺组织中的DNA加合物含量(个/108 核苷酸)与吸烟的关系,某研究者用“同位素标记法”测定了12名肺癌患者肺组织中DNA加合物含量(y),并调查其每日吸烟量(x),结果如下表所示。问该资料有无可疑的离群点,并建立直线回归方程来分析肺组织中DNA加合物含量y与每日吸烟量x之间的关系,结果:,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号