08.相关分析与回归分析.doc

上传人:博****1 文档编号:543872104 上传时间:2024-03-12 格式:DOC 页数:63 大小:628KB
返回 下载 相关 举报
08.相关分析与回归分析.doc_第1页
第1页 / 共63页
08.相关分析与回归分析.doc_第2页
第2页 / 共63页
08.相关分析与回归分析.doc_第3页
第3页 / 共63页
08.相关分析与回归分析.doc_第4页
第4页 / 共63页
08.相关分析与回归分析.doc_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《08.相关分析与回归分析.doc》由会员分享,可在线阅读,更多相关《08.相关分析与回归分析.doc(63页珍藏版)》请在金锄头文库上搜索。

1、第八章 相关分析与回归分析医学上人的身高与体重、血压与年龄、药物剂量与疗效、肺活量与体重和胸围等均有一定的联系。说明客观事物或现象相互间数量关系的密切程度并用适当的统计指标表示出来,这是相关分析的任务。而研究某个结局(因变量)与其它影响因素(自变量、解释变量、协变量)之间的数量关系,并用函数形式表示出来,则是回归分析要解决的问题。下面依次介绍有关内容。8.1相关分析8.1.1概述描述两个变量间相关关系的统计指标称为相关系数。现以两个变量的直线相关分析为例,说明相关系数的意义。研究变量X和Y的直线相关关系用直线相关系数(记为r),其计算公式为: (8.1)其值为1r1。r值为正表示正相关,即X和

2、Y同时增大或减小,变化趋势是同向的;反之,r值为负表示负相关,即X和Y呈反向变化。r等于零为零相关,表示X和Y无直线相关关系;r值的绝对值为等于1为完全相关,即X和Y严格服从直线关系。在生物界由于影响因素众多,因此r值一般界于1与1之间。r的绝对值越接近1,表示两变量间直线相关程度越高。r为总体相关系数的样本估计值,所以一般还要需做=0的假设检验。在用相关分析的方法解决实际问题时,应根据资料类型和分析要求,选择恰当的方法,SAS中可作如下相关分析:统计量意义SAS过程资料要求直线(Pearson)相关系数两个变量间的直线相关性CORR 二元正态分布资料等级(Spearman)相关系数两个变量间

3、的等级相关性CORR 二元非正态分布或等级资料复相关系数一个变量与一组变量间的相关性CANCORR 多元正态分布资料典型相关系数两组变量的相关性CANCORR 多元正态分布资料偏相关系数固定其它变量时两个变量间的相关性CORR 本节介绍PROC CORR的应用。CANCORR的用法详见多元统计分析部分。但PROC REG中会给出复相关系数。8.1.2 CORR过程1. CORR过程的语句组成。 *PROC CORR options; *VAR 变量表; WITH 变量表; PARTIAL 变量表; WEIGHT 变量; BY 变量表; END;2. CORR过程的语句说明。(1) PROC C

4、ORR语句格式: PROC CORR options;选择项主要有: PEARSON 计算通常的Pearson相关系数,即直线相关系数,是缺省值。 SPEARMAN 计算Spearman等级相关系数。 KENDALL 计算Kendall 系数。 OUT=dataset 产生含有Pearson相关系数的一个新数据集。 NOMISS 将带有某一变量缺失值的观测值从所有计算中除去。 NOSIMPLE 取消打印每个变量的描述统计量。(2) WITH语句指明配对的变量名。与VAR语句配合使用,VAR语句列出相关矩阵上部出现的变量,WITH语句列出左侧出现的变量。使用WITH语句后,把变量分成WITH组和

5、非WITH组,只计算两组间两两变量的相关系数。(3) PARTIAL语句作偏相关分析时,指定相对固定的那些变量,此时将自动激活NOMISS选择项。注意PARTIAL语句指定的变量名不能出现在VAR或WITH语句中。8.1.3 直线相关分析与偏相关分析例8.1 研究肺活量时测得10名女中学生体重x1(kg)、胸围x2(cm)、呼吸差x3(cm)及肺活量y(ml),数据如下:表8.1 10名女中学生体重、胸围、呼吸差及肺活量体重x1(kg)胸围x2(cm)呼吸差x3(cm)肺活量y(ml)35600.7160040742.5260040642.0210042713.0265037721.12400

6、45681.5220043784.3275037662.0160044703.2275042653.02500下面先用DATA步建立计算用数据集,再用PROC CORR作两两变量间的直线相关分析,最后作固定体重时肺活量与胸围和呼吸差的偏相关分析。DATA CORR1;INPUT X1 X2 X3 Y;CARDS;35 60 0.7 160040 74 2.5 260042 65 3.0 2500;PROC CORR; VAR X1 X2 X3 Y;RUN;PROC CORR NOSIMPLE;VAR Y;WITH X2 X3;PARTIAL X1;RUN;结果如下: CORRELATION A

7、NALYSIS 4 VAR Variables: X1 X2 X3 Y Simple StatisticsVariable N Mean Std Dev Sum Minimum MaximumX1 10 40.50000 3.30824 405.00000 35.00000 45.00000X2 10 68.80000 5.28730 688.00000 60.00000 78.00000X3 10 2.33000 1.08735 23.30000 0.70000 4.30000Y 10 2315 434.00589 23150 1600 2750 CORRELATION ANALYSISPe

8、arson Correlation Coefficients / Prob|R| under Ho: Rho=0 / N = 10 X1 X2 X3 Y X1 1.00000 0.43195 0.64093 0.69454 0.0 0.2125 0.0458 0.0258 X2 0.43195 1.00000 0.62927 0.76165 0.2125 0.0 0.0513 0.0105 X3 0.64093 0.62927 1.00000 0.72882 0.0458 0.0513 0.0 0.0168 Y 0.69454 0.76165 0.72882 1.00000 0.0258 0.

9、0105 0.0168 0.0PROC CORR的缺省输出包括各变量的描述性统计量(例数N、均数Mean、标准差Std Dev、总和Sum、最小值Minimum、最大值Maximum)和变量两两之间的Pearson相关系数矩阵,在每个相关系数下方给出了对应的总体相关系数为零的假设检验的概率。当需要计算数据集中所有变量两两之间的相关系数时,VAR语句可以省略。由输出结果可见,肺活量与体重、胸围、呼吸差之间的相关系数分别为0.69454(P=0.0258)、0.76165(P=0.0105)和0.72882(P=0.0168),肺活量与体重之间的相关系数最小。下面的结果反映了体重固定时,肺活量与胸

10、围、呼吸差之间的偏相关系数。 CORRELATION ANALYSIS 1 PARTIAL Variables: X1 2 WITH Variables: X2 X3 1 VAR Variables: Y Pearson Partial Correlation Coefficients / Prob |R| under Ho: Partial Rho=0 / N = 10 Y X2 0.71146 0.0316 X3 0.51366 0.1572我们在PROC CORR语句中用了NOSIMPLE选择项,所以没有打印有关变量的描述性统计量。VAR语句与WITH语句结合使用,输出结果中只包含Y与X

11、2、X3之间的偏相关系数。可见在体重相同的女中学生中,肺活量与胸围之间仍保持了较大的相关性,而与呼吸差之间的相关性较小,且无统计显著性(P=0.1572)。用ry1、ry2和r21表示分别y与x1、x2,x2与x1之间的相关系数,ry21表示固定x1时y与x2之间的偏相关系数,则 (8.2)实际上,在研究多个变量中两两之间的相关性时,把两变量之外的其它变量作为固定变量所求得的偏相关系数更能真实地反映两变量之间的相关程度。8.1.4 等级相关在相关分析中,要求x、y两变量均服从正态分布。若不满足这一条件,要定量地描述两变量的协同变化,宜计算等级相关系数。等级相关适用于下列资料:不服从双变量正态分

12、布 总体分布型未知 原始数据是用等级表示。例8.2 在肝癌病因研究中,某地调查了10个乡的肝癌死亡率(1/10万)和食物中黄曲霉毒素相对含量,数据如下:表8.2 肝癌死亡率(1/10万)和黄曲霉毒素相对含量黄曲霉毒素相对含量肝癌死亡率(1/10万)X秩次Y秩次0.7121.531.0218.921.7314.413.7446.574.0527.345.1664.695.5746.365.7834.255.9977.610 .10.0 .10 .55.18程序如下:DATA RANKCORR;INPUT X Y;CARDS; 0.7 21.5 1.0 18.9 1.7 14.4 3.7 46.5 4.0 27.3 5.1 64.6 5.5 46.3 5.7 34

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号