三种简单相关分析与sas实现

上传人:mg****85 文档编号:49515858 上传时间:2018-07-29 格式:PPT 页数:58 大小:1.04MB
返回 下载 相关 举报
三种简单相关分析与sas实现_第1页
第1页 / 共58页
三种简单相关分析与sas实现_第2页
第2页 / 共58页
三种简单相关分析与sas实现_第3页
第3页 / 共58页
三种简单相关分析与sas实现_第4页
第4页 / 共58页
三种简单相关分析与sas实现_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《三种简单相关分析与sas实现》由会员分享,可在线阅读,更多相关《三种简单相关分析与sas实现(58页珍藏版)》请在金锄头文库上搜索。

1、三种简单相关分析与SAS实现医学统计学教研室柳伟伟相关v在生物医学科研与实践中,经常涉及两个变量之 间的关系研究,以说明事物发生、发展及变化的 原因或变量间依存变化的数量关系。例如:n医学上人的身高与体重的关系、年龄与血压的关系 等;n药物剂量与反应的关系等;n病程与疗效的关系。 v相关与回归分析是研究这种关系的统计方法,属 双变量分析(bivariate analysis)范畴。v相关分析的任务说明客观事物或现象相互间数量关系的密切 程度和方向,并用适当的统计指标表示出来。而把客观事物或现象间的数量依存关系表示 出来,则是回归分析所要解决的问题。三种简单相关1. Pearson直线相关2.

2、Spearman秩相关3. Kendall等级相关Pearson直线相关v了解两个随机变量X与Y之间相关关系及其 密切程度,可用直线相关分析方法。v直线相关(linear regression)又称简单 相关,此方法适用于X和Y都服从正态分布 的资料。Pearson直线相关直线相关的概念直线相关的定量描述相关系数的假设检验相关系数的区间估计直线相关分析的一般步骤直线相关分析的注意事项Pearson直线相关1. 定义如果两个随机变量中,当其中一个变量由小到大变 化时,另一个变量也相应地由小到大(或由大到小) 变化,并且其相应变化的散点图在直角坐标系中呈现 直线趋势,则称这两个随机变量存在直线相关

3、。推断两个随机变量是否存在直线相关关系以及描述 这种相关关系大小的分析方法就是直线相关分析 (linear correlation analysis),也称简单相关分析 (simple correlation analysis)。Pearson直线相关v直线相关图示完全正相关完全负相关正相关负相关零相关零相关零相关零相关Pearson直线相关v直线相关分析的适用条件(1) 两个变量均为服从正态分布的随机变量,即要求他们服从双变量正态分布;(2) 每对数据对应的点在直角坐标系中呈现直线趋势。Pearson直线相关v2.直线相关的定量描述相关系数的意义在分析两个事物间的关系时,常常要了解两 者间的

4、数量关系是否密切。说明两个变量 间关系密切程度和方向的统计指标称相关系数, 又称pearson相关系数,或积差相关系数。样本相关系数用r表示,总体相关系数用表 示。Pearson直线相关v计算相关系数的基本公式是:v式中,lXX 、 lYY 分别表示X、Y 的离均差平方和, lXY 表示X与Y的离均差乘积和。Pearson直线相关v相关系数的意义u 相关系数的符号反映两变量间的相关方向: r0为正相关,r0.7为高度相关。等级相关1. 定义:用双变量等级数据作直线相关分析2. 适用范围:(1)不服从双变量正态分布(2)总体分布类型未知(3)原始数据用等级表示等级相关vSpearman秩相关vK

5、endall等级相关Spearman秩相关vSpearman秩相关对于不符合正态分布的资料,不用原始数 据计算相关系数,而是将原始观察值由小到大 编秩,然后根据秩次来计算秩相关系数。通过秩相关系数rs来说明两个变量间相关 关系的密切程度Spearman秩相关v 设有n例观察对象同时取得两个测定值(Xi,Yi), 分别按Xi、 Yi(i=1,2,3,n)的值由小到大编秩为 1,2,3 ,n。用RXi表示Xi的秩次, RYi表示Yi的秩 次。因为n是固定的,所以总秩相等即平均秩但Xi的秩顺序不一定与Yi的秩顺序相同,故所对应的 RXi与RYi不一定相等。Spearman秩相关v只要求出 就可按以下

6、公式计算秩相关系数rs令同一观察对象的两个秩次差为:得到秩相关系数的简化公式为:式中n为 观察例数。rs的取值为| rs |1。Spearman秩相关相同秩次较多时TX(或TY)(t3t)/12,t为X(或Y)中相同秩 次的个数。 v例 某地方病防治所随机抽样调查了某县10个村 饮水中氟含量与氟骨症患病率间的关系饮用水中氟含量(X )与氟骨症患病率(Y )Spearman秩相关vSpearman秩相关分析步骤:v 1.编秩 将各Xi由小到大编秩得RXi,列于表中第(3)列 。采用相同的排秩规则将Yi的记分列于表中第(5)列RYi 。当遇到相等的测定值时则用平均秩。如Y2=Y4=22.64, 按

7、编秩为3和4,这两个测定值的平均秩为(3+4)/2=3.5 ,故有RY2= RY4=3.5。v 2.秩次差 求每例观察对象的秩次差 列于表中第(6)列,应有 。本例的合计为 表示排秩无误,可作核对之用。Spearman秩相关v3.计算秩次之差的平方并求和 计算出的 列于表中第(7)列。本例有4.计算秩相关系数rs 本例 代入简化公式中得到: 简化公式适用于资料中取相同秩次的例数不多的情 况,但如果取相同秩次的例数较多时,就使得计算的 结果偏差较大,这时应用原始公式计算秩相关系数。Spearman秩相关v Spearman秩相关系数的假设检验 v对总体相关系数的假设检验的方法有两种: v1.查表

8、法 当n50时,查“rs界值表”进行假 设检验。 v2.计算法 当n50时,按下式计算检验统计 量u:查标准正态分布表,确定P 值。Spearman秩相关v对前面例子得到的秩相关系数进行假设检验检验步骤:1.建立无效假设和确定检验水准H0:s=0,即饮用水中氟含量与氟骨症患病率 间无相关关系H1:s0,即饮用水中氟含量与氟骨症患病 率间有相关关系=0.052.计算秩相关系数rs=0.918Spearman秩相关3.确定P 值并下结论:查表得到rs,0.05/2(10)=0.648,小于样本统计量rs=0.918,故按=0.05水准拒绝H0,判断rs 系来自s0的总体,从专业上分析,可以认 为饮

9、水中氟含量与氟骨症患病率之间存在着正 相关关系。Kendall等级相关vKendall等级相关当两个变量都用等级来表示时,用一个统计量来 衡量它们的等级不一致的情况。Kendall等级相关系数也在1之间变动。完 全不相关时,=0。它不仅可对两个变量作等级 相关分析,而且可对多个变量作等级相关分析Kendall等级相关vKendall等级相关的分析步骤:1.先将第一个变量(x)和第二个变量(y) 由小到大列出等级,数值相同时取平均等级。2.把两变量的等级列出,以x的等级为顺序排 列。3.计算Kendall等级相关系数v 例 下表是一些环状化合物的相对分子质量与用药后大 鼠24h胆汁排泄量资料,要

10、研究相对分子质量与胆汁排 泄量有无关系。环状化合物的相对分子质量与大鼠24h胆汁排泄量关系Kendall等级相关v 1.将第一个变量即相对分子质量(x)和第二个变量即胆 汁排泄量(y)由大到小列出等级,数值相同时取平均等 级见上表等级列。 v 2.把两变量的等级列成下表形式,即以x的等级为顺序排 列。 Kendall等级相关计算表Kendall等级相关v 表中第1,2行是从第一张表中转抄过来的,但顺序是按x的 等级从小到大排列的。第3行是对应于每一个排泄量(y) 等级的右边的更小(包括相等)的等级个数。v 例如,对于y的等级2,在它右边只有一个等级(即1)比它 小,所以在等级2的下面写1,也就

11、是第3行第一个数字是1. 而对应于第2行的等级1,在它右边没有更小的等级,所以 在它下面即第3行第2个数字为0,其余以此类推。Kendall等级相关v第4行则是应对于该列的y的等级Ry右边 更大的等级个数。第3行的合计为11,记 为负的;第4行的合计为34,记为正的。 两者的代数和称为S,即S=34-11=23.Kendall等级相关v3.计算Kendall等级相关系数实际上分母就是等级对子数例中共有10个数,则对子数为:Kendall等级相关v从S的计算过程可知,S值最小是 ,最大是 ,因此值一定在-1和+1之间。完全负相关是-1,完全正相关是+1,不相关则为0。Kendall等级相关v当两

12、变量等级呈完全正相关时,计算S值过程 如下表所示假设的完全正相关资料计算S值从表中可以看出S=450=45Kendall等级相关v当两变量等级呈完全负相关时,计算S值过程如 下表所示假设的完全正相关资料计算S值从表中可以得出S=045=-45Kendall等级相关v4. 的假设检验。v Kendall等级相关的无效假设是两变量的等 级不相关,即在无效假设成立时S期望值为0或 者说的期望值为0,如果没有相同等级,S的 方差为:Kendall等级相关v如果有相同等级,那么S的方差为:式中:t为x的相同等级个体数;u为y的相同 等级个体数。Kendall等级相关v假设检验可用含有连续性校正的正态近似检验 :v例中含有相同等级,故其方差为:Kendall等级相关v故得因u 1.96,P 1.96,P |r|xy x10.89317 .0001 y0.893171 .0001例 题Pearson 相关统计量;基于 Fisher z 转换变量变量N样本相关Fisher z95% 置信限p 值,对于 H0:Rho=0xy130.893171.437390.6737610.967853.0001

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号