医学统计学:相关分析

上传人:cn****1 文档编号:568840950 上传时间:2024-07-27 格式:PPT 页数:73 大小:3.85MB
返回 下载 相关 举报
医学统计学:相关分析_第1页
第1页 / 共73页
医学统计学:相关分析_第2页
第2页 / 共73页
医学统计学:相关分析_第3页
第3页 / 共73页
医学统计学:相关分析_第4页
第4页 / 共73页
医学统计学:相关分析_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《医学统计学:相关分析》由会员分享,可在线阅读,更多相关《医学统计学:相关分析(73页珍藏版)》请在金锄头文库上搜索。

1、Zhao Yangs PowerPoint For Postgraduate StudentsMedical Statistics 医学统计学相关分析Correlation Analysis主要内容引言数值变量的相关相关的定义(掌握)相关的图示(掌握)相关系数的计算(掌握)相关系数的假设检验(掌握)相关系数的区间估计(了解)两样本相关系数的比较(了解)分类和等级变量的相关行列表资料的关联性(熟悉)等级资料的关联性(熟悉)相关分析的正确应用(掌握)一个分析实例:3岁男童体重与体表面积编号体重X体表面积Y111.05.283211.85.299312.05.358412.35.292513.15.

2、602613.76.014714.45.830814.96.102915.26.0751016.06.411合计133.457.266分析方法之一将10名儿童按体重分为两组(三组)结论:体重较重的一组3岁男童,体表面积也较大。体重分组体表面积均数组间比较13.5Kg5.37 103cm2t=-6.0413.5Kg6.09 103cm2P0.001分析方法之二如果想得到的结论为:体重越重,体表面积越大。关联的密切程度 相关分析体重为X时,体表面积估计为多少?数量依存关系 回归分析相关关系与确定性关系所谓确定性关系是指两变量间的关系是函数关系。已知一个变量的值,另一个变量的值可以通过这种函数关系精

3、确计算出来。C =2RS=vt非确定性关系是指两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高随年龄增长而增高;体表面积与体重有关数值变量的相关相关的定义(掌握)相关的图示(掌握)相关系数的计算(掌握)相关系数的假设检验(掌握)相关系数的区间估计(了解)两样本相关系数的比较(了解)相关的定义当两个数值变量之间出现如下情况:当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,也就是有相关关系(correlation) 。若两个变量同时增加或减少,变化趋势是同向的,则两变量之间的关系为正相关(positive correlation);若一个变量增加时,另一个变量

4、减少,变化趋势是反向的,则称为负相关(negative correlation)。直线相关(linear correlation),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。 相关系数用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数(correlation coefficient),又称为积差相关系数(coefficient of product-moment correlation),Pearson相关系数 。总体相关系数用希腊字母表示,而样本相关系数用r表示,取值范围均为-1,1。绘制散点图!体重 X体表面积Y1112131

5、415165.05.56.06.5X(1)Y(2)11.05.28311.85.29912.05.35812.35.29213.15.60213.76.01414.45.83014.96.10215.26.07516.06.411r=0r=0r-1r1完全正相关完全负相关零相关零相关0r1-1r0r=0 r=0零相关正相关负相关零相关直线相关的图示r =-1-1r 0r =0直线相关的图示与相关系数的关系0r 1r =1直线相关系数的计算离均差积和离均差平方和体重(kg),X体表面积(103cm2)Y1112131415165.05.56.06.5绘制散点图相关系数的计算相关系数的假设检验H0

6、:0,两变量间无直线相关的关系;H1:0,两变量间有直线相关的关系。例试对例10.1资料相关关系是否存在进行假设检验,并估计总体相关系数。H0:体重与体表面积无相关关系;H1:体重与体表面积有相关关系。=0.05。 = n-2=10-2=8按自由度 =8查附表2 t界值表,得P0.001。按=0.05水准,拒绝H0,接受H1,故可认为3岁男童的体重与体表面积之间有正相关关系。总体相关系数的区间估计(了解)从相关系数不等于0的总体中抽样,样本相关系数的分布是偏态的。 相关系数的抽样分布( = - 0.8)-0.8-0.6-0.4-0.20.00100200300-1.0在一个总体相关系数为-0.

7、8的总体中,进行随机抽样,每次抽取10个个体,测量其X和Y值,并计算样本相关系数,重复1000次,将所得的相关系数绘制成频数图。相关系数的抽样分布( = 0)-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.00100200300相关系数的抽样分布( =0.8) 00.20.40.60.81.00100200300R.A. Fisher(1921) 的 z 变换 z 近似服从均数为 ,标准差为 的正态分布。 相关系数的z 值的抽样分布( = - 0.8)00.51.01.52.0050100150200相关系数的z 值的抽样分布( = 0)-2-101205010015

8、0200相关系数的z 值的抽样分布( = 0.8) 01234050100150200相关系数的可信区间估计将 r 变换为 z ;根据 z 服从正态分布,估计 z 的可信区间;再将 z 变换回 r 。相关系数的可信区间估计 Fishers 变换 r z 正态近似 Fishers 反变换 的95CI z的95CI 检验系数是否等于已知常数?H0:c;H1:c。两样本相关系数的比较 某医院分别测定正常成年男子12人和正常成年女子12人的心率(X,次/分)与心脏左室电机械收缩时间QS(Y,毫秒) ,试比较男子和女子的心率(次/分)与心脏左室电机械收缩时间QS(毫秒)的相关是否相同。 男子女子心率,X

9、(次/分)收缩时间,Y(毫秒)心率,X(次/分)收缩时间,Y(毫秒)574055639161393594106339763387664006737467380673856838368376693767037870382723847538875370793667935083370873578634594329Step 1: 散点图 5060708090100300350400450心率(次/分)收缩时间(毫秒)5060708090300350400450100收缩时间(毫秒)心率(次/分)男女Step 2: 计算样本相关系数男子的相关系数:女子的相关系数:Step 3: 检验两总体相关系数是否为

10、0=122=10,则P10.001,P20.20,故尚不能认为男子和女子的心率与心脏左室电机械收缩时间间的相关系数不等。分类和等级变量的相关定性资料的关联性(熟悉)四格表资料的列联相关系数RC表资料的列联相关系数等级资料的关联性(熟悉)其他的一些关联性考察(了解)定性资料的关联性分析(association)定性指标间的相关程度和方向常用列联系数(contingency coefficient)来表示。例:四格表资料的相关分析某中医师采用两种方法观察舌象200例,试分析两种观察方法的结果有无联系?乙法甲法合计84(a)16(b)100(a+b)20(c)80(d)100(c+d)合计104(a

11、+c)96(b+d)200(n)相关系数计算列联相关系数的假设检验乙法(分组)甲法合计组60(60%)40(40%)100组60(60%)40(40%)100合计12080200乙法甲法合计84(84%)16(16%)10020(20%)80(80%)100合计10496200r=0r=0.64列联相关系数的假设检验如果两法没有相关性,那么在乙法判断为阳性和阴性的病例中,甲法判断为阳性的比例应该相同!即a/(a+b)=c/(c+d)检验行间的构成比或者率!2检验乙法甲法合计aba+bcdc+d合计a+cb+dnH0:两种方法观察舌象的结果无相关;H1:两种方法观察舌象的结果有相关。=0.05。

12、=1查附表3 2界值表,得P0.005,按=0.05水准,拒绝H0,接受H1,认为甲乙两种方法观察舌象的结果有相关关系。当用0、1分别编码“”、“”时,点相关系数等于Pearson系数。id甲法结果X乙法结果Y11(+)1 (+)21 (+)1 (+)841 (+)1 (+)850(-)1 (+)1000 (-)1 (+)1011 (+)0 (-)1201 (+)0 (-)1210 (-)0 (-)2000 (-)0 (-)行列表资料的相关分析 Cramr修正列联系数C较适合于定性资料的相关C的取值范围在01之间,0表示不相关;越接近于1表示关系越密切;1表示完全相关。C只表示两指标间的相关程

13、度,并不表示相关方向。 某人按两种血型系统统计某地6094人的血型分布,结果见表10.5,问两种血型的分布间有无关系? ABO血型MN血型合计MNMNO4314909021823A3884108001598B4955879502032AB137179325641合计1451166629776094注意: Cramr修正列联系数对行或者列的顺序信息是不敏感的!等级资料的相关Spearman等级相关将各变量X,Y分别编秩RX, RY;计算RX与RY的Pearson相关;所得结果即为Spearman等级相关rS。-1rs1例 抗白指数与临床疗效的关系某研究所用野百合治疗白血病,并作抗白血病指数(简称

14、抗白指数)及疗效的分析,问抗白指数与临床疗效间有无关系? 病例号 抗白指数X 临床疗效Y(1)(2)12+23+39+410+511+630735845955+1070+11881290RX(3)123456789101112RY(4)99911.511.53336.56.533将X,Y分别由小到大编秩。其中Y有相同等级,分别取平均秩次。计算等级相关系数rs。将有关数据代入上式得:等级相关的假设检验H 0:S0,抗白指数与疗效无相关关系;H 1: S0,抗白指数与疗效有相关关系。 = 0.05。当n50时,用查“等级相关界值表”;当n50时,用 t 检验:t t 服从自由度为n-2的 t t

15、分布。本例,n=12,查附表15 rs界值表得,双侧 (0.05,12) =0.587,P50,计算t值查附表2 t界值表,P0.05,说明儿童智力等级与母亲文化程度间存在正等级相关关系。等级相关的含义等级相关反映的是两变量等级间的相关,并不反映两变量间的数值关系。例1 XY1122334455例2 XY1124394 165 25例3XY112 1.13 1.24 1.35 1.4例4XY1 12 103 1004 10005 10000定性变量和等级变量的相关如果一个变量是2分类,另一个是等级的,用Spearman相关是可行的;如果一个变量是多分类,另一个是等级的,用Ridits。A Lo

16、gistic Regression Model is recommended!构建一个有序结果变量和无序分组变量间的模型,以描述其关联性。各种资料间的相关定性资料等级资料定量资料定性资料等级资料定量资料列联相关Ridits;Logistic Modelspearman相关spearman相关Pearson相关Spearman相关当有一个变量带有次序信息时,结合使用回归模型会得到更为详细的结果。相关分析的正确应用相关关系是一种共变关系,不一定是因果关系。谨防多个变量间的相关性所带来的虚假关系充分利用散点图判断线性趋势判断离群值排除资料的间杂性直线相关分析对资料本身的要求:双变量正态分布当样本含量

17、较大时,统计学检验的作用减小;多个变量间的相关分析要使用多重相关。(multiple correlation)关联性和差异性是辨证统一的!组内相关散点图的作用飞行员的着陆次数(x)与焦虑程度(Y)散点图的作用识别离群值;PQ离群值对相关的影响排除间杂性(a)(b) 样本甲观察点 样本乙观察点样本的间杂性对相关和回归的误导二元正态分布二元正态分布的密度函数为:二元正态分布曲面(11=1,22=1,12=0) 二元正态分布曲面(11=1,22=1,12=0) 二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面(11=2,22

18、=4,12=0.75)二元正态分布曲面剖面(11=1,22=1/2,12=0.75)XZY多个变量间的相关因此,谈到多个变量间的相关性时,往往要说在扣除了其他变量的影响后,考察某两个变量的相关性。偏相关(Partial Correlation)关联性和差异性何为关联?两个变量中一个发生变化,另一个也随之变化如果X为分组变量,Y为观察结果那么所谓关联性,意味着X的取值变化(对应于不同分组),Y的平均水平(均数、率)出现有统计学意义的变化。故关联性=差异性!例:关联性=差异性某医院用某新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/l)如下

19、,问新药与常规药物的疗效有无差别? t = 1.0195,P = 0.3215新药与常规药物的疗效无差别。新药组:24362514263423201519常规药组:14182015222421252723例:关联性=差异性以group=0做为新药组, group=1做为对照药组。Pearson相关系数r=-0.2336tr=1.0195,P=0.3215用药分组和疗效没有相关性!groupx024036025019114118120115125127123Thank YouZhao Yang, PhD Department of Epidemiology and BiostatisticsSchool of Public HealthNanjing Medical UnivesrityEmail:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号