卫生统计学:第12章 双变量关联性分析

上传人:s9****2 文档编号:569985790 上传时间:2024-08-01 格式:PPT 页数:65 大小:1.40MB
返回 下载 相关 举报
卫生统计学:第12章 双变量关联性分析_第1页
第1页 / 共65页
卫生统计学:第12章 双变量关联性分析_第2页
第2页 / 共65页
卫生统计学:第12章 双变量关联性分析_第3页
第3页 / 共65页
卫生统计学:第12章 双变量关联性分析_第4页
第4页 / 共65页
卫生统计学:第12章 双变量关联性分析_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《卫生统计学:第12章 双变量关联性分析》由会员分享,可在线阅读,更多相关《卫生统计学:第12章 双变量关联性分析(65页珍藏版)》请在金锄头文库上搜索。

1、8/1/20241第第12章章 双变量关联性分析双变量关联性分析2024/8/12n前面前面描述性统计及假设检验描述性统计及假设检验只只涉及到一个变量涉及到一个变量,如体重、红细胞数、血压下降值等如体重、红细胞数、血压下降值等,着重于描述某着重于描述某一变量的统计特征或比较该变量的组间差别。一变量的统计特征或比较该变量的组间差别。n在大量的医学问题研究中常常还要分析在大量的医学问题研究中常常还要分析两个随机两个随机变量之间的关系,如体重与肺活量、年龄与血压变量之间的关系,如体重与肺活量、年龄与血压之间是否存在线性联系,之间是否存在线性联系,此联系是正向还是负向此联系是正向还是负向以及联系的程度

2、如何?以及联系的程度如何?8/1/20243第一节 直线相关 医学上许多现象之间都有相互联系,例如:身高与体重、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。这里,体温和脉搏的关系就比产前检查与婴儿体重之间的关系密切得多,而体重和身高的关系则介与二者之间。一一直线相关直线相关 Linear correlation 相关与回归就是用于研究和解释两个变量相关与回归就是用于研究和解释两个变量之间相互关系的。之间相互关系的。 相关分析相关分析用于分析两变量间相互联系的密用于分析两变量间相互联系的密切程度及相关方向。切程度及相关方向。回归分析

3、回归分析适用于分析变量适用于分析变量间的依存关系;用一个自变量的值来估计另一间的依存关系;用一个自变量的值来估计另一个应变量的值个应变量的值。8/1/20246n如果两个连续型变量 X和 Y 都随机变动且不分主次,可通过线性相关(linear correlation)分析来估计它们之间可能存在的线性联系的方向与程度。n两个随机变量 X 和 Y ,可以是对同一观察单位同时测量 X 与 Y 的数值,也可以是测量成对观察单位的同一变量或不同变量的数值,而产生一对观察值。 直线相关直线相关(linear correlation) 又又 称称 简简 单单 相相 关关 (simple correlatio

4、n)或或 Pearson 相相关关分分析析,用用于于研研究究具具有有直直线线关关系系的的两两个个变变量量间间相相关关关关系系的的密密切切程程度度与与相相关关方方向向的的一一种种统统计计分分析析方方法法,用用于于双双变变量量正正态态分分布资料布资料(要求两个变量均服从正态分布要求两个变量均服从正态分布)n在线性相关分析中,两个变量在线性相关分析中,两个变量X X 和和Y Y的的值总是成对的出现,记为(值总是成对的出现,记为(X X1 1,Y Y1 1)、)、(X X2 2,Y Y2 2)(X Xn n,Y Yn n),这些观察值),这些观察值在直角坐标系中形成一幅散点图,这在直角坐标系中形成一幅

5、散点图,这种散点图可以简单而直观的表示两变种散点图可以简单而直观的表示两变量间的线性关系量间的线性关系 例如例如 为研究中年女性为研究中年女性体重指数和收体重指数和收缩压缩压之间的关系,随机测量了之间的关系,随机测量了16名名40岁以上的女性的体重指数和收缩岁以上的女性的体重指数和收缩压,试绘制散点图。压,试绘制散点图。 实实 例例解:解:以体重指数为变量以体重指数为变量X,收缩压为变量,收缩压为变量Y作散点图,见下图。可见,体重指作散点图,见下图。可见,体重指数与收缩压有比较密切的线性相关关数与收缩压有比较密切的线性相关关系。系。 某地方病研究所调查了 8名正常儿童的尿肌酐含量(mmol/2

6、4h)如表9-1。估计尿肌酐含量(Y)对其年龄(X)的相关关系。编号编号12345678年龄年龄X131196810127尿肌酐含量尿肌酐含量 Y3.543.013.092.482.563.363.182.65实实 例例表表14-1 8名正常儿童的年龄名正常儿童的年龄 X(岁岁)与尿肌酐含量与尿肌酐含量 Y(mmol/24h)8/1/202414一、概述 概念 又称简单相关或Pearson相关分析,用于研究具有直线关系的两个变量间相关关系的密切程度与相关方向的一种统计分析方法应用条件 要求两个变量均服从正态分布 (双变量正态分布 ) 8/1/202415相关系数的意义及计算 又称积差相关系数或

7、Pearson相关系数,说明具有直线关系的两个变量间相关关系的密切程度与相关方向的指标 r 表示样本相关系数,表示总体相关系数 8/1/202416n没有单位,取值介于-1与1之间n相关方向用正负号表示n相关的密切程度用绝对值表示 相相关关系系数数,说说明明具具有有直直线线关关系系的的两两个个变变量量间间相相关关关关系系的的密密切切程程度度与与相相关关方方向向的的指指标标. r 表表示示样样本本相相关关系系数数,表表示示总总体体相相关系数关系数, -1 r 1 r 的计算结果说明了两个变量的计算结果说明了两个变量X与与Y之之间关联的间关联的密切程度密切程度(绝对值大小)与关联(绝对值大小)与关

8、联的性质或方向(正负号)。的性质或方向(正负号)。l相关分析的目的在于通过相关系数相关分析的目的在于通过相关系数r来描述来描述和度量两变量线性联系的程度和方向。和度量两变量线性联系的程度和方向。 r0 正相关正相关 r0 负相关负相关 r=0 零相关零相关 零相关即两变量间无关。零相关即两变量间无关。l 样本相关系数不等于零,并不表示总体相样本相关系数不等于零,并不表示总体相关系数不等于零,还要作显著性检验。关系数不等于零,还要作显著性检验。2024/8/119相关关系图示8/1/202420nr r无单位,无单位, -1 r 1 r 值为正值为正 正相关正相关 r 值为负值为负 负相关负相关

9、 |r|=1 - 完全相关完全相关 r=0 - 零相关零相关 8/1/202421相关关系密切程度的判断 低度相关 中度相关 高度相关相关系数的计算:相关系数的计算:X和和Y的离均差积和的离均差积和X的离均差平方和的离均差平方和y的离均差平方和的离均差平方和其中,其中, 为为X 的离均差平方和的离均差平方和 为为Y 的离均差平方和的离均差平方和 为为X和和Y 的离均差积和的离均差积和编号年龄X肌酐YX2Y2XY1133.5416912.53 46.022113.011219.06 33.11393.09819.55 27.81462.48366.15 14.88582.56646.55 20.

10、486103.3610011.29 33.607123.1814410.11 38.16872.65497.02 18.55合计7623.8776472.27 232.61SXSYSX2 SY2SXY8/1/202425n【例例12-1】2000年测得某地年测得某地16名名7岁男孩体岁男孩体重与胸围资料,见表重与胸围资料,见表12-1。编号12345678910111213141516体重(kg)24.527.023.528.523.026.726.824.624.819.719.517.220.019.020.221.0胸围(cm)61.062.060.064.059.358.458.658

11、.758.556.055.654.553.052.058.057.0表表12-1 2000年某地年某地16名名7岁男孩体重与胸围资料岁男孩体重与胸围资料 8/1/202426散点图图图12-2 2000年某地年某地16名名7岁男孩体重与胸围散点图岁男孩体重与胸围散点图 散点图8/1/202427计算例计算例12-1中体重与胸围间相关系数中体重与胸围间相关系数计算基础数据,并列成相关系数计算表计算基础数据,并列成相关系数计算表求出求出 、 、 、 、 (见表见表12-2)代入公式,求出相关系数代入公式,求出相关系数 值值8/1/202428表表12-2 2000年某地年某地16名名7岁男孩体重与

12、胸围相关系数计算表岁男孩体重与胸围相关系数计算表编号(1)x体重(kg)(2)y胸围(cm)(3)x2(4)(2)2y2(5)=(3)2xy(6)=(2)(3)124.561.0600.253721.001494.50227.062.0725.003844.001674.00323.560.0552.253600.001410.00428.564.0812.254096.001824.001520.258.0408.043364.001171.601621.057.0441.003249.001197.00合计366.0926.68548.3053813.5621332.388/1/20242

13、98/1/202430 r0原因: 由于抽样误差引起,=0 存在相关关系, 0t t检验检验 查表法查表法,按,按v=n-2查查r界值表,做出推断结论界值表,做出推断结论 二、相关系数的假设检验二、相关系数的假设检验8/1/202431n查表法 根据自由度 =n-2=14,查附表14,nr 0.001,14=0.742, r=0.8343, 则P小于0.0018/1/202432n t 检验方法8/1/202433【检验步骤检验步骤】1. 建立检验假设,确定检验水准建立检验假设,确定检验水准8/1/2024342.计算检验统计量计算检验统计量 值值 8/1/2024353.确定确定P值,做出统

14、计推断值,做出统计推断 n按自由度按自由度 =n-2=16-2=14 ,查附表,查附表4,得,得P r2 就就说说r1比比 r2相相关关更更密密切切。因因为为查查附附表表13-1 ,前前一一样样本本得得 P 0.05, 后后一一样样本本P 50时,可用正,可用正态近似法近似法进行行检验检验统计量量z的的计算公式算公式为: 8/1/2024488/1/2024498/1/202450第三节第三节 列联表的关联性分析列联表的关联性分析 n【例例12-4】某研究者欲研究幽门螺杆菌感染(Hp)与家庭成员胃病史的关联性,随机抽取599例慢性胃炎或胃溃疡的患者,分成家庭成员有胃病史组和家庭成员无胃病史组,

15、结果家庭成员有胃病史组182例,Hp阳性125例;家庭成员无胃病史组417例,Hp阳性198例。8/1/2024518/1/202452n两样本率比较与两分类变量关联性的对比二者2检验公式、理论频数计算和自由度的计算应用条件等完全相同。形式相同,是从不同角度推导的8/1/202453研究目的、设计方案、数据结构以及对结果的解释都是不同的 n两样本率比较检验的是两个样本率所代表的未知的两总体率是否相同n分类变量关联性分析是要检验两个分类变量是否独立,二者之间是否存在关联8/1/202454一、一、22列联表的关联性分析列联表的关联性分析 【检验步骤检验步骤】1. 建立检验假设,确定检验水准建立检

16、验假设,确定检验水准 H0:Hp与家庭成员胃病史之间互相独立 H1:Hp与家庭成员胃病史之间互相关联 = 0.058/1/2024552.计算检验统计量计算检验统计量 值值 8/1/2024563.确定确定P值,做出统计推断值,做出统计推断 查附表9,0.005P0.01,按 = 0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为幽门螺杆菌感染(Hp)与家庭成员胃病史之间有关联8/1/202457计算关联系数计算关联系数Pearson列联系数(列联系数(contingency coefficient) 8/1/202458n列联系数c(用于行列数相同):nCramer 校正v (用于行

17、列数不同):8/1/202459二、配对设计二、配对设计22表的关联性分析表的关联性分析 【例12-5】有56份咽喉涂抹标本,把每份标本一分为二,按同样的条件分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,结果见表12-5。实验者欲研究甲乙两种培养基的结果有无关联,用配对2检验(或McNemar检验)对资料进行了分析,得2 =11.25,查2界值表,P 0.05,认为甲乙两种培养基的结果有关联8/1/2024608/1/202461n当比较甲乙两种方法测定结果的阳性率是否有差别时,可采用配对2 检验(或McNemar检验)n当了解甲乙两法测定结果之间有无相关关系时,应采用普通四格表的检验。 8/1/202462【检验步骤检验步骤】1. 建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:两种培养基的结果之间互相独立 H1:两种培养基的结果之间互相关联 = 0.058/1/2024632.计算检验统计量计算检验统计量 值值 8/1/2024643.确定确定P值,做出统计推断值,做出统计推断 查附表9,P0.005,按 = 0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为两种培养基的结果之间有关联 8/1/202465小小 结结1、直线相关的概念和应用2、相关系数的计算和意义3、等级相关的分析4、列联表资料的关联分析及应用

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号