文档详情

双变量关联性分析.ppt

pu****.1
实名认证
店铺
PPT
1,000KB
约66页
文档ID:580108167
双变量关联性分析.ppt_第1页
1/66

授课教师:殷菲双变量关联性分析 ØØ单变量分析方法(univariate analysis):t检验、u检验、方差分析 ØØ双变量分析方法(bivariable analysis) :直线回归与相关、秩相关等 直线相关直线相关 直线相关的概念 n n用相关系数描述两变量间直线关系的密切程度和方向 n n相关系数又称Pearson 积矩相关系数,样本相关系数用r表示,总体相关系数用 表示 相关的种类相关的种类 0< r <1 -1< r <0 r = 1 r = -1 r = 0 r = 0 相关的种类相关的种类n n正相关:0< r <1 完全正相关: r =1n n负相关:-1< r <0 完全负相关: r =-1n n零相关:r =0n n相关系数没有单位,其值为-1≤r≤1 相关系数的意义相关系数的意义n n相关密切程度:用r的大小表示,r的绝对 值越接近于1,说明相关越密切n n相 关 方 向 : 用r的正负号表示 P164 例例13.1n n某医师测量了15名正常成年人的体重(kg)与CT双肾体积(ml)大小,数据如表13.1所示。

据此回答两变量是否有关联?其方向与密切程度如何? 直线相关的计算步骤直线相关的计算步骤n n绘制散点图:观察散点是否随一变量的变化而变化,所有散点是否呈直线关系 图13.1 15名正常成年人体重和双肾体积的散点图体重体重 (kg) x双双肾肾体体积积 (ml) y 直线相关的计算步骤直线相关的计算步骤n n计算样本相关系数(本例r =0.875)离均差积和 相关系数的假设检验相关系数的假设检验 n n检验r是否来自总体相关系数为零的总体n n常用t检验: n nH Ho o: :  ==0 0,,两变量间无直线相关关系两变量间无直线相关关系 n nH H1 1: :  ≠ ≠0 0 两变量间有直线相关关系两变量间有直线相关关系n n ==0.050.05n n查查附附表表3 3,,t t界界值值表表,,得得p p<0.001<0.001,,,,拒拒绝绝H Ho o,,可以认为体重和双肾体积之间有直线相关关系 相关分析应用中应注意的问题相关分析应用中应注意的问题 n n1. 进行相关分析前应先绘制散点图 散点图能使我们直观地看出两变量间有无线性关系并发现可能的离群点(outlier),当散点有线性趋势时,才能进行相关分析。

n n2. 出现离群点时慎用相关 n n3. 分层资料不可盲目合并 n n3. 分层资料不可盲目合并 n n3. 分层资料不可盲目合并 n n3. 分层资料不可盲目合并 直线回归与直线相关的区别与联系直线回归与直线相关的区别与联系 区区 别别1、资料要求不同回归:y服从正态分布,x没有特别的 要求相关:x和y服从双变量正态分布 (若x数值系人为选定,莫作相关 例 药物的剂量-反应关系) 区区 别别2、应用情况不同回归:反映两变量间的数量关系(b)相关:反映两变量间互依的程度和方向(r) n n提问方式不同年龄增加,血压发生什么样的变化?年龄和血压之间有关系吗? 联联 系系n n1、方向一致:对同一组数据若同时计算r和b,其正负号是一致的Question: r和b的大小有关系吗?r较大,是否b也较大? 联联 系系2、假设检验等价:r和b的假设检验是等价的,即对同一样本,两者的t值相等,检验结果完全一致 联联 系系3、用回归解释相关 r的平方称为决定系数 决定系数决定系数r2n n表示回归平方和占总平方和的比例,即应变量y的总变异中由自变量x可以解释的比例。

n nSS回越接近于SS总,则r2越接近于1,说明引入相关变量的效果越好n n当相关系数较小时,若引入回归,可能由于减少的误差太少而无实际意义 examplen n如 r=0.20,n=100时,P<0.05,r有统计学意义但r2=0.04,表示SS回在SS总中仅占4%,说明两变量相关分析的实际意义不大 应用直线回归和相关的注意点应用直线回归和相关的注意点1、作回归和相关分析之前,先绘制散点图2、据资料的性质正确选用回归和相关3、用回归方程进行预测的时候,应当谨慎X不能偏离实测范围太远,否则偏差太大 example x:20~50妇女年龄 y:血压 x=0时, 应用直线回归和相关的注意点应用直线回归和相关的注意点4、相关关系不一定是因果关系,也可能是伴随关系 n n如某生春种一植物,不久长出幼苗恰邻院盖楼,细心观测,苗长楼增计算发现,苗高与楼高具有相关性n n两者是否真有内在联系? 例:1875~1920,美国年铁制品产量与英国年出生率相关系数为-0.98因素:社会、经济、技术 应用直线回归和相关的注意点应用直线回归和相关的注意点5、不能只根据相关系数的绝对值大小来判断相关的密切程度,应首先作假设检验例:r=0.601 n=8 p=0.10~0.20 r=0.401 n=42 p=0.005~0.01 应用直线回归和相关的注意点应用直线回归和相关的注意点6、 和 为零仅说明没有变量间没有直线关系,不能说明变量间没有关系 秩秩 相相 关关 秩相关适用条件秩相关适用条件n n原始数据只能以等级表示n n总体分布未知n n不服从双变量正态分布 P169 例例13.4n n某研究者对15例30~50岁成年男子的舒张压(mmHg)与夜间最低血氧含量分级进行研究,结果见表13.2,试分析两者的关联性。

rs的计算的计算将x及y的秩次直接代入直线相关系数的计算公式可得到rs rs的假设检验的假设检验n n当n≤50时,检验ρs是否为零可用查表法(查附表15,rs界值表)n n当n>50时,按式(13-4)和(13-5)计算检验统计量 分类变量的关联性分析分类变量的关联性分析 n n 对一组观察对象, 分别观察其两种分类变量的表现, 归纳成双向交叉排列的统计表, 这类统计表用以描述行变量和列变 量 之 间 的 关 系 , 亦 称 为 列 联 表(contingency table)什么是关联性分析?什么是关联性分析? n单一样本,按两种属性分级,故称双向有序列联表n分析目的:推断两种属性标志间有无关系 关联性分析关联性分析ü2×2 列联表üR×C列联表 例例13.6 为研究青少年在校情况与对艾滋为研究青少年在校情况与对艾滋病知晓情况之间的关系,某研究者在某地病知晓情况之间的关系,某研究者在某地共调查了共调查了384名青少年,并对每名青少年名青少年,并对每名青少年按是否在校和对艾滋病是否知晓两种属性按是否在校和对艾滋病是否知晓两种属性交叉分类,如表交叉分类,如表13.3所示试问两变量是所示。

试问两变量是否存在关联性?否存在关联性? 青少年青少年编编号号是否在校是否在校是否知是否知晓晓1 1是是否否2 2是是是是3 3是是是是4 4否否否否5 5是是否否. . . .. . . .. .. . 表表13.3 交叉分类表交叉分类表 n n两种方法有无关系-关联性分析 两法检验的结果有无关系两法检验的结果有无关系n n :两变量互相独立(无关系) :两变量互相关联(有关系) α=0.05 n n查附表9, 得P<0.05, 按α=0.05水准拒绝, 故可以认为青少年是否在校与对艾滋病是否知晓之间有关联 上述检验说明有无关联,若需了解两个分类变量的关联程度,需进一步计算列联系数 列联系数取值范围为0~1,数值越接近1,关联性越强 关联性分析关联性分析ü2×2 列联表üR×C列联表 例例13.7为为研研究究自自我我效效能能感感与与领领导导行行为为类类型型是是否否有有关关,,某某研研究究者者抽抽样样调调查查了了来来自自某某省省各各三三甲甲医医院院的的238名名护护士士长长,,并并对对每每个个个个体体按按自自我我效效能能感感和和领领导导行行为为类类型型两两种种属属性性交交叉叉分分类类,,如表如表13.5所示。

试分析两变量的关联性试分析两变量的关联性 表13.5 自我效能感与领导行为交叉分类表自我效能感领导行为类型合计pmpMPmPM低67251317122高32123438116合计99374755238 1.建立检验假设建立检验假设n nH0:自我效能感与领导行为类型间无关联 n nH1:自我效能感与领导行为类型间有关联 n n =0.05 2.计算检验统计量计算检验统计量=(4-1)(2-1)=3 作出统计推断作出统计推断n n查2界值得P<0.005,按=0.05水准拒绝H0,接受H1,可以认为自我效能感与领导行为类型之间有关联 进一步计算列联系数: 作业作业n nP416n n四、综合分析题 1、2、3 。

下载提示
相似文档
正为您匹配相似的精品文档
相关文档