临床统计分析6_第六讲_2009硕士直线回归相关与等级相关1

上传人:热**** 文档编号:125962851 上传时间:2020-03-21 格式:PPT 页数:72 大小:1.58MB
返回 下载 相关 举报
临床统计分析6_第六讲_2009硕士直线回归相关与等级相关1_第1页
第1页 / 共72页
临床统计分析6_第六讲_2009硕士直线回归相关与等级相关1_第2页
第2页 / 共72页
临床统计分析6_第六讲_2009硕士直线回归相关与等级相关1_第3页
第3页 / 共72页
临床统计分析6_第六讲_2009硕士直线回归相关与等级相关1_第4页
第4页 / 共72页
临床统计分析6_第六讲_2009硕士直线回归相关与等级相关1_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《临床统计分析6_第六讲_2009硕士直线回归相关与等级相关1》由会员分享,可在线阅读,更多相关《临床统计分析6_第六讲_2009硕士直线回归相关与等级相关1(72页珍藏版)》请在金锄头文库上搜索。

1、直线回归 直线相关与等级相关 第六讲 直线相关与回归分析概述 l研究两个变量之间的相互关系的统计方法 l区别 直线回归研究两个变量之间的数量依存 关系 直线相关研究两个随机变量相关的密切程 度 第一部分 回归的基本类型 l直线回归 I II型回归 l曲线回归 l多元线性回归 the tendency of offspring to be smaller than large parents and larger than small parents Referred to as regression towards the mean 向均数回归现象 线性关系与线性趋势 y x b0 inter

2、cept b1 linear coefficient b2 quadratic coefficient 非线性关系 非线性关系 直线回归分析 一 直线回归 一 直线回归方程简介 直线回归类似但不等于直线方程 y x y a b x a b x y x l定义 直线回归是用直线回归方程 表示两个数量变量间依存关系的统计 分析方法 属双变量分析 X Y 的 范畴 a b x ly为应变量 dependent variable 指在x规定范围 内随机变化的量 x为自变量 independent variable 一般为资料 中能精确测定和控制的量 也可为随机变化 a 常数项 截距 是回归直线与纵轴的

3、交点 表示 y的基线平均水平量 b 回归系数 斜率 意为x每改变一个单位时 的平均变化量 l应用条件 应变量 Y 是独立 方差齐 性 正态分布 可加的资料 二 直线回归及其过程 l统计描述 绘制散点图 定量描述直线回归模型 计算回归系数与常 数项 l统计推断 直线回归关系的检验 方差分析与t检验 95 可信区间 总体回归系数 的总体 均数的95 可信区间 Y值的95 可信区间 实例分析 例1 某高校新生入学体检 测量了一年级12名女大 学生的体重与肺活量数据如下 探讨肺活量对体重是否 存在线性依存关系 体重 Kg 424246464650505052525858 肺活量 L 2 552 22

4、752 42 82 813 43 13 462 853 53 l绘制散点图 线性趋势 极端值 l明确自变量与应变量 肺活量 体重 l考察应变量是否具备独立性与正态性 1 绘制散点图 样本统计描述 散点图初步确定回归模型的线性趋势 明确有无极端 异常值 2 估计直线回归方程中的回归系 数b与常数项a a b x 定量描述样本的两个变量间的直线回归关系 l利用最小二乘法原理确定直线回归方程 l先求 回归系数 b 基本公式 b lxy lxx SSxy SSxx 其中lxy为X Y的离均差积和 lxx为X的离均差平方和 l再求常数项 a 根据回归方程 a等于Y 的均值减去x均值与b乘积的差值 实例分

5、析 l直线回归方程为 0 001 0 059 x 其中b 0 059 a 0 001 b的意义在于x 体重 每增加一个单位 千克 肺活量平均增加0 059升 a为基础水平量 0 001 回归方程的图示 l在散点图的基础上绘制回归方程的图示 l根据回归方程 在坐标轴上任意取相距较 远的两点 连接上述两点就可得回归方程 图示 l基本原则 连出的回归直线不应超过x的实测 值范围 散点应尽可能分布在直线的两侧 直线回归方程的统计推断 l回归估计标准误 抽样误差造成回归方程不 同 l回归关系检验又称回归方程检验 其目的是 检验求得的回归方程在总体中是否成立 即 是否样本代表的总体也有直线回归关系 l有相

6、互等价两种方法 方差分析以及t检验 3 假设检验 方差分析 其基本思想是将总变异分解为 SS总 SS回归 SS剩余 用F检验来判断回归方程是否成立 其中SS回归表示在总变异中被x解释 的部分 SS回归越大 表示回归效果越好 SS剩余表示除x的影响外剩余部分 建立假设 H0 0 即体重与肺活量之间无直线关系 H1 0 即体重与肺活量之间有直线关系 检验水准 0 05 无效假设 总体回归系数为0 备择假设 总体回归系数不为0 方差分析结果 F 1 10 值 12 95 P值 0 005 结论 拒绝H0 接受H1 可认为总体上体 重与肺活量存在直线回归关系 3 假设检验 t检验 l其基本思想也是推断

7、总体回归系数 是否 等于0 以判断回归方程是否成立 F 12 95 4 直线回归相关参数估计 l 总体回归系数 的估计 l回归系数 的95 可信区间为 0 022 0 095 l常数项 的95 可信区间为 1 805 1 806 5 其它相关参数估计 lX固定时 估计值 95 可信区间 l X固定时 Y值95 可信区间 个体Y 值的容许区间 即总体中 当X为某定 值时 个体Y值的波动范围 与个体Y值的容许区间估计 0 001 0 059 x Y 三 直线回归类型的选择 lI II回归 在资料要求上 回归要求因变量Y服从 正态分布 X是可以精确测量与严格控制的 变量 一般称为I型回归 而对两个变

8、量均服从双变量正态分布的 资料 进行回归分析称为II型回归 l应变量 Y 满足独立性 方差齐性 正态 性 效应可加性 四 直线回归方程的应用 l描述两变量之间的依存关系 利用直线回归方 程即可定量描述两个变量间的依存关系 l利用回归方程进行预测 把预报因子 即自变 量x 代入回归方程对预报量 即因变量Y 进 行估计 即可得到个体Y值的容许区间 l利用回归方程进行统计控制 规定Y值的变化 通过控制x的范围实现统计控制的目标 a b x y a b x 五 直线回归分析的注意事项 l回归分析前 最好先作散点图 确定回归类型 回归分析两变量要有线性关系 考核个别离群值及其作用 五 直线回归分析的注意

9、事项 l基本应用条件 LINE 线性趋势L 独立性I 正 态性N 方差齐性E 直线回归要求应变量是正 态分布计量资料 自变量可以是计量资料 等 级资料 分类计数资料 方差齐性 利用残差 Y 图 做分析后评价 在Y 值存在自相关 不独立 或方差不齐时 散 点呈扇型分布时 应注意曲线回归 Y x 散点图 l观察的样本必须是同质 组别 测量时点 的 否则会产生实际上不存在的回归或者忽略 了确实存在的回归关系 Y x 男 Y x 女 l回归直线不要外延 一般以自变量的取值 范围为限 均应经过假设检验 p 0 01 与 p 0 05 的含义 两者的结论均为直 线回归关系成立 l非线性观察值的处理 变量变

10、换 符合条件后 再做线性分 析 分段进行直线回归分析 多分类回归 非线性回归 第二部分 直线相关分析 一 直线相关的概念 l直线相关分析是描述两变量间是否有直线关 系及直线关系的方向和密切程度分析方法 l用以描述两变量间相关关系的指标是相关系 数 常用r表示 两变量间相关关系的种类有 正相关 0 r 1 负相关 1 r 0 75 强相关 但当相关系数大于0 95时 要格外慎重 五 直线相关分析的注意事项 l散点图是关键 直线相关是定量两者呈直线 关系 但呈曲线不通 异常 极端值 l相关的解释应慎重 可以是因果关系 也可 以只是伴随关系 相关显著只是表明两变量间 存在直线关系 不能说明存在内在联

11、系 或因 果关系 只能为理论研究提供线索 l双变量正态应同时满足 单变量偏态分布或 有极端值时 或者通过变量变换转化成正态化 或者计算等级相关系数 等级相关分析 1 等级相关分析的适用范围 l资料不是双变量正态分布 l总体分布未知 l数据一端或两端有不确定值的资料 l等级资料 l有极端值 2 等级相关分析基本过程 l分别对两个变量 X Y 的原始数值按照从 小到大的进行排序 l再对两个变量所对应的秩次进行相关分析 3 常用两种方法 l常用的Spearman等级相关系数rs是利用 x Y的秩次来进行直线相关分析的 因 此当x Y的相同秩次较多时 计算出的rs 需矫正 同样的 等级相关系数rs也需

12、要 进行假设检验 l此外还有Kendall等级相关系数rk 两 者只是计算方式不同 其余皆相同 实例分析 主要结果 第三部分 直线相关与回归的区别与联系 1 区别 l相关说明两者之间的相关关系 回归说 明两者之间的依存关系 l r与b有区别 r表示直线关系的方向和密 切程度 b为直线回归的斜率 意为x每改 变一个单位时 的平均变化量 斜率的大 小并不能判断相关的密切程度 l资料要求与应用条件不同 l回归系数对度量尺度敏感 2 两者的联系 l r与b值可相互换算 参考相关书籍 l r与b正负号一致 l对于II型回归资料 r与b的假设检验完全等价 l回归可解释相关 相关系数的平方r2 又称决定 系

13、数 是回归平方和与总的离均差平方和之比 故回归平方和是引入相关变量后总平方和减少的 部分 用于说明相关关系的密切程度 第四部分 常见错误辨析 实例1 某研究者测量了7名糖尿病患者的血中胰岛素与血 糖的含量 测量结果如下 作者采取直线相关分析 得r 0 3 p 0 05 结论为 胰岛素含量与血糖含量无直线相关关系 患者编号 1 2 3 4 5 6 7 胰岛素含量24 17 17 12 14 121 9 血糖含量142 170194 213 214 238 249 实例2 l例3 某研究者欲分析年龄和LgA的关 系 采用直线相关与回归分析 得相 关系数 r 0 340 由此得结论为 LgA随年龄增

14、大而升高 实例3 作者原结论 l作者对急性心肌梗死与气温之间 采用直 线相关与回归分析 l结论是本研究显示急性心肌梗死与气温不 呈直线而呈S曲线相关 其回归方程为 8 9913 0 1978X 相关系数为0 7463 P 0 01 即气温过高或过低时 急性发病人 数增多 结束语 l两个变量 测量值的变化范围 应同时具备实际 意义 应确保相同时间段内同步测量 l线性关系可以是因果关联或函数关系 结合专业知 识判断因果关联是否存在 因和果的顺序如何 关联强度 关联的特异性 关联的一致性或可重复性 关联的合理性 Hill标准 Hill AB因果检验标准 l是否有采用人群试验研究的证据 l是否有很高程度的关联 l从各个研究中得到的关联是否一致 l时间关系是否恰当 所假定的原因是否先于所假定的效应 l存在剂量 效应梯度吗 是否所推论的原因发生越多 所推 论的效果出现得也越大 l这种关联是否具有流行病学意义 l这个关联具有生物学意义吗 l这个关联是否有特异性 l现在这个关联是否与以前证实的因果关系有相似之处 直线相关 回归分析 选择Analyze 点击correlate l选择Bivariate 例9 1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号