刘欣医学统计学方法-12临床统计-6讲

上传人:杰猫 文档编号:120575520 上传时间:2020-02-07 格式:PPT 页数:96 大小:1.60MB
返回 下载 相关 举报
刘欣医学统计学方法-12临床统计-6讲_第1页
第1页 / 共96页
刘欣医学统计学方法-12临床统计-6讲_第2页
第2页 / 共96页
刘欣医学统计学方法-12临床统计-6讲_第3页
第3页 / 共96页
刘欣医学统计学方法-12临床统计-6讲_第4页
第4页 / 共96页
刘欣医学统计学方法-12临床统计-6讲_第5页
第5页 / 共96页
点击查看更多>>
资源描述

《刘欣医学统计学方法-12临床统计-6讲》由会员分享,可在线阅读,更多相关《刘欣医学统计学方法-12临床统计-6讲(96页珍藏版)》请在金锄头文库上搜索。

1、吉林大学公共卫生学院 1 医学统计学 主讲人刘欣 流行病与卫生统计学教研室 吉林大学公共卫生学院 2 第十三章直线相关与回归 吉林大学公共卫生学院 3 第一节直线相关 一 直线相关的概念 直线相关 linearcorrelation 是描述两个变量间互依关系的一种统计分析方法 此法又称简单相关 simplecorrelation 此法通过直线相关系数 linearcorrelationcoefficient 描述两个变量直线关系的大小和方向 此法要求两个变量服从双变量正态分布 吉林大学公共卫生学院 4 相关系数又称积差相关系数 也称Pearson相关系数 用r表示 它是说明具有直线关系的两个变

2、量间 相关关系的密切程度和相关方向的指标 用r的大小表示密切程度 用r的正负表示相关方向 其计算公式为 吉林大学公共卫生学院 5 图13 7a相关系数含义图 吉林大学公共卫生学院 6 图13 7b相关系数含义图 吉林大学公共卫生学院 7 公式 13 1 相关系数无单位 其取值范围为 1 r 1 r值为正表示正相关 为负表示负相关 为零表示零相关 r 1为完全正相关 r 1为完全负相关 二 直线相关系数的计算 吉林大学公共卫生学院 8 吉林大学公共卫生学院 9 例研究者为探讨女性的年龄与收缩压的关系 收集了某地12名妇女的年龄与收缩压数据见下表13 1的 2 3 根据妇女年龄与收缩压的数据计算二

3、者的相关系数 1 先根据原始数据绘制散点图 大致判断两变量之间是否有直线趋势 本例的散点图见图13 1 可见年龄与收缩压呈直线趋势 故可进行直线相关分析 吉林大学公共卫生学院 10 吉林大学公共卫生学院 11 吉林大学公共卫生学院 12 2 计算相关系数 由前面计算可知 lXX 1550 7 lYY 44 04 lXY 233 7 代入公式 13 1 得相关系数为 三 直线相关系数的假设检验 前面所求相关系数r是样本相关系数 它实为总体相关系数 的估计值 我们知道即使X Y的总体相关系数 为零 由于抽样误差的存在 样 吉林大学公共卫生学院 13 本相关系数r也不一定为零 因此需要对相关系数r进

4、行假设检验 以此推断X Y是否存在直线相关关系 常用t检验 其检验统计量公式如下 公式 13 3 式中Sr为样本相关系数的标准误 自由度 n 2 例就例1求得的r值 检验妇女年龄与收缩压间是否存在直线相关关系 吉林大学公共卫生学院 14 H0 0即年龄与收缩压之间无直线相关关系 H1 0即年龄与收缩压之间有直线相关关系 检验假设 0 05 计算检验统计量本例n 12 r 0 8943 代入公式 12 3 求t 吉林大学公共卫生学院 15 由 0 05 n 2 12 2 10 查t界值表得t t0 05 10 2 228 今求得t 6 32 2 228 则P 0 05 按 0 05水准拒绝H0

5、可认为妇女年龄与收缩压之间有直线相关关系 确定P值和作出推断结论 吉林大学公共卫生学院 16 一 直线回归的概念 直线回归 linearregression 是描述两个变量间依存数量关系的一种统计分析方法 此法又称简单回归 simpleregression 此法通过直线回归方程 linearregressionequation 描述一个变量Y 常称为应变量 dependentvariable 依存另一个变量X 常称为自变量 independentvariable 第二节直线回归 吉林大学公共卫生学院 17 变化的数量关系 由此方程可确定一条回归直线 二 直线回归方程的求法 线性回归方程的表达式

6、为 公式 13 4 式中X为自变量 为应变量Y的估计值 a为回归直线在Y轴上的截距 intercept b为回归系数 regressioncoefficient 也即回归直线的斜率 slope 根据数学上的最小二乘法的原理计算a和b 计算公式如下 吉林大学公共卫生学院 18 公式 13 5 式中lXX和lXY分别表示离均差平方和与离均差积和 公式 13 6 例1某研究者为探讨女性的年龄与收缩压的关系 收集了某地12名妇女的年龄与收缩压数据见下表13 1的 2 3 试求年龄与收缩压的直线回归方程 最小二乘法原理的含义是保证各实测点至直线的纵向距离的平方和最小 吉林大学公共卫生学院 19 吉林大学

7、公共卫生学院 20 1 先根据原始数据绘制散点图 scatterplot 大致判断两变量之间是否有直线趋势 本例的散点图见下图13 1 可见年龄与收缩压呈直线趋势 故可进行直线回归分析 吉林大学公共卫生学院 21 2 计算 X Y X2 Y2 XY见表13 1中的 2 6 合计项 X 628 Y 224 4 X2 34416 Y2 4240 3 XY 11977 3 3 计算和lXX lYY lXY 吉林大学公共卫生学院 22 4 求回归系数b和截距a按公式 12 5 求回归系数b 求截距a 5 列直线回归方程 为了直观分析或实际需要 可按求出的直线回归方程作图 在X的实测全距范围内任取相距较

8、远且易读数的两个X值 代入方程得到两个Y值 吉林大学公共卫生学院 23 以直线连接两点即得回归直线 本例可取X1 42 得Y1 17 14 取X2 72 得Y2 21 66 连接两点即得本资料的回归直线 见下图13 1a 吉林大学公共卫生学院 24 三 回归系数的假设检验 我们知道即使X Y的总体回归系数 为零 由于抽样误差的存在 样本回归系数b也不一定为零 因此需要对回归系数进行假设检验 以此推断X Y是否存在直线关系 可用方差分析或t检验 吉林大学公共卫生学院 25 检验统计量t的计算公式为 t检验 公式 13 7 例3对例1求得的回归系数进行t检验 t检验的步骤如下 式中Sb为样本回归系

9、数的标准误 吉林大学公共卫生学院 26 H0 0即年龄与收缩压之间无直线关系 H1 0即年龄与收缩压之间有直线关系 0 05 前已算得lXX 1550 7 lYY 44 04 lXY 233 7 b 0 1507 代入公式得 吉林大学公共卫生学院 27 由 0 05 n 2 12 2 10 查t界值表得t t0 05 10 2 228 今求得t 6 32 2 228 则P 0 05 按 0 05水准拒绝H0 可认为年龄与收缩压之间有直线关系 吉林大学公共卫生学院 28 四 直线回归方程的应用 1 描述两变量间的数量依存关系2 利用回归方程进行预测3 利用回归方程进行统计控制 吉林大学公共卫生学

10、院 29 五 应用回归分析时应注意的问题 1 两变量作直线回归分析时 要求应变量Y服从正态分布 通常自变量X为可以精确测量或严格控制的因素 2 作回归分析时要有实际意义 不能把毫无关联的两事物或现象进行回归分析 3 在进行回归分析前 应绘制散点图 4 回归方程适用范围一般以自变量X实际取值范围为限 不能任意外推 吉林大学公共卫生学院 30 第三节直线相关与回归的区别和联系 吉林大学公共卫生学院 31 回归与相关是两个既有区别又有联系的统计分析方法 若研究目的是想定量地描述两个变量间的依存关系 常用来由一个变量的数值去推算另一个变量的数值 则应作回归分析 若目的是想定量地描述两个变量间互依关系的

11、密切程度和方向 则应作相关分析 区别 1 资料要求不同回归要求应变量Y服从正态分布 X是可精确测量或严格控制的变量 一般称I型回归 相关要求两个变量服从双变量正 吉林大学公共卫生学院 32 态分布 此时若作回归分析 称II型回归 2 在应用上不同回归用来描述两个变量间的依存关系 相关用来描述两个变量间的互依关系 联系 1 符号相同对一组数据若同时计算r与b 它们的正负号相同 r为正说明两个变量间的相互关系是同向变化的 b为正说明X增 减 一个单位 Y平均增 减 b个单位 吉林大学公共卫生学院 33 2 假设检验等价对同一样本 样本回归系数b的t检验与样本相关系数r的t检验的t值相等 即tb t

12、r 由于b的假设检验较繁 故在实际应用中常用r的t检验代替 3 用回归解释相关r的平方称为决定系数 coefficientofdetermination 吉林大学公共卫生学院 34 接近1 则回归效果越好 上式说明当SS总固定不变时 回归平方和SS回的大小决定了r2的大小 SS回越接近SS总 则r2越 吉林大学公共卫生学院 35 第十四章统计表与统计图 统计表与统计图是统计描述的重要方法 是对比 分析事物的重要工具 在科技报告或论文中 常把统计数据或统计指标用表格的形式列出 称为统计表 statisticaltable 它常用来集中 浓缩 简洁地概括说明某类被研究事物 代替冗长 单调的文字叙述

13、 并能够鲜明 清晰地表达该事物 便于进一步比较和计算 吉林大学公共卫生学院 36 第一节统计表 统计图 statisticalchart 是用点的位置 线段的升降 直条的长短或面积的大小等形式表达统计资料的一种方法 它可以把资料的变化趋势 分布特征 数据之间的关联等 以形象直观的方式表现出来 统计图容易理解 能醒目地给读者留下深刻印象 缺点是不能精确地表达数字的大小 故常与统计表一同使用 以达到相辅相成的效果 吉林大学公共卫生学院 37 一 统计表的基本结构 统计表主要由标题 表线 标目和数字组成 其结构如下图所示 标题 表号 纵标目 横标目 数字 合计 顶线 分隔线 合计线 底线 吉林大学公

14、共卫生学院 38 统计表分为简单统计表和复合统计表两种 以下是论文和科技报告中常见的统计表的式样 其中表1是简单表 表2 表3和表4是复合表 二 统计表的种类 吉林大学公共卫生学院 39 吉林大学公共卫生学院 40 吉林大学公共卫生学院 41 三 编制统计表的注意事项 制作统计表总的原则 重点突出 简单实用 逻辑合理 条理清晰 即一个统计表最好只包含一个中心内容 不要面面俱到 纵 横标目的安排既要符合专业要求 又要逻辑分明 针对统计表的各组成部分 具体的制表基本要求如下 标题 用简明扼要的文字说明表的中心内容 必要 吉林大学公共卫生学院 42 时写明时间和地点 标题写在表体的上端中部 注意标题

15、不要过长 也不要太简略 更不要不写 表号 一般标于标题的前部 与标题以空格相隔 若文中有多个表 以数字编号表示 如 表1 表2 表12 1 表5 4 等 若文中只有一个表 用 附表 表示 表线 表线有顶线 分隔线 合计线 底线等 顶 吉林大学公共卫生学院 43 线和底线一般用粗线 其余用细线 表线只能用横线 不能用竖线 也不能用斜线 表线不宜过多 最基本的统计表一般为三线表 四线表 纵标目 常用精炼的文字或术语写明各项指标或某种分类 位于表的上部 有单位的指标要注明单位 如 体重 kg 死亡率 等 纵标目上可以再列总标目 二者用一短线分隔 注意标目不宜过多 纵标目不宜划分过多层次 吉林大学公共

16、卫生学院 44 横标目 常为被研究或要说明的事物名称 位于表的左中部 横标目上部常列事物的性质或类别 如 类型 年份 组别 等 横标目下部可列合计项 合计与横标目之间一般不用短线分隔 数字 表内数字一律采用阿拉伯数字 同一指标的数字应该数位对齐 小数位数要一致 数字不标明单位 表内不宜有空项 如遇数据缺失 不详 吉林大学公共卫生学院 45 或未记录时 可用 表示 不该有数字处可用 表示 数字是 0 均填 0 数字应位于所属纵标目的正下方 横标目的右侧同一行 合计数字与分数据之间可用短线分隔 备注 当表中有某个对象需附加或特殊说明时 可先在该对象的右上角用 或其它特殊符号标示 再在表的底线下面左侧用该符号引导写出具体内容 吉林大学公共卫生学院 46 统计图是用点的位置 线段的升降 直条的长短或面积的大小等形式表达统计资料的一种方法 它可以把资料的变化趋势 分布特征 数据之间的关联等 以形象直观的方式表现出来 统计图容易理解 能醒目地给读者留下深刻印象 常用的统计图有条图 百分条图 圆图 线图 半对数线图 散点图 直方图 统计地图等 第二节统计图 吉林大学公共卫生学院 47 一 绘制统计图

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号