第五章简单直线回归与相关分析

上传人:w****i 文档编号:108732912 上传时间:2019-10-25 格式:PDF 页数:95 大小:2.77MB
返回 下载 相关 举报
第五章简单直线回归与相关分析_第1页
第1页 / 共95页
第五章简单直线回归与相关分析_第2页
第2页 / 共95页
第五章简单直线回归与相关分析_第3页
第3页 / 共95页
第五章简单直线回归与相关分析_第4页
第4页 / 共95页
第五章简单直线回归与相关分析_第5页
第5页 / 共95页
点击查看更多>>
资源描述

《第五章简单直线回归与相关分析》由会员分享,可在线阅读,更多相关《第五章简单直线回归与相关分析(95页珍藏版)》请在金锄头文库上搜索。

1、下一张下一张主 页主 页退 出退 出上一张上一张 基本内容基本内容 一一简单相关分析简单相关分析、简单相关分析简单相关分析 二、一元线性回二、一元线性回归分析归分析归分析归分析 三、注意事项三、注意事项 下一张下一张首 页首 页退 出退 出上一张上一张 相关与回归分析相关与回归分析 仔猪出生重与断奶重的关系 变量间关系问题: 仔猪出生重与断奶重的关系 猪瘦肉率与背膘厚度、眼肌面积、胴体长等的关系 动物实验中动物进食量与增加体重的关系 动物实验中动物进食量与增加体重的关系 药物剂量与动物死亡率等。 两个关系: (1)互依关系:应变量Y与自变量X间的彼此关系 相关分析 (2)依 存 关 系 : 应

2、 变 量 (dependentvariable)Y随 自 变 量 (independent variable)X变化而变化回归分析 下一张下一张首 页首 页退 出退 出上一张上一张 双变量计量资料 总体无限或有限对变量值总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), , (Xn,Yn)( 11) (22) ( nn) 目的:研究X和Y的数量关系 方法:相关与回归 简单基本直线回归直线相关简单、基本直线回归、直线相关 下一张下一张首 页首 页退 出退 出上一张上一张 名词解释名词解释 相关分析相关分析 就是用个指标来

3、表明现象间相互就是用一个指标来表明现象间相互 依存关系的密切程度。 回归分析回归分析 就根据相关关的体形态选就是根据相关关系的具体形态,选 择一个合适的数学模型,来近似地表达 变间的均变化关系变量间的平均变化关系。 下一张下一张首 页首 页退 出退 出上一张上一张 区别区别区别区别 相关分析所研究的变量是对等关系相关分析所研究的变量是对等关系 (平行);回归分析所研究的两个变量不是 对等关系因果对等关系(因果) 。 对两个变量来说相关分析只能计算对两个变量来说,相关分析只能计算 出一个相关系数,而回归分析,可建立不同 的回归方程。的回归方程。 相关分析要求两个变量都必须是随机 的而回归分析的要

4、求自变量是给定的的,而回归分析的要求,自变量是给定的, 因变量是随机的。 下一张下一张首 页首 页退 出退 出上一张上一张 史背景历史背景 十九世纪英国人类学家 F.Galton首次在自 然遗传一书中提出并阐明了“相关”和然遗传书中,提出并阐明了相关和 “相关系数”两个概念,为相关论奠定了基础。 其后,他和英国统计学家 Karl Pearson对上千个 家庭的身高臂长拃长(伸开大拇指与中指家庭的身高、臂长、拃长(伸开大拇指与中指 两端的最大长度)做了测量, 发现:发现: 下一张下一张首 页首 页退 出退 出上一张上一张 儿子身高(Y,英寸)与父亲身高(X,英寸) 存在线性关系: 33 73 0

5、 516YX 即高个子父代的子代在成年之后的身高平均 33.73 0.516YX=+ 即高个子父代的子代在成年之后的身高平均 来说不是更高,而是稍矮于其父代水平,而矮 个子父代的子代的平均身高不是更矮,而是稍 高于其父代水平G lt将这种趋向于种族稳高于其父代水平。Galton将这种趋向于种族稳 定的现象称之“回归”。定的现象称之回归。 下一张下一张首 页首 页退 出退 出上一张上一张 下一张下一张首 页首 页退 出退 出上一张上一张 小插曲小插曲小插曲小插曲F.Galton Galton(18221911)是一位人类学家,著名生物学 家达尔文的表兄弟,早年学医,曾在剑桥大学念表桥 书。尽管他

6、的数学不是很好,但在人类学和优生 学研究中萌发的统计学思想,对生物统计的发展 产生了深远影响,如“回归”、 “双变量正态分 布”的概念等。他没有子女,但一生写了9部书, 发表了近200篇论文。1860年当选英国皇家学会 会员,1909年被封为爵士,1910年获得英国皇家 学会Copley奖。 下一张下一张首 页首 页退 出退 出上一张上一张 第第一一节节 相关性分析相关性分析第节第节 相关性分析相关性分析 下一张下一张首 页首 页退 出退 出上一张上一张 基本内容基本内容基本内容基本内容 一一函数关系函数关系与与相关关系相关关系、函数关系函数关系与与相关关系相关关系 二二、相关种类相关种类二二

7、、相关种类相关种类 三三、相关图相关图和和相关表相关表三三、相关图相关图和和相关表相关表 四四、相关分析相关分析、相关分析相关分析 下一张下一张首 页首 页退 出退 出上一张上一张 函数关系函数关系与与相关关系相关关系 在自然界和人类社会中许多现象之间都是相互联系在自然界和人类社会中,许多现象之间都是相互联系、 相互制约的,这种现象之间的关系可以概括为两种不同 类型即:函数关系和相关关系类型,即:函数关系和相关关系。 1、函数关系: y=f(x) 两个变量的关系是确定的,可以用一个数学表达式表示出来。两个变量的关系是确定的,可以用个数学表达式表示出来。 例:圆的面积与半径的关系S=R2 2、相

8、关关系: y=f(x)+ 例药物剂量与动物死亡率例:药物剂量与动物死亡率 ? ? 相关关系的理解应把握二点: 1变量之间确实存在数量上的互依关系;1、变量之间确实存在数量上的互依关系; 2、变量之间互依互依关系的具体数值是不确定的。 由此可知函数关系与相关关系之间的区别就是变量由此可知,函数关系与相关关系之间的区别就是变量 之间的具体关系值是否确定。 下一张下一张首 页首 页退 出退 出上一张上一张 ()根据自变量的多少划分 相关种类相关种类 (一)根据自变量的多少划分 单相关:只有一个自变量。 复相关有个个以上的变复相关:有两个及两个以上的变量。 (二)根据相关关系的表现形态不同划分 线性相

9、关(直线相关) 非线性相关(曲线相关) (三)根据相关关系的方向划分 正相关:两个变量之间的变化方向一致 负相关:两个变量变化趋势相反 (四)按相关的程度来分 完全相关、不完全相关、无相关。 下一张下一张首 页首 页退 出退 出上一张上一张 相关图相关图和和相关表相关表相关图相关图和和相关表相关表 相关图相关图又称散点图散点图,用直角坐标系的x轴代表自变量, y轴代表因变量,将两个变量间相对应的变量值用坐标 r = 1r = -1 点的形式描绘出来,用以表明相关点分布状况的图形。 y r 1 y r 1 xx (a)完全正相关(b)完全负相关 下一张下一张首 页首 页退 出退 出上一张上一张

10、0 0,直线从左下方,直线从左下方 走向右上方走向右上方Y 随随 X Y 走向右上方走向右上方,Y 随随 X 增大而增大;增大而增大; ? b0 ? b010=01. 0P 否定HO:0,接受HA:0,即直线回归系 数b=21.7122是极显著的,表明太湖白鹅 70 日龄 重与雏鹅重间存在极显著的直线关系,可用所建 立的直线回归方程来进行预测和控制。 第四节进行直线相关与回归分析时进行直线相关与回归分析时 应注意的问题应注意的问题 下一张下一张首 页首 页退 出退 出上一张上一张 回归系数与相关系数的关系:回归系数与相关系数的关系: yy y x yxyx SP SSSSs sSPSP brr

11、b SSSSSSSS = 即即:相关系数是标准化了的回归系数相关系数是标准化了的回归系数 yy xxy xyx xxy SSssSSSSSS SSSSSS 即即:相关系数是标准化了的回归系数相关系数是标准化了的回归系数 同理,可得同理,可得 y xy s rb s = 两者相乘两者相乘,即:即: 即为前面讨论过的决定系数即为前面讨论过的决定系数 x s 2 yxxy rbb= yxxy rbb= 即为前面讨论过的决定系数即为前面讨论过的决定系数 即相关系数是两个方向相反的回归系数的几何平均即相关系数是两个方向相反的回归系数的几何平均 2 r 即相关系数是两个方向相反的回归系数的几何平均即相关系

12、数是两个方向相反的回归系数的几何平均 值值 相关系数和回归系数的区别和联系:相关系数和回归系数的区别和联系: 相关系数是一个纯量,没有单位;相关系数是一个纯量,没有单位; 回归系数是有单位的回归系数是有单位的 U 回归系数是有单位的回归系数是有单位的: 相关系数没有方向相关系数没有方向, y x U U 相关系数没有方向相关系数没有方向, 回归系数是有方向的:回归系数是有方向的: 为为 y 对对 x 的回归,为的回归,为 x 对对 y 的回归的回归 相关系数的分布范围为相关系数的分布范围为 yx b xy b 相关系数的分布范围为相关系数的分布范围为: 回归系数的分布范围为回归系数的分布范围为

13、: 1, 1 + + 回归系数的分布范围为回归系数的分布范围为: 两者的关系:两者的关系: , + 2 yxxy rbb= y xy x s rb s = x yx s rb s = yxxy rbb= x y s 注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项 1. 作相关回归分析要有实际意义。不要把毫无联系 的两种现象作相关回归分析。 2.相关关系不一定是因果关系,也可能是伴随关 3.在进行直线相关与回归分析之前应先绘制散点 2.相关关系不定是因果关系,也可能是伴随关 系。有无因果关系还需结合专业知识进一步研究。 3.在进行直线相关与回归分

14、析之前,应先绘制散点 图,当观察到点的分布呈直线趋势时,方可进行 分析,如散点图呈曲线趋势,应进行曲线回归分分析,如散点图呈曲线趋势,应进行曲线回归分 析。 (特别注意异常点) 下一张下一张首 页首 页退 出退 出上一张上一张 注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项 4样本相关系数与总体相关系数间存在 抽样误差,所以求得样本相关系数后应进抽样误差,所以求得样本相关系数后应进 行假设检验。 5. 回归方程一般只适用于自变量X的原始数据范 围内,不能任意外延。因为超出这个范围,X与Y围内,不能任意外延。因为超出这个范围,X与Y 就不一定仍然

15、呈线性关系。 6. 对于双变量正态分布资料,根据研究目的可选择由 X 估计 Y 或 者由 Y 估计 X ,一般情况下两个回归方程不相同。相关关系中,两 个变量不必定出哪个是自变量哪个是因变量因此相关的两个个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个 变量都是随机变量,二者没有主次之分。 下一张下一张首 页首 页退 出退 出上一张上一张 注意事项注意事项注意事项注意事项注意事项注意事项 7. 直线相关与回归的区别 在资料需求上,相关分析要求两变量X与Y均为服从正态分布的随机变量, 即两者都不能预先指定;回归分析要求Y是正态随机变量,而X可以不 是正态随机变量而是一确定值,此时回归分

16、析称为型回归,X也可以 是正态随机变量,此时回归分析称为型回归。 在意义上,相关反映两变量的相关关系;回归反映两变量间的依存关系。 在应用上,说明两变量间的相关程度及相关方向用相关;说明两变量间 的依存变化的数量关系用回归。 下一张下一张首 页首 页退 出退 出上一张上一张 注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项注意事项 8. 相关与回归的联系 在同一组数据相关系数r与回归系数b在同一组数据,相关系数r与回归系数b 的符号一致。 组数与 的假设检验等价的同一组数据,r与b的假设检验是等价的, 即tr=tb。因r的假设检验可直接查表,较即 rb。因 的假设检验可直接查表,较 为简便,故可代替b的假设检验。 下一张下一张首 页首 页退 出退 出上一张上一张

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号