《回归与相关分析》ppt课件

上传人:tian****1990 文档编号:74754332 上传时间:2019-01-29 格式:PPT 页数:33 大小:684.81KB
返回 下载 相关 举报
《回归与相关分析》ppt课件_第1页
第1页 / 共33页
《回归与相关分析》ppt课件_第2页
第2页 / 共33页
《回归与相关分析》ppt课件_第3页
第3页 / 共33页
《回归与相关分析》ppt课件_第4页
第4页 / 共33页
《回归与相关分析》ppt课件_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《《回归与相关分析》ppt课件》由会员分享,可在线阅读,更多相关《《回归与相关分析》ppt课件(33页珍藏版)》请在金锄头文库上搜索。

1、第七章 回归与相关分析,(针对两个变量的相互关系进行分析) 第一节 直线回归 第二节 直线相关 第三节 多项式回归 第四节 协方差分析*,第七章要点提示,本章对两个变量的相互关系进行分析,是多元统计分析的基石。学习时首先要求区分“回归”术语古今含义的不同之处,充分认识一元线性回归与相关分析的基础地位; 熟悉回归关系与相关关系的本质区别及两者在统计表述方法上的联系(如r与b在数学意义上的统一性)和各自的侧重点; 重点掌握直线回归与相关分析的显著性检验方法和双变量回归模型的协方差分析技术,以便将统计控制手段与试验控制手段一起综合运用到试验设计和统计分析中去。 涉及教材内容:第九章全五节,第十章、第

2、十一章各一节。 作业布置:教材第十、十一章所余三节内容自习; 教材P191 T5、 T6、 T9 ; P224 T7。,第一节 直线回归,一、回归的含义 “回归”原文为regression,该术语最先由英国的F.Galton于1886年左右研究人类身高遗传的规律时所作的“高尔顿解释”中使用,详情如右图所示: 高尔顿对此所作的解释是:大自然有 一种约束机制,使人类身高分布保持某种稳定形态而不作两极分化,也就是有回归于中心的作用,这个中心值即该种族身高在一定历史时期的平均值。 现在就“回归”所作的定义是: 如果两个变量X和Y,总是Y随着X的变化而变化,且这种变化关系不可逆,则称X和Y为回归关系。其

3、中: X叫自变量dependent variable;Y叫因变量或依变量independent variable。,高:xg 71 72 g (69) 64 a 矮:xa 67 调查n 1074个家庭,统计结果: X 68英寸 69英寸 得: X 1 (1英寸2.54cm) 但分组统计的结果却并非如此 父母为高个子组时,g 721 父母为矮个子组时, a 641 走向指回归的本意 走向指回归的今义,第一节 直线回归,二、建立直线回归方程 例7.1 一些夏季害虫的盛发期迟早与春季温度高低有关。江苏武进县观察1956-1964年3 月下旬至4 月中旬的3 段旬均温累积值X和一代三化螟盛发期Y(5月

4、10日起算)所得结果如下,试予分析。 解 描散点图 本例已知害虫盛发期迟早随春季气温的变化而变化,且不可逆,又据散点图反映的趋势来看,在3045的温度范围,盛发期天数随值呈下降的线性变化关系。 故可假定直线回归方程为: y a bx 读作“Y依x直线回归”,30 35 40 45,y a bx,第一节 直线回归,数据整理 由原始数据算出一级数据6个: X333.7 Y70 XY2436.4 X 212517.49 Y 2794 n9 再由一级数据算出二级数据5个: SSX X 2 (X) 2 /n144.64 SSY Y 2 (Y ) 2 /n 249.56 SP XY X Y /n 159.

5、04 XX/n 37.08 Y/n 7.78 计算三级数据 b SP/ SSX 1.10 (159.04 )144.64 a bX48.55 7.78 (1.10 )37.08 得所求直线回归方程为: y 48.55 1.10 x,y 48.55 1.10 x,30 35 40 45,31.7,44.2,第一节 直线回归,三、直线回归关系的显著性检验 将a bx 代入Y a bx 得: y b(xx )及 y b(xx ) 于是由因变量离均差的两个线性分量: (Y)2(Yy )( y )2 可推导出因变量总SS的如下分解公式: (Y )2(Yy ) 2 ( y ) 2 简写成:SSY SSQ

6、SSU Q U 分别叫“离回归平方和”与“回归平方和” 其计算公式及本例分解结果: SSUSP2/ SSX159.042 / 144.64 174.89 SSQSSY SSU249.56174.8974.67 故 F MSU / MSQ 16.4* (F0.01, 1, 712.25) (174.891)/(74.677) 表明双变量直线回归关系极显著,所得方程 y 48.55 1.10 x可用于预测。,也可对回归系数进行t-test来证实。 只是要利用df(分子)1时,Ft2的关系 推导出回归系数的标准误SbSe/SSX 其中,Se2SSQ/dfQ 74.677 10.67 于是t-test

7、的步骤如下: H0: = 0(为回归系数b的真值) Sb Se2/ SSX 0.2715 10.67144.64 t(b)Sb(-1.1)0.2715-4.05 (3) 按自由度 7 查得两尾 t0.01 = 3.50 (4) 推断: t t0.01 H0 不成立。 可见t-test与F-test的效果完全一致。 若显著性检验结果不显著,则三选一: Y与X没有回归关系; Y与X有回归关系,但不是直线回归; Y与X有回归关系,但不是简单回归, 而是多元回归。,第二节 直线相关,一、相关的含义 如果两个变量X和Y,总是X和Y 相互制约、平行变化,则称X和Y为相关关系。 此时,X和Y没有严格意义上的

8、自变量和因变量之分,既可以说Y随着X的变化而变化, 也可以讲X随着Y 的变化而变化。即不存在谁决定谁或谁依赖谁的问题。 如人或动物的胸围和体重,作物的生物产量和经济产量,树干的胸径与材积等。 可见,相关关系以双向、平行为特征。 但相关关系如果仅从数学角度看,和回归关系是统一的,因为其双变量变化规律如果是线性关系的话,也可以由根据“最小二乘法”原理得出的直线方程来表述,所以有些文献不区分回归关系和相关关系,将二者笼统地称之“回归”或者“相关”。 从统计上讲,相关分析的侧重点和回归分析不完全一样。,二、相关系数 前已述及,具有线性回归关系的双变量中,Y变量的总变异量分解为: SSY SSQ SSU

9、 Q U 对于具有线性相关关系的双变量, Y变量的总平方和也可以分解成同样的两个分量,只是分别改称为“非相关平方和”与“相关平方和”于是有: r SSU / SSY SP/ SSX SSY “ r ”叫相关系数,其绝对值越大, SSU所占的比重就越大,在散点图上就表现为各散点越靠近直线;反之, 即SSQ所占的比重越大,各散点越远离直线。并且有以下性质: r 的正负和b一样取决于SP的正负; r0,正相关;r0,负相关 r1,1或r(1,1); 决定系数 r 2bb 或 r bb,第二节 直线相关,三、相关分析举例 例7.2 为研究绵羊胸围(cm)和体重(kg)的相互关系,调查了10只绵羊胸围和

10、体重的对应观察值X和Y, 所得结果如下表,试予分析。 解 描散点图 本例已知绵羊胸围(X)和体重(Y)为相关关系,散点图也显示两者的变化规律呈线性正相关,SP0。 故可假定直线相关方程为: y a bx 或 x a b y 后一个方程也可写成:y a b x,y a bx,80 74 68 62 56 50,第二节 直线相关,数据整理 由原始数据算出一级数据6个: X720 Y680 XY49123 X 251904 Y 246818 n10 再由一级数据算出二级数据5个: SSX X 2 (X) 2 /n64 SSY Y 2 (Y ) 2 /n 578 SP XY X Y /n 163 XX

11、/n 72 Y/n 68 计算三级数据 b SP/ SSX 16364 2.547 a 72 2.54768 115.4 b SP/ SSY 163578 0.282 a 68 0.282 72 52.82 即所求相关方程可以有两个(如右图) r SP/ SSX SSY 0.8475 r 2bb2. 547 0.2820.7192,y 52.82 0.282 x,76 72 68,40 50 60 70 80,80 70 60 50,y 2.547x115.4,第二节 直线相关,、直线相关关系的显著性检验 和直线回归关系的显著性检验原理一样,直线相关关系的双变量也可导出Y变量总SS的如下分解公

12、式: (Y )2(Yy ) 2 ( y ) 2 简写成:SSY SSQ SSU Q U 分别叫“非相关平方和”与“相关平方和” 其计算公式引用三级数据后简化为: SSY (1 r 2 )SSY r 2 SSY 或者 SSX (1 r 2 )SSX r 2 SSX SSU r 2 SSY0.7182 578 415 SSQ (1 r 2 ) SSY 0.2818 578 163 故 F MSU / MSQ 20.4* (F0.01, 1, 811.26) (n 2 ) r 2 / (1 r 2 ) 表明双变量直线相关关系极其显著, 所得两个直线相关方程都可用于预测。,也可对回归系数进行t-tes

13、t来证实。 只是要利用df(分子)1时,Ft2的关系 推导出相关系数的标准误: Sr (1 r 2 ) / (n 2 ) 并且 Se2SSQ/dfQ 1638 20.4 于是t-test的步骤如下: H0: = 0(为相关系数 r 的真值) Sr 0.28188 0.1877 t(r )Sr0.84750.18774.516 (3) 按自由度 8 查得两尾 t0.01 = 3.355 (4) 推断: t t0.01 H0 不成立。 可见t-test与F-test的效果完全一致。 若显著性检验结果不显著,则三选一: Y与X没有相关关系; Y与X有相关关系,但不是直线相关; Y与X有相关关系,但不

14、是简单相关, 而是复相关。,第二节 直线相关,四、回归与相关关系的统一性 既然相关关系和回归关系的显著性检验原理一样,那么,不论回归还是相关关系,其检验都可用“相关系数” r 进一步简化如下:即由 t2 F (n 2 ) r 2 / (1 r 2 ) 解得: r t2 / ( n 2 t2 ) 于是利用这一关系将各个自由度下的 t 临界值t0.05和 t0.01换算出相关系数r的临界值r0.05和 r0.01,从而得到直接用于检验回归或者是相关关系显著性的临界值表(附表10)。 如从教材P376查得M2,dfQ8时 r0.05 0.632, r0.01 0.765 今得 r 0.8475* r0.01 再由例7.1从P376查得M2,dfQ7时 r0.05 0.666, r0.01 0.798 算得 “ r ” 0.8371* r0.01 检验效果与F-test或者是t-test完全一样。,例7.2关于体重(Y)的ANOVA表

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号