第七章相关与回归分析.课件

上传人:m**** 文档编号:571571107 上传时间:2024-08-11 格式:PPT 页数:68 大小:1.22MB
返回 下载 相关 举报
第七章相关与回归分析.课件_第1页
第1页 / 共68页
第七章相关与回归分析.课件_第2页
第2页 / 共68页
第七章相关与回归分析.课件_第3页
第3页 / 共68页
第七章相关与回归分析.课件_第4页
第4页 / 共68页
第七章相关与回归分析.课件_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《第七章相关与回归分析.课件》由会员分享,可在线阅读,更多相关《第七章相关与回归分析.课件(68页珍藏版)》请在金锄头文库上搜索。

1、统计学统计学统计学统计学第七章第七章 相关与回归分析相关与回归分析实例实例1:1:中国妇女生育水平的决定因素是什么中国妇女生育水平的决定因素是什么? ?妇女生育水平除了受计划生育政策影响以外,还可能妇女生育水平除了受计划生育政策影响以外,还可能与社会、经济、文化等多种因素有关。与社会、经济、文化等多种因素有关。1、影响中国妇女生育率变动的因素有哪些?2、各种因素对生育率的作用方向和作用程度如何?3、哪些因素是影响妇女生育率主要的决定性因素?4、如何评价计划生育政策在生育水平变动中的作用?5、计划生育政策与经济因素比较,什么是影响生育率的 决定因素?6、如果某些地区的计划生育政策及社会、经济、文

2、化 等因素发生重大变化,预期对这些地区的妇女生育 水平会产生怎样的影响?据世界卫生组织统计,全球肥胖症患者达3亿人,其中儿童占2200万人,11亿人体重过重。肥胖症和体重超常早已不是发达国家的“专利”,已遍及五大洲。目前,全球因”吃”致病乃至死亡的人数已高于因饥饿死亡的人数。(引自光明日报刘军/文)问题: 肥胖症和体重超常与死亡人数真有显著 的数量关系吗?实例实例2:2:全球吃死的人比饿死的人多全球吃死的人比饿死的人多? ?发生车祸的次数与司机的年龄有关吗发生车祸的次数与司机的年龄有关吗 ?一一年年的的葡葡萄萄酒酒消消耗耗量量(平平均均每每人人喝喝葡葡萄萄酒酒摄摄取取酒酒精精的的升升数数)以以

3、及及一一年年中中因因心心脏脏病病死死亡亡的的人人数数(每十万人死亡人数)之间有关系吗?(每十万人死亡人数)之间有关系吗? 身高与足迹长度有关吗?身高与足迹长度有关吗?这些类型的问题可以运用相关分析与回归分析这些类型的问题可以运用相关分析与回归分析的方法去解决。的方法去解决。 第七章第七章 相关与回归分析相关与回归分析第一节第一节 相关分析相关分析第二节第二节 一元线性回归分析一元线性回归分析第三节第三节 线性回归的显著性检验及回归预测线性回归的显著性检验及回归预测第四节第四节 多元线性回归分析多元线性回归分析 学习目标1 1、变量间的相关关系与相关系数的计算、变量间的相关关系与相关系数的计算2

4、 2、总体回归函数与样本回归函数、总体回归函数与样本回归函数3 3、线性回归的基本假定、线性回归的基本假定4 4、一元线性回归参数的估计与检验、一元线性回归参数的估计与检验5 5、多元线性回归参数的估计与检验、多元线性回归参数的估计与检验6 6、回归预测的方法、回归预测的方法一、一、相关关系的概念相关关系的概念确定性的函数关系确定性的函数关系 Y=f (X) 不确定性的统计关系相关关系相关关系 Y= f(X)+ (为随机变量) 没有关系没有关系 变量间关系的图形描述: 坐标图(散点图)变量间的相互关系变量间的相互关系 (一)相关关系的概念(一)相关关系的概念(一)相关关系的概念(一)相关关系的

5、概念 1 1 1 1、相相相相关关关关关关关关系系系系:客客客客观观观观现现现现象象象象之之之之间间间间确确确确实实实实存存存存在在在在的的的的、但但但但在在在在数数数数量表现上量表现上量表现上量表现上不严格对应不严格对应不严格对应不严格对应的依存关系。的依存关系。的依存关系。的依存关系。 确实存在确实存在确实存在确实存在关系是真实的、具有内在联系,而关系是真实的、具有内在联系,而关系是真实的、具有内在联系,而关系是真实的、具有内在联系,而不是主观臆造的,也不是形式上的偶然巧合。不是主观臆造的,也不是形式上的偶然巧合。不是主观臆造的,也不是形式上的偶然巧合。不是主观臆造的,也不是形式上的偶然巧

6、合。 通过定性分析确定,即根据通过定性分析确定,即根据通过定性分析确定,即根据通过定性分析确定,即根据经济理论或经济常识经济理论或经济常识经济理论或经济常识经济理论或经济常识以及相关学科的知识分析判断是否存在这样的关系。以及相关学科的知识分析判断是否存在这样的关系。以及相关学科的知识分析判断是否存在这样的关系。以及相关学科的知识分析判断是否存在这样的关系。数量表现上不严格对应数量表现上不严格对应 1)1)变变变变量量量量间间间间的的的的关关关关系系系系不不不不能能能能用用用用函函函函数数数数关关关关系精确表达系精确表达系精确表达系精确表达2)2)2)2)一一一一个个个个变变变变量量量量的的的的

7、取取取取值值值值不不不不能能能能由由由由另另另另一一一一个变量唯一确定个变量唯一确定个变量唯一确定个变量唯一确定3)3)3)3)当当当当变变变变量量量量 x x x x 取取取取某某某某个个个个值值值值时时时时,变变变变量量量量 y y y y 有有有有若若若若干干干干取取取取值值值值与与与与之之之之对对对对应应应应这这些些数数值值虽虽然然有有波波动动,但但总总是是以以一一定定的的分分布布规规律律围绕其均值上下波动围绕其均值上下波动4)4)4)4)各观测点分布在直各观测点分布在直各观测点分布在直各观测点分布在直线(或曲线)周围线(或曲线)周围线(或曲线)周围线(或曲线)周围直线相关图直线相关图

8、直线相关图直线相关图居民收入居民收入居民收入居民收入( ( ( (x x x x) ) ) )与社会商品零售额与社会商品零售额与社会商品零售额与社会商品零售额( ( ( (y y y y) ) ) )之间的关系之间的关系之间的关系之间的关系父亲身高父亲身高父亲身高父亲身高( ( ( (x x x x) ) ) )与子女身高与子女身高与子女身高与子女身高( ( ( (y y y y) ) ) ) 之间的关系之间的关系之间的关系之间的关系受教育程度受教育程度受教育程度受教育程度( ( ( (x x x x) ) ) )与收入水平与收入水平与收入水平与收入水平( ( ( (y y y y) ) )

9、)之间的关系之间的关系之间的关系之间的关系广广广广告告告告费费费费支支支支出出出出( ( ( (x x x x1 1 1 1) ) ) ) 、价价价价格格格格( ( ( (x x x x2 2 2 2) ) ) )与与与与商商商商品品品品销销销销售售售售额额额额( ( ( (y y y y) ) ) ) 之之之之间间间间的关系的关系的关系的关系施施施施肥肥肥肥量量量量( ( ( (x x x x1 1 1 1) ) ) ) 、降降降降雨雨雨雨量量量量( ( ( (x x x x2 2 2 2) ) ) ) 、温温温温度度度度( ( ( (x x x x3 3 3 3) ) ) )与与与与粮粮粮

10、粮食食食食亩亩亩亩 产量产量产量产量( ( ( (y y y y) ) ) ) 之间的关系之间的关系之间的关系之间的关系相关关系的例子相关关系的例子相关关系的例子相关关系的例子2.2.2.2.函数关系函数关系函数关系函数关系 客观现象之间客观现象之间客观现象之间客观现象之间确实确实确实确实存在的、而且数量表现上是存在的、而且数量表现上是存在的、而且数量表现上是存在的、而且数量表现上是严格严格严格严格的确定性的依存关系。的确定性的依存关系。的确定性的依存关系。的确定性的依存关系。1 1 1 1)对对对对于于于于变变变变量量量量x x x x和和和和y y y y,当当当当自自自自变变变变量量量量

11、x x x x取取取取某某某某个个个个数数数数值值值值时时时时,因因因因变变变变量量量量y y y y依依依依确确确确定定定定的的的的关关关关系系系系取取取取相相相相应应应应的的的的值值值值,则则则则称称称称y y y y是是是是x x x x的的的的函函函函数数数数,记记记记为为为为y y y y = = = =f f f f ( ( ( (x x x x) ) ) )。2 2 2 2)各观测点落在一条线上)各观测点落在一条线上)各观测点落在一条线上)各观测点落在一条线上 ( ( ( (直线或曲线直线或曲线直线或曲线直线或曲线) ) ) )XY函数关系的例子函数关系的例子函数关系的例子函数关

12、系的例子圆面积(圆面积(圆面积(圆面积(S S S S)与半径之间的关系:)与半径之间的关系:)与半径之间的关系:)与半径之间的关系:S S S S = = = = R R R R2 2 2 2 里程里程里程里程 (D)(D)与速度与速度与速度与速度(V)(V)、时间、时间、时间、时间(t)(t)之间的关系:之间的关系:之间的关系:之间的关系:D=VtD=Vt某种商品的销售额某种商品的销售额某种商品的销售额某种商品的销售额( ( ( (y y y y) ) ) )与销售量与销售量与销售量与销售量( ( ( (x x x x) ) ) )、单价(、单价(、单价(、单价( p p p p )之间的

13、关系:之间的关系:之间的关系:之间的关系:y y y y = = = = p xp xp xp x企业的原材料消耗额企业的原材料消耗额企业的原材料消耗额企业的原材料消耗额( ( ( (y y y y) ) ) )与产量与产量与产量与产量( ( ( (x x x x1 1 1 1) ) ) ) 、单位产量、单位产量、单位产量、单位产量消耗消耗消耗消耗( ( ( (x x x x2 2 2 2) ) ) ) 、原材料价格、原材料价格、原材料价格、原材料价格( ( ( (x x x x3 3 3 3) ) ) )之间的关系:之间的关系:之间的关系:之间的关系:y y y y = = = = x x

14、x x1 1 1 1 x x x x2 2 2 2 x x x x3 3 3 3 3 3、相关关系与函数关系的联系、相关关系与函数关系的联系、相关关系与函数关系的联系、相关关系与函数关系的联系函函函函数数数数关关关关系系系系往往往往往往往往通通通通过过过过相相相相关关关关关关关关系系系系表表表表现现现现出出出出来来来来;由由由由于于于于存存存存在在在在测测测测量量量量误误误误差差差差和和和和其其其其他他他他随随随随机机机机因因因因素素素素的的的的干干干干扰扰扰扰,可可可可以以以以说说说说现现现现实实实实中中中中没没没没有有有有纯纯纯纯粹的函数关系。粹的函数关系。粹的函数关系。粹的函数关系。相相

15、相相关关关关关关关关系系系系要要要要通通通通过过过过函函函函数数数数关关关关系系系系进进进进行行行行研研研研究究究究。相相相相关关关关变变变变量量量量之之之之间间间间的的的的数数数数量量量量变变变变动动动动虽虽虽虽然然然然表表表表现现现现出出出出一一一一定定定定的的的的波波波波动动动动性性性性,但但但但是是是是这这这这种种种种波波波波动动动动总总总总是是是是按按按按照照照照一一一一定定定定的的的的分分分分布布布布规规规规律律律律围围围围绕绕绕绕其其其其理理理理论论论论均均均均值值值值而而而而波波波波动动动动的的的的,因因因因此此此此可可可可以以以以通通通通过过过过寻寻寻寻找找找找这这这这种种种

16、种数数数数量量量量变变变变化化化化规规规规律律律律,使使使使相相相相关关关关关关关关系系系系转转转转化为函数关系进行研究。化为函数关系进行研究。化为函数关系进行研究。化为函数关系进行研究。 4 4、因果关系、因果关系原因与结果、影响因素与被影响因素之间的关系。原因与结果、影响因素与被影响因素之间的关系。原因与结果、影响因素与被影响因素之间的关系。原因与结果、影响因素与被影响因素之间的关系。 因果关系因果关系因果关系因果关系相关关系;是因果关系同时是相关关系,相关关系;是因果关系同时是相关关系,相关关系;是因果关系同时是相关关系,相关关系;是因果关系同时是相关关系,但是相关关系不一定是因果关系。

17、但是相关关系不一定是因果关系。但是相关关系不一定是因果关系。但是相关关系不一定是因果关系。 施肥量施肥量施肥量施肥量( ( ( (x x x x) ) ) )与粮食亩产量与粮食亩产量与粮食亩产量与粮食亩产量( ( ( (y y y y) ) ) )之间的关系之间的关系之间的关系之间的关系父亲身高父亲身高父亲身高父亲身高( ( ( (x x x x) ) ) )与子女身高与子女身高与子女身高与子女身高( ( ( (y y y y) ) ) )之间的关系之间的关系之间的关系之间的关系受教育程度受教育程度受教育程度受教育程度( ( ( (x x x x) ) ) )与收入水平与收入水平与收入水平与收

18、入水平( ( ( (y y y y) ) ) )之间的关系之间的关系之间的关系之间的关系居民收入居民收入居民收入居民收入( ( ( (x x x x) ) ) )与商品的消费量与商品的消费量与商品的消费量与商品的消费量( ( ( (y y y y) ) ) )之间的关系之间的关系之间的关系之间的关系广告费支出广告费支出广告费支出广告费支出( ( ( (x x x x) ) ) )与商品销售额与商品销售额与商品销售额与商品销售额( ( ( (y y y y) ) ) )之间的关系之间的关系之间的关系之间的关系 互为因果的情况互为因果的情况互为因果的情况互为因果的情况如:如:如:如:收收收收入入入

19、入水水水水平平平平和和和和股股股股票票票票持持持持有有有有额额额额是是是是正正正正相相相相关关关关,但但但但,是是是是收收收收入入入入增增增增加加加加使股票持有增加?还是持有股票的盈利使收入增加?使股票持有增加?还是持有股票的盈利使收入增加?使股票持有增加?还是持有股票的盈利使收入增加?使股票持有增加?还是持有股票的盈利使收入增加?收入水平和物价水平之间的关系。收入水平和物价水平之间的关系。收入水平和物价水平之间的关系。收入水平和物价水平之间的关系。vv统计只能说明现象间有无数量上的关系,不能说明统计只能说明现象间有无数量上的关系,不能说明统计只能说明现象间有无数量上的关系,不能说明统计只能说

20、明现象间有无数量上的关系,不能说明谁因谁果。谁因谁果。谁因谁果。谁因谁果。因与果的确定因与果的确定因与果的确定因与果的确定定性分析定性分析定性分析定性分析 5 5 5 5、注意假相关(伪相关)、注意假相关(伪相关)、注意假相关(伪相关)、注意假相关(伪相关) 现现现现象象象象之之之之间间间间没没没没有有有有本本本本质质质质联联联联系系系系,只只只只是是是是表表表表面面面面数数数数字字字字的的的的偶偶偶偶然然然然巧巧巧巧合合合合或或或或受到其他潜在变量的影响而表现出不真实的相关性受到其他潜在变量的影响而表现出不真实的相关性受到其他潜在变量的影响而表现出不真实的相关性受到其他潜在变量的影响而表现出

21、不真实的相关性。 如上证股票价格综合指数与气温的关系;如上证股票价格综合指数与气温的关系;如上证股票价格综合指数与气温的关系;如上证股票价格综合指数与气温的关系; 有人测算出教师工资增长与酒价上升是正相关;有人测算出教师工资增长与酒价上升是正相关;有人测算出教师工资增长与酒价上升是正相关;有人测算出教师工资增长与酒价上升是正相关; 有人测算出小孩脚的大小与识字多少是正相关;有人测算出小孩脚的大小与识字多少是正相关;有人测算出小孩脚的大小与识字多少是正相关;有人测算出小孩脚的大小与识字多少是正相关; 有有有有数数数数据据据据表表表表明明明明英英英英国国国国股股股股票票票票指指指指数数数数升升升升

22、降降降降与与与与一一一一年年年年半半半半前前前前的的的的汽汽汽汽车车车车销销销销售售售售量有相同的变化规律,相关系数达量有相同的变化规律,相关系数达量有相同的变化规律,相关系数达量有相同的变化规律,相关系数达0.880.880.880.88 还还还还有有有有人人人人做做做做过过过过测测测测算算算算,发发发发现现现现在在在在美美美美国国国国经经经经济济济济学学学学学学学学位位位位越越越越高高高高的的的的人人人人,收收收收入入入入越越越越低低低低,相相相相关关关关系系系系数数数数为为为为负负负负(要要要要注注注注意意意意不不不不正正正正确确确确的的的的计计计计算算算算方方方方法法法法也也也也会模糊

23、对事物本质的认识)。会模糊对事物本质的认识)。会模糊对事物本质的认识)。会模糊对事物本质的认识)。 即时思考:即时思考:即时思考:即时思考: 有数据显示世界各国平均每人拥有电视机数有数据显示世界各国平均每人拥有电视机数有数据显示世界各国平均每人拥有电视机数有数据显示世界各国平均每人拥有电视机数x x x x及居民及居民及居民及居民预期寿命预期寿命预期寿命预期寿命y y y y之间有很强的正相关,可否认为电视机很多之间有很强的正相关,可否认为电视机很多之间有很强的正相关,可否认为电视机很多之间有很强的正相关,可否认为电视机很多的国家,居民预期寿命比较长?的国家,居民预期寿命比较长?的国家,居民预

24、期寿命比较长?的国家,居民预期寿命比较长? 有人测试出火灾现场的消防员人数和该场火灾造成的有人测试出火灾现场的消防员人数和该场火灾造成的有人测试出火灾现场的消防员人数和该场火灾造成的有人测试出火灾现场的消防员人数和该场火灾造成的损害之间有很强的正相关损害之间有很强的正相关损害之间有很强的正相关损害之间有很强的正相关 ,可否认为派出的消防员越可否认为派出的消防员越可否认为派出的消防员越可否认为派出的消防员越多造成的损害越大多造成的损害越大多造成的损害越大多造成的损害越大 ? (二)相关关系的种类(二)相关关系的种类单相关(一元相关)单相关(一元相关)单相关(一元相关)单相关(一元相关):两个现象

25、之间的相关两个现象之间的相关两个现象之间的相关两个现象之间的相关复相关(多元相关)复相关(多元相关)复相关(多元相关)复相关(多元相关):两个以上现象之间的相关两个以上现象之间的相关两个以上现象之间的相关两个以上现象之间的相关 正正正正相相相相关关关关:现现现现象象象象之之之之间间间间的的的的变变变变化化化化方方方方向向向向一一一一致致致致,即即即即一一一一个个个个现现现现象象象象的的的的数数数数量增加或减少,另一个现象的数量随之增加或减少。量增加或减少,另一个现象的数量随之增加或减少。量增加或减少,另一个现象的数量随之增加或减少。量增加或减少,另一个现象的数量随之增加或减少。 负负负负相相相

26、相关关关关:现现现现象象象象之之之之间间间间的的的的变变变变化化化化方方方方向向向向不不不不一一一一致致致致,即即即即一一一一个个个个现现现现象象象象的的的的数量增加或减少,另一个现象的数量随之减少或增加。数量增加或减少,另一个现象的数量随之减少或增加。数量增加或减少,另一个现象的数量随之减少或增加。数量增加或减少,另一个现象的数量随之减少或增加。直线(线性)相关:直线(线性)相关:直线(线性)相关:直线(线性)相关:一一一一个个个个现现现现象象象象的的的的数数数数量量量量每每每每变变变变动动动动一一一一个个个个单单单单位位位位,另另另另一一一一个个个个现现现现象象象象随随随随之之之之每每每每

27、次都发生大致均等的变动,散点分布近似一条直线。次都发生大致均等的变动,散点分布近似一条直线。次都发生大致均等的变动,散点分布近似一条直线。次都发生大致均等的变动,散点分布近似一条直线。曲线(非线性)相关:曲线(非线性)相关:曲线(非线性)相关:曲线(非线性)相关:一一一一个个个个现现现现象象象象的的的的数数数数量量量量每每每每变变变变动动动动一一一一个个个个单单单单位位位位,另另另另一一一一个个个个现现现现象象象象随随随随之之之之发发发发生不均等的变动,散点分布近似某种曲线。生不均等的变动,散点分布近似某种曲线。生不均等的变动,散点分布近似某种曲线。生不均等的变动,散点分布近似某种曲线。 相关

28、关系的种类相关关系的种类相关关系的种类相关关系的种类一元相关一元相关一元相关一元相关多元相关多元相关多元相关多元相关负相关负相关负相关负相关正正正正 相相相相 关关关关线性相关线性相关线性相关线性相关曲线相关曲线相关曲线相关曲线相关xy正线性正线性正线性正线性相关相关相关相关xy负线性负线性负线性负线性相关相关相关相关xy曲线相关曲线相关曲线相关曲线相关xy不不不不 相相相相 关关关关进行相关分析的一般程序:进行相关分析的一般程序:定性分析定性分析定量分析定量分析相关表和相关图相关表和相关图计算相关系数计算相关系数和判定系数和判定系数二、二、 相关关系的测定相关关系的测定相相相相关关关关表表表

29、表是是是是表表表表现现现现具具具具有有有有相相相相关关关关关关关关系系系系的的的的现现现现象象象象(变变变变量量量量)之之之之间间间间数数数数量量量量取取取取值值值值的的的的表表表表格格格格。一一一一般般般般将将将将成成成成对对对对数数数数据据据据依依依依其其其其中中中中一一一一个个个个变变变变量量量量按大小顺序排列,另一个变量对应排列而成。按大小顺序排列,另一个变量对应排列而成。按大小顺序排列,另一个变量对应排列而成。按大小顺序排列,另一个变量对应排列而成。但但但但仅仅仅仅能能能能对对对对现现现现象象象象作作作作大大大大体体体体初初初初步步步步观观观观测测测测,当当当当涉涉涉涉及及及及多多多

30、多个个个个影影影影响响响响因素时制表较困难。因素时制表较困难。因素时制表较困难。因素时制表较困难。相相相相关关关关图图图图(散散散散点点点点图图图图)将将将将两两两两现现现现象象象象(或或或或多多多多个个个个现现现现象象象象)对对对对应应应应的的的的样样样样本本本本观观观观测测测测值值值值标标标标绘绘绘绘到到到到坐坐坐坐标标标标轴轴轴轴上上上上所所所所作作作作的的的的图图图图形形形形称称称称为为为为散散散散点点点点图。图。图。图。(一)相关表和相关图(一)相关表和相关图能源消耗能源消耗量与工量与工业总产业总产值的相值的相关表关表能源消耗量能源消耗量(十万吨)(十万吨)工业总产值工业总产值(亿元

31、)(亿元)能源消耗量能源消耗量(十万吨)(十万吨)工业总产值工业总产值(亿元)(亿元)3524624138256440402465474228685049326949523171515437724859407658能源消耗能源消耗量与工业量与工业总产值相总产值相关图关图 19191919个个个个发发发发达达达达国国国国家家家家一一一一年年年年的的的的葡葡葡葡萄萄萄萄酒酒酒酒消消消消耗耗耗耗量量量量以以以以及及及及一一一一年年年年中中中中因因因因心心心心脏病死亡的人数资料(选自脏病死亡的人数资料(选自脏病死亡的人数资料(选自脏病死亡的人数资料(选自统计学的世界统计学的世界统计学的世界统计学的世界

32、):):):):国家国家国家国家从从从从 葡葡葡葡 萄萄萄萄酒酒酒酒 摄摄摄摄 取取取取的的的的 酒酒酒酒 精精精精(升)(升)(升)(升)心心心心脏脏脏脏病病病病死死死死亡亡亡亡率率率率(每每每每十十十十万万万万人人人人死死死死亡人数)亡人数)亡人数)亡人数)国家国家国家国家从从从从 葡葡葡葡 萄萄萄萄酒酒酒酒 摄摄摄摄 取取取取的的的的 酒酒酒酒 精精精精(升)(升)(升)(升)心心心心脏脏脏脏病病病病死死死死亡亡亡亡率率率率(每每每每十十十十万万万万人人人人死死死死亡人数)亡人数)亡人数)亡人数)澳大利亚澳大利亚澳大利亚澳大利亚2.52.52.52.5211211211211荷兰荷兰荷兰

33、荷兰1.81.81.81.8167167167167奥地利奥地利奥地利奥地利3.93.93.93.9167167167167新西兰新西兰新西兰新西兰1.91.91.91.9266266266266比利时比利时比利时比利时/ / / /卢森堡卢森堡卢森堡卢森堡2.92.92.92.9131131131131挪威挪威挪威挪威0.80.80.80.8227227227227加拿大加拿大加拿大加拿大2.42.42.42.4191191191191西班牙西班牙西班牙西班牙6.56.56.56.586868686丹麦丹麦丹麦丹麦2.92.92.92.9220220220220瑞典瑞典瑞典瑞典1.61.61

34、.61.6207207207207芬兰芬兰芬兰芬兰0.80.80.80.8297297297297瑞士瑞士瑞士瑞士5.85.85.85.8115115115115法国法国法国法国9.19.19.19.171717171英国英国英国英国1.31.31.31.3285285285285冰岛冰岛冰岛冰岛0.80.80.80.8211211211211美国美国美国美国1.21.21.21.2199199199199爱尔兰爱尔兰爱尔兰爱尔兰0.70.70.70.7300300300300德国德国德国德国2.72.72.72.7172172172172意大利意大利意大利意大利7.97.97.97.9107

35、107107107 19191919个个个个发发发发达达达达国国国国家家家家一一一一年年年年的的的的葡葡葡葡萄萄萄萄酒酒酒酒消消消消耗耗耗耗量量量量以以以以及及及及一一一一年年年年中中中中因因因因心心心心脏病死亡的人数的相关图脏病死亡的人数的相关图脏病死亡的人数的相关图脏病死亡的人数的相关图身高与足迹长度的相关图身高与足迹长度的相关图身高与足迹长度的相关图身高与足迹长度的相关图(二)相关系数(二)相关系数(1 1 1 1)相关系数相关系数相关系数相关系数是对变量之间关系密切程度的度量;是对变量之间关系密切程度的度量;是对变量之间关系密切程度的度量;是对变量之间关系密切程度的度量;(2 2 2

36、2)总体总体总体总体相关系数:相关系数:相关系数:相关系数:反映总体的相关程度,根据总体全反映总体的相关程度,根据总体全反映总体的相关程度,根据总体全反映总体的相关程度,根据总体全部数据计算,部数据计算,部数据计算,部数据计算, 通常用通常用通常用通常用“”表示;表示;表示;表示; 样本相关系数样本相关系数样本相关系数样本相关系数:反映样本的相关程度,根据样本数:反映样本的相关程度,根据样本数:反映样本的相关程度,根据样本数:反映样本的相关程度,根据样本数据计算据计算据计算据计算。(3 3 3 3)单单单单相关系数:相关系数:相关系数:相关系数:反映两个变量之间的相关程度;反映两个变量之间的相

37、关程度;反映两个变量之间的相关程度;反映两个变量之间的相关程度; 复复复复相关系数:相关系数:相关系数:相关系数:反映两个以上变量之间的相关程度。反映两个以上变量之间的相关程度。反映两个以上变量之间的相关程度。反映两个以上变量之间的相关程度。(4 4 4 4)直直直直线线线线相相相相关关关关系系系系数数数数(通通通通常常常常简简简简称称称称为为为为相相相相关关关关系系系系数数数数):反反反反映映映映变变变变量量量量之间直线相关关系的密切程度;之间直线相关关系的密切程度;之间直线相关关系的密切程度;之间直线相关关系的密切程度; 曲曲曲曲线线线线相相相相关关关关系系系系数数数数(也也也也称称称称为

38、为为为非非非非线线线线性性性性相相相相关关关关系系系系数数数数或或或或相相相相关关关关指指指指数数数数)反映变量之间曲线相关关系的密切程度。反映变量之间曲线相关关系的密切程度。反映变量之间曲线相关关系的密切程度。反映变量之间曲线相关关系的密切程度。(5 5 5 5)直线相关直线相关直线相关直线相关系数系数系数系数的取值范围是的取值范围是的取值范围是的取值范围是 -1,1-1,1-1,1-1,1| | | |r r r r|=1|=1|=1|=1,完全线性相关;,完全线性相关;,完全线性相关;,完全线性相关;r r r r = 0= 0= 0= 0,没有线性相关,没有线性相关,没有线性相关,没有

39、线性相关-1-1-1-1 r r r r 0000,负线性相关;,负线性相关;,负线性相关;,负线性相关;0000 t t t t,拒绝,拒绝,拒绝,拒绝H H H H0 0 0 0;若;若;若;若 t t t t t (n-2)或或P-值值 ,拒绝,拒绝H0;反;反之,不能拒绝之,不能拒绝H0。前例,在前例,在前例,在前例,在=0.05=0.05=0.05=0.05的显著性水平下,可计算得:的显著性水平下,可计算得:的显著性水平下,可计算得:的显著性水平下,可计算得: 拒拒拒拒绝绝绝绝HH0 0,总总总总体体体体回回回回归归归归系系系系数数数数显显显显著著著著不不不不为为为为0 0 0 0,

40、说说说说明明明明总总总总体体体体两两两两变变变变量量量量(每每每每千千千千个个个个驾驾驾驾驶驶驶驶执执执执照照照照中中中中发发发发生生生生死死死死亡亡亡亡事事事事故故故故的的的的车车车车祸祸祸祸次次次次数数数数和和和和有有有有驾驾驾驾驶驶驶驶执执执执照照照照的的的的司司司司机机机机中中中中21212121岁岁岁岁以以以以下下下下者者者者所所所所占占占占比比比比例例例例)之之之之间间间间的的的的线线线线性性性性影影影影响响响响关关关关系是显著的,样本回归方程是有效的。系是显著的,样本回归方程是有效的。系是显著的,样本回归方程是有效的。系是显著的,样本回归方程是有效的。1 1、提出假设:提出假设:

41、二、回归方程的显著性检验(二、回归方程的显著性检验(二、回归方程的显著性检验(二、回归方程的显著性检验(f f f f检验)检验)检验)检验)2 2、确定检验统计量:确定检验统计量:3、确定显著性水平、确定显著性水平 ,找出临界值,找出临界值F (1,n-2)或计或计算算P-值;值;4、作出决策:若、作出决策:若F F 或或P-值值 ,拒绝,拒绝H0;反之不能;反之不能拒绝拒绝H0。 检检检检验验验验统统统统计计计计量量量量中中中中,分分分分子子子子的的的的方方方方差差差差(回回回回归归归归平平平平方方方方和和和和除除除除以以以以其其其其自自自自由由由由度度度度1 1 1 1)是是是是x x

42、x x对对对对y y y y的的的的线线线线性性性性影影影影响响响响所所所所产产产产生生生生的的的的;分分分分母母母母的的的的方方方方差差差差(剩剩剩剩余余余余平平平平方方方方和和和和除除除除以以以以其其其其自自自自由由由由度度度度n-2n-2n-2n-2)是是是是除除除除去去去去x x x x的的的的线线线线性性性性影影影影响响响响外的其他因素及随机因素所产生的。外的其他因素及随机因素所产生的。外的其他因素及随机因素所产生的。外的其他因素及随机因素所产生的。 分分分分子子子子越越越越大大大大,二二二二者者者者的的的的比比比比值值值值F F F F值值值值就就就就越越越越大大大大,说说说说明明

43、明明x x x x对对对对y y y y的的的的线线线线性性性性影影影影响响响响就就就就越越越越大大大大,变变变变量量量量间间间间线线线线性性性性相相相相关关关关性性性性越越越越显显显显著著著著;若若若若x x x x对对对对y y y y无无无无影影影影响响响响,则则则则 F=0F=0F=0F=0,故故故故F F F F分分分分布布布布是是是是以以以以0 0 0 0为为为为原原原原点点点点的的的的右右右右偏偏偏偏斜斜斜斜分分分分布布布布;检验是右侧检验。检验是右侧检验。检验是右侧检验。检验是右侧检验。 F F分布分布分布分布F F (k-1,n-k)(k-1,n-k)0 0拒绝拒绝拒绝拒绝H

44、H0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F如果如果如果如果如果如果y y y yy y估计值估计值估计值估计值估计值估计值=y=y=y=y=y=y平均值平均值平均值平均值平均值平均值F=SSR/SSEF=SSR/SSEF=SSR/SSE0 00检验与检验与检验与检验与 t t t t 检验的一致性检验的一致性检验的一致性检验的一致性 在一元线性回归分析中,回归方程的检验等价于回在一元线性回归分析中,回归方程的检验等价于回归系数的检验。对于同一样本资料,检验与归系数的检验。对于同一样本资料,检验与 t t 检检验的结果完全一致,有:验的结果完全一致,有: 但多元回

45、归中,二者有所不同(略)。但多元回归中,二者有所不同(略)。EXCELEXCELEXCELEXCEL对于前例,对于前例,在在=0.05=0.05的显著性水平下,可计算得:的显著性水平下,可计算得: 拒绝拒绝拒绝拒绝H H H H0 0 0 0,总体回归系数显著不为总体回归系数显著不为总体回归系数显著不为总体回归系数显著不为0 0 0 0,说明总体两变量,说明总体两变量,说明总体两变量,说明总体两变量(发生死亡事故的车祸次数和司机中(发生死亡事故的车祸次数和司机中(发生死亡事故的车祸次数和司机中(发生死亡事故的车祸次数和司机中21212121岁以下者所占岁以下者所占岁以下者所占岁以下者所占比重比

46、重比重比重)之间的线性关系是显著的,所拟合的线性回归之间的线性关系是显著的,所拟合的线性回归之间的线性关系是显著的,所拟合的线性回归之间的线性关系是显著的,所拟合的线性回归方程具有方程具有方程具有方程具有95959595的置信概率。的置信概率。的置信概率。的置信概率。三、回归预测三、回归预测1 1、就是根据自变量、就是根据自变量 x x 的一定值来估计或预测因变量的一定值来估计或预测因变量 y y 的可能值;经检验认为有意义的回归方程,可进行的可能值;经检验认为有意义的回归方程,可进行内插预测。内插预测。2 2、估计或预测的类型、估计或预测的类型点预测点预测点预测点预测: : : :给定给定x

47、=xox=xo,因变量,因变量 y y 对应的点预测为:对应的点预测为:区间预测:区间预测:区间预测:区间预测:在在1-1- 置信水平下,因变量置信水平下,因变量 y y 对应的对应的预测区间为预测区间为大样本的置信区间大样本的置信区间x x0 0y yx x置信上限置信上限置信上限置信上限置信下限置信下限置信下限置信下限 x x小样本的小样本的置信区间置信区间x x0 0y yx x x x置信上限置信上限置信上限置信上限置信下限置信下限置信下限置信下限*影响估计区间宽度的因素影响估计区间宽度的因素1 1 1 1、置置置置信信信信水水水水平平平平1-1-1-1- :区区区区间间间间宽宽宽宽度

48、度度度随随随随置置置置信信信信水水水水平平平平1-1-1-1- 的的的的增增增增大大大大而而而而增大;增大;增大;增大;2 2 2 2、回回回回归归归归估估估估计计计计标标标标准准准准差差差差 (Se)(Se)(Se)(Se):区区区区间间间间宽宽宽宽度度度度随随随随变变变变量量量量间间间间离离离离散散散散程程程程度度度度的增大而增大;的增大而增大;的增大而增大;的增大而增大;3 3 3 3、样本容量、样本容量、样本容量、样本容量 n n n n:区间宽度随样本容量的增大而减小;:区间宽度随样本容量的增大而减小;:区间宽度随样本容量的增大而减小;:区间宽度随样本容量的增大而减小;4. 4. 4

49、. 4. 用用用用于于于于预预预预测测测测的的的的 x x x xo o o o与与与与 x x x x 的的的的差差差差异异异异程程程程度度度度:区区区区间间间间宽宽宽宽度度度度随随随随x x x xo o o o与与与与 x x x x 的差异程度的增大而增大。的差异程度的增大而增大。的差异程度的增大而增大。的差异程度的增大而增大。3 3、如果两个变量是互为因果关系的,要反映、如果两个变量是互为因果关系的,要反映y y对于对于x x的线性影响关系,根据的线性影响关系,根据y y的确定值估计的确定值估计x x,应另外建应另外建立立y y倚倚x x的回归方程:的回归方程:而不能根据而不能根据倒

50、推。倒推。l l应用回归估计(预测)时注意:应用回归估计(预测)时注意:1 1、内插效果优于外推效果,不宜外推太远;、内插效果优于外推效果,不宜外推太远;2 2、用于拟合回归方程的数据不能太少;、用于拟合回归方程的数据不能太少;qq因因因因变变变变量量量量 y y y y 与与与与 x x x x 之之之之间间间间不不不不是是是是线线线线性性性性关关关关系系系系;可可可可通通通通过过过过变变变变量量量量代代代代换换换换转转转转换换换换成成成成线线线线性性性性关关关关系系系系;用用用用最最最最小小小小二二二二乘乘乘乘法法法法求求求求出出出出参参参参数的估计值数的估计值数的估计值数的估计值qq并非

51、所有的非线性模型都可以化为线性模型并非所有的非线性模型都可以化为线性模型并非所有的非线性模型都可以化为线性模型并非所有的非线性模型都可以化为线性模型第四节可线性化的回归方程第四节可线性化的回归方程一、可线性化的常用曲线类型一、可线性化的常用曲线类型一、可线性化的常用曲线类型一、可线性化的常用曲线类型两端取对数得:两端取对数得:两端取对数得:两端取对数得:lnlnlnlny y y y = = = = lnlnlnln + + + + x x x x令:令:令:令:y y y y = = = = lnlnlnlny y y y,则有,则有,则有,则有y y y y = = = = lnlnlnl

52、n + + + + x x x x 指数函数指数函数指数函数指数函数(Exponent)(Exponent) 幂函数幂函数幂函数幂函数( ( ( (PowerPower) ) ) )基本形式:基本形式:基本形式:基本形式:00 1 1 1 1 = 1= 1-1-1 0 0 -1 -1 =-1 =-1 线性化方法线性化方法线性化方法线性化方法两端取对数得:两端取对数得:两端取对数得:两端取对数得:log log y y = log= log + + loglog x x令:令:令:令:y y = log = logy y,x x = log = log x x,则则则则y y = log= lo

53、g + + x x 双曲线函数双曲线函数双曲线函数双曲线函数( ( ( (InverseInverse) ) ) ) 0 0 0令:令:令:令:y y = 1/ = 1/y y,x x = 1/= 1/x x, , 则有则有则有则有y y = = + + x x 对数函数对数函数对数函数对数函数( ( ( (LogarithmLogarithm) ) ) )x x = = loglogx x , , 则有则有则有则有y y = = + + x x 0 0 0 0 说说说说明明明明变变变变量量量量间间间间的的的的非非非非线线线线性性性性相相相相关关关关程程程程度度度度,当当当当两两两两变变变变量

54、量量量为为为为完完完完全全全全线线线线性性性性相关时,该相关指数公式等同于积差法相关系数公式。相关时,该相关指数公式等同于积差法相关系数公式。相关时,该相关指数公式等同于积差法相关系数公式。相关时,该相关指数公式等同于积差法相关系数公式。相关指(系)数的取值范围:相关指(系)数的取值范围:相关指(系)数的取值范围:相关指(系)数的取值范围:二、非线性相关系数二、非线性相关系数二、非线性相关系数二、非线性相关系数( ( ( (相关指数相关指数相关指数相关指数) ) ) )和判定系数和判定系数和判定系数和判定系数 非线性相关系数非线性相关系数非线性相关系数非线性相关系数不能判明现象的相关方向,用于测不能判明现象的相关方向,用于测不能判明现象的相关方向,用于测不能判明现象的相关方向,用于测定直线相关时,定直线相关时,定直线相关时,定直线相关时,符号由回归系数或定性分析确定符号由回归系数或定性分析确定符号由回归系数或定性分析确定符号由回归系数或定性分析确定非线性判定系数非线性判定系数非线性判定系数非线性判定系数

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号