相关与回归分析课件

上传人:鲁** 文档编号:590222542 上传时间:2024-09-13 格式:PPT 页数:58 大小:988.42KB
返回 下载 相关 举报
相关与回归分析课件_第1页
第1页 / 共58页
相关与回归分析课件_第2页
第2页 / 共58页
相关与回归分析课件_第3页
第3页 / 共58页
相关与回归分析课件_第4页
第4页 / 共58页
相关与回归分析课件_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《相关与回归分析课件》由会员分享,可在线阅读,更多相关《相关与回归分析课件(58页珍藏版)》请在金锄头文库上搜索。

1、第第7 7章章 相关与回归分析相关与回归分析12第一节第一节 数据的相关分析数据的相关分析(一)双变量相关关系的含义(一)双变量相关关系的含义3一、双变量相关一、双变量相关关系的含义和种类关系的含义和种类函数关系函数关系相关关系相关关系现象之间确定性的数量依存关系现象之间非确定性的数量依存关系(二)双变量相关关系的种类4一、双变量相关一、双变量相关关系的含义和种类关系的含义和种类相关关系的种类相关方向正相关和负相关相关形式线性相关和非线性相关相关程度完全相关、不完全相关和不相关 【例7-1】歌乐音响设备商店于2014年79三个月份中,连续10周使用了周末电视广告来提高商店的销售额。商店经理想调

2、查这段时间内播出的广告次数和店内销售额之间是否存在某种关系。 问题:如果该经理将这项工作交给你,你该怎样做呢?5二、二、双变量相关双变量相关关系的测度方法关系的测度方法(一)(一)相关表相关表法法 1. 1.编制编制原始数据表原始数据表如下如下表表 7-1 7-1 立体声音响设备商店的原始数据立体声音响设备商店的原始数据 6二、双变量相关关系的测度方法二、双变量相关关系的测度方法周次广告次数下一周销售额(百元) 1 2 3 4 5 6 7 8 91011251341534250574154543863485946 2 2. .将原始数据表编制成相关表将原始数据表编制成相关表 表表7-2 7-2

3、 立体声音响设备商店的广告次数与销售额相关表7二、双变量相关关系的测度方法二、双变量相关关系的测度方法广告次数销售额(百元) 1 1 2 2 3 3 4 4 5 5384146504854545963(二)相关图法(二)相关图法 8二、双变量相关关系的测度方法二、双变量相关关系的测度方法图图7-1 立体声音响设备商店数据散点图立体声音响设备商店数据散点图 (三)相关系数法(三)相关系数法 相关系数相关系数是用以是用以衡量两变量间线性相关关系衡量两变量间线性相关关系情况下,相关方向和密切程度的相对数。情况下,相关方向和密切程度的相对数。9二、双变量相关关系的测度方法二、双变量相关关系的测度方法1

4、.1.相关系数相关系数的计算的计算 样本相关系数的定义公式样本相关系数的定义公式10二、双变量相关关系的测度方法二、双变量相关关系的测度方法(7.1)11样本数据的简捷公式样本数据的简捷公式12总体数据的相关系数总体数据的相关系数7-27-2 根据表根据表7-27-2相关数据,利用样本数据计算相相关数据,利用样本数据计算相关系数。关系数。132.相关系数的应用a.相关系数的取值范围 的取值在-1和1之间,即 b.正负相关的判断 当 0时为正相关;当 0时为负相关。14c.相关密切程度的判断 当 时,相关关系越密切,当 说明X与Y之间完全相关,即函数关系;当 时, 相关关系越不密切,当 =0,说

5、明X与Y之间不存在直线相关关系,但也许存在非线性相关关系。 15在做具体判断时,有几个数量标准:在做具体判断时,有几个数量标准: ,称为微弱相关。一般情况下,将其视为没有线性相关关系; 0.3 ,称为低度相关;0.5 ,称为显著相关; 0.8 ,称为高度相关。 16 计算结果表明,歌乐立体音响设备商店在过去10周内,周末所做的广告次数与下一周的销售额之间存在着高度线性正相关关系。17对对上面上面计算结果的统计分析计算结果的统计分析18第二节第二节 简单线性回归模型简单线性回归模型 只涉及两个变量(一个自变量和一个因变量)之只涉及两个变量(一个自变量和一个因变量)之间关系的回归分析称为间关系的回

6、归分析称为简单简单回归分析回归分析。 两两个个变变量量之之间间的的关关系系大大约约呈呈一一条条直直线线的的简简单单回回归归分析称为分析称为简单线性回归简单线性回归分析分析。19 用回归分析可以预测运行一条商业航空线的成本吗? 如果可以,那么哪些变量与这一成本有关呢?20一、从一个实际问题一、从一个实际问题入手入手21飞机运行成本飞机型号飞行距离乘客数量乘客数量行李或货物重量天气状况 为了为了减少自变量个数,我们做如下假定:减少自变量个数,我们做如下假定: 飞机飞机类别类别波音波音737飞机飞机 飞行飞行距离距离500公里公里 航线航线可比,而且在每年的相同季节可比,而且在每年的相同季节 在在这

7、这种种条条件件下下,可可以以用用乘乘客客数数来来预预测测飞飞行行的的成成本吗?本吗?22 表表7-3是是每年相同季节波音每年相同季节波音737飞机在飞机在12条条500公里公里的不同航线不同乘客数时的飞行成本。我们用这些数的不同航线不同乘客数时的飞行成本。我们用这些数据以乘客数作为自变量构造模型来预测成本。据以乘客数作为自变量构造模型来预测成本。 2324(7.4) 25二、回归模型和二、回归模型和回归方程回归方程:因变量(随机变量):因变量(随机变量) :自变量(给定变量):自变量(给定变量) :参数:参数 :误差项(随机变量),含义为说明在:误差项(随机变量),含义为说明在 中不能中不能被

8、被 和和 之间线性关系解释的变异性。之间线性关系解释的变异性。 在有关 假设中,有一个假设就是的期望值或均值等于0,即 26(7.5) 如果简单线性回归模型满足了这个条件,那如果简单线性回归模型满足了这个条件,那么就意味着么就意味着 的均值或期望值就是一个线性函数。的均值或期望值就是一个线性函数。 描述描述 的均值与的均值与 的关系如何的方程称为的关系如何的方程称为回归方程回归方程。 在简单线性回归中 1.回归方程的图形是一条直线(如图7.3所示); 27(7.6) 283. :斜率(回归系数); 292. : 的截距;的截距; 的的含含义义:当当自自变变量量 给给定定一一个个具具体体变变动动

9、值值时时,因因变量变量 平均平均变化的量。变化的量。3031 估计回归方程估计回归方程 就是用样本统计量作为参数的估计值所建立的回归方程。 32三、估计回归方程三、估计回归方程 (7.7) : 的估计值的估计值: 的估计值的估计值 : 的估计值的估计值 33 最小最小平方平方法,法,也称最小二乘法最小二乘法,是将回归模型的方差之和最小化,以得到一系列方程,从这些方程中解出模型中需要的参数的一种方法。 34四、四、 最小平方法最小平方法 (一)画散点图,以初步观察成本与乘客数量之间是否呈回归直线。 35 (二)建立估计回归方程36(7.8) 最最小小平平方方法法运运用用样样本本数数据据求求出出

10、和和 的的值值,使使得得因因变变量量的的实实际际观观察察值值 与与其其估估计计值值 之之差差的的平平方方和最小,即和最小,即(7.9) (三)估计回归方程斜率和截距的计算公式37(7.11)38394041 (四)将(四)将 和和 的计算结果代入式的计算结果代入式(7.8)有:有: 计算结果表明,在其他条件相同情况下,计算结果表明,在其他条件相同情况下,12条条航线上波音航线上波音737飞机各条航线每次飞行时每增加飞机各条航线每次飞行时每增加1名名乘客,将会使飞行成本平均增加乘客,将会使飞行成本平均增加40.70元。元。 结论:结论:42*Y = 4.48千元二者差千元二者差0.061千元或千

11、元或61元。元。测定系数估计标准误差43五、五、 一元线性回归方程的评价一元线性回归方程的评价(一)测定系数 回归直线与各观测数据的接近程度称回归直线与各观测数据的接近程度称为回归直线的为回归直线的拟合优度拟合优度。 度量回归直线的拟合优度最常用的指度量回归直线的拟合优度最常用的指标是标是测定系数测定系数,(又称,(又称可决系数可决系数、判定系数判定系数)。 该指标是建立在对总离差平方和进行该指标是建立在对总离差平方和进行分解的基础之上的。分解的基础之上的。 4445离差分解图离差分解图xyy离差分解图两端平方后求和有两端平方后求和有46离差平方和的分解离差平方和的分解总离差平方和(SST)回

12、归平方和(SSR)残差平方和(SSE)(7.12)(7.13)(7.14) R R2 2的取值范围是的取值范围是00,11。 R R2 2越接近于越接近于1 1,表明回归平方和占总离差平,表明回归平方和占总离差平方和的比例越大,回归直线与各观测点越接近,回方和的比例越大,回归直线与各观测点越接近,回归直线的拟合程度就越好。归直线的拟合程度就越好。 在在一元线性回归中,相关系数一元线性回归中,相关系数r r的平方等的平方等于判定系数,符号与自变量于判定系数,符号与自变量x x的系数一致。因此可的系数一致。因此可以根据回归结果求出相关系数。以根据回归结果求出相关系数。 47决定系数的取值决定系数的

13、取值1.1.残差残差 残差残差是因变量的观察值y和因变量的估计值 之间的偏差。48 例如,上面的例子, (7.15)49表表表表7-57-5残差残差残差残差计算表计算表计算表计算表 残差平方的总和称为残差平方的总和称为误差平方和误差平方和(SSE)。)。 502.2.误差平方和误差平方和 (7.16) SSE的值是用估计回归方程估计样本中因变量的的值是用估计回归方程估计样本中因变量的值时所产生误差的一种测度。值时所产生误差的一种测度。 因变量的值与其均值之间离差的平方和称为总离差平方和总离差平方和(SST)。513.3.总总离差平方和离差平方和(7.17) 因变量的值与其估计值之间离差的平方和

14、称为回归平方和回归平方和(SSR)。 524.4.回归平方和回归平方和 (7.18) 表7-6 计算表 53例如;例如;例如;例如;飞行成本案例中各种有关数据计算如下飞行成本案例中各种有关数据计算如下飞行成本案例中各种有关数据计算如下飞行成本案例中各种有关数据计算如下由表7-6计算结果可知,SSE = 0.31434,SSR = 2.79775,SST = 3.11209,则 54 这就是说,在一条商业航线上一架波音这就是说,在一条商业航线上一架波音737飞机飞机飞行成本的方差中有飞行成本的方差中有89.9%可以被乘客数目说明或预可以被乘客数目说明或预测,换句话说,飞行成本测,换句话说,飞行成

15、本Y的方差中不能由的方差中不能由X或回归方或回归方程解释的有程解释的有10.1%。 55 估计标准误估计标准误:是对各观测数据在回归直线周围分散程度的一个度量值,它是对误差项的标准差的估计。 估计估计标准误反映了用估计的回归方程拟合因变标准误反映了用估计的回归方程拟合因变量量Y Y时平均误差的大小。时平均误差的大小。各观测数据越靠近回归直线,各观测数据越靠近回归直线,s sy y 就越小,回归直线对各观就越小,回归直线对各观测数据的代表性就越好。测数据的代表性就越好。与与R R2 2不同的是,估计标准误是一个有单位的平均数。不同的是,估计标准误是一个有单位的平均数。56(二)估计(二)估计标准误标准误(7.19)在飞行成本的案例中:sse=0.31414 n=1257【统计分析】计算结果表明,在12条商业航线上,每架波音737飞机在飞行500公里和其他条件相同情况下,其飞行成本与它们的平均飞行成本平均相差117.3元。 计算结果表明,波音计算结果表明,波音737飞机在相同季节飞机在相同季节12条航条航线上,乘客数量与运行成本之间存在线性高度的正线上,乘客数量与运行成本之间存在线性高度的正相关关系。相关关系。 58

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号