《统计学基础》任务7:相关与回归

上传人:飞*** 文档编号:57432384 上传时间:2018-10-21 格式:PPT 页数:49 大小:980.50KB
返回 下载 相关 举报
《统计学基础》任务7:相关与回归_第1页
第1页 / 共49页
《统计学基础》任务7:相关与回归_第2页
第2页 / 共49页
《统计学基础》任务7:相关与回归_第3页
第3页 / 共49页
《统计学基础》任务7:相关与回归_第4页
第4页 / 共49页
《统计学基础》任务7:相关与回归_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《《统计学基础》任务7:相关与回归》由会员分享,可在线阅读,更多相关《《统计学基础》任务7:相关与回归(49页珍藏版)》请在金锄头文库上搜索。

1、1,任务七 相关与回归分析,统计学基础,2/49,任务七 相关与回归分析,7.1 相关分析7.2 一元线性回归分析7.3 多元线性回归分析,学 习 目 标,3/49,学习要点,7.1 相关分析,任务七相关与回归分析,7.1.1 相关关系的含义7.1.2 相关关系的类型7.1.3 相关关系的判断方法7.1.4 Excel操作,4/49,7.1.1 相关关系的含义,任务七相关与回归分析,函数关系与相关关系,函数关系,相关关系,还是,?,7.1.1 相关关系的含义,任务七相关与回归分析,5/49,函数关系,一个变量的取值由另一个变量唯一确定,即变量间是一一对应的确定关系。,当变量 取某个数值时,依确

2、定的关系取相应的值, 则称 是 的函数,记为 。,各观测点都落在一条直线上,7.1.1 相关关系的含义,任务七相关与回归分析,6/49, 函数关系的例子 某种商品的销售额y与销售量x之间的关系可表示为 y = px (p 为固定单价) 圆的面积S与半径之间的关系可表示为S=R2,7.1.1 相关关系的含义,任务七相关与回归分析,7/49,相关关系(correlation),一个变量的取值不能由另一个变量唯一确定,当变量 取某个值时,变量 的取值可能有几个,各观测点分布在直线周围,7.1.1 相关关系的含义,任务七相关与回归分析,8/49, 相关关系的例子 父母身高 y 与子女身高 x 之间的关

3、系 收入水平 y 与受教育程度 x 之间的关系 商品的消费量 y 与居民收入 x 之间的关系 商品销售额 y 与广告费支出 x 之间的关系,7.1.1 相关关系的含义,任务七相关与回归分析,9/49,7.1.2 相关关系的类型,任务七相关与回归分析,7.1.2 相关关系的类型,任务七相关与回归分析,10/49,7.1.2 相关关系的类型,任务七相关与回归分析,11/49,定性分析,相关表,散点图,相关系数,测定 方法,7.1.3 相关关系的判断方法,任务七相关与回归分析,7.1.3 相关关系的判断方法,任务七相关与回归分析,12/49,定性分析,依赖于研究者的理论知识、经验和分析研究能力。,辨

4、别真相关和伪相关,7.1.3 相关关系的判断方法,任务七相关与回归分析,13/49,相关表是根据现象变动的样本资料编制出 来的反映变量间相互关系的统计表。,相关表,7.1.3 相关关系的判断方法,任务七相关与回归分析,14/49,7.1.3 相关关系的判断方法,任务七相关与回归分析,15/49,将两变量相对应的变量值用坐标点形式描绘出来用以表明相关关系的图形,称为相关图 利用相关图可以: 判断现象之间有无相关关系 观察相关关系的类型 观察相关关系的密切程度,相关图(或散点图),7.1.3 相关关系的判断方法,任务七相关与回归分析,16/49,7.1.3 相关关系的判断方法,任务七相关与回归分析

5、,17/49,相关系数(correlation coefficient),相关系数是说明两个变量之间在线性相关 条件下相关关系密切程度的统计分析指标.,若相关系数是根据总体全部数据计算的,称为总体相关系数,记为.,若是根据样本数据计算的,则称为样本相关系数,记为 .,7.1.3 相关关系的判断方法,任务七相关与回归分析,18/49,r的取值范围:0 r 1 当r0时, X与Y正相关 当r0时, X与Y负相关 当r0时, X与Y之间不存在线性相关关系 当r1时, X与Y之间完全正线性关系 当r-1时, X与Y之间完全负线性关系,相关系数的取值,7.1.3 相关关系的判断方法,任务七相关与回归分析

6、,19/49,0r0.3 ,X与Y弱线性相关 0.3r0.5 ,X与Y低度线性相关 0.5r0.8,X与Y显著线性相关 0.8r1,X与Y高度线性相关,相关系数的取值,7.1.3 相关关系的判断方法,任务七相关与回归分析,20/49,相关系数r的计算公式,7.1.3 相关关系的判断方法,任务七相关与回归分析,21/49,简捷公式:,7.1.3 相关关系的判断方法,任务七相关与回归分析,7.1.3 相关关系的判断方法,任务七相关与回归分析,7.1.3 相关关系的判断方法,任务七相关与回归分析,22/49,高度正相关,23/49,为什么进行相关系数的显著性检验?,r的显著性检验通常采用费希尔(R.

7、A.Fisher)提出的t分布检验。,相关系数的显著性检验,检验两个变量之间是否存在线性相关关系,7.1.3 相关关系的判断方法,任务七相关与回归分析,为什么进行相关系数的显著性检验?,r的显著性检验通常采用费希尔(R.A.Fisher)提出的t分布检验。,24/49,检验的步骤为: 提出假设:H0: ;H1: 0,计算检验的统计量:,确定显著性水平,并作出决策若tt,拒绝H0若tt,不能拒绝H0,相关系数的显著性检验,7.1.3 相关关系的判断方法,任务七相关与回归分析,25/49,运用Excel、SPSS等软件我们可以轻松地得到相关系数及其检验结果。,7.1.4 相关分析的Excel操作,

8、任务七相关与回归分析,7.1.4 相关分析的Excel操作,任务七相关与回归分析,26/49,将相关的两列数据输入Excel表格,“工具”,“相关系数”,散点图,相关系数,7.1.4 相关分析的Excel操作,任务七相关与回归分析,“数据分析”,“插入”,“散点图”,“图表”,27/49,学习要点,7.2 一元线性回归分析,任务七相关与回归分析,7.2.1 回归分析的含义7.2.2 一元线性回归方程7.2.3 参数的最小二乘估计7.2.4 拟合优度与显著性检验7.2.5 一元线性回归预测7.2.6 Excel操作,28/49,7.2.1 回归分析的含义,任务七相关与回归分析,回归分析,(Reg

9、ression),回归分析是对具有密切关系的两个变量,根据其相关形式,选择一个合适的数学关系式来近似地表现变量之间平均变化程度的一种统计分析方法。,7.2.1 回归分析的含义,任务七相关与回归分析,29/49,7.2.1 回归分析的含义,任务七相关与回归分析,回归分析与相关分析的联系,相关关系是回归分析的前提, 回归分析是相关分析的深入。,相关分析是回归分析的前提,对于相关程度很低的两个变量进行回归分析是没有实际意义的 回归分析是建立在相关分析的基础上,对于具有密切相关的两个变量进行深入分析,建立它们之间的数学关系式,并进行统计推断,是相关分析的拓展,30/49,7.2.1 回归分析的含义,任

10、务七相关与回归分析,回归分析的内容,从一组样本数据出发,估计回归参数,建立回归模型; 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度,31/49,7.2.2 一元线性回归方程,任务七相关与回归分析,7.2.2 一元线性回归方程,任务七相关与回归分析,7.2.2 一元线性回归方程,任务七相关与回归分析,7.2.2 一元线性回归方程,任务七相关与回归分析,32/49,涉及一个自变量的回归 因变量 y 与自变量 x 之间为线性关系 被

11、预测或被解释的变量称为因变量,用 y 表示 用来预测或用来解释因变量的一个或多个变量称为自变量,用 x 表示 因变量与自变量之间的关系用一个线性方程来表示,7.2.2 一元线性回归方程,任务七相关与回归分析,一元线性回归方程,33/49,一元线性回归方程可表示为,其中:a 是估计的回归直线在y轴上的截距;b 是直线的斜率,它表示 x 每变动一个单位时,y 的平均变动量x、y 是自变量和因变量的实际观察值是因变量的估计值,7.2.2 一元线性回归方程,任务七相关与回归分析,7.2.2 一元线性回归方程,任务七相关与回归分析,34/49,使因变量的观察值与估计值之间的离差平方和达到最小来求得 a

12、和 b 的方法。即,用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。,7.2.3 参数的最小二乘估计,任务七相关与回归分析,7.2.3 参数的最小二乘估计,任务七相关与回归分析,参数的最小二乘估计,35/49,7.2.3 参数的最小二乘估计,任务七相关与回归分析,36/49,7.2.3 参数的最小二乘估计,任务七相关与回归分析,37/49,7.2.3 参数的最小二乘估计,任务七相关与回归分析,表7-2-1,7.2.3 参数的最小二乘估计,任务七相关与回归分析,38/49,月销售收入与电视广告费用的回归方程,回归系数 b=5.37 表示电视广告投入每增加1万元,销

13、售收入平均增加5.37万元。,7.2.3 参数的最小二乘估计,任务七相关与回归分析,39/49,7.2.4 拟合优度与显著性检验,任务七相关与回归分析,1拟合优度,(1)判定系数R2,R2的取值范围是(0,1),越接近于1,表明回归直线拟合程度越好;反之,拟合程度越差。,在一元线性回归中,判定系数R2实际上是相关系数r的平方,相关系数与回归系数的正负号也是相同的。,(2)估计标准误差,一般:,15%,40/49,7.2.4 拟合优度与显著性检验,任务七相关与回归分析,根据表7-2-2,判定系数,估计标准误差,(万元),15%,41/49,7.2.4 拟合优度与显著性检验,任务七相关与回归分析,

14、2显著性检验,(1)F 检验,(2)t 检验,检验变量 x 和 y 之间的线性关系是否显著,检验自变量 x 对 因变量 y 的影响是否显著,Significance F ,表明自变量与因变量之间有显著的线性关系,P-value ,表明自变量对因变量的影响是显著的,通常取0.05或0.01,7.2.4 拟合优度与显著性检验,任务七相关与回归分析,42/49,利用Excel输出结果建立回归方程,并对回归方程的检验结果进行判断,上例中:,7.2.4 拟合优度与显著性检验,任务七相关与回归分析,根据表7-2-3和7-2-4判断,43/49,7.2.5 一元线性回归预测,任务七相关与回归分析,一元线性回

15、归预测的方法:,点估计,区间估计,一、点估计,点估计是利用估计的回归方程,给x一个特定值x0,求出y的一个估计值。,【例7-2-4】,将x0 =40带入方程,得销售额为:,(万元),44/49,7.2.5 一元线性回归预测,任务七相关与回归分析,二、区间估计,区间估计是利用估计的回归方程,给 x 一个特定值 x0 ,求出 y 的一个估计值区间。,1、置信区间:对 x 的给定值 x0 ,求 y 的平均值的估计区间,2、预测区间:对 x 的给定值 x0 ,求 y 的一个个别值的估计区间,45/49,7.2.6 Excel操作,任务七相关与回归分析,回归分析的Excel路径:,“工具” “数据分析”

16、 “回归”,46/49,任务七相关与回归分析,7.3 多元线性回归分析,7.3.1 多元线性回归模型,式中: 为因变量的估计值;为 k 个自变量;为常数项,是回归直线在 y 轴上的截距;为 k 个偏回归系数,是回归直线的斜率,表示当其他自变量取值不变时,自变量 每改变一个单位, 的平均变动量。,47/49,任务七相关与回归分析,7.3 多元线性回归分析,7.3.2 多元线性回归方程的拟合优度,多元判定系数R2,估计标准误差,48/49,任务七相关与回归分析,7.3 多元线性回归分析,7.3.3 多元线性回归方程的显著性检验,F检验,t 检验,检验 k 个自变量与因变量 y 之间的线性关系是否显著,检验 某 个自变量对因变量 y 的影响是否显著,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号