《第九章相关与回归ppt课件全》由会员分享,可在线阅读,更多相关《第九章相关与回归ppt课件全(33页珍藏版)》请在金锄头文库上搜索。
1、第九章第九章 回归分析与相关分析回归分析与相关分析9.19.1相关分析概述相关分析概述9.29.2一元线性回归分析一元线性回归分析相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是构造各具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、种经济模型、进行结构分析、政策评价、预测和控制的重要工具。预测和控制的重要工具。一、相关分析的意义一、相关分析的意义二、相关关系的测定二、相关关系的测定9.19.1相关分析概述相关分析概述 出租汽车费用与行驶里程:出租
2、汽车费用与行驶里程: 总费用总费用=行驶里程行驶里程 每公里单价每公里单价 家庭收入与恩格尔系数:家庭收入与恩格尔系数: 家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。函数关系函数关系(确定性关系)(确定性关系)相关关系相关关系(非确定性关系)(非确定性关系)比较下面两种现象间的依存关系比较下面两种现象间的依存关系现象间的依存关系大致可以分成两种类型:现象间的依存关系大致可以分成两种类型:函数关系函数关系指现象间所具有的严格的确定性指现象间所具有的严格的确定性的依存关系的依存关系相关关系相关关系指客观现象间确实存在,但数量指客观现象间确实存在,但数量上不是严格对应的依存关系上不是严格
3、对应的依存关系函数关系与相关关系之间并无严格的界限:有函数函数关系与相关关系之间并无严格的界限:有函数函数关系与相关关系之间并无严格的界限:有函数函数关系与相关关系之间并无严格的界限:有函数关系的变量间,由于有测量误差及各种随机因素的关系的变量间,由于有测量误差及各种随机因素的关系的变量间,由于有测量误差及各种随机因素的关系的变量间,由于有测量误差及各种随机因素的干扰,可表现为相关关系;对具有相关关系的变量干扰,可表现为相关关系;对具有相关关系的变量干扰,可表现为相关关系;对具有相关关系的变量干扰,可表现为相关关系;对具有相关关系的变量有深刻了解之后,相关关系有可能转化为或借助函有深刻了解之后
4、,相关关系有可能转化为或借助函有深刻了解之后,相关关系有可能转化为或借助函有深刻了解之后,相关关系有可能转化为或借助函数关系来描述。数关系来描述。数关系来描述。数关系来描述。相关分析的意义相关分析的意义按涉及变量的多少分为按涉及变量的多少分为相相关关关关系系的的种种类类按照表现形式不同分为按照表现形式不同分为按照变化方向不同分为按照变化方向不同分为一元相关一元相关多元相关多元相关直线相关直线相关曲线相关曲线相关负相关负相关正相关正相关相关分析的意义相关分析的意义一、相关分析的意义一、相关分析的意义二、相关关系的测定二、相关关系的测定9.19.1相关分析概述相关分析概述定性分析定性分析是依据研究
5、者的理论知识和实践经是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关验,对客观现象之间是否存在相关关系,以及何种关系作出判断关系,以及何种关系作出判断定量分析定量分析在定性分析的基础上,通过编制在定性分析的基础上,通过编制相相关表关表、绘制、绘制相关图相关图、计算、计算相关系数相关系数与与判定系数判定系数等方法,来判断现象之等方法,来判断现象之间相关的方向、形态及密切程度间相关的方向、形态及密切程度相关关系的测定相关关系的测定简单简单相关表相关表适用于所观察的样本单位数适用于所观察的样本单位数较少,不需要分组的情况较少,不需要分组的情况分组分组相关表相关表适用于所观察的样本单位数适
6、用于所观察的样本单位数较多标志变异又较复杂,需较多标志变异又较复杂,需要分组的情况要分组的情况将现象之间的相互关系,用将现象之间的相互关系,用表格的形式来反映。表格的形式来反映。相关表相关表正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy又称又称散点图散点图,用直角坐标系的,用直角坐标系的x轴代表自变量,轴代表自变量,y轴代表因变量,将两个变量间相对应的变量轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。点分布状况的图形。相关图相关图在在直线相关直线相关的条件下,用以反映的条件下
7、,用以反映两变量两变量间间线线性相关性相关密切程度的统计指标,用密切程度的统计指标,用r表示表示相关系数相关系数相关系数相关系数r r的取值范围:的取值范围:-1r1-1r1r0 为为正相关,正相关,r 0 为负相关;为负相关;|r|=0 表示不存在表示不存在线性线性关系;关系;|r|1 表示表示完全完全线性线性相关;相关;0|r|1表示存在表示存在不同程度线性相关:不同程度线性相关: |r| 0.4 为低度线性相关;为低度线性相关; 0.4 |r| 0.7为显著性线性相关;为显著性线性相关; 0.7|r| 1.0为高度显著性线性相关。为高度显著性线性相关。是相关系数的平方,用是相关系数的平方
8、,用 表表示;用来衡量回归方程对示;用来衡量回归方程对y y的的解释程度。解释程度。判定系数取值范围:判定系数取值范围: 越接近于越接近于1 1,表明,表明x x与与y y之间之间的相关性越强;的相关性越强; 越接近于越接近于0 0,表明两个变量之间几乎没有直,表明两个变量之间几乎没有直线相关关系线相关关系. .判定系数判定系数【例】【例】计算工业总产值与能源消耗量之间的相计算工业总产值与能源消耗量之间的相关系数及判定系数关系数及判定系数 资料资料结论:结论:工业总产值与能源消耗量之间存工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量在高度的正相关关系,能源消耗量x的变的变化能够解释
9、工业总产值化能够解释工业总产值y变化的变化的95.2。第九章第九章 相关与回归分析相关与回归分析9.19.1相关分析概述相关分析概述9.29.2一元线性回归分析一元线性回归分析一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差9.29.2一元线性回归分析一元线性回归分析回归分析与相关分析回归分析与相关分析q理论和方法具有一致性;理论和方法具有一致性;q无相关就无回归,相关程度越高,回无相关就无回归,相关程度越高,回归越好;归越好;q 相关系数和回归系数方向一致,可相关系数和回归系数方向一致,可以互相推算。以互相推算。联系:联系:q相关分
10、析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要要确定自变量和因变量;确定自变量和因变量;q相关分析中相关分析中x、y均为随机变量,回归分析均为随机变量,回归分析中只有中只有y为随机变量;为随机变量;q相关分析测定相关程度和方向,回归分析相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。用回归模型进行预测和控制。回归分析与相关分析回归分析与相关分析区别:区别:回归分析的种类回归分析的种类一元回归一元回归(简单回归)(简单回归)多元回归多元回归(复回归复回归)线性回归线性回归非线性回归非线性回归一一 元元线线性性回回归归Simple Linear regression
11、按自变量的按自变量的 个数分个数分按回归曲线按回归曲线的形态分的形态分一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差9.29.2一元线性回归分析一元线性回归分析一元线性回归方程的几何意义一元线性回归方程的几何意义截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0一元线性回归方程一元线性回归方程中参数中参数a、b的确定:的确定:最小平方法最小平方法基本数学要求:基本数学要求:整理得到由两个关于整理得到由两个关于a、b的二元一次的二元一次方程组成的方程组:方程组成的方程组:进一步整理,有:进
12、一步整理,有:【分析】因为工业总产值与能源消耗量之间存【分析】因为工业总产值与能源消耗量之间存在高度正相关关系(在高度正相关关系( ),),所以可以拟合工业总产值对能源消耗量的线性所以可以拟合工业总产值对能源消耗量的线性回归方程。回归方程。【例】【例】建立工业总产值对能源消耗量的线建立工业总产值对能源消耗量的线性回归方程性回归方程 资料资料解:设解:设线性回归方程为线性回归方程为即线性回归方程为:线性回归方程为:计算结果表明,在其他条件不变时,能源消耗计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将量每增加一个单位(十万吨),工业总产值将增加增加0.79610.
13、7961个单位(亿元)。个单位(亿元)。b与与r的关系:的关系: r0 r0 r=0b0 b0 b=0判定系数与相关系数的关系判定系数与相关系数的关系判定系数与相关系数的区别:判定系数与相关系数的区别:q判定系数判定系数无方向性,无方向性,相关系数相关系数则有方向,则有方向,其方向与样本回归系数其方向与样本回归系数 b 相同;相同;q判定系数判定系数说明变量值的总离差平方和中说明变量值的总离差平方和中可以用回归线来解释的比例,可以用回归线来解释的比例,相关系数相关系数只说明两变量间关联程度及方向;只说明两变量间关联程度及方向;q相关系数相关系数有夸大变量间相关程度的倾向,有夸大变量间相关程度的
14、倾向,因而因而判定系数判定系数是更好的度量值。是更好的度量值。一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差9.29.2一元线性回归分析一元线性回归分析回归估计标准差回归估计标准差是因变量各实际值与其估计值之间的是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实平均差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计方程的代表性越强,用回归方程估计或预测的结果越准确。或预测的结果越准确。在大样本条件下,可用公式计算:在大样本条件下,可用公式计算:【
15、例】【例】计算前面拟合的工业总产值对能源消耗计算前面拟合的工业总产值对能源消耗量回归方程的回归标准差量回归方程的回归标准差 资料资料企业编号企业编号月产量(千吨)月产量(千吨)X生产费用(万元)生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用八个同类工业企业的月产量与生产费用简单相关表简单相关表平均每昼平均每昼夜产量夜产量 固定资产原值固定资产原值35404045455050555560606565706006501 1550600123500550213450500151740045
16、0224350400030035022223543120(百万元)(百万元)(吨)(吨)20个同类工业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量分组相关表分组相关表序号序号能源消耗量能源消耗量(十万吨)(十万吨)x工工业总产值(亿元)元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合合计916625550862617537887