第八章_回归

上传人:今*** 文档编号:111394954 上传时间:2019-11-02 格式:PPT 页数:44 大小:2.04MB
返回 下载 相关 举报
第八章_回归_第1页
第1页 / 共44页
第八章_回归_第2页
第2页 / 共44页
第八章_回归_第3页
第3页 / 共44页
第八章_回归_第4页
第4页 / 共44页
第八章_回归_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《第八章_回归》由会员分享,可在线阅读,更多相关《第八章_回归(44页珍藏版)》请在金锄头文库上搜索。

1、第八章_回归分析,8.1 回归分析基础 8.2 用Excel进行回归分析处理 8.3 上机实验八 用Excel进行回归分析,回归和相关已成为统计学中最基本的概念之一,其分析方法已是最标准、最常用的统计工具之一。从狭义上看,相关分析的任务主要是评判现象之间的相关程度高低以及相关的方向,而回归分析则是在相关分析的基础上进一步借用数学方程将那种显著存在的相关关系表示出来,从而使这种被揭示出的关系具体化并可运用于实践中去。从广义的角度去理解相关和回归,此时回归分析就包含着相关分析。,【实例描述】,1887年生物统计学家高尔顿在研究豌豆和人体的身高遗传规律时,首先提出“回归”的思想 。1888年他又引入

2、“相关”(Correlation)的概念。原来,他在研究人类身高的遗传时发现,不管祖先的身高是高还是低,成年后代的身高总有向一般人口的平均身高回归的倾向。,8.1 回归分析基础,8.1.1 一元线性回归 8.1.2 多元线性回归 8.1.3 逐步回归,8.1.1 一元线性回归,回归分析最简单的情形是一个自变量和一个因变量,且它们有线性关系,这叫一元线性回归,即模型为YABX,这里X是自变量,Y是因变量,是随机误差,通常假定随机误差的均值为0,方差为2(20),2与X的值无关。 A和B为未知待估的总体参数,又称其为回归系数。,8.1.1 一元线性回归,如何根据样本资料去估计就成为回归分析的基本任

3、务。由此可以假设样本的回归方程如下:,、,上式中, 、和分别为Y、A和B的估计值,8.1.1 一元线性回归,例8-1:为研究某类企业的生产量和单位成本之间的关系,现随机抽取10个企业,得如下数据(见表8-1):,根据该资料,经计算可得表8-2:,8.1.1 一元线性回归,由上表资料,可得:,这样就可以得到生产量(x)和单位成本(y)之间的样本回归方程,8.1.2 多元线性回归,总体的多元线性回归方程为,总体回归方程一般未知,需要通过样本去估计。设估计方程为,上式中,、b1、b2、bk称为回归系数,其中,bi(i=1,2,,k)又称为偏回归系数,它表示当其它自变量均为零时,xi每变化一个单位对因

4、变量影响的数值。,8.1.2 多元线性回归,设样本为(x1,x2,xk,y),利用最小二乘法可估计出回归方程中的参数,即要求,=最小值,当k=2可解得:,8.1.2 多元线性回归,例8-2:为研究某商品的需求量、价格、消费者收入三者之间的关系,经调查得如表8-3所示资料:,根据上表资料,可得如表8-4的回归计算表:,8.1.2 多元线性回归,据表中数据,如果设需求量(y)与收入(x1)及价格(x2)之间的回归方程为:,8.1.2 多元线性回归,8.1.3 逐步回归,逐步回归分析的主要计算步骤如下: (1)确定F检验值 (2)逐步计算 如果已计算t步(包含t0), 且回归方程中已引入l个变量,

5、则第t+1步的计算为: 计算全部自变量的贡献V(偏回归平方和)。 在已引入的自变量中, 检查是否有需要剔除的不显著变量。 在已引入的变量中选取具有最小V值的一个并计算其F值, 如果FF2,则不需要剔除变量, 这时则考虑从未引入的变量中选出具有最大V值的一个并计算F值, 如果FF1, 则表示该变量显著, 应将其引人回归方程, 计算转至。 如果F = F1, 表示已无变量可选入方程, 则逐步计算阶段结束, 计算转人(3) 剔除或引人一个变量后, 相关系数矩阵进行消去变换, 第t+1步计算结束。其后重复计算。 (3)其他计算, 主要是回归方程入选变量的系数、复相关系数及残差等统计量的计算,8.2 用

6、EXCEL进行回归分析处理,8.2.1相关函数 8.2.2 Excel回归分析工具,8.2.1相关函数,1线性回归函数LINEST 功能 :运算结果返回一线性回归方程的参数,即当已知一组混合成本为Y因变量序列值、N组Xi有关自变量因素的数量序列值时,函数返回回归方程的系数mi(i=1,2n单位变动成本)和常数b(固定成本或费用)。 多元回归方程模型则为:y=m1x1m2x2mnxnb。,8.2.1相关函数,语法:LINEST (known_ys, known_xs, const, stats)。其中Known_ys 是关系表达式 y = mx + b 中已知的 y 值集合;Known_xs是关

7、系表达式 y = mx + b 中已知的可选 x 值集合;Const 为一逻辑值,用于指定是否将常量 b 强制设为 0;Stats为一逻辑值,指定是否返回附加回归统计值。,8.2.1相关函数,附加回归统计值如下:,8.2.1相关函数,例8-3:计算柯布-道格拉斯生产函数(Cobb-Douglas ):lnQ = lnA + a lnL + b lnK,式中Q为产出,L和K分别表示劳动和资本投入量,A表示平均生产技术水平, a和b分别是Q相对于L和K的弹性。使用下表的统计数据,求线性回归参数A, a, b。,8.2.1相关函数,8.2.1相关函数,(1)建立“线性回归”工作表,如图8-1所示。,

8、图8-1 “线性回归”工作表,8.2.1相关函数,(2)在单元格E1中输入“ln(Q)”,在单元格F1中输入“ln(L)” ,在单元格G1中输入“ln(K)”。 (3)选中单元格E2,输入公式“=LN(B2)”,复制公式到单元区域E3:E19;选中单元格F2,输入公式“=LN(C2)”,复制公式到单元区域F3:F19;选中单元格G2,输入公式“=LN(D2)”,复制公式到单元区域G3:G19。 (4)将E2:E19定义为因变量,将F2:G19定义为自变量,选中单元格A20,在单元格中输入“回归分析”。 (5)选中单元区域A21:C25,插入统计函数“LINEST”,在函数参数Known_ys中

9、输入“E2:E19”,在参数Knowm_xs中输入“F2:G19”,在参数Const中输入值“TRUE”,在参数Stats中输入值“TRUE”。如图8-2所示。,8.2.1相关函数,图8-2 函数LINEST参数对话框,8.2.1相关函数,(4)按Ctrl + Shift + Enter将返回值以数组形式显示,输出结果如图8-3所示。,图8-3 回归分析输出结果,8.2.1相关函数,由回归计算得线性回归参数 LnA=-6.2119,a=2.437547,b=0.8577589,保留四位小数得柯布-道格拉斯生产函数lnQ= -16.2119+2.4375lnL+0.8578lnK。,8.2.1相

10、关函数,2索引取值函数index 如果只想要返回值中的指定项,则可以用索引取值index函数。 语法格式:INDEX(单元格区域或数组常量,行序号,列序号);功能:使用索引从单元格区域或数组中选取值。可用该函数在LINEST函数返回系数序列数组表中根据所需数据所处的行列位置定位选取。,8.2.1相关函数,3四舍五入函数ROUND 语法格式:ROUND(数字,小数位数);功能:将数字四舍五入到指定的小数位数。由于LINEST函数的返回值为6位小数,用此函数指定保留的小数位数。 例如在需要的位置输入“=ROUND(INDEX(LINEST(Y,X,TRUE,TRUE),1,4),2)”,则表示取l

11、inest函数返回的数组的第1行第4列的数据,并保留2位小数。,8.2.2 Excel回归分析工具,例8-4:某溶液浓度正比对应于色谱仪器中的峰面积,现欲建立不同浓度下对应峰面积的标准曲线以供测试未知样品的实际浓度。已知8组对应数据如下所示,建立标准曲线,并且对此曲线进行评价,给出分析数据。=0.01,8.2.2 Excel回归分析工具,(1)建立“溶液浓度”工作表,如图8-4所示。,图8-4 “溶液浓度”工作表,8.2.2 Excel回归分析工具,(2)选择成对的数据列,将它们使用“X、Y散点图”制成散点图,如图8-5所示。,图8-5 X、Y散点图,8.2.2 Excel回归分析工具,(3)

12、选中数据点,单击右键,选择“添加趋势线”-“线性”,并在选项标签中要求给出公式和相关系数等,可以得到拟合的直线。如图8-68-8所示。,图8-6 “添加趋势线”-“线性”对话框,图8-7 “添加趋势线”选项,8.2.2 Excel回归分析工具,图8-8 趋势线及其公式,由图中可知,拟合的直线是y=1639.5x-200.89, R2的值为0.9961。,8.2.2 Excel回归分析工具,为了进一步使用更多的指标来描述这一个模型,可以使用数据分析中的“回归”工具来详细分析这组数据。 (1)打开“溶液浓度”工作表,在“工具”菜单中选择“数据分析”命令,选择“回归”分析工具。 (2)单击确定按钮,

13、打开“回归”分析工具对话框。在输入选项Y值输入区域中输入$B$1:$B$9,X值输入区域中输入$A$1:$A$9,选中“标志”、“常数为零”选项;在输出选项中选择输出区域,本例中不妨选择输出区域为$D$1;选择“残差”、“正态分布”选项,如图8-9所示。,8.2.2 Excel回归分析工具,图8-9 “回归”分析工具对话框,8.2.2 Excel回归分析工具,(3)单击“确定”按钮。“回归”工具为我们提供了三张图,分别是残差图、线性拟合图和正态概率图,输出结果如图8-10所示。,图8-10 “回归”分析工具输出结果,8.2.2 Excel回归分析工具,Excel回归分析工具的输出结果包括3个部

14、分: 1回归统计表 回归统计表包括以下几部分内容: (1)Multiple R:是R2的平方根,又称为相关系数,用来衡量变量x和y之间相关程度的大小。上例中R为0.999076,表示二者之间的关系是高度正相关的。 (2)R Square:用来说明自变量解释因变量变差的程度,以测定因变量y的拟合效果。,8.2.2 Excel回归分析工具,(3)Adjusted R Square:仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。 (4)标准误差:用来衡量拟

15、合程度的大小,也用于计算与回归相关的其他统计量,值越小说明拟合程度越好。 (5)观测值:用于估计回归方程的数据的观测值个数。,8.2.2 Excel回归分析工具,2方差分析表 方差分析表的主要作用是通过F检验来判断回归模型的回归效果。 3回归参数表 回归参数表主要用于回归方程的描述和回归参数的推断。 如图8-10所示的回归参数表中第16行和第17行分别是截距和谐率的各项指标,第二列是具体的值,据此可以写出回归方程。第三列是各个回归系数的P值,最后是置信区间的上下限。 从计算结果中可得到回归方程:y=1627.15x。,8.3 上机实验八 用Excel进行回归分析,一、实验目的及要求 1了解回归

16、分析与相关分析的不同点,了解回归分析的基本方法。 2能用Excel相关函数求回归方程。 3会用Excel回归分析工具对数据进行回归分析,理解回归分析的输出结果,并能根据回归分析工具的输出结果正确写出回归方程。,8.3 上机实验八 用Excel进行回归分析,二、实验内容 (一)确定企业年设备能力与年劳动生产率的关系 某市电子工业公司有14个所属企业,各企业的年设备能力与年劳动生产率统计数据如下表。试分析企业年设备能力与年劳动生产率的关系。若该公司计划新建一个设备能力为9.2千瓦/人的企业,估计劳动生产率将为多少?,8.3 上机实验八 用Excel进行回归分析,(二)测定某矿脉的金属含量 一矿脉有13个相邻样本点,人为地设定一个原点,现测得各样本点与原点的距离x,与该样本点处某种金属含量y的一组数据如下:,试建立合适的回归模型。(首先画散点图),【小 结】,本章主要介绍回归分析的概念与一元线

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号