实验一“家家有房”公司建筑许可证多元线性回归分析

上传人:xins****2008 文档编号:113583419 上传时间:2019-11-09 格式:DOC 页数:24 大小:3.41MB
返回 下载 相关 举报
实验一“家家有房”公司建筑许可证多元线性回归分析_第1页
第1页 / 共24页
实验一“家家有房”公司建筑许可证多元线性回归分析_第2页
第2页 / 共24页
实验一“家家有房”公司建筑许可证多元线性回归分析_第3页
第3页 / 共24页
实验一“家家有房”公司建筑许可证多元线性回归分析_第4页
第4页 / 共24页
实验一“家家有房”公司建筑许可证多元线性回归分析_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《实验一“家家有房”公司建筑许可证多元线性回归分析》由会员分享,可在线阅读,更多相关《实验一“家家有房”公司建筑许可证多元线性回归分析(24页珍藏版)》请在金锄头文库上搜索。

1、统计预测与决策实验指导书统计与信息学院数量经济教研室 2014年7月课程实验要求统计预测与决策课程要求学生掌握统计预测与决策的基本概念、预测的基本思路和方法,以及各种预测模型的建立、检验、预测、分析的方法,并能运用所学方法、利用相关软件对实际问题进行建模分析。在教学中应注意理论与应用并重,在理论部分,重在基本原理和方法思路,同时也应强调模型应用,并加强综合练习,锻炼学生理论、方法和应用的综合能力。据此在正常教学课时之中,特配备8学时的实验课时,使学生在教师指导下练习在计算机上怎样使用相关软件对各种预测方法进行分析、建模。要说明的是,要想熟练掌握统计预测与决策这种统计分析方法在计算机上利用软件就

2、某些实际问题进行具体实现,8学时的实验课时是不够的,还需要学生自己课后多练习。实验课课时:8学时,每次课2学时,共4次课。实验课地点:由学校统一安排使用的软件:Excel、EViews实验案例说明:以下所有案例为示范案例,实验教师可根据需要选用合适的数据和案例让学生进行各期实验。实验一 时间序列平滑预测法一、实验目的:熟悉Excel软件有关命令的使用方法,练习利用Excel软件采用简单一次移动平均、二次移动平均、一次指数平滑、二次指数平滑等方法对给定数据进行预测并比较不同的预测方法或选取不同的移动步长、选取不同的平滑系数时的预测精度,最后给出最适合的预测方法(及选取的合适的移动步长或平滑系数)

3、。二、实验内容及实验基本步骤:实验基本步骤如下:1. 对所给数据做数据图,观察序列特点;2. 对所给数据选择合适的移动平均法进行预测(简单一次或二次移动平均,选用不同的移动步长考查预测精度);3. 对所给数据选择合适的指数平滑法进行预测(简单一次或二次指数平滑,选用不同的平滑系数考查预测精度。);4. 对上两种预测方法的预测精度进行分析实验基本内容如下:一、利用简单一次移动平均进行预测1.数据如下:2. 移动平均法预测:移动平均计算公式:;误差:在“C5、D5” 单元格分别输入求3项移动平均公式和误差平方公式并向下复制。如下:在“E5、F5” 单元格分别输入求4项移动平均公式和误差平方公式并向

4、下复制。分别在“D17、F17” 单元格计算误差:,3. 比较预测精度,结果说明3项移动平均比4项移动平均好。4. 绘出移动平均法的图形:二、利用简单一次指数平滑进行预测1. 指数平滑法的计算形式如下;误差:数据如下: 在“C2” 单元格输入初始值S0(1)=50,“C3、D2” 单元格分别输入求指数平滑值公式和误差平方公式并向下复制。2. 同样的计算方法可以计算、的情形。3. 分别在“D14、F14、H14” 单元格计算误差:,以比较的取值。4. 绘出图形:三、利用二次移动平均法进行预测1. 二次移动平均计算公式如下:,2.模型参数计算形式:, 3. 按计算估计值和预测误差:四、利用二次指数

5、平滑法进行预测1. 二次指数平滑法计算公式:, 进行两次指数平滑如下:2.模型参数计算形式: 3. 按计算估计值和预测误差:9. 整理完成实验报告实验二 曲线模型趋势外推预测法一、实验目的:掌握曲线模型趋势外推预测法在计算机上的实现,熟悉相关软件的有关操作。二、实验基本内容和基本步骤如下:1. 数据如下: 要求用曲线趋势外推预测法,预测公司2007年7月会员卡的发行量2. 绘制散点图,观察数据特点,选择合适的曲线模型所示在单元格a1:c15中布置好公司从2006年5月至2007年6月的会员卡发行数据。绘制公司从2006年5月至2007年6月共14个月的会员卡发行量的折线图,结果如下。从曲线的形

6、状看,它先上升较快后上升较慢,符合对数曲线的特征,因此我们可以选用对数趋势模型进行预测。3. 添加曲线模型趋势线。 如上图所示,在图中选中数据系列,右键菜单中选择“添加趋势线”,出现“添加趋势线”对话框。 在“添加趋势线”对话框的“类型”中选择“对数”。 在“添加趋势线”对话框的“选项”中选中“显示公式”和“显示r平方值” 选择添加趋势线功能添加趋势线对话框添加趋势线选项对话框2006年5月至2007年6月会员卡发行量和对数趋势线4. 趋势线前推法大致预测非线性趋势值。选定对数趋势线,右键菜单中选择“趋势线格式”,出现 “趋势线格式”对话框。 在“趋势线格式”对话框中选定“选项”,将趋势预测前

7、推1周期,得到如下图所示的大致预测结果。 由此趋势线可见,公司2007年7月的会员卡发行量预测值约为25万张。 5. 用方程或函数准确预测非线性趋势值。根据得到的方程公式y=7.7785ln(x)+3.7651,如图3-38所示,在单元格c16中输入公式:“=7.7785*ln(a16)+3.7651”,即将x=15(2007年7月为第15个时间序列点)代入公式,计算得到2007年7月的会员卡发行预测值为24.83万张。6. 将预测结果在图中表示。 趋势线前推只能在图中看到大致预测结果,而上图所示,可在图中看到准确的预测值,且预测值一定在趋势线的延伸线上。7. 详细记录每一步所用的命令,以及查

8、看结果的方法和具体结果,整理完成实验报告。实验三 季节变动预测法一、实验目的:掌握季节变动预测法在Excel中实现的基本方法,熟悉Excel的有关操作。二、实验基本内容和基本步骤如下:1. 数据如下:注意要使。2. 直线模型的计算资料: 计算趋势值;计算3. 计算季节指数:把H列重新排列,消除随机因素,并进行调整。4. 按季节指数和趋势值预测:5. 详细记录每一步所用的命令,以及查看结果的方法和具体结果,整理完成实验报告。实验四 回归预测法一、实验目的:掌握利用软件建立、估计并检验多元线性回归模型的方法,并能在给定自变量的情况下,根据多元线性回归模型预测被解释变量的值。二、实验基本内容和基本步

9、骤如下:1. 数据如下:问题背景:“家家有房”开发公司的王经理根据上表数据,经过研究发现:建筑许可证的颁发数量既与每平方公里的人口密度有着密切的关系,也与自由房屋的均值有着密切的关系,同时还与平均家庭收入也有关系,现要求建立一个模型,用来预测建筑许可证的颁发数量,并给出当每平方英里的人口密度为7000时,自由房屋的均值为300时,平均家庭收入为800千元时,预测出建筑许可证的颁发数量是多少?(通过excel中的“加载宏”加载“规划求解”和“数据分析”工具。)2. 建立合适的多元线性回归模型根据实验要求,我们确定因变量为建筑许可证的颁发数量(y),因变量为每平方公里的人口密度(x1)、自由房屋的

10、均值(x2)与平均家庭收入(x3),假设多元线性模型为: y=A+B1*x1+B2*x2+B3*x3+u。3. 根据数据绘制几个变量的关系散点图图1 建筑许可证数量与每平方公里人口密度的散点图这个问题涉及到三个候选自变量,每平方公里的人口密度(x1)、自由房屋的均值(x2)与平均家庭收入(x3)。首先分别对每个候选自变量绘制与因变量建筑许可证的颁发数量关系的散点图。图2 建筑许可证数量与自由房屋的均值的散点图图3 建筑许可证数量与平均家庭收入的散点图4. 进行回归分析分别对这三个候选变量做回归分析报告,根据值,找出最优的变量。这里我们采用向前增选法,先给出建筑许可证的颁发数量与三个候选变量之间

11、的回归分析报告,分别见图4、图5和图6。 图4 许可证数量与人口密度的回归分析报告图5 许可证数量与自由房屋均值的回归分析报告图6 许可证数量与平均家庭收入的回归分析报告关于几个统计量的分析: 1)(adjust r square):这个参数用于对一个自变量的线性回归时必须考察的参数。一般情况下,对于一元线性回归,是我们考察的主要指标,如果大于0.5,我们一般就可以接受因变量与自变量之间的线性关系,越大表示线性关系越高。在图4-图6中,平均家庭收入的最大,为0.95178136,而自由房屋的均值的最小,为0.872939546。从三份回归分析报告中的值可知平均家庭收入(x3)与建筑许可证颁发数

12、量的线性关系最强,所以我们可以确定平均家庭收入(x3)为多元回归模型中必须考虑的自变量之一。 在这里,我们要注意,回归分析报告只能对线性关系的方案求解参数。如果我们对一个非线性关系的方案,想采用回归分析报告的方法来求解参数的话,必须先进行转换,将非线性方程转换为线性方程。 2)标准误差se:单元格l7中的标准误差为因变量的估计值与观测值之间的标准误差,其计算公式为:(其中n为观测点的个数,此处为18,在单元格l8中显示出来)。关于“方差分析”的分析: t统计量:对于自变量“每平方公里的人口密度”,其t统计量为21.33,其p值为 ,表明自变量系数b的真实值为0的可能性几乎为0,远远小于显著水平

13、(显著水平=1-置信度),说明该自变量与因变量是相关的,回归方程有效。对于一元线性回归,在方差分析时,只要考察t统计量即可。 在单元格a17中表示的是回归方程的截距,也就是参数a,单元格a18中表示的是回归方程的斜率,即参数b。5. 根据调整后的值确定回归分析所要采用的两元自变量根据图4图6中的结果,发现平均家庭收入的最大,因此平均家庭收入一定在包含两个候选自变量的子集里,下面分别做建筑许可证的颁发数量与每平方公里人口密度x1,平均家庭收入x3及自由房屋的均值x2,平均家庭收入x3之间的回归分析报告,分别见图7与图8。图7 建筑许可证数量与人口密度及平均家庭收入的回归分析报告图8 建筑许可证数

14、量与自由房屋均值及平均家庭收入回归分析报告分析与解释:1)调整后的(adjust r square):这个参数用于对多自变量的回归方案进行比较时代替来判断拟合优度,如果调整后的R2越大,表明这几个自变量与因变量的线性相关性越强,我们比较一下图7与图8中调整后的,发现图8中调整后的值比图9中调整后的大,为0.973825753,因此变量每平方公里人口密度x1,平均家庭收入x3要比变量自由房屋的均值x2,平均家庭收入x3与建筑许可证的颁发数量的线性相关性要强。我们再将此调整后的值和许可证数量与平均家庭收入的一元线性拟合优度值(0.95178136)相比,显然前者更大,说明两元变量(每平方公里人口密度x1,平均家庭收入x3)要比一元变量(平均家庭收入x3)与建筑许可证的颁发数量的线性相关性更强。所以我们确定将变量(每平方公里人口密度x1,平均家庭收入x3)为多元回归模型中必须考虑的两个自变量。 2)F统计量:F统计量可以用来确定自变量的全体与因变量之间的关系是否显著,也就是我们通常所说的回归方程的解释能力如何。在实际应用中,通过F统计量的p值来进行判断,即在预先选取的显著性水平下进行回归分析的统计检验。如果对于自变量,其F统计量的p值小于

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号