数据模型与决策概述.ppt

上传人:F****n 文档编号:96385925 上传时间:2019-08-25 格式:PPT 页数:37 大小:1.93MB
返回 下载 相关 举报
数据模型与决策概述.ppt_第1页
第1页 / 共37页
数据模型与决策概述.ppt_第2页
第2页 / 共37页
数据模型与决策概述.ppt_第3页
第3页 / 共37页
数据模型与决策概述.ppt_第4页
第4页 / 共37页
数据模型与决策概述.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《数据模型与决策概述.ppt》由会员分享,可在线阅读,更多相关《数据模型与决策概述.ppt(37页珍藏版)》请在金锄头文库上搜索。

1、数据、模型与决策,丁邦俊 13818068959 ,第六讲 回归模型,一名优秀的管理者具有的最重要的技能之一就是洞察商务数据的趋势以及基于这种趋势进行精确预测的能力。 依据历史数据及行业趋势,预测销售额、盈利、成本、金融工具和金融产品的价格走势 本章介绍一种强有力的基于数据的线性回归预测模型,其目标是建立一个变量(Y=生产成本)与其它相关变量(X1=劳动时间、X2=设备支出、X3=人力成本等)之间变化关系的具体公式。 需要掌握Excel或SPSS软件。,回归模型,例 广告支出与销售额,假设John对销售额与广告效果的分析感兴趣,他正在考虑把Apple-Glo产品引进到两个新区域,其中一个区域的

2、广告费用高达200万美元,而另一个区域为150万美元,John想要预测Apple-Glo产品在这两个区域中每个区域第一年销售额的期望值。,John Brode是J&T产品的营销经理,这是一家大型家用产品制造商,公司推出一种Apple-Glo的新产品,它是一种安全的家用清洁剂该产品已经被引进到东北销售区域,并在最近两年中花费了大量广告活动费用,见下表。,广告费用与销售额数据,广告费用与销售额数据,John想了解如下问题: 第一年的广告费用和第一年的销售额之间的关系如何?存在与这两个数量值有关的等式吗? 如果广告支出为150美元或200美元,那么第一年的销售额的期望值分别为多少? 关于销售额估计的

3、可靠性是多少?预测效果如何?,广告费用与销售额数据,利用Excel绘图功能,画出下列图形,广告费用与销售额数据,利用Excel回归分析功能,得到预测方程,初步结论,预测方程为Y= 48.597x + 13.824; 得到x=150万,Y=86.72万; x=200万,Y=111.02万。 R2 = 0.9296,得出两个结论: 一是模型拟合数据的效果是92.96%,话句话说,模型在多大程度上解释了数据呢,答案是92.96%,不能解释的部分为7.04%;另一个结论是,R=0.964,说明广告支出与销售额关系非常密切。,一元回归理论,对于一个因变量和一个自变量,先考察它们的相关系数r,在Excel

4、中的函数是corr(X,Y),只有相关系数足够大,才去研究它们回归关系,回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。 Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。,趋向中间高度的回归,孩子身高与父母身高的相关系数有多大,男孩成年身高=(父身高+母身高+13) 2 7.5厘米 女孩成

5、年身高=(父身高+母身高 -13) 2 6.0厘米,相关系数为 0.75,两种趋势的回归模型,一元线性回归模型,一个自变量的简单线性回归模型可表示为 y = b0 + b1 x + e 模型中,y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差 e 是随机变量,通常假设服从正态N(0,2) b0 和 b1称为模型的参数,最小二乘法,最小二乘法的几何解释,最小二乘解,Excel-数据分析-回归,输出结果解读,相关系数r=0.964,已经足够大,说明X与Y之间有很强的相关性,可以研究回归关系; 误差分布N(0,2) 中的=9.106; 模型检验:F对

6、应的P值=2.8410-8 0.05,应该拒绝原假设(注意:原假设是所以系数全为0); 系数检验:两个P值分别是0.03和0,说明截距和斜率都显著不等于0; 回归方程为Y=13.82+48.6x 最后截距的95%区间估计是1.67,25.98; 斜率的95%区间估计是40.18,57.01。,多元回归模型,多个自变量的线性回归模型可表示为 y = b0 + b1 x1 + b2 x2 + bk xk + e 模型中,y 是 xi 的线性函数(部分)加上误差项 线性部分反映了由于 xi 的变化而引起的 y 的变化 误差 e 是随机变量,通常假设服从正态N(0,2) b0 、 b1、b2、,bk称

7、为模型的参数.,最小二乘法,最小二乘法的几何解释,最小二乘解,多元线性回归模型的最小二乘解满足,该解Excel会自动给出。,一个二元回归的例子,Excel输出结果,Excel输出结果解读,回归模型显著性检验,回归模型诊断,模型的线性性:通过R2的大小检查 较高的 R2表示线性假设是合适的。,不合适,合适,回归模型诊断,误差的正态性:残差的直方图是不是正态,不合适,合适,回归模型诊断,异方差性:残差与每个自变量的散点图,不合适,合适,不合适,合适,回归模型诊断,自相关性,存在自相关 不合适,不存在自相关 合适,回归模型诊断,多重共线性,分析相关系数表 X1与x3存在共线性,银行不良贷款率,银行不良贷款率,首先看看相关系数表,银行不良贷款率,其次,分析是否存在多重共线性,X1与X3可以互相替代,X1与X4也是。,第三,Y与各个变量的相关性的强弱分析,发现Y与X1相关性最高,其次是X2,第四,若建立一元回归,应该建立Y与X1的回归方程;若建立二元回归,应该建立Y与X1、X2的回归方程;若建立三元回归,应该建立Y与X1、X3、X4的回归方程。,银行不良贷款率,通过分析,最佳模型是建立Y与X1、X2的二元回归,课后讨论题,案例分析9:美国国家税务局税额数据分析,谢 谢 !,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号