相关与回归分析技术

上传人:ni****g 文档编号:486906857 上传时间:2022-10-21 格式:DOC 页数:31 大小:935KB
返回 下载 相关 举报
相关与回归分析技术_第1页
第1页 / 共31页
相关与回归分析技术_第2页
第2页 / 共31页
相关与回归分析技术_第3页
第3页 / 共31页
相关与回归分析技术_第4页
第4页 / 共31页
相关与回归分析技术_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《相关与回归分析技术》由会员分享,可在线阅读,更多相关《相关与回归分析技术(31页珍藏版)》请在金锄头文库上搜索。

1、第七章 相关与回归分析技术【案例素材】阳光超市位于河北省某市,是该市的一个较大型的连锁超市。超市的总经理希望了解超市的总销售额受哪些因素的影响,进而决定应采取哪些措施来提高超市的销售额,提高超市的竞争力,达到战胜竞争对手的目的。总经理组织人员收集了该超市的各个连锁营业点某周六的销售额、该营业点经营面积及上周花费的促销费用等信息。总经理希望数据分析人员通过对这些数据的分析,找到该超市销售额的影响因素,为今后的决策提供必要的帮助,收集的各个营业点的数据如表7-1所示。表7-1 阳光超市各营业点的数据营业点编号销售额(万元)促销费用(万元)面积(百平方米)120.81.22 2.511.5352.2

2、1.34521.351021.56102.31.57222.528222.52.59212.4210212.6211282.5312222.52.613414414424.13.5154443.516454.33.517484.55.518464.4519474620484.17【任务导向】根据收集到的阳光超市各个营业点的数据,数据分析人员应当分析这些数据间的关系,建立数学模型,进而帮助总经理进行决策。需要完成的工作如下:1、绘制散点图初步了解各个变量间的关系2、通过相关分析描述各个变量间的关系3、通过回归分析建立相应的数学模型来描述各个变量间的关系4、帮助总经理进行决策第一节 相关分析技术任

3、何事物的存在都不是孤立的,而是相互联系、相互制约的。在实际经济问题中,某一经济行为常受多因素的影响和制约,调研人员经常利用相关分析来说明客观事物相互间关系的密切程度。接受这次数据分析任务的调研人员,首先对阳光超市提供的经营统计数据进行了相关分析,寻找影响超时营业额与竞争力的因素。一、确定相关变量数据分析员:总经理提供的阳光超市各营业点的统计数据,有销售额、促销费用、营业面积三个变量,它们之间是什么关系呢? 项目组长:只是看这些数据找不到准确的答案,需要采用一定的方法对这些数据进行定量分析,寻找这三个变量之间的关系。数据分析员:从数据看,好像都是增大的趋势。我感觉这些数据之间是有关系的,怎样才能

4、分析出它们之间的关系呢?项目组长:首先要明确分析的目的。数据分析员:按照总经理的要求,我们要分析销售额受哪些因素的影响。项目组长:这样的话,可以分别选择促销费用与销售额、营业面积与销售额,然后绘制散点图,初步看一下销售额同这两个因素之间的关系,再计算相关系数进行定量的判定与分析。1、相关分析方法大家都知道,商品的销售量与商品的价格、商品的质量以及消费者的收入水平等因素有关;又如果树的产量受施肥量、降雨量、气温等因素的影响。因此,要研究该经济行为就应从事物变化的因果关系出发,寻找它与其他因素之间的内在联系,这就是因果关系分析法。在因果关系分析法中最常用的方法之一就是回归分析法。回归分析法就是从各

5、种经济现象之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种分析方法。而相关分析对这些对等的经济数列,用相关系数测定反映它们之间变动的联系程度和联系方向。正确确定相关关系对回归分析具有决定性作用。2、确定相关变量这项工作的难点和重心是确定自变量,即确定影响和制约分析目标(因变量)的因素。确定自变量,既要对历史资料和现实调查资料进行分析,又要充分运用分析人员的经验和知识,进行科学的定性分析。要充分注意事物之间联系的复杂性,用系统思维的方式对复杂的关系进行系统分析,确定那些主要的影响因素。在分析人员进行的阳光超市分析工作中,阳光超市的总经理要求分析该

6、超市的销售额受哪些因素的影响,其因变量无疑就是该超市的销售额。而分析影响阳光超市的销售额的主要因素是促销费用和营业面积,这两个因素就是自变量。二、确定变量间相关类型数据分析员:变量选定之后,我们怎样才能进行相关分析哪?可以利用软件的函数命令直接计算相关系数吗?项目组长:不行。因为只有当变量间是线性相关关系的时候,才能用这种方法计算相关系数,计算结果的数值大小才反映两个变量之间的关系。数据分析员:哦,也就是说需要首先判定变量间的相关关系的类型。我已经学会了用Excel软件来绘制散点图了,从散点图来直观的判定行吗?项目组长:当然可以,实际中都是这样做的。数据分析员:组长,还有问题耶,散点图是根据两

7、个变量来绘制的,现在影响销售额的因素有两个,该怎样来绘制呢?项目组长:我们可以分别绘制销售额与这两个因素的散点图,也就是说用两个散点图来描述它们之间的关系。1、相关关系的类型相关(correlation)指两个或两个以上变量间相互关系的程度或强度,相关关系按强度分为:(1)完全相关,变量间存在函数关系(2)强相关,变量间近似存在函数关系(3)弱相关,变量间有关系但不明显(4)零相关,变量间不存在任何关系具有相关关系的变量,之间的关系不能用函数关系精确表达,一个变量的取值不能由另一个变量唯一确定。 相关关系按变量个数分为:(1)简单相关,即两个变量间相关。按形式分为线性相关、 非线性相关,按符号

8、分为正相关、负相关、零相关。(2)复相关,又称为多重相关和偏相关,是指三个或三个以上变量间相关。2、确定相关关系方法确定变量之间相关的类型一般可通过绘制相关图直观地看出。相关图是指将自变量和因变量的数值对应地描绘在直角坐标系中形成的图形,有些教材也称之为散点图或散布图。根据散点图的形状,大致可以认识变量之间是否相关,是正相关还是负相关,是线性相关还是非线性相关。对阳光超市统计数据的分析,利用Excel软件绘制销售额与促销费用的散点图、销售额与营业面积的散点图,如图7-1、图7-2所示。图7-1 销售额与促销费用的散点图图7-2 销售额与营业面积的散点图从图7-1、图7-2中可以看出销售额与促销

9、费用、营业面积之间是存在相关关系的,而且,散点图基本呈现了线性的变化趋势。3、相关分析的主要内容 相关分析的主要内容包括确定现象之间有无相关关系,确定相关关系的表现形式,确定相关关系的密切程度,选择合适的数学模型,测定变量估计值的可靠程度,对计算出的相关系数进行显著检验。三、确定变量之间相关的密切程度数据分析员:散点图呈现了线性关系,但是相关程度的大小仅仅通过图形是很难确切知道。但是,相关系数的计算公式很复杂,手工计算不可能的,怎么办呢?项目组长:相关系数的计算公式的确是比较复杂,也不容易记忆,所以我们不必记住公式,我们只需知道相关系数的特性,根据相关系数的大小会判断变量之间的关系就可以了,具

10、体相关系数的计算可以利用Excel软件来完成。数据分析员:那就太好了,我很头疼的就是记公式,这样就简单了。1、变量密切程度的界定确定变量之间线性相关的密切程度,通常可通过计算相关系数来衡量。相关系数r具有以下特性:(1)相关系数取值范围为或。(2)相关系数r的符号反映变量间的相关方向。当时,变量间的线性相关关系为正相关,这时y随着x增加而线性增加;时,变量间的线性相关关系为负相关,这时y随着x增加而线性减少。(3)若相关系数愈接近1时,两个变量间的线性相关程度愈高;若相关系数愈接近0时,两个变量间的线性相关程度愈低。通常当时,变量间无线性相关关系,但可能存在其他非线性关系;当时,变量之间存在完

11、全确定的线性相关关系。 也就是说,当时,称x与y存在一定的线性相关关系,其线性相关的密切程度由的大小说明。一般为高度线性相关密切程度;为中度线性相关密切程度;为低度线性相关密切程度。如图7-3所示。(a)完全相关 (b)高度相关、线性相关、正相关图7-3 线性相关关系示意图 图7-3(c) 弱线性相关关系示意图2、确定变量间的密切程度影响阳光超市销售额的有两个自变量促销费用与营业面积。下面分析它们与因变量销售额的相关性。Excel具体操作步骤如下: 第一步,选择工具菜单中的“数据分析”命令,弹出“数据分析”对话框。如果没有该命令,需要通过安装Excel的加载宏之后,对它们进行调用,然后该命令才

12、可以在编辑窗口的菜单中出现。第二步,在分析工具列表框中,选“相关系数”工具。这时将出现“相关系数”对话框,如图74所示。图7-4 相关系数对话框第三步,在输入框中指定输入参数。在“输入区域”指定数据所在的单元格区域B1:D21;因输入数据是以列方式排列的,所以在“分组方式”中选择逐列;因指定的输入区域包含标志行,所以选中“标志位于第一行”复选框。;在“输出选项”框中指定输出选项,我们选择“输出区域”,并指定输出到当前工作表以F2为左上角的单元格区域。 第四步,单击确定按钮,所得到的相关分析结果如图7-5所示。图7-5 相关分析结果从图75中给出的相关系数可以看出,促销费用、营业面积和销售额都有

13、较强的相关性。因此,需要利用回归分析工具进一步建立关系模型。另外,也可以运用函数CORREL求出相关系数,CORREL函数的语法格式如下:Array1是第一组数值单元格区域,Array2是第二组数值单元格区域。输入数据区域后可以得到参数计算结果,如图 7-6所示。图7-6 CORREL函数第二节 线性回归分析技术对于存在线性相关关的变量,调研人员需要进一步研究变量之间的因果关系,把其中一些因素作为控制变量,把另一些因素作为因变量,利用适当的数学模型描述它们的关系。于是,接受阳光超市统计数据分析的工作人员,面对具有线性相关关系的两组变量,运用线性回归分析技术展开了进一步的数据分析。一、线性回归分

14、析方法数据分析员:通过上面相关系数的计算,我发现销售额与促销费用的线性相关程度是比较高的,销售额和营业面积线性相关程度要稍微差一些,我们怎么定量的说明这两个因素对销售额的影响程度呢?项目组长:既然销售额与促销费用的线性相关程度比较高,说明促销费用对销售额的影响是比较大的,那么我们首先通过建立一元线性回归模型来分析促销费用对销售额的影响。数据分析员:一元线性回归分析呀,需要计算两个参数,我记得是最小二乘法,计算起来很麻烦的。 项目组长:我们不必去深究最小二乘法的原理,但要记住散点图是线性变化趋势,相关系数的绝对值和1又比较接近,变量之间就是线性相关关系,就可以建立一元线性回归模型了。数据分析员:

15、是呀,这点记住了,但是不用最小二乘法的公式,我们怎么求解模型参数呢?项目组长:可以利用Excel软件来完成,软件中既有专门的回归分析工具,还有许多函数命令可以用。数据分析员:这太好了,操作简单吗?会不会像专门的统计软件那样,还需要专门学习才行呀?项目组长:只要熟悉Excel软件的基本操作,就可以直接进行。数据分析员:我们前面已经分析出阳光超市的销售额受到促销费用和营业点面积两个因素的影响,是不是需要建立多元线性回归模型呢?项目组长:是的,分析方法和一元线性回归模型建立基本相似,都是利用最小二乘法求解模型参数,进而建立模型。数据分析员:参数的计算是不是更复杂一些呢?项目组长:多元回归分析法在因素分析和计算上都比较复杂,一般都通过专门统计软件来完成,也仍然可以使用常用的办公软件Excel来进行多元回归的数据分析。1、回归分析内容对于存在相关关系的变量,运用数学工具建

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号