统计学原理李洁明7

上传人:小** 文档编号:90527595 上传时间:2019-06-13 格式:PPT 页数:42 大小:599.50KB
返回 下载 相关 举报
统计学原理李洁明7_第1页
第1页 / 共42页
统计学原理李洁明7_第2页
第2页 / 共42页
统计学原理李洁明7_第3页
第3页 / 共42页
统计学原理李洁明7_第4页
第4页 / 共42页
统计学原理李洁明7_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《统计学原理李洁明7》由会员分享,可在线阅读,更多相关《统计学原理李洁明7(42页珍藏版)》请在金锄头文库上搜索。

1、第七章 相关分析,第一节 相关分析的意义和任务 第二节 简单线性相关分析 第三节 直线回归分析 第四节 曲线回归分析,第一节 相关分析的意义和任务,第一节 相关分析的意义和任务,社会经济现象之间的数量关系可分为:函数关系和相关关系。 函数关系反映着现象之间严格的依存关系。 相关关系反映着现象之间不确定、不严格的依存关系。,(一)现象之间的数量关系 1.函数关系 客观现象之间相互依存的确定性的数量关系是函数关系,它是变量之间客观存在的一种对应关系。在这个关系中,当中一个或多个表述现象的数量(自变量)发生变化时,另一个表述现象的数量(因变量)按照一定的规律有确定的值与之对应,可以用数学表达式描述这

2、种关系。,一、相关分析的概念,2.相关关系 (1)概念:相关关系是指经济现象之间客观存在的在数量上不是确定性的对应关系。 (2)特征:某一现象或多个现象与另一有联系的现象之间在数量上存在着一定的依存关系,但不是确定和严格的数学函数关系。 (3)举例:居民的月可支配收入和消费支出的关系。,(二)相关关系分析,1.广义上的相关分析包括以下五个方面: (1)确定现象之间是否存在相关关系; (2)确定相关关系的表现形式; (3)判定相关关系的方向和密切程度; (4)对达到一定密切程度的相关关系建立适当的数学模型,以确定自变量与因变量之间数量变化的规律性; (5)测定数学模型的代表性大小并根据自变量数值

3、对因变量的数量变化做出具有一定概率保证程度的推算和预测。 2.前三个方面内容称为狭义的相关分析,后两方面内容的研究称为回归分析。,二、相关关系的分类,(一)按相关关系涉及的因素多少划分 1.单相关:是两个变量的相关,即一个因变量对一个自变量的相关关系。 2.复相关:是三个或三个以上变量的相关,即一个因变量对两个或两个以上自变量的相关关系。 (二)按现象之间相关关系的方向划分 1.正相关:是当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为正相关。 2.负相关:是当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为负相关。,(三) 按现象之间相关关系的程度

4、分 1.完全相关:当一种现象的数量变化完全由另一个现象的数量变化所确定时,称这两种现象间的关系为完全相关。例如在价格不变的条件下,商品销售额与销售量之间成正比例关系。 2.完全不相关:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关现象。 3.不完全相关:两个现象之间的关系介于完全相关和不相关之间,称为不完全相关,一般的相关现象都是指这种不完全相关。如人的身高和体重之间的关系。,(四)按现象之间相关的形式分 1.线性相关:当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关,即直线相关。如产品总成本和单位成本之间的关系、职工工资总额和职工平均工资之间的关系等。 2.非线性相关:

5、如果两种相关现象之间,并不表现为直线的关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关,即曲线相关。如产品单位成本和产量之间的关系。,三、相关分析的内容,(一) 确定现象之间是否存在相关关系,及相关关系的表现形式 (二) 确定相关关系的密切程度 (三) 确定相关关系的数学表达式 (四) 测定变量估计值的可靠程度 (五) 对计算出的相关关系,进行显著检验,第二节 简单线性相关分析,一、简单线性相关关系的概念 (一)概念 (二)特征 1.现象之间在数量上存在着一定的线性关系,但不是确定和严格的。 2.研究现象所涉及的变量有两个,变量之间的地位是平等的。,简单线性相关关系是指经济现象

6、之间客观存在的数量上的不确定、不严格的线性(直线)关系。,二、相关关系的测定方法,(一) 相关表 1.简单相关表:直接根据原始资料,将某一变量按大小排列,再将另一变量的对应值平行排列得到的相关表。 例7-1 表7-1即为一个简单相关表。 表7-1 某市居民月消费支出和可支配收入相关表 单位:百元,2.分组相关表:是将原始资料进行分组而编制的相关表。可分为单变量分组相关表和双变量分组相关表。 (1)单变量分组相关表 在具有相关关系的两个变量中,把其中一个变量进行分组,列出各组次数,另一个变量不分组,这种相关表称为单变量分组相关表。 (2)双变量分组相关表 双变量分组相关表是对具有相关关系的两个变

7、量都进行分组而编制的相关表。,(二)相关图 相关图是以直角坐标系的横轴代表自变量,纵轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形,又称散点图或散布图或相关点图。,(三)相关系数,1.相关系数的概念和意义 (1)概念:相关系数是指在直线相关条件下,说明两个现象之间相关关系密切程度的统计分析指标。 (2)意义:比相关表和相关图更能概括表现相关的形式和程度。根据相关系数的大小,或把若干相关系数加以对比,可以发现现象发展中决定性的影响因素,因而相关系数对于判断变量之间相关关系的密切程度有着重要的作用。,2 相关系数的计算,其中,,(1)积差法,2 相

8、关系数的计算,其中,,(2)相关系数简捷计算方法,在已有平均值及标准差的情况下也可以使用以下公式,在已有平均值及标准差的情况下还可以使用以下公式,3.相关系数的密切程度,相关系数的数值有个范围,在-1和+1之间,即 。计算结果带有负号表示负相关,带有正号表示正相关。,为了判断时有个标准,有人提出了相关关系密切程度的等级,相关系数在0.3以下为无相关,0.3以上为有相关。0.30.5是低度相关;0.50.8是显著相关;0.8以上是高度相关。,相关系数r的数值越接近于1(+1或-1),表示相关关系越强;越接近于0,表示相关关系越弱。,4.分组表计算的相关系数,(1)单变量分组表计算相关系数,简捷公

9、式,4.分组表计算的相关系数,(2)双变量分组表计算相关系数,式中, 组的频数; 组的频数; 与 交错组的频数,5.相关系数的显著性检验,两变量之间是否存在相关关系需检验样本的 值是否可能来自一个不存在线性相关的总体(即 为总体的相关系数),即 为显著性检验。 通过r值在统计上是否显著,可以说明它能否作为两个变量间存在线性关系的依据:若r在统计上是显著的,就证明两个变量间存在线性关系;反之,则说明两个变量之间不存在线性关系。,5.相关系数的显著性检验,对于线性相关,为了评价相关系数的显著性,在小样本情况下(我们观测两变量之间的对应数据一般都不会超过30对),通常采用t分布来检验 的显著性。其方

10、法和步骤如下: 第一步:提出假设。假设样本是从一个不相关的总体中抽出的,即,5.相关系数的显著性检验,第二步:计算检验的统计量: 第三步:进行决策。根据给定的显著水平 和自由度df=n-2查t分布表,查出 的临界值。若 ,则拒绝原假设 ,表明总体的两个变量之间存在显著的线性关系。,第三节 直线回归分析,一、回归分析的概念,(一)回归分析的概念 回归分析实际上是相关现象间不确定、不规则的数量关系的一般化、规律化。回归分析采用的方法是配合直线或曲线来反映现象之间的一般数量关系。这条直线或曲线叫回归直线或回归曲线,它们的方程称为回归直线方程或回归曲线方程。,回归分析是对具有相关关系的现象根据其相关形

11、式,选择合适的数学模型(回归方程),近似地描述变量间的平均变化关系的一种统计分析方法。,(二) 回归分析与相关分析的关系,1. 区别 (1)相关分析所研究的两个变量是对等关系。 回归分析所研究的两个变量不是对等关系,必须根据研究目的,确定自变量和因变量。 (2)相关分析只能计算一个相关系数,改变自变量和因变量的地位不影响相关系数的数值。 回归分析可以根据研究目的分别建立两个不同的回归方程。 (3)相关分析中两个变量都必须是随机变量。 回归分析中自变量是给定的变量,因变量是随机变量。,2.回归分析与相关分析的联系 (1)相关分析是回归分析的基础和前提。如果缺少相关分析,没有从定性上说明现象间是否

12、存在相关关系及相关关系的密切程度,就无法进行回归分析。 (2)回归分析是相关分析的深入和继续。仅仅说明现象间具有密切的相关关系是不够的,只有进行回归分析,拟合回归方程,才可能进行深入分析和回归预测,相关分析才有实际应用价值。,二、回归分析的种类,(一)按回归分析中自变量的个数不同 1.简单回归/一元回归:在回归关系中包含两个变量,一个是具有确定性的自变量;另一个称因变量,是随机变量。 2.多元回归:在回归关系中包含三个或以上的变量,一个是因变量,是随机变量;其他变量是具有确定性的自变量。,(二)按回归线的形状 1.直线回归:变量间变化的规律近似于线性关系,从散点图看,表示变量关系的点接近于一条

13、直线。 2.非直线回归:变量间变化的规律不是线性关系,从散点图看,表示变量关系的点接近于一条曲线。,三、简单直线回归分析,(一) 简单直线回归分析的特点 1.在两个变量之间进行回归分析时,必须根据研究目的,具体确定哪个是自变量,哪个是因变量。 2.在两个现象互为根据的情况下,可以有两个回归方程y倚x回归方程和x倚y回归。 3.回归方程的主要作用在于给出自变量的数值来估计因变量的可能值。一个回归方程只能作一种推算。推算的结果表明变量之间的具体的变动关系。,1.回归模型为: 2.建立求解回归参数的标准方程组 3.计算回归参数,(二)简单直线回归方程的确定,3.计算回归参数 如果已用积差法计算了相关

14、系数,有相应的资料,也可以用如下的方法求解:,(二)简单直线回归方程的确定,线性回归方程拟合优度的好坏实质上就是回归方程误差大小的问题。,(三)判定系数,设有y的实际值 到 的离差即 被回归直线分割成两部分: 。那么,对所有的实际值y来说,有它们的离差平方和,即总偏差,回归偏差,剩余偏差(未被解释的偏差),总偏差,线性回归方程拟合优度的好坏实质上就是回归方程误差大小的问题。,(三)判定系数,判定系数 便是以回归偏差占总偏差的比率来表示线性回归方程的拟合优度的评价指标。,回归偏差,剩余偏差(未被解释的偏差),总偏差,线性回归方程拟合优度的好坏实质上就是回归方程误差大小的问题。,(三)判定系数,在

15、实际工作中,采用简捷公式:,估计标准误差就是用来说明回归方程推算结果的准确程度的统计分析指标,或者说是反映回归直线代表性大小的统计分析指标。,(四)估计标准误差,估计标准误差有两种计算方法。 1.根据因变量实际值和估计值的离差计算。 2.根据a,b两个参数值计算估计标准误差。,对回归系数b的检验就是要验证变量x和y之间是否真正存在线性关系,一般采用t检验,其步骤如下:,(五)线性回归方程的显著性检验,1.假设观测的样本是从一个没有线性关系的总体中选出的,即 2.计算回归系数b的检验统计量t的值: 3.根据给定的显著水平 和自由度 ,查t分布表中相应的临界值 。 4.判断:若 ,则拒绝 得出 的

16、结论;否则不能拒绝 。,在实际中,通常影响因变量的因素不只是一个,而是很多个。因此,须用两个或更多的自变量来估计因变量,这叫做多元线性回归分析。,四、多元线性回归分析,(一)多元线性回归方程 确定三个规范方程式:,在实际中,通常影响因变量的因素不只是一个,而是很多个。因此,须用两个或更多的自变量来估计因变量,这叫做多元线性回归分析。,四、多元线性回归分析,(二)多元线性回归模型的判定系数和估计标准误差 1.判定系数 简捷公式为:,四、多元线性回归分析,(二)多元线性回归模型的判定系数和估计标准误差 2.估计标准误差,第四节 曲线回归分析,在对经济变量进行配合回归方程时,常遇到的问题是因变量和自变量间的关系并不是直线型,而是曲线型。这时通常采用变量代换法将非线性模型线性化,再按照线性模型的方法处理。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号