统计学第二版马敏娜王静敏第08章相关与回归correlationandregression

上传人:w****i 文档编号:91835156 上传时间:2019-07-02 格式:PPT 页数:38 大小:3.12MB
返回 下载 相关 举报
统计学第二版马敏娜王静敏第08章相关与回归correlationandregression_第1页
第1页 / 共38页
统计学第二版马敏娜王静敏第08章相关与回归correlationandregression_第2页
第2页 / 共38页
统计学第二版马敏娜王静敏第08章相关与回归correlationandregression_第3页
第3页 / 共38页
统计学第二版马敏娜王静敏第08章相关与回归correlationandregression_第4页
第4页 / 共38页
统计学第二版马敏娜王静敏第08章相关与回归correlationandregression_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《统计学第二版马敏娜王静敏第08章相关与回归correlationandregression》由会员分享,可在线阅读,更多相关《统计学第二版马敏娜王静敏第08章相关与回归correlationandregression(38页珍藏版)》请在金锄头文库上搜索。

1、第八章,教学目的,了解相关分析的意义和作用 掌握测定现象之间相关程度和建立回归模 型的方法 会计算相关系数,一元回归方程参数。,第一节 简单线性相关分析 第二节 一元线性回归分析 第三节 多元线性回归分析,第八章 相关与回归,相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。,第一节 简单线性相关分析,一、变量之间的关系 客观事物或现象之间总是存在着相互联系、相互制约的关系。这些关系反映到数量上就是变量间的关系。变量之间的关系一般分为两类: (一)函数关系(也称确定性关系) (二

2、)相关关系(也称非确定性关系),5,Y = f (x),二、相关关系的分类,6,(一) 根据相关关系涉及变量的多少,单相关,复相关,(二)按相关关系表现形态的不同,直线相关,曲线相关,(三) 根据相关关系的变化方向(在直线相关中),7,正相关,负相关,(四)按相关的程度,完全相关,不完全相关,不相关(零相关),一元相关,多元相关,负 相 关,正 相 关,线性相关,曲线相关,散点图 (scatter diagram),相关分析的主要内容 有两方面内容:一是确定现象之间有无相关关系;二是确定现象之间相关的形态和相关的密切程度。 (一)相关关系的判断 1定性分析。在进行相关分析之前,首先根据研究者的

3、理论知识、专业知识和实践经验,对客观现象之间是否存在相关关系,以及有何种相关关系做出判断,这就是定性分析。 2相关表。相关表就是根据现象之间的原始资料,将一变量的若干变量值按从小到大的顺序排列,并将另一变量的值与之对应排列形成的统计表。 3相关图。相关图又称散点图,它是根据相关表中的数据,在直角坐标系中绘制的图形。通常,以x轴代表自变量,以y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点的分布状况。,相关图,11,也叫散点图,是在分析两个变量之间的关系时, 将对应的数据(x,y)在平面坐标上用点画出来, 通过点的分布可以初步判断现象x和y之间有无相关关系。,x,

4、散点图,y,三、相关关系的确定 相关系数,总体相关系数,样本相关系数,相关系数是标准化了的协方差,相关系数 (计算公式), 样本相关系数的计算公式,或化简为,用相关系数表示的相关程度的等级,14,1. r0:不相关 2. r 0.3:极低度相关 3. 0.3 0.8:高度相关 r1:完全相关,r0 正相关;r0 负相关,相关系数的性质 (取值及其意义的图解),r,二、回归分析和相关分析的联系与区别,1理论和方法具 有一致性;,2无相关就无回归, 相关程度越高,回归越好;,3相关系数和回归系数 方向一致,可以互相推算。,1相关分析是研究变量之间的共变关系 ,x与y对等,回归分析中,x与y要确定自

5、变量和因变量;,2相关分析中x,y均为随机变量,回归分析中,只有y为随机变量;,3相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。,第二节 一元线性回归分析,一、回归的概念 “回归”(Regression)一词是由英国生物学家FGalton在研究人体身高的遗传问题时首先提出的。,三、一元线性回归模型,以家庭为单位,某种商品年需求量与该商品价格之间的一组数据如表所示。,从散点图可看出,这些数据描出的点分布在一条直线的附近,而不完全在一条直线上,这是由于Y还受到其它一些随机因素的影响。设这条直线为,四、模型参数的估计 Karl Gauss的最小化图,x,y,(xn , yn),(x1

6、 , y1),(x2 , y2),(xi , yi),由于Q是 , 的二次函数,并且是非负的,由二次函数的性质可知,Q的最小值总是存在的。根据微积分学中极值原理,需使Q对 , 的一阶偏导数为零,即,上式经整理后得正规方程组,求解正规方程组得,可以证明最小二乘估计量,具有线性、无偏性和最小方差性。,最小二乘法 ( 和 的计算公式), 根据最小二乘法,可得求解 和 的公式如下,为研究家庭收入和食品支出的关系,随机抽取了10个家庭的样本,得到数据见表7-3所示。试建立收入和支出之间的回归方程,并解释结果,于是,得到收入与支出的一元线性回归方程为,回归方程说明当收入为零时,也必须有217.26元的食品

7、支出,这部分支出可视为基本支出或固定支出水平。收入每增加100元,支出就增加20.23元,(一)拟合优度检验,判定系数(r2),是对回归模型拟合优度的评价。,x,y,总偏差= 回归偏差 + 剩余偏差,r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释。,r的符号同b,五、回归方程的统计检验,(二)回归方程的显著性检验,检验统计量,F,检验假设,= 或,一元线性回归方差分析表,六、利用回归方程进行预测,(一)点预测 设Y与X的回归方程为,已知X的一特定值,利用回归方程求出的估计值为,就是 的预测值,两者之间的偏差为估计标准误(Sxy),(二)区间预测,给定x0,y0的置信度(1-)的置

8、信区间为:,x,y,X0,0,给定的x0越接 ,y值估计的精确度越高。,第三节 多元线性回归分析,一、多元线性回归模型,二元线性回归模型:,总体多元线性回归模型的一般形式,Y的数学期望E(Y),随机误差,表明自变量,共同变动引起的Y 的平均变动。也称总体的二元线性回归方差。,常数项,,和Y构成的平面与Y轴的截距,偏回归系数,表示在 固定时 每变化一个单位引起的Y的平均变动;,偏回归系数,表示在 固定时 每变化一个单位引起的Y的平均变动;,随机误差,其理论假定与一元线性回归模型中的 一样。,在多元回归模型中,还要求各自变量之间不存在显著相关,或高度相关也即不得存在多重共线性。,总体多元线性回归模

9、型的一般形式,样本多元线性回归模型的一般形式,二元线性回归模型为:,其数学期望,也称样本(或估计的)二元线性回归方程。,二元线性回归方程的确定,根据实际资料,用最小平方法,即使 ,分别对a、b1、b2求编导并令其为零,求得三个标准方程:,解此联立方程便可得到a、b1、b2。,二、模型参数的估计,三、回归方程的统计检验,(一)拟合优度检验,判定系数,修正的判定系数:,要注意复相关系数同简单相关系数的区别,复相关系数是衡量作为一个整体的与Y的线性关系的密切程度。,估计标准误(Sy(x1、x2),r2和Sy(x1、x2)都是对回归模型拟合优度的评价指标。 Sy(x1、x2)也是用自变量对因变量进行区

10、间估计的抽样误差。,(二)回归系数的显著性检验,H0: 1=0 , H1: 10; H0: 2=0, H1: 20。,检验统计量:,按显著性水平和自由度 (n-3)查t表可得到临界值,t,0,(三)回归系数的显著性检验,检验统计量:,(k自变量个数),或,按给定的和自由度(2) 和(n-3)查F表可得到 临界值,F,四、利用回归方程进行预测,Y的平均值的区间估计,Y的特点值的区间估计,式中,,是,即区间估计的抽样误差。,的抽样分布的标准差,,式中,,是,的抽样分布的标准差,,即区间估计的抽样误差。,三、本章主要思考题 1、直线回归分析的特点。 2、直线回归分析的计算。 3、直线相关分析的特点。 4、相关系数的计算。 5、估计标准误差的涵义?,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号