[教育学]第七章 回归分析

上传人:tia****nde 文档编号:70516527 上传时间:2019-01-17 格式:PPT 页数:72 大小:451.81KB
返回 下载 相关 举报
[教育学]第七章 回归分析_第1页
第1页 / 共72页
[教育学]第七章 回归分析_第2页
第2页 / 共72页
[教育学]第七章 回归分析_第3页
第3页 / 共72页
[教育学]第七章 回归分析_第4页
第4页 / 共72页
[教育学]第七章 回归分析_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《[教育学]第七章 回归分析》由会员分享,可在线阅读,更多相关《[教育学]第七章 回归分析(72页珍藏版)》请在金锄头文库上搜索。

1、1,第七章 相关关系分析,2,一、相关的意义和种类,1、相关的概念 2、相关分析概念 3、相关的种类,3,、相关的概念,二元总体:如果对变量x的每一个值,相应还有第二个变量y值,由各对变量值组成的总体称为二元总体,变量x称为自变量,变量y称为因变量。 一般二元总体中变量之间的相互关系可以分为两种,一种是函数关系,一种是相关关系。,4,函数关系,函数关系:自变量值确定,因变量值也随之完全确定。 如圆半径与圆面积、海拔高度与气压等。,5,相关关系,相关关系:是不完全确定的随机关系。自变量的每一个值,都可能对应若干个因变量值。 如学习时间与学习成绩,产品数量与单位成本等。,6,单选题,下面现象间的关

2、系属于相关关系的是( )。 A.圆的周长和它的半径之间的关系 B.价格不变条件下,商品销售额与销售量之间的关系 C.家庭收入愈多,其消费支出也有增长的趋势 D.正方形面积和它的边长之间的关系,答案:C (A、B、D时函数关系),7,相关关系与函数关系的不同之处,(1)变量之间关系不同:函数关系指变量之间的关系是确定的,而相关关系的两变量的关系则是不确定的,可以在一定范围内变动;,8,(2)变量关系表现形式不同,函数关系可以用一定的方程y=f(x)表现出来,可以给定自变量来推算因变量;相关关系不能用一定的方程表示。 (3)函数关系是相关关系的特例 即函数关系是完全的相关关系,相关关系是不完全的相

3、关关系。,9,函数关系与相关关系是两种不同类型的关系,但是它们之间并不存在严格的界限。 由于在观察或实验中出现的误差,函数关系也有时通过相关关系反映出来;而当着对现象之间的内在联系和规律性了解得更加清楚的时候,相关关系又可能转化为函数关系。,10,多选题,下列哪些关系是相关关系( ) A.球的半径长度和体积的关系 B.农作物收获和施肥量的关系 C.商品销售额和利润率的关系 D.产品产量与单位成品成本的关系 E.家庭收入多少与消费支出增长的关系,答案:B C D E A是函数关系,11,、相关分析,相关分析是研究两个或两个以上变量之间相关程度大小以及用一定函数来表达现象相互关系的形式。 相关分析

4、的研究对象是相关关系,相关分析的工具是函数关系。 本学期相关分析主要研究二元总体。,12,相关分析的主要内容,确定相关关系的存在,其形态、方向和密切程度。 确定相关关系的数学表达式。 确定因变量估计值的误差程度。,13,3、 相关的种类:,()按相关的程度分为,完全相关、不完全相关和不相关。 完全相关:函数关系。 不完全相关:具有不确定的随机关系。 不相关:两个变量相互独立。,14,()按相关的性质,按相关的性质分为,正相关和负相关。 正相关:自变量和因变量变动的方向一致; 负相关:自变量和因变量变动的方向相反。,15,()按相关的形式,按相关的形式有线性相关和非线性相关。 线性相关:在直角坐

5、标系中,变量组成的点分布在一条直线周围。 非线性相关:在直角坐标系中,变量组成的点分布在一条曲线周围。,16,()按影响因素多少,按影响因素多少分为,单相关和复相关。 单相关:一个因素标志与结果一个标志相关。 复相关:多个因素标志与结果一个标志相关。,17,填空题,当变量x值增加,变量y值也增加,这是 相关关系;当变量x值减少,变量y值也减少,这是 相关关系。,答案:正 正,18,填空题,若按影响因素的多少划分,相关关系分为 相关和 相关。,答案:单 复,19,判断题,施肥量与收获率是正相关关系。 ( ),答案: 施肥量与收获率有相关关系,但不是正相关。,20,单选题,若物价上涨,商品的需求量

6、相应减少,则物价与商品需求量之间的关系为( )。 A.不相关 B.负相关 C.正相关 D.复相关,答案:B,21,多选题,下列属于正相关的现象是( ) A.家庭收入越多,其消费支出也越多 B.某产品产量随工人劳动生产率提高而增加 C.流通费用率随商品销售额的增加而减少 D.生产单位产品所耗工时随劳动生产率的提高而减少 E.产品产量随生产用固定资产价值的减少而减少,答案:A B E,22,多选题,下列属于负相关的现象是( ) A.商品流转的规模愈大,流通费用水平越低 B.流通费用率随商品销售额的增加而减少 C.国民收入随投资额的增加而增长 D.生产单位产品所耗工时随劳动生产率的提高而减少 E.某

7、产品产量随工人劳动生产率的提高而增加,答案:A B D,23,二、相关系数,相关系数():测定变量之间线性相关密切程度和相关方向的代表性指标。 本学期只研究变量间的线性相关性。,24,相关系数的计算公式,相关系数的基本公式 利用相关系数的基本公式计算相当繁琐,但可利用计算相关系数的简化式。,25,相关系数的简化式,26,、相关系数的性质(1),判别相关密切程度的方法 =1 x,y完全相关 0 1 x,y不完全相关 =0 不相关,27,、相关系数的性质,判别相关方向的方法 0 正相关 0 负相关,28,相关系数计算 计算相关系数前的准备工作: 首先需要计算指标,29,练习:,30,31,32,3

8、3,相关系数特点:,()参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个。 ()相关系数有正负号反映相关关系的方向,正号反映正相关,负号反映负相关。 ()计算相关系数的两个变量都是随机变量。,34,填空题,相关系数是在 相关条件下用来说明两个变量相关 的统计分析指标。,答案:线性 相关的密切程度,35,判断题,计算相关系数的两个变量都是随机变量( ),答案:,36,填空题,相关系数绝对值的大小反映相关的 ,相关系数的正负反映相关的 。,答案:相关的密切程度 相关的方向,37,多选题,相关系数是零,说明两个变量之间的关系( ) A.完全不相关 B.高度相关 C.低度相关

9、D.不相关 E.显著相关,答案:A D,38,多选题,若两个变量之间的相关系数为-1,则这两个变量是( ) A.负相关关系 B.正相关关系 C.不相关 D.完全相关关系 E.不完全相关关系,答案:A D,39,四、回归分析 、回归分析的意义,回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。,40,简单线性回归方程的建立,简单线性回归方程式为: yc 式中:yc 是的估计值, 代表直线在轴上的截距,yc 起点值。 表示直线的斜率,又称为回归系数。 、都是待定参数,可以用最小平方

10、法求得。,41,回归系数 b 的涵义,当自变量每增加一个单位时,因变量c平均增加(减少)b 个单位。 当0时,表示两个变量是正相关,当0时,表示两个变量是负相关。,42,待定系数a,b的计算公式,先计算 b ,后计算 a 。,43,44,(1)配合直线方程 计算 b, a,45,代入简单线性回归方程公式,回归方程为: c .,46,()产量每增加1000件时,单位成本平均变动,因为b=-1.820,且产量x的计量单位是千件,根据回归系数b的意义有: 产量每增加一个单位即1000件时,单位成本平均减少1.82元。,47,()产量为6000件时的单位成本,当产量为6000件时,即,代入回归方程:

11、c77.371.82 66.45(元) 当产量为6000件时,单位成本为66.45元。,48,相关系数与回归系数,反映内容不同。相关系数反映两变量相关程度和方向,回归系数反映当自变量每增加一个单位时,因变量c的平均增加值。 变量间的关系不同。计算相关系数时两个变量关系对等,计算回归系数时两个变量关系不对等。 相关系数只有一个,回归系数可以有不同的两个。,49,回归分析与相关分析回归的区别和联系 两者联系:,概念:相关分析包括相关和回归两项内容 具体内容:相关分析研究两个变量之间相关的方向和相关的密切程度。而回归分析是研究两变量具有因果关系的数学形式。 回归分析和相关分析都是研究两个变量相互关系

12、的分析方法。两者互相补充、密切联系。,50,相关分析需要回归分析来表明现象数量相关的具体形式,而回归分析则应该建立在相关分析的基础上。依靠相关分析表明现象的数量变化具有密切相关,进行回归分析求其相关的具体形式才有意义。 在相关程度很低的情况下,回归函数的表达式代表性就很差。,51,两者区别,变量间关系的对等性不同。 变量的随机性不同。 计算结果表现不同。对于没有明显因果关系的两个线性相关变量可求得两个回归方程。而相关系数只有一个。,52,例题,根据某部门8个企业产品销售额和销售利润的资料得出以下计算结果: 要求: (1)计算产品销售额与利润额的相关关系; (2)建立以利润额为因变量的直线回归方

13、程并说明回归系数的经济意义; (3)计算估计标准误差。,53,54,55,56,三、估计标准误差分析,估计标准误差是衡量因变量的估计值与观测值之间的平均误差大小的指标。利用此指标可以说明回归方程的代表性。 估计标准误差越小回归方程的代表性越大。,57,(一)离差平方和的分解,所有观察值y是上下波动的,y取值的这种波动的现象称为变差。 产生这种变差是由两个方面原因引起的: (1)受自变量变动的影响,即x取值的不同。 (2)其他因素(包括观察和实验中产生的误差)的影响。 为了分析这两个方面的影响,需要对总的变差进行分解。,58,59,60,61,62,2 的无偏估计,Se 称为标准误差。,回归效果

14、的评价 数据总的变动称为总离差平方和,记为 QT,它由两部分构成:1)被回归方程解释的部分,称为回归平方和,记为QR ;2)未被回归方程解释的部分,称为残差平方和,记为QE 。 它们的计算公式为:,63,它们的相互关系为: QT = QE + QR (1)(样本)可决系数(判定系数),可决系数 R2可以做回归值与实际观测值拟合程度的度量。 R2 越接近1,说明二者的拟合程度越好。特别地,当 y 与 x 为线性相关关系时,R2 = r2。,64,单选题,配合回归直线方程对资料的要求是( )。 A.因变量是给定的数值,自变量是随机的 B.自变量是给定的数值,因变量是随机的 C.自变量和因变量都是随

15、机的 D.自变量和因变量都不是随机的,答案:B,65,多选题,直线回归方程yc=a+bx 中的b 称为回归系数,回归系数的作用是( ) A可确定两变量之间因果的数量关系 B.可确定两变量的相关方向 C.可确定两变量相关的密切程度 D.可确定因变量的实际值与估计值的变异程度 E.可确定当自变量增加一个单位时,因变量的平均增加量,答案:A B E,66,单选题,在回归直线方程yca+bx中,b表示( )。 A.当x增加一个单位时,y增加a的数量 B.当y增加一个单位时,x增加b的数量 C.当x增加一个单位时,y的平均增加量 D.当y增加一个单位时,x的平均增加量,答案: C,67,单选题,某校对学

16、生的考试成绩和学习时间的关系进行测定,建立了考试成绩倚学习时间的直线回归方程为:yc=180-5x,该方程明显有误,错误在于( )。 A. a值的计算有误,b值是对的 B. b值的计算有误,a值是对的 C. a值和b值的计算都有误 D. 自变量和因变量的关系搞错了,答案:C,68,多选题,回归分析的特点有( ) A.两个变量是不对等的 B.必须区分自变量和因变量 C.两上变量都是随机的 D.因变量是随机的 E.自变量是可以控制的量 F.回归系数只有一个,答案: A B D E,69,判断题,利用一个回归方程,两个变量可以互相推算( ),答案: 只能用自变量推算因变量,70,多选题,直线回归分析中( ) A.自变量是可控制量,因变量是随机的 B.两个变量不是对等的关系 C.利用一个回归方程,两个变量可

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号