一元线性回归模型ppt课件

上传人:cn****1 文档编号:590332435 上传时间:2024-09-13 格式:PPT 页数:155 大小:1.49MB
返回 下载 相关 举报
一元线性回归模型ppt课件_第1页
第1页 / 共155页
一元线性回归模型ppt课件_第2页
第2页 / 共155页
一元线性回归模型ppt课件_第3页
第3页 / 共155页
一元线性回归模型ppt课件_第4页
第4页 / 共155页
一元线性回归模型ppt课件_第5页
第5页 / 共155页
点击查看更多>>
资源描述

《一元线性回归模型ppt课件》由会员分享,可在线阅读,更多相关《一元线性回归模型ppt课件(155页珍藏版)》请在金锄头文库上搜索。

1、第二章第二章 一元线性回归模型一元线性回归模型第一第一节节 相关分析和回相关分析和回归归分析分析一一. .经济变经济变量之量之间间的相互关系的相互关系: : 经济变经济变量之量之间间的关系,大致可分的关系,大致可分为为两两类类,一,一类类是函数关系;另一是函数关系;另一类类是是统计统计相关关系相关关系 函数关系是指函数关系是指变变量之量之间间存在着完全确定存在着完全确定性的依存关系性的依存关系 。例如,当价。例如,当价钱钱不不变时变时,销销售量售量X X与与销销售售额额Y Y之之间间的关系。的关系。 相关关系是指景象之相关关系是指景象之间间客客观观存在的非确存在的非确定性数量定性数量对应对应依

2、存关系依存关系 。例如,每。例如,每亩亩耕地的施肥量耕地的施肥量X X与与亩产亩产量量Y Y之之间间的关系的关系 。 ;函数关系与相关关系联络函数关系与相关关系联络l两两者者虽虽有有明明显显区区别别,但但两两者者之之间间并并无无严严厉厉的的界界限限,由由于于存存在在丈丈量量误误差差等等缘缘由由,函函数数关关系在实践中往往经过相关关系表现出来系在实践中往往经过相关关系表现出来;l在在研研讨讨相相关关关关系系时时,假假设设要要找找呈呈景景象象间间数数量量的的内内在在联联络络和和表表现现方方式式,往往往往又又需需求求借借助助函数关系的方式来加以描画函数关系的方式来加以描画;l因因此此,可可以以说说,

3、相相关关关关系系是是相相关关分分析析的的研研讨讨对象,函数关系是相关分析的工具。对象,函数关系是相关分析的工具。;二、相关分析二、相关分析 研讨一个变量与另一个组变量之间研讨一个变量与另一个组变量之间相关方向和相关亲密程度的一种统计分析方相关方向和相关亲密程度的一种统计分析方法。法。相关分析目的:相关分析目的:明确变量之间有无关系,明确变量之间有无关系,确定相关关系的表现方式曲线与直线,确定相关关系的表现方式曲线与直线,断定相关关系的方向,断定相关关系的方向,测定相关关系的亲密程度等。测定相关关系的亲密程度等。 ;一、相关关系的分类一、相关关系的分类1.1.从变量之间相互关系的方向来看,可以成

4、从变量之间相互关系的方向来看,可以成为正相关与负相关;为正相关与负相关; 2.2.按相关关系涉及的变量或要素的多少,按相关关系涉及的变量或要素的多少,可分为单相关与复相关、偏相关;可分为单相关与复相关、偏相关; 3.3.按变量之间相关关系的表现方式来看,可按变量之间相关关系的表现方式来看,可以分成为直线相关和曲线相关;以分成为直线相关和曲线相关; 4.4.按相关的程度来分,可以分为不相关,不按相关的程度来分,可以分为不相关,不完全相关和完全相关三类;完全相关和完全相关三类; 函数关系是相关关系的一种特殊情况。函数关系是相关关系的一种特殊情况。 ;二相关关系的度量二相关关系的度量l在在相相关关分

5、分析析中中,经经过过绘绘制制相相关关表表和和相相关关图图,可可以以对对景景象象之之间间存存在在的的相相关关关关系系的的方方向向、方方式式和和亲亲密密程程度度作直观的、大致的判别。作直观的、大致的判别。l1.相相关关表表:将将景景象象之之间间的的相相关关关关系系,用用表表格格来来反反映映,这这种种表表称称为为相相关关表表,分分为为简简单单相相关关表表和和分分组组相相关关表表。例例如如,某某农农场场实实验验田田在在七七次次实实验验中中,获获得得的的小小麦麦产产量与施肥量的察看资料量与施肥量的察看资料表表2-1 2-1 施肥量与小麦产量的察看数据施肥量与小麦产量的察看数据试验顺序试验顺序1 12 2

6、3 34 45 56 67 7X X施肥量斤施肥量斤/ /亩亩1515252530303636444450505555Y Y小麦产量斤小麦产量斤/ /亩亩380380420420410410430430450450470470490490;2.相关图:l将将变变量量之之的的关关系系,经经过过图图形形来来表表示示,这这种种图图形形为为相相关关图图。又又称称为为散散点点图图,经经过过相相关关图图,可可以以大大致致看看出出两两个个变变量量之之间间有有无无相相关关关关系系、相相关关的的形形状状、方向及亲密程度。方向及亲密程度。 l图图2-1相关散点图相关散点图; 3. 3.相关系数相关系数l经经经经过

7、过过过线线线线性性性性相相相相关关关关图图图图、表表表表可可可可以以以以粗粗粗粗略略略略地地地地察察察察看看看看两两两两个个个个变变变变量量量量之之之之间间间间相相相相互互互互关关关关系系系系的的的的类类类类型型型型、方方方方向向向向以以以以及及及及相相相相关关关关的的的的亲亲亲亲密密密密程程程程度度度度,但但但但无无无无法确切地法确切地法确切地法确切地阐阐阐阐明两个明两个明两个明两个变变变变量之量之量之量之间线间线间线间线性相关的程度。性相关的程度。性相关的程度。性相关的程度。l英英英英国国国国著著著著名名名名统统统统计计计计学学学学家家家家卡卡卡卡尔尔尔尔皮皮皮皮尔尔尔尔逊逊逊逊 Karl

8、 Karl Karl Karl PearsonPearsonPearsonPearson 1890189018901890年年年年设设设设计计计计了了了了一一一一个个个个用用用用于于于于测测测测定定定定两两两两个个个个变变变变量量量量之之之之间间间间线线线线性性性性相相相相关关关关程程程程度度度度和和和和相相相相关关关关方方方方向向向向的的的的目目目目的的的的简简简简单单单单相相相相关关关关系系系系数数数数, , , ,也也也也称称称称为为为为PearsonPearsonPearsonPearson相关系数。相关系数。相关系数。相关系数。 l 1 1 1 1 相关系数的定相关系数的定相关系数的

9、定相关系数的定义义义义l 2 2 2 2 相关系数的相关系数的相关系数的相关系数的计计计计算算算算l 3 3 3 3 根据相关系数初步断定根据相关系数初步断定根据相关系数初步断定根据相关系数初步断定变变变变量之量之量之量之间间间间的关系的关系的关系的关系l 4 4 4 4 简单简单简单简单相关系数的缺陷相关系数的缺陷相关系数的缺陷相关系数的缺陷;1 1相关系数的定义相关系数的定义 离差离差 在在、象限:象限:在在、象限:象限:x,y符号一样符号一样x,y符号相反符号相反;判别判别l假假设设一一切切的的观观测测值值落落在在、象象限限,离离差差之之积积为为正正,那那么么X、Y为为正正相相关关,假假

10、设设一一切切观观测测值值在在、象象限限,离离差差之之积积为为负负,那那么么X,Y为为负负相相关关,假假设设一一切切的的观观测测值值散散落落在在四四个个象象限限内内,那那么么正正的的和和负负的乘的乘积积趋趋于相互抵消,其乘于相互抵消,其乘积积之和将之和将趋趋于于0。l假假设设一一切切变变量量值值X和和Y与与其其平平均均数数的的离离差差乘乘积积之之和和为为正,那么正,那么X和和Y之之间间就是正相关。用符号表示就是正相关。用符号表示为为:l假假设设一一切切变变量量值值X和和Y与与其其平平均均数数的的离离差差乘乘积积之之和和为负为负,那么和之,那么和之间间是是负负相关。用符号表示相关。用符号表示为为:

11、;缺陷:缺陷:l离离差差乘乘积积之之和和提提供供了了X和和Y之之间间的的一一个个相相关关度度量量。但但是是,这这样样来来度度量量相相关关关关系系,只只能能表表示示相相关关方方向向,要要表表示示详详细细相关程度相关程度还还有缺陷:有缺陷:l受受观观测测值值数数目目n影影响响,观观测测值值数数目目n越多,越多,越大,相关程度越越大,相关程度越强强;l受受X,Y计计量量单单位位的的影影响响,假假设设将将X和和Y的的单单位位改改为为吨吨,那那么么X,Y数数值值就就更更小小,同同样观测值样观测值,相关度量,相关度量结结果不同。果不同。;为了抑制第了抑制第个缺陷个缺陷l用用观测值观测值数目数目n除除xy,

12、即,即l叫做叫做X和和Y的的协协方差,方差,l协协方差不只能直接方差不只能直接显显示示X与与Y是正相关是正相关还还是是负负相关;而且能反映相关;而且能反映X与与Y两个两个变变量的量的“共共变变性。性。lSxy消除了消除了样样本本单单位数多少的影响,但依然位数多少的影响,但依然受受观测值计观测值计量量单单位的影响;位的影响;;为了抑制第了抑制第缺陷缺陷l给协方差除以给协方差除以X,Y各自的规范差:各自的规范差:lSx,Syl这样便可消除变量计量量单位的影响。这样便可消除变量计量量单位的影响。l规范差规范差Sx和和Sy的作用,在于对的作用,在于对X,Y与各自与各自平均数的离差,分别用各自的规范差为

13、尺平均数的离差,分别用各自的规范差为尺度,加以规范化,然后再求规范差的协方度,加以规范化,然后再求规范差的协方差,用符号差,用符号表示,即:表示,即:相关系数定义式相关系数定义式;皮皮尔逊相关系数的最相关系数的最简式式其中:;2.2.相关系数的相关系数的计计算算积差式积差式;同理:同理:;相关系数简捷式相关系数简捷式相关系数平均式相关系数平均式;4.4.等级相关系数等级相关系数l也也称称为为斯斯皮皮尔尔曼曼 SpearmanSpearman 相相关关系系数数,用用来来度度量量定定序序变变量量之之间间的的线线性性相相关关关关系系,就就是是把把有有联联络络的的定定量量变变量量或或定定性性变变量量的

14、的详详细细表表现现按按等等级级次次序序陈陈列列,构构成成两两个个定定序序数数列列,再再测测定定标标志志等等级级与与标标志志等等级级间间的的相相关关程程度度的的一一种种方方法法,等等级级相相关关法法又又称顺位相关法称顺位相关法. .l用用rsrs表示。表示。l l式式中中,n n为为样样本本容容量量,D D为为序序列列等等级级之之差差, ,即即d=Xd=X等等级级-Y-Y等等级级 。SpearmanSpearman相相关关系系数数的的适适用用范范围围较较PearsonPearson相关系数要广得多。相关系数要广得多。 ;三相关系数的范三相关系数的范围1.相关系数的相关系数的绝对值绝对值不超越不超

15、越1,即,即|r|12.根根据据相相关关系系数数的的符符号号,断断定定正正相相关关 正正比比例例 r0、负负相关相关 反比例反比例 r0.3.根据相关系数的大小,断定:根据相关系数的大小,断定:当当r=0时时,称称为为不不相相关关。或或者者不不存存在在直直线线相相关关,但但能能够够存在其他存在其他类类型的关系。型的关系。当当0|r|0.3时时,称称为为微弱相关。微弱相关。当当0.3|r|0.5时时,称,称为为低度相关。低度相关。当当0.5|r|0.8时时,称,称为为中度相关。中度相关。当当0.8|r|F,小小概概率率事事件件发发生生了了,根根据据小小概概率率原原理理,小小概概率率事事件件在在一

16、一次次实实验验中中是是不不能能够够发发生生的的,于于是是H0不不成成立立。就就不不能能以以为为X没没有有作作用用。那那么么直直线线是是有意有意义义的。可靠性的。可靠性=1-;F F检验的意义检验的意义l对对这这种种假假设设进进展展F检检验验,本本质质上上就就是是对对一一元元线线性回归模型进展显著性检验。由于:性回归模型进展显著性检验。由于:l这这阐阐明明,F统统计计量量是是在在思思索索自自在在度度的的条条件件下下,已已解解释释变变差差的的平平方方和和相相对对于于残残差差平平方方和和的的倍倍数数,就就回回归归模模型型整整体体来来说说,F统统计计量量越越大大,阐阐明明回回归归模模型型中中的的一一切

17、切解解释释变变量量对对被被解解释释变变量量的解释程度越高。的解释程度越高。;拟合优度与拟合优度与F F统计量之间的联络统计量之间的联络lF显显著著拟拟合合优优度必然度必然显显著著l可以直可以直观观地看出,假地看出,假设设模型模型对样对样本有本有较较高的高的拟拟合合优优度,那么度,那么F检验检验普通都能普通都能经过经过,即越容易回,即越容易回绝绝原原假假设设,换换句句话说话说,样样本回本回归归函数函数对样对样本数本数据的据的拟拟合程度好,那么模型越能准确地反映合程度好,那么模型越能准确地反映总总体体特征。因此,用来判特征。因此,用来判别别估估计计的回的回归归方程方程显显著性的著性的F检验检验,实

18、实践上也是断定系数的践上也是断定系数的显显著性著性检验检验.实实践运践运用中不用用中不用过过分苛求分苛求R2值值的大小。的大小。;F F检验与检验与t t检验的关系检验的关系 l在一元线性回归中,在一元线性回归中,F检验和检验和t检验是一致的,这检验是一致的,这是由于它们有一样的原假设是由于它们有一样的原假设,并且,并且t统计统计量和量和F统计量之间存在如下关系:统计量之间存在如下关系:l此时,对参数的显著性检验此时,对参数的显著性检验t检验与对回归总检验与对回归总体线性的显著性检验体线性的显著性检验F检验是等价的。检验是等价的。;第四节第四节 预测预测一、预测的定义与种类一、预测的定义与种类

19、二、点预测二、点预测三、区间预测三、区间预测四、预测的精度四、预测的精度;一、预测的定义与分类一、预测的定义与分类l预测是对于未来或未知的估计估计与推测;预测是对于未来或未知的估计估计与推测;l预测不是臆测,这里的预测是科学的预测,它是预测不是臆测,这里的预测是科学的预测,它是建立在对预测对象认识、分析和科学的推理根底建立在对预测对象认识、分析和科学的推理根底之上的。之上的。l预测是计量经济研讨的目的之一,也是回归分析预测是计量经济研讨的目的之一,也是回归分析运用的主要方面。运用的主要方面。l一元线性回归模型预测,就是指由的或预先测定一元线性回归模型预测,就是指由的或预先测定的解释变量的数值,

20、去估计被解释变量在所观测的解释变量的数值,去估计被解释变量在所观测的样本数据以外的数值。的样本数据以外的数值。;预测的分类预测的分类l内内插插预预测测和和外外推推预预测测。在在解解释释变变量量值值属属于于的的样样本本区区间间的的情情况况下下预预测测相相应应的的被被解解释释变变量量值值,这这种种预预测测称称为为内内插插预预测测,也也可可以以看看成成是是对对被被解解释释变变量量在在同同一一时时间间不不同同空空间间形形状状的的静静态态预预测测;通通常常用用内内插插预预测测来来检检验样本回归方程的预测才干。验样本回归方程的预测才干。l当当解解释释变变量量在在样样本本区区间间以以外外但但可可以以用用其其

21、他他方方法法先先估估计计预预测测期期的的解解释释变变量量的的情情况况下下预预测测某某个个被被解解释释变变量量值值,这这样样的的预预测测称称为为外外推推预预测测。这这种种预预测测可可以以看看成成是是对对被被解解释释变变量量未未来来时时期期的的动动态态预预测测,建建立立计计量量经经济济模模型型的的目目的的就就是是解解释释经经济济景景象象并并预预测测经经济济变变量量的的未来走势,因此在实践预测里,经常作外推预测。未来走势,因此在实践预测里,经常作外推预测。;二、点预测二、点预测1.1.根本思想根本思想运运用用计计量量经经济济模模型型作作预预测测:指指利利用用所所估估计计的的样样本本回回归归函函数数,

22、用用解解释释变变量量的的值值或或预预测测值值,对对预预测测期期或或样样本本以以外外的的被被解解释释变变量量数数值值能能够取值或能够取值范围作出定量的估计。够取值或能够取值范围作出定量的估计。按按照照预预测测方方法法来来分分,预预测测可可以以分分为为点点预预测测和和区区间间预预测测两两种种;按按照照预预测测对对象象来来分分,点点预预测测和和区区间间预预测测又又都都可可以以进进一一步步分分为为个个别别值值预测和平均值预测两种。预测和平均值预测两种。;预测值、平均值、个别值的相互关系预测值、平均值、个别值的相互关系 是真实平均值的点估计,也是对个别值的点估计个别值真实平均值点预测值;2.2.被解释变

23、量被解释变量Y Y 的点预测的点预测l将将解解释释变变量量特特定定值值X0直直接接代代入入估估计计的的方方程程l这这样样计计算算的的是是一一个个点点估估计计值值,既既是是对对被被解解释释变变量量平平均均值值EY/X0的的点点预预测测,也是对个别值也是对个别值Y0的点预测的点预测;l由由于于存存在在随随机机扰扰动动u0的的影影响响,Y的的平平均均值值并不等于并不等于Y的个别值。的个别值。;3.3.被解释变量均值的点预测被解释变量均值的点预测l由由于于总总体体回回归归函函数数是是,当当Xi=X0时时,相相应应的的总总体体均均值值,由由于于和和是是随随样样本本变变化化的的随随机机变变量量,又又由由于

24、于和和分分别别是是和和的的最最正正确确线线性性无无偏偏估估计计BLUE,所所以以,由由样样本本回回归归函函数数计计算算的的也也是是均均值值EY/X0的最正确线性无偏估计。的最正确线性无偏估计。l1线性性线性性:;2 2无偏性无偏性: : l即即可表示成的无偏预测值。可表示成的无偏预测值。l3有效性:与证明参数估计量最小方差性同样的有效性:与证明参数估计量最小方差性同样的方法,也可以证明方法,也可以证明是均值是均值EY/X0的一切线的一切线性无偏预测中方差最小的。性无偏预测中方差最小的。l即:即:;4.4.个别值个别值Y0Y0的点预测的点预测 l由样本回归函数由样本回归函数计算的计算的作为当作为

25、当Xi=X0时时,对个别值对个别值的预测值也的预测值也是合理的;是合理的;l但是,但是,ll可见可见不是不是的无偏估计式。可是的无偏估计式。可是l在这个意义上,用在这个意义上,用来估计来估计,并用,并用作为作为的的预测值也是合理的。预测值也是合理的。;三、区间预测三、区间预测l当当我我们们用用样样本本回回归归函函数数所所决决议议的的被被解解释释变变量量的的值值来来估估计计总总体体均均值值和和个个别别值值时时,一一方方面面,由由于于存存在在抽抽样样动动摇摇,估估计计的的参参数数与与总总体体真真实实参参数数有有误误差差,那那么么由由样样本本回回归归函函数数求求出出的的被被解解释释变变量量预预测测值

26、值与与总总体体真真实实平平均均值值EY/X0也也会会有有误误差差,两两者者之差称为预测误差。之差称为预测误差。l另另一一方方面面,由由于于随随机机扰扰动动ui的的存存在在,当当用用被被解解释释变变量量预预测测值值在在预预测测个个别别值值Y0和和平平均均值值EY/X0时时,其其相相对对个个别别值值的的预预测测误误差差必必定定大大于于其其相相对对均均值值的的预预测测误误差差,所所以以还还有有必必要要对对均均值值和和个个别别值值的的置信区间作出区间预测。置信区间作出区间预测。;1.Y平均值的区间预测平均值的区间预测根本思想:根本思想:由于存在抽由于存在抽样动摇样动摇,预测预测的平均的平均值值不一定不

27、一定等于真等于真实实平均平均值值E Y/X0 ,还还需求需求对对E Y/X0 作区作区间间估估计计。为对为对E Y/X0 作区作区间预测间预测,必需确定,必需确定预测值预测值的抽的抽样样分布,分布,必需找出与必需找出与和和E Y/X0 都都有关的有关的统计统计量量.;的抽样分布的抽样分布l由前面分析知,由前面分析知,是是和和的最正确线性无偏估的最正确线性无偏估计,所以,计,所以,也是也是EY/X0的最正确线性无偏估的最正确线性无偏估计,而且由于计,而且由于均服从正态分布,作为其线性均服从正态分布,作为其线性函数的函数的也必然服从正态分布。也必然服从正态分布。l由于,由于,l以及以及;均值均值E

28、 EY/X0Y/X0的预测区间的预测区间 l所以:所以:l那么有:那么有:l给定显著性程度给定显著性程度,可查,可查t分布表确立临界值分布表确立临界值,l于是于是l从而在从而在1-的置信度下,均值的置信度下,均值EY/X0的预测区的预测区间为间为:; 2.个别值的预测区间: l 剩余项 e0= Y0- 是与预测值 及个别值Y0 都有关的变量,由于Y0和 都服从正态分布,显然e0也服从正态分布,且可证明l Ee0=E =E + - =0l l因此,e0的规范误差为 :l 而且 e0N0,Vare0,规范化后: ;l当用当用替代替代时,对时,对e0规范化规范化的统计量的统计量t为为:l给定显著性程

29、度给定显著性程度,可查,可查t分布表确立临界分布表确立临界值值,l于是于是l从而在从而在1-的置信度下,个别值的置信度下,个别值的预测区的预测区间为间为:构建个别值的预测区间构建个别值的预测区间; 被解释变量被解释变量Y Y 区间预测的特点区间预测的特点 1、 平均值的预测值与真实平均值有误差,主要是 受抽样动摇影响 个别值的预测值与真实个别值的差别,不只受抽 样动摇影响,而且还受随机扰动项的影响;2、平平均均值值和和个个别别值值预预测测区区间间都都不不是是常常数数,是是随随的的变变化化而而变变化化的的,特特别别当当时时,此此时时预预测测区区间间最最窄窄,离离越越远远,越越大,预测区间越宽,预测精度会下降。大,预测区间越宽,预测精度会下降。3、预预测测区区间间上上下下限限与与样样本本容容量量有有关关,当当样样本本容容量量时时个个别别值值的的预预测测误误差差只只决决议议于于随随机机扰动的方差扰动的方差 被解释变量被解释变量Y Y 区间预测的特点区间预测的特点;SRF各种预测值的关系各种预测值的关系Y的个别值的置信区间Y均值的置信区间;

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号