计量第二章讲义

上传人:今*** 文档编号:108210496 上传时间:2019-10-22 格式:PPT 页数:64 大小:895.50KB
返回 下载 相关 举报
计量第二章讲义_第1页
第1页 / 共64页
计量第二章讲义_第2页
第2页 / 共64页
计量第二章讲义_第3页
第3页 / 共64页
计量第二章讲义_第4页
第4页 / 共64页
计量第二章讲义_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《计量第二章讲义》由会员分享,可在线阅读,更多相关《计量第二章讲义(64页珍藏版)》请在金锄头文库上搜索。

1、第二章 一元线性回归模型,古典线性回归模型及其基本假设 回归参数的点估计OLS法 经典假设满足时的区间估计与假设检验 方差分析与拟合优度 用回归模型进行预测 一元线性回归分析案例,一、古典线性回归模型,任意抽出一个妇女,试猜测其体重 如何猜?准确性如何? 猜平均体重,最大偏差:26 如何猜得更准确? 影响体重的最直接因素是身高:一般身高高的人体重大。 平均身高:62.85inch, 标准差:3.3 以平均身高分界:最大偏差20 E(weight/hight)=b0+b1hight,,例:20个妇女的体重资料如表, 平均体重:123.6pound,标准差:15.5 最低体重:93pound, 最

2、大体重:155,一个身高60的妇女体重平均111.5,最大偏差12,猜体重平均值,最大偏差:26,身高相同的人体重不一定相同,平均来看,体重随身高的增加而增加,以平均身高分界,高于平均身高猜134,低于平均身高猜113.2:最大偏差20,能不能猜得更准?,这条直线的含义是什么?,一个身高60的妇女体重平均111.5,最大偏差12,观测值weighti,总体回归线,通常,身高高的人体重大。同样身高的人体重不同,即在给定身高下,体重有一个分布。大样本下为正态分布。,总体回归线反映了给定身高下,体重的平均水平: E(weight/hight)=b0+b1hight ,b0,b1是未知的参数,已知20

3、个妇女的身高体重资料以此为样本估计总体参数,样本回归线,为什么要有,回归分析的任务:从样本 回归线估计总体回归线,一元线性回归的一般模型,其中:(Yi, Xi)-样本观测值, 0、1回归系数(总体参数,待估), i-随机误差项(方差为总体参数,待估,反映了因变量的离散程度) 1的经济意义:X对Y的影响程度:X增加一个单位,平均来说将导致Y增加1个单位,经典回归模型的基本假定,假设1:解释变量x是非随机变量,它的值是确定的条件回归。Yi与i同分布。,假设2:随机误差项具有0均值和同方差。 即:E(i )=0, Var(i )= i=1,2,n,E(i )=0 的说明,E(i )=0 即:凡是模型

4、不显含的、因而归属于i 的因素,对y的均值都没有系统影响。,如果E(i )=,即被省略的变量对y的均值有系统性影响,则有: Yi=0+1Xi+i= 0+1Xi+i+- =(0+)+1Xi+(i-) = +1Xi+ 新模型, 所有系统性影响都包含在截距项(常数项)中,所以一般不予过多关注。,总体回归函数,Var(i )= 的说明,随机误差项具有相同的散布程度,即对应于不同x值的y总体具有同样的方差。 如果Var(i)= 则称随机误差项具有异方差,古典回归模型的基本假定,假设3:随机误差项在不同样本点之间是独立的,不存在序列相关,即: Cov(i,j)=0 ij i,j=1,2,n Cov(i,j

5、)=E(iE(i)(jE(j) =E(ij)=0 当来自于不同观测值的误差项相关时,即其协方差不为0,则称这个误差序列是序列相关的。,古典回归模型的基本假定,i,j,i,i,j,j,古典回归模型的基本假定,假设4:随机误差项与解释变量之间不相关,即:Cov(Xi,i)=0 i=1,2,n 此假定意味着X和(代表了所有被省略的变量的影响)对Y有各自的影响,并且使可加的。 当X为非随机变量时,此假设自动成立。证明? Cov(Xi,i)= E(XiE(Xi)(iE(i)=0,古典回归模型的基本假定,假设5:随机误差项服从0均值,同方差的正态分布,即: i N(0, ) Yi N(0+1Xi , ),

6、前4个假设构成了古典线性回归模型。对于假设5,根据中心极限定理,但样本容量趋于无穷大时,对于任何实际模型都是满足的。,二、回归参数的点估计,回归参数的最小二乘估计 最小二乘估计量的性质,1. 普通最小二乘估计(OLS),一元线性回归模型:Y=0+1X+ 在的零均值假设下,,总体回归线,总体回归线:说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。 0、1为总体参数,1. 普通最小二乘估计(OLS),随机抽取n组样本值Xi, Yi, i=1,2,n,有Yi=0+1Xi+i 利用样本数据得到参数0 、1的估计量 、 设被解释变量Yi的估计值为: 样本回归线可以看作是对总体回归线的一

7、个点估计 样本观测值与估计值的关系为: 称为回归残差,它是对随机误差项i的一个估计,样本回归线,回归分析的主要目的:根据样本回归函数估计总体回归函数。,1. 普通最小二乘估计(OLS),OLS的思路:使残差平方和最小,即:,极值条件:,残差的性质,正规方程组,正规方程组的另一种写法:,1. 普通最小二乘估计(OLS),求解上述联立方程得到回归参数点估计量:,其中:,分别是xi和yi的离差,随机误差项方差的估计量为:,1. 普通最小二乘估计(OLS),OLS回归线的性质: 回归线通过Y和X的样本均值,即: 残差之和为零,即: 残差和Xi不相关,即: 残差和i不相关,即:,证明?,*极大似然估计,

8、基本原理:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。 ML必须已知随机项的分布。,Yi的分布,Yi的概率函数,Y的所有样本观测值的联合概率似然函数,对数似然函数,对数似然函数极大化的一阶条件,结构参数的ML估计量,结果与参数的OLS估计相同。,分布参数的ML估计量,分布参数估计结果与OLS不同,2. 最小二乘估计量的性质,高斯-马尔可夫定理:在给定经典线性回归模型的假定下,最小二乘估计量在无偏线性估计量一类中具有最小方差,即它们是最优线性无偏估计量(BLUE)。 线性性: 0、1的最小二乘估计量是Y的观测值的线性函数,即: 无偏性:

9、一个估计量的均值(期望)等于其真值,即: 有效性:在所有线性无偏估计量中方差最小,OSL估计量与各类估计量的关系,全部估计量,线性估计量子集,线性无偏估计量子集,BLUE,OLS估计量性质的证明,线性性的证明:,性质:1. ki非随机 2. ki=0 3. 4.,OLS估计量性质的证明,无偏性证明:,OLS估计量性质的证明,有效性证明: 方差的推导,方差的性质:,最小二乘估计量的方差,OLS估计量性质的证明,有效性证明:设 为1的任一线性无偏估计量,则有:,且 i=0 , iXi=1,只要iki,关于OLS估计量方差的说明,对给定的 ,方差 越大,回归系数估计量的方差就越大,估计精度越低;对给

10、定的 ,x值越分散, 的方差越小,估计的精度越高。,和 之间的依赖性由它们间的协方差来衡量。,随着样本容量n的增大,总和 中的项数将增加,1的估计精度也随之增加。,负号表明:如果1被高估, 0就将被低估,三、经典假设满足时的区间估计与假设检验,只有在经典假设满足时,OLS估计量是最优线性无偏估计量区间估计和统计检验的前提条件 回归系数的置信区间 回归系数的假设检验t检验,1. 回归系数的置信区间,求1的置信区间,在i正态性假定下,OLS估计量也是正态分布的: 构造t变量: 设给定的显著性水平是, 其/2的临界值为,t变量遵循自由度为n-2的t分布,置信上限,置信下限,例1. 手表需求函数,根据

11、我国1973-1983年手表价格和销售的实际资料拟合手表需求函数,置信度95%。 解题步骤: 作散点图,观察销售量与价格的相关形式 建立一元线性回归模型 yi=0+1xi+i i=1,2,n y:手表销售量 x:手表平均价格, 结果: i=9642.6-64.95xi se: (1009.8)(8.4),195%的置信区间:,t=2.262,的95%的置信区间为(0.42, 0.60),例2. 凯恩斯消费函数,每周家庭消费支出y和每周家庭收入x的数据如表,求凯恩斯消费函数。 建立一元线性回归模型 yi=0+1xi+i i=1,2,n y:每周家庭消费支出 x:每周家庭收入 结果: i=24.4

12、5+0.51xi se: (6.41) (0.04),195%的置信区间:,t=2.306,=2.306*0.04=0.09,2. 回归系数的显著性检验,凯恩斯消费函数例。样本回归方程为(一次估计): i=24.45 + 0.51xi E(yi/xi)=0+1xi se: (6.41) (0.04) H0: 1=0 ;H1: 10,检验统计量t服从n-2的t分布,接受域: 或t的精确p值大于。,结果:,计量经济学中,回归系数的显著性检验主要是针对回归参数真值是否为零来进行的。,2. 回归系数的显著性检验,对一元模型yi=0+1xi+i 得到回归系数的估计值后,软件输出两个常规检验的t统计量,并

13、给出各自的精确p值:,一般t检验:经济意义检验,一般回归系数的显著性检验用t检验:,边际消费倾向11的假设检验? H0: 11 H1: 11,拒绝域: 或t的精确p值小于,=0.05, T=-1.86 统计上显著,拒绝原假设,p(t)=3.88E-07,四. 方差分析与方程显著性检验,方差分析:一个好的方程应该是有助于解释y的大部分变异的方程。,回归误差,可由X的改变解释,残差:随机,四. 方差分析与方程显著性检验,TSS = RSS + ESS,总平方和,残差平方和,回归平方和,Y的变异,拟合优度,拟合优度由判定系数来衡量:,含义:Y的总变异中可由X变化解释的部分所占百分比 0r2 1,如果

14、实际观测点离样本回归线越近,则ESS在TSS中占的比重越大, r2越接近1,拟合程度越高,方程的显著性检验:,对模型中被解释变量与所有解释变量之间的线性关系在总体上是否成立做出判断。 H0: 1=0, H1: 10 检验统计量F构造如下:,如果I服从正态分布,则F服从分子自由度为1,分母自由度为n-2的F分布。,给定显著性水平,则当F1,n-2F临界或当F1,n-2的p值小于时,拒绝原假设。,注意F统计 量与t统计 量的区别,注意:一元线性回归中,t检验与F检验一致,一方面,t检验与F检验都是对相同的原假设H0:1=0 进行检验; 另一方面,两个统计量之间有如下关系:,参数估计的标准误,回归参

15、数估计值,单零检验之t统计量:H0:B=0,方程显著性检验之F统计量,判定系数,假设检验例:凯恩斯消费函数,残差平方和,因变量均值,因变量标准差,假设检验例,凯恩斯消费函数估计结果 i=24.45+0.51xi Se: 6.414 0.036 t: 3.813 14.243 p: 0.0051 0.0000 在5%的水平下显著R2=0.962 即:96%的每周支出的变异能由收入来说明 F=202.868 p(F)=0.0000 在5%的水平下显著,在$80-$260这个极差范围内,收入每增加$1,平均消费估计增加$0.51,20个妇女的体重对身高作回归,身高对体重的影响是显著的吗? 求回归系数95%的置信区间,五. 利用回归方程做预测,给定样本以外的观测值X=X0,可以得到Y的条件均值 E(Y0/X0)=0+1X0的估计值:,1. 均值预测:给定X0,预测E(Y0/X0),均值预测的置信区间,可以证明

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号