简单线性回归模型计量经济学

资源描述

《简单线性回归模型计量经济学》由会员分享，可在线阅读，更多相关《简单线性回归模型计量经济学（123页珍藏版）》请在金锄头文库上搜索。

1、计量经济学,第二章简单线性回归模型,2,从2004中国国际旅游交易会上获悉，到2020年，中国旅游业总收入将超过3000亿美元，相当于国内生产总值的8%至11%。（资料来源：国际金融报2004年11月25日第二版）是什么决定性的因素能使中国旅游业总收入到2020年达到3000亿美元？旅游业的发展与这种决定性因素的数量关系究竟是什么？怎样具体测定旅游业发展与这种决定性因素的数量关系?,引子: 中国旅游业总收入将超过3000亿美元吗？,3,第二章简单线性回归模型,本章主要讨论: 回归分析与回归函数简单线性回归模型参数的估计拟合优度的度量回归系数的区间估计和假设检验回归模型预测

2、,4,第一节回归分析与回归方程,本节基本内容: 回归与相关总体回归函数随机扰动项样本回归函数,5,1. 经济变量间的相互关系确定性的函数关系不确定性的统计关系相关关系 (为随机变量) 没有关系,一、回归与相关（对统计学的回顾）,6,函数关系,指某一经济变量可直接表示为其他经济变量的确定的函数，函数表达式中没有未知参数，不存在参数估计的问题。,1) 某一商品的销售收入Y与单价P、销售数量Q之间的关系Y = PQ 2) 某一农作物的产量Q与单位面积产量q 、种植面积S之间的关系Q = q S,例如:,7,相关关系,指不同经济变量的变化趋势之间存在某种不确定的联系，某一或某几个经济变

3、量的取值确定后，对应的另一经济变量的取值虽不能唯一确定，但按某种规律有一定的取值范围。,居民消费C与可支配收入Y之间的关系，可支配收入的取值确定后，消费的取值虽不能唯一确定，但有一定的取值范围，0 C Y ，遵循边际消费倾向递减的规律。居民消费C与可支配收入Y之间的关系可表示为C = + Y，、为待估参数。,例如:,相关关系的表达式一般表示为含有未知参数的函数形式，需要进行参数估计。,8,9,相关关系的类型从涉及的变量数量看简单相关多重相关（复相关）从变量相关关系的表现形式看线性相关散布图接近一条直线非线性相关散布图接近一条曲线从变量相关关系变化的方向看正相关变量同方向变化，

4、同增同减负相关变量反方向变化，一增一减不相关完全相关、完全不相关,10,11,相关系数的取值介于11之间，取值为负表示两变量之间存在负相关关系；取值为正表示两变量之间存在正相关关系；取值为1表示两变量之间存在完全负相关关系；取值为0表示两变量不相关；取值为1表示两变量之间存在完全正相关关系。,12, 和都是相互对称的随机变量线性相关系数只反映变量间的线性相关程度，不能说明非线性相关关系样本相关系数是总体相关系数的样本估计值，由于抽样波动，样本相关系数是个随机变量，其统计显著性有待检验相关系数只能反映线性相关程度，不能确定因果关系，不能说明相关关系具体接近哪条直

5、线计量经济学关心：变量间的因果关系及隐藏在随机性后面的统计规律性，这有赖于回归分析方法,使用相关系数时应注意,13,函数关系与相关关系的区别,确定的函数关系可以直接用于经济活动，无需分析。,不确定的相关关系，隐含着某种经济规律，是有关研究的重点,14,4. 回归分析,回归的古典意义：高尔顿遗传学的回归概念 ( 父母身高与子女身高的关系) 回归的现代意义：一个应变量对若干解释变量依存关系的研究回归的目的（实质）：由固定的解释变量去估计应变量的平均值,15,3. 回归分析,研究不仅存在相关关系而且存在因果关系的变量之间的依存关系的一种分析理论与方法，是计量经济学的方法论基础，,主要

6、内容,1）设定理论模型，描述变量之间的因果关系；,2）根据样本观察数据利用适当方法对模型参数进行估计，得到回归方程；,3）对回归方程中的变量、方程进行显著性检验，推求参数的置信区间、模型的预测置信区间；,4）利用回归模型解决实际经济问题。,16,例如:,居民消费C与可支配收入Y之间不仅存在相关关系而且存在因果关系，不仅可以利用相关分析研究两者之间的相关程度，还可以利用回归分析研究两者之间的具体依存关系。可以将C作为被解释变量、Y作为解释变量，根据相关经济理论，设定含有待估参数、的理论模型C = + Y，估计模型中的参数、，得到回归方程，进行相关统计检验和推断，利用回归模型进行结构分析

7、、经济预测、政策评价等。,17, 的条件分布当解释变量取某固定值时（条件），的值不确定，的不同取值形成一定的分布，即的条件分布。的条件期望对于的每一个取值，对所形成的分布确定其期望或均值，称为的条件期望或条件均值,注意几个概念,18,19,回归函数：应变量的条件期望随解释变量的变化而有规律的变化，如果把的条件期望表现为的某种函数这个函数称为回归函数。回归函数分为：总体回归函数和样本回归函数,举例：假如已知100个家庭构成的总体。,回归线与回归函数,20,例:100个家庭构成的总体 (单位:元),21,22,总体回归曲线与总体回归函数,给定解释变量条件

8、下被解释变量的期望轨迹称为总体回归曲线（population regression curve），或总体回归线（population regression line）。,描述总体回归曲线的函数称为总体回归函数（population regression function）。,23,24,实际的经济研究中总体回归函数通常是未知的，只能根据经济理论和实践经验去设定。“计量”的目的就是寻求PRF。总体回归函数中与的关系可是线性的，也可是非线性的。对线性回归模型的“线性”有两种解释就变量而言是线性的的条件均值是的线性函数就参数而言是线性的的条件均值是参数的线性函数,3.如何理解总体

9、回归函数,25,例2-1,假设一个由100个家庭构成的总体，并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800 元、3300元、3800元、4300元、4800元、5300元、5800元10 种情况，每个家庭的月可支配收入与消费数据如表2-1所示，要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系，以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。,26,表2-1 100个家庭的月可支配收入与消费数据单位：元,27,家庭消费支出主要取决于家庭可支配收入，但不是唯一取决于家庭可支配收入，还会受到其他各种不确定性因素的

10、影响，因而可支配收入相同的不同家庭的消费支出各不相同。,由此可求得对应于家庭可支配收入X的各个水平的家庭消费支出Y的条件均值（conditional mean）或称为条件期望（conditional expectation），如表2-2所示。,析：,28,表2-2 100个家庭的月可支配收入与消费数据单位：元,由表2-1、表2-2中的数据绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的总体回归曲线，如图2-1所示。,29,从散点图可以清晰地看出，不同家庭的消费支出虽然存在差异，但总体趋势随可支配收入的增加而增加，总体回归曲线反映了这一趋势。,30,事实上，经济活动

11、中的总体包含的个体的数量往往非常多，一般不大可能像例2-1假设的那样得到总体中所有个体的观察数据，因此也就不大可能依据总体的所有观察数据计算得到被解释变量Y的条件期望，无法画出精确的总体回归曲线，相应地，总体回归函数的具体形式也无法精确确定。所以，对于总体回归函数，通常只能根据经济理论或实践经验进行设定，也就是说，通常需要对总体回归函数作出合理的假设。,31,32,三、随机扰动项,概念: 各个值与条件均值的偏差代表排除在模型以外的所有因素对的影响。性质：是期望为0有一定分布的随机变量重要性：随机扰动项的性质决定着计量经济方法的选择,33, 未知影响因素的代表无法取得数据

12、的已知影响因素的代表众多细小影响因素的综合代表模型的设定误差变量的观测误差变量内在随机性,引入随机扰动项的原因,34,四、样本回归函数（SRF）,35,SRF 的特点,每次抽样都能获得一个样本，就可以拟合一条样本回归线，所以样本回归线随抽样波动而变化，可以有许多条（SRF不唯一）。,SRF2,36,样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。样本回归线还不是总体回归线，至多只是未知总体回归线的近似表现。,37,38,对样本回归的理解,如果能够获得和的数值，显然: 和是对总体回归函数参数和的估计是对总体条件期望的估计在概念上类似总体回归函数中的，可

13、视为对的估计。,39,40,41,第二节简单线性回归模型的最小二乘估计,本节基本内容: 简单线性回归的基本假定普通最小二乘法 OLS回归线的性质参数估计式的统计性质,42,一、简单线性回归的基本假定,1. 为什么要作基本假定？模型中有随机扰动，估计的参数是随机变量，只有对随机扰动的分布作出假定，才能确定所估计参数的分布性质，也才可能进行假设检验和区间估计只有具备一定的假定条件，所作出的估计才具有较好的统计性质。,43,（1）对模型和变量的假定如假定解释变量是非随机的，或者虽然是随机的，但与扰动项是不相关的假定解释变量在重复抽样中为固定值假定变量和模型无设定误

14、差假定变量没有测量误差,2、基本假定的内容,44,又称高斯假定、古典假定假定1：零均值假定在给定的条件下，的条件期望为零假定2：同方差假定在给定的条件下，的条件方差为某个常数,（2）对随机扰动项的假定,45,假定3：无自相关假定随机扰动项的逐次值互不相关假定4：随机扰动与解释变量不相关,46,假定5：对随机扰动项分布的正态性假定即假定服从均值为零、方差为的正态分布（说明：正态性假定不影响对参数的点估计，但对确定所估计参数的分布性质是需要的。且根据中心极限定理，当样本容量趋于无穷大时，的分布会趋近于正态分布。所以正态性假定是合理的）,47,的分布性质,由

15、于的分布性质决定了的分布性质。对的一些假定可以等价地表示为对的假定：假定1：零均值假定假定2：同方差假定假定3：无自相关假定假定5：正态性假定,48,OLS的基本思想不同的估计方法可得到不同的样本回归参数和，所估计的也不同。理想的估计方法应使与的差即剩余越小越好因可正可负，所以可以取最小即,二、普通最小二乘法（rdinary Least Squares ）,49,正规方程和估计式,用克莱姆法则求解得观测值形式的OLS估计式：,取偏导数为0，得正规方程,50,为表达得更简洁，或者用离差形式OLS估计式：注意其中：而且样本回归函数可写为,用离差表现的OLS估计式,51,三、OLS回归线的性质,可以证明：回归线通过样本均值估计值的均值等于实际观测值的均值,52,剩余项的均值为零应变量估计值与剩余项不相关,解释变量与剩余项不相关,53,四、参数估计式的统计性质,(一)参数估计式的评价标准 1. 无偏性前提：重复抽样中估计方法固定、样本数不变、经重复抽样的观测值，可得一系列参数估计值参数估计值的分布称为的抽样分布，密度函数记为如果

展开阅读全文