典型建模案例的实际操作

上传人:xzh****18 文档编号:33757607 上传时间:2018-02-17 格式:DOC 页数:42 大小:2.61MB
返回 下载 相关 举报
典型建模案例的实际操作_第1页
第1页 / 共42页
典型建模案例的实际操作_第2页
第2页 / 共42页
典型建模案例的实际操作_第3页
第3页 / 共42页
典型建模案例的实际操作_第4页
第4页 / 共42页
典型建模案例的实际操作_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《典型建模案例的实际操作》由会员分享,可在线阅读,更多相关《典型建模案例的实际操作(42页珍藏版)》请在金锄头文库上搜索。

1、典型建模案例的实际操作张晓峒(2009-12-4)南开大学数量经济研究所所长、博士生导师中南财经政法大学兼职教授中国数量经济学会常务理事、天津市数量经济学会理事长http:/202.113.23.180:7050(南开大学经济学院数量经济研究所)建立计量经济模型的一般过程:(1)确定研究对象,以及影响其变化的因素。(2)定义解释变量与被解释变量。收集数据(间接收集数据,直接作统计抽样调查) 。(3)画变量散点图,分析变量之间的关系。(4)计量经济学主要研究:设定模型形式,估计模型,对估计模型进行诊断与检验,确定模型最终估计结果,分析回归参数,解释经济含义,用模型预测等几个环节。(2)建模案例:

2、【案例】中国旅游业产值预测(多元回归模型) (file:0611525)【案例】恩格尔是怎样发现恩格尔定律的(一元回归模型) (file:food) 。【案例】建立什么形式的模型最合理(多元回归模型) (file: 0611724) 。【案例】日本人口模型(ARIMA 模型) (file:japopu )【案例】香港季节 GDP 数据拟合(SARIMA 模型) (file:HongKong )【案例】预测中国旅游人数(regARIMA 模型) (file:5arma09a) 。【案例】黄金价格增长率与人民币兑美元汇率增长率关系研究(GARCH 模型)(file:5GARCH-2 )【案例】股票

3、交易的上证指数和总成交量关系(VAR 模型) (file :2120061741,5var03 )【案例】对天津市旅馆服务质量的评估(有序响应模型)(file:5order_model-3)【案例】病人看大夫次数的计量分析(计数模型)(file:5count-model01)【案例】蒙特卡罗模拟与编程。分位数回归模型非线性时间序列模型确定研究对象 其影响因素。定义变量收集数据 画变量 散点图 设定,估计,诊断、检验模型,分析回归参数,预测。 (1)确定研究对象,以及影响其变化的因素。【例】研究中国旅游业的发展。确定研究对象:是研究总量的变化,还是研究增长率的变化?是研究全国的情况,还是分省的情

4、况?还是与其他国家的对比?是研究旅游业产值,还是旅游人数的变化?是研究国内游客规模,还是入境的国外游客规模?【例】以研究旅游业产值为例,确定其影响因素:经济发展规模,中国人口规模,旅馆业规模,物价,旅游景点,旅游人数,黄金周政策。(2)定义解释变量与被解释变量,确定研究范围。被解释变量的选取要(1)依据经济理论, (2)要深调查研究,具体问题具体分析。【案例】研究范围:以研究全国旅游业产值为例,被解释变量:Y:全国旅游业产值 Y(单位:万元)解释变量:X 1:国内生产总值 GDP(单位:亿元)X2:消费者物价指数 CPI,X3:中国人口数(单位:万人)X4:全国旅馆数,X5:全国旅游景点数(单

5、位:千个)X6:旅游人数(单位:万人) ,H:黄金周政策虚拟变量收集数据间接收集数据:各种统计年鉴、数据库、数据网站。直接作统计调查:普查、抽样调查。经济数据不变价格的计算(用定基价格指数修正) 。(3)画变量散点图,分析变量之间的关系(强调这一点) 。例:0120340560781014018020260XY 01203405607181201260130X3Y012034056079510510512051305140XY 01203405607-.20.0.20.40.60.81.01.2HY例:画对数变量散点图:(线性化有所改善)6.87.27.68.08.48.909.29.49.6

6、9.810.10.2LOG(X1)LOG(Y) 6.87.27.68.08.48.101201260130X3LOG(Y)6.87.27.68.08.48.-020.0.20.40.60.81.01.2HLOG(Y)6.87.27.68.08.48.9510510152015301540XLOG(Y)例:观察旅游收入序列01203405607945967980102304506Y(分析 1)1999 年施行的黄金周政策(H )未对旅游收入产生显著性影响。(分析 2)非典对旅游收入影响显著。分析相关系数矩阵:(分析 3)旅游收入 Y 和中国人口数 X3 关系最密切。应该以 Y 和 X3 的回归为

7、基础建立多元回归模型。(分析 3)解释变量间 log(X3)和 log(X1)相关最强。(4)设定模型形式,估计模型,对估计模型进行诊断与检验,确定模型最终估计结果,分析回归参数,解释经济含义,用模型预测等几个环节。建立 5 元回归模型LnYt = 0 + 1LnX1 + 2LnX2 + 3LnX3 +4H+ 5D + ut回归结果分析:(1)log(X 1)的回归系数为负,且无显著性,一定和“与 log(X3)高度相关”有关。(2)如预期的一样,黄金周分期 H 的作用无显著性。从模型中删去 log(X1)和 H,得模型中不存在自相关,也不存在异方差。估计结果:log(Y) = -192.40

8、 + 0.67 log(X2) + 16.76 log(X3) + 0.23D1 (-35. 5) (3.7) (32.3) (6.8) R2=0.997, DW=1. 92【案例】恩格尔是怎样发现恩格尔定律的(file:food) 。1857 年,德国德累斯顿市的德国统计学家恩斯特恩格尔(Engel)使用经 Edouard Ducpetiaux 收集的 198 个比利时家庭的收入与食物支出数据(单位:比利时法郎)得出其著名的恩格尔定律:收入越高的家庭将其收入用于食物支出的比例越低。040801201602040801206204028032TOALFODFOD vs.TOALfood = 0

9、 + 1 (income) + ut = 84.1 +0.53income(5.1) (32.7) R2=0.85, T=198食物支出占收入的比例为 。 53.01.840incomeincoeimfd食物支出占收入的比例随着收入的增加而递减。048012602408120620402830TOALFOD(Ernst Engel ,1821 1896)【案例】建立什么形式的模型最合理(file: 0611724) 。关于私家车保有量的模型CAR:私家汽车保有量(单位:万辆)GDP:代表国内生产总值(单位:亿元)POPU:代表城市人口(单位:千万人)ROAD:代表全国公路里程数(单位:万公里)

10、 分别观察 CAR 与 GDP、POPU、ROAD 的散点图,0408012016020240408012016020240GDPCAR 04080120160202402832364044852560PCAR 040801201602024011502025030350ROADCAR学生的做法:可以看出全国的公路里程数与私家车的保有量没有显著的关系,通过观察散点图可以排除掉 road 因素,建立 car 与 gdp 和 p 之间关系的模型。CARt=C+1GDPt+2POPUt+ ut用最小二乘法估计结果如下图:x2=-0.027 明显不符合现实,通过观察 CAR 与 GDP 的散点图,进一

11、步补充虚拟变量D1,D1=1 (1990-1998 ) ,D1=0(1999-2006 )建立模型 CARt=C+1GDPt+2POPUt+3D1+4D1GDPt+ ut估计结果如下图:模型:CARt=-903.34+0.144GDPt+0.002 POPU t +824.140D1-0.010D1GDPtR2=0.998 , DW=1.76 此模型虽然拟合度很高而且 DW 通过检验,但 POPU 的 t 检验没有通过,通过进一步观察 CAR 与 POPU 的散点图,增加虚拟变量 D2,D2 = 1,(1990-1999),D2 = 0 ,(2000-2006)建立模型如下图:数学模型:CAR

12、t = -1215.902+0.014GDPt+9.851 POPUt +884.675D1-0.011D1GDPt+1.702D2*pR2=0.9998, DW=1.96【点评】(1)最终结果,人口仍没通过检验。虚拟变量用得不好。CAR 与 POPU 的关系处理的不好。(2)全国的公路里程数(ROAD)与私家车的保有量( CAR)有显著的线性关系。(3)虚拟变量 D1 分期不好,应该把 0 值前移两年,即D1=1, (1990-1996) ;D1= 0, (1997-2006) 。0408012016020240408012016020240GDPCAR 040801201602024028

13、32364044852560PCAR 040801201602024011502025030350ROADCAR定义虚拟变量 D1=1(1990-1996) ,D1= 0(1997-2006) , (0 值前移两年)CAR 与 POPU 的关系处理成抛物线形式。估计结果如下:POPU 和 POPU2 项都有显著性。CAR 与 GDP 是带有结构突变的线性关系,CAR 与 POPU 是 2 次多项式关系。误差项不存在自相关也不存在异方差。预测效果好。048012602401992149619820024206CARCARF注意:虚拟变量 D1 定义是, D1=1, (1990-1996) ;D1

14、= 0, (1997-2006) 。如果定义为D1=0, (1990-1996) ;D1= 1, (1997-2006) ,效果不好。【案例】用组合模型预测中国旅游人数(Y t,万人次) (file:5arma09a) 。(数据:1999 年 1 月至 2007 年 6 月) ,非典(2003 年 46 月)数据来源:1999 年 1 月至 2007 年 6 月中国旅游统计年鉴和中国旅游网 http:/。非典对旅游人数序列是一个干扰。序列中存在时间趋势和月度影响。首先定义时间变量 t 和月度虚拟变量。设定 1999 年 1 月,t =1,定义 11 个月度虚拟变量12 .,3 01jjDj 月

15、 份数 据 不 属 于 第, 月 份数 据 属 于 第,序列在 2003 年 4、5、6 月份存在明显的非典冲击,旅游人数剧减。定义 3 个虚拟变量AO1,AO2,AO3,4203,1月年 月年非AO 5,月年 月年非 6203,1月年 月年非AO AO1,AO2,AO3 属于脉冲式虚拟变量。-0.5.0.51.5192020120203204205206AO1由图分析,旅游人数是经过一年多的恢复才回到正常状态。定义一个指数非典冲击变量exp1。 1,72038.6exptt月年 月 及 以 前年EViews命令:exp1= 0,(2003 年6月以前);exp1=.8trend(2003m6

16、),(2003年7月以后)0.0.40.8192020120203204205206EXP1估计两个回归式,用旅游人数(Y t,万人)对常数项,非典冲击虚拟变AO1,AO2,AO3,exp1,时间 t 回归。得结果如下:-20-15-0-5051051920012032045206RESID残差序列中还存在月度成分。把描述月度变化的虚拟变量D2、D3、D4、D5、D6、D7、D8、D9、D 10、D 11、D12 加入模型,除取不显著虚拟变量,得-10-5005010920012032045206RESID经分析,模型中还可以加入 MA(3)或 AR(3)。得最终两个模型如下:观察特征根的位置,做 Q 检验。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 法律文献 > 理论/案例

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号