计量经济学课件2lecture04_模型设定

上传人:w****i 文档编号:91881217 上传时间:2019-07-03 格式:PPTX 页数:33 大小:645.91KB
返回 下载 相关 举报
计量经济学课件2lecture04_模型设定_第1页
第1页 / 共33页
计量经济学课件2lecture04_模型设定_第2页
第2页 / 共33页
计量经济学课件2lecture04_模型设定_第3页
第3页 / 共33页
计量经济学课件2lecture04_模型设定_第4页
第4页 / 共33页
计量经济学课件2lecture04_模型设定_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《计量经济学课件2lecture04_模型设定》由会员分享,可在线阅读,更多相关《计量经济学课件2lecture04_模型设定(33页珍藏版)》请在金锄头文库上搜索。

1、Model Specification,Outline,导论 是否要常数项 参数比较 方程形式 基于R2的模型选择 虚拟变量问题,Introduction,前面讨论OLS估计是true参数的无偏估计,也讨论如何从估计值推断true参数是否满足一些限制,那么 What is an econometric model? Is it a true model?几个说法: It is accused that economists searching for “true” model is something like “people searching in a dark room for a no

2、n-existent black cat”. George Box: “All models are wrong, but some one are useful” Theil: Models are to be used, but not to be believed.” Therefore, there is some consensus that models are windows through which researchers view the observable world, and that their acceptance and use depends not upon

3、 whether they can be deemed “true”, but rather upon whether they can be said to correspond to the fact.,因为没有true model,模型的设定就变得非常重要 它甚至比模型的估计与检验来得更重要 但很不幸,我们这门功课主要讲估计和检验,而模型的设定是经济学、金融学等的任务。 那能否通过数据来设定模型? Data can never speak for themselves. Fact can never speak for themselves 模型是窗口,窗口放在哪里是人定的。当然我们还是

4、希望能“窗口”能客观全面一些 There is no accepted “best” way of going about finding a correct specification, 但有一些经验。,1. 是否要常数项,Example: CAPM vs 市场模型 如何回归?理论及实证 不用常数项的后果: R-squares problem Biasness 为什么一般要保留,即使你认为它是零? 什么情况下可以不用常数项? 理论模型是正确的,并且用在长期预测等,2. Scaling Effect and Beta Coefficients,两个问题: Statistically signi

5、ficant, but very small coefficient has any meaning? Does the relative size of two parameters have any economic meaning? 对第一个问题,一种原因是Scaling effect 例如企业规模对企业的社会责任的影响的回归,规模的单位是万元或亿元 On parameter estimate:变化 t value, R2:无变化 但量纲解决不了第二个问题,因为量纲不同。 第二个问题的一种解决方法是用弹性,但改变了方程的性质。 标准化模型能在一定程度上回答两个问题 标准化的步骤:去样本均

6、值,再除样本标准差 为什么标准化模型下,量纲问题不存在? 为什么标准化模型下,系数有可比性? 实际应用中,标准化模型不太多,只有在需要比较参数是才用,3. Functional Form,我们前面讨论的线性回归模型,指的是关于参数的线性,而不是要求关于解释变量的线性 现实生活,非线性(原因与结果之间)才是本来的面目,而线性是近似。当这个近似不够好时,我们就需要考虑x和y之间的非线性关系 我们这里介绍两种非线性关系: 自然对数 有三种模型 SAS中log函数就是自然对数 二次型 什么情况下用非线性?,Beta1的经济含义:弹性 供给函数、需求函数中的价格弹性估计 这个回归模型假定弹性为常数。 B

7、eta1的经济含义:半弹性(百分比变化) 更多的在数据问题中: 既然模型误差u应该是正态分布(假设6),那要求被解释变量的取值区间为(-无穷,+无穷)。而有些被解释变量数据显然不是。这时一般要做对数变换。比如: Comovement (R2), credit quality (default probability): (0,1) z=Ln(y/(1-y) Risk (volatility): (0,infinity) z=ln(y) Other similar data,是否取对数的非正式简单规则:,除了上面的两种取对数的情况,一般我们在下面情况下也取对数(for both dependen

8、t and independent variables) When a variable is a positive dollar amount: wages, salaries, firm sales, and firm market value. Variables being large integer values: population, total number of employees, and school enrollment 一般不用对数的情况: Variables that are measured in yearssuch as education, experienc

9、e, tenure, age, and so onusually appear in their original form. A variable that is a proportion or a percent such as the unemployment rate, returncan appear in either original or logarithmic form,取对数时,回归模型的估计,只要简单地把变化后的log(x)看做x,代入公式就可以。没有任何其它问题。 One limitation of the log is that it cannot be used i

10、f a variable takes on zero or negative values. In cases where a variable y is nonnegative but can take on the value 0, log(1+y) is sometimes used. The percentage change interpretations are often closely preserved, except for changes beginning at y=0 (where the percentage change is not even defined).

11、 Generally, using log(1 + y),第二种非线性关系是二次型: 对二次型回归模型,只要简单地把变化后的x的平方项看做一个新的变量w,这是一个通常的多元回归模型 但beta1不是通常的x的边际影响,beta2也不是x2的边际影响。 因为这里不可能保持x的平方项不变,而考察x对y的影响。 事实上,x对y的影响是 经济含义: 比如大股东持股比例对公司治理的作用、FDI程度对当地经济发展的影响 比如信息透明度对个股特质风险的影响 not very common in empirical finance.,房价问题: 平方项的功能,利用二次型(U型或倒U型)的回归模型,还要注意 ,

12、那么数据中有多少观测值分布在这个极值点的两边? 如果某一边只有几个观测值,那很有可能是outlier 导致的二次型,结果不一定可靠。 所以,一般要看数据特征。比如前面的房价问题中,二次型问题是真的吗? 另外,模型设置中,有二次项时,必须有一次项。 因为一次函数是最基本的近似,二次函数是在考虑了一次之后的近似 还有一种二次函数,即下面的x1*x2的形式,Functional Form: Interaction Term,有时解释变量对被解释变量的边际影响大小,依赖于另一变量。比如: 一套房子的价格与卧室数量的关系,依赖于房子的总面积 实证金融中,也有很多这样的模型: 信息透明度与个体风险的关系:

13、依赖于机构持股比例 管理层持股与企业业绩的关系:依赖于机构持股比例,How to interpret the parameters? the coefficient on atndrte is negative, does it means that attendance has a negative effect? We must plug in interesting values of priGPA to obtain the partial effect or using the sample mean (-.0067 +.0056*(2.59) = .0078) How to tes

14、t whether the effect (0.0078) is significant? F test for beta1 = 0, beta6 = 0? Stronger than what we want. It means any priGPA T-test: we replace priGPA_atndrte with (priGPA-2.59)*atndrte. Exer7_attend.sas 交叉变量模型的设定中,用交叉项时,必须要有单独项!原因? 线性模型是泰特展开近似,必须从低到高。,4 Model Selection Based on R-squares,R2 is no

15、t comparable, but can be used to select model 问题:研究高管的社会关系对公司业绩的影响,社会关系的衡量有: top MBA worked for top companies 用哪个解释变量? 从经济学看,它们都可以用。 如果有一个显著,一个不显著,用显著的那个。 但如果两个都显著,怎么办? 不能都用,因为会有多重共线性问题 解决方案:R2 comparison 为什么? 类似的问题:,相关的问题:用什么非线性? Consider the following two models relating R&D intensity to firm sale

16、s: Which one is better? 这里一般是用来做预测目的的模型选择 Comparing R2 to choose among different nonnested sets of independent variables can be valuable. But we cannot use it to choose different dependent variable or different form of dependent variable. 还有一个类似的问题:用哪些控制变量,需要哪些控制变量?如何报告选择过程?,在大多情况下,我们需要用多元回归,而不是一元回归。那需要加哪些控制变量? 从估计的无偏性来看 如果加入一个无关的控制变量z(与y无关)? 没影响,因为在true model中,z的系数为0. 不影响x的系数的估计的无偏性。 而如果遗漏一个有关的控制变量z(与y有关)? 如果与解释变量x有关 有偏估计 如果与解释变量x无关 没有关系 从这个意义上,多多益善。 但在实际估计时,明知无关的变量肯定不能加,因为它们会加大工作量,并

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号