第3章 双变量模型假检验

上传人:新** 文档编号:586457890 上传时间:2024-09-04 格式:PPT 页数:61 大小:972.02KB
返回 下载 相关 举报
第3章 双变量模型假检验_第1页
第1页 / 共61页
第3章 双变量模型假检验_第2页
第2页 / 共61页
第3章 双变量模型假检验_第3页
第3页 / 共61页
第3章 双变量模型假检验_第4页
第4页 / 共61页
第3章 双变量模型假检验_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《第3章 双变量模型假检验》由会员分享,可在线阅读,更多相关《第3章 双变量模型假检验(61页珍藏版)》请在金锄头文库上搜索。

1、1Review of simple regression model: estimationlPopulation regression model:E(Y|X)= b0 +b1 XYi=b0 +b1 Xi+uilSample regression model:l“Linear” regressionLinear with parameters2Estimation of simple regression model: OLS3第第3章双变量模型:假设检验章双变量模型:假设检验Simple regression model: Inferencey= b0 + b1 x + u4目录l3.1经

2、典线性回归模型基本假设l3.2OLS估计量的方差与标准差l3.3OLS估计量的性质l3.4OLS估计量的分布l3.5假设检验l3.6判定系数:R2l3.7回归分析结果的报告l3.8正态性检验l3.9例子:简单工资决定模型l3.10预测53.1经典线性回归模型的基本假设l解释变量(X)与随机误差项(u)不相关。即cov(X,u)=0,如果X是非随机的,上述假定自动成立。l随机误差项的均值为0,即E(u)=0平均来说,随机项的影响可以相互抵消,其实该假设只是为了便于处理。l随机误差项同方差(homoscedasticity),即Var(ui)=s2, 所以Var(Y|X)=var(b0 + b1X

3、 + u|X) = s2Var(Y)=var(b0 + b1X + u) = s26同方差性(Homoscedasticity).x1x2E(y|x) = b0 + b1xyf(y|x)7异方差(Heteroscedasticity).x x1x2yf(y|x)x3.E(y|x) = b0 + b1x83.1经典线性回归模型的基本假设l随机误差项无自相关(no autocorrelation),又称序列相关,即Cov(ui, uj) = 0 for all ij,等价于E(ui, uj) = 0l随机误差项服从正态分布,即u N (0, s2)l上述几条假设称为经典线性模型基本假设(CLRM)

4、93.2 OLS估计量的方差与标准差lOLS估计量103.2 OLS估计量的方差与标准差113.2 OLS估计量的方差与标准差ls2的估计量l回归标准差(standard error of the regression)123.2 OLS估计量的方差与标准差133.3OLS估计量的性质lGauss-Markov Theorem如果满足经典计量经济学模型基本假设,则在所有无偏估计量中,OLS估计量具有最小方差性;即OLS估计量是最优线性无偏估计量(BLUE)。l线性:模型参数估计量是样本观察值的线性函数。143.3OLS估计量的性质l无偏性l最小方差性:OLS估计量是所有无偏估计量中方差最小的估

5、计量。153.4OLS估计量的分布 首先,首先, 由于解释变量iX是确定性变量,随机误差项iu是随机性变量,因此被解释变量iY是随机变量,且其分布 (特征)与iu相同。其次其次,0b和1b分别是iY的线性组合,因此0b、1b的概率分布取决于 Y。在u是正态分布的假设下,Y 是正态分布,因此0b和1b也服从正态分布,其分布特征(密度函数)由其均值和方差唯一决定。163.4OLS估计量的分布l经典模型假设ui N(0,s2)XN(a, s12), YN(b, s22), 相互独立X+YN(a+b, s12+ s22)因此,OLS估计量也服从正态分布173.4OLS估计量的分布18例3.1在收入收入

6、- -消费支出例子消费支出例子中,参数估计及其标准差的计算如下19 (64.1382) (0.0357)203.5假设检验l在模型估计中,我们往往关注某些变量是否对被解释变量有关系,如果关系不大,我们估计出的参数应该比较小,接近于零。因此,在假设检验中,我们往往关注这样的原假设,H0: b1=0比如居民消费函数Y b0 + b1X + u213.5假设检验223.5假设检验233.5假设检验243.5假设检验:例子 (64.1382) (0.0357)253.5假设检验:例子263.5假设检验:例子l事实上,我们可以进行其他形式的假设检验,不只是考虑为0的假设。比如:273.5假设检验:例子2

7、83.5假设检验:例子l如果我们现在要检验斜率的标准差是否为0.03,我们将使用卡方分布。29Summary for the classlClassical linear model assumption (CLM)Cov(X,u)=0E(Xu)=0E(u)=0Var(u)=s2, homoskedasticityCov(ui, uj)=0, no autocorrelationuiN(0, s2), normal distributionlGuass-Markov Theorem: OLS estimates are BLUE under CLM assumption.30Variances

8、 and stand deviations of OLS estimates31Estimate of variances and stand deviations of OLS estimates32The distribution of OLS estimates333.6判定系数R2343.6判定系数R2353.6判定系数R2.eixy363.7回归分析结果的报告373.7回归分析结果的报告(STATA)383.7回归分析结果的报告(Eviews)393.8正态性检验我们CLM假设误差项服从正态分布,如果不服从正态分布,我们就无法推出OLS估计量的分布,也就无法进行假设检验。那么我们的数

9、据是不是正太分布呢,有一些检验方法:l残差直方图lJarque-Bera 检验403.8正态性检验lJarque-Bera 检验H0:变量服从正态分布。从上面的式子可以看出,如果为正态分布,则JB值为0。如果通过计算,JB值大于临界值c2a(2),则拒绝原假设,认为变量不服从正态分布。lSK检验H0:变量服从正态分布。如果通过计算,JB值大于临界值c2a(2),则拒绝原假设,认为变量不服从正态分布。413.9例子:简单工资决定模型l考虑两种形式的工资决定模型wage=b0+b1educ+ulog(wage)=b0+b1educ+ul数据(wage1.raw)l结果wge=-0.905+0.54

10、1educ(0.685) (0.053) 0.187 0.000 n=526, R2=0.1648Skewness=1.861 Kurtosis=7.797 JB=807.843SK=212.55log(wge)=0.583+0.083educ (0.097)(0.0076) 0.0000.000 n=526 R2=0.1853Skewness=0.268 Kurtosis=3.586 JB=13.811 SK=11.80c20.05=5.99423.9例子:美国的进行支出模型l我们考察1968-1987年间美国的进口支出(Y)(或购买外国商品,包括耐用品或非耐用品的支出等)与个人的可支配收入

11、(X)之间的关系。l凯恩斯的消费函数理论:个人的消费支出与个人可支配收入正相关。而对进口支出是对国外商品的消费支出,是总支出的一部分,所以我们预期美国的进口支出与个人可支配收入之间也会正相关。构建模型:Y = b0 + b1 X + u433.9例子:美国的进行支出模型yearyxyearyx1968135.71551.31978274.12167.41969144.61599.81979277.92212.61970150.91668.11980253.62214.31971166.21728.41981258.72248.61972190.71797.41982249.52261.5197

12、3218.21916.31983282.22331.91974211.81896.91984351.12469.81975187.91931.71985367.92542.81976229.920011986412.32640.91977259.42066.619874392686.3443.9例子:美国的进行支出模型453.9例子:美国的进行支出模型l从散点图看,美国的进口支出(Y)与个人可支配收入(X)之间近似线性相关关系,因此我们前面假设的模型形式是合适的。即Y = b0 + b1 X + ul参数的意义数学上: b1 是斜率, b0是截距。经济学: b1是进口支出的边际消费倾向,即个人

13、可支配收入每增加1美元,所增加的进口支出。如果b1 0.25,表示个人可支配收入增加1美元,对国外商品的平均消费支出将增加0.25美元。根据经济理论, 0b1 1。b0表示个人的支配收入为0时,对国外商品的平均消费支出。463.9例子:美国的进行支出模型473.9例子:美国的进行支出模型l对回归结果的解释与我们的预期相同,进口支出(Y)与可支配收入(X)之间正相关。样本回归曲线的斜率为0.245,表示个人的可支配收入每增加1美元,对国外商品的需求支出将增加0.245美元。即对国外商品的边际消费倾向为0.245。同时,0.2451,符合经济理论的要求。R20.9388,表示我们的样本回归模型对数

14、据的拟合程度达到93.88%。即进口支出波动性的93.88%被我们的模型解释了,说明我们的模型是比较好的模型。注意:注意:在实际估计中,并不是说R2越高越好,更重要的是看模型的参数估计是不是能够通过t检验和F检验(下一章内容)。483.9例子:美国的进行支出模型l显著性检验下面,我们要检验我们的回归系数是不是显著的不为0。首先,对于斜率是否为0进行检验。容易计算出其t检验值为0.245/0.014816.616,给定显著性水平a=0.05,我们计算出双侧检验临界值t0.05/2(20-2)=2.101,对于本例,我们的斜率显著为不0。如果,我们考察的备选假设是斜率大于零,我们将使用右侧检验,侧

15、给定a=0.05,我们的单侧临界值则为t0.05(20-2)=1.734, 同样我们会拒绝原假设,认为我们的斜率是大于0的。我们可以计算出我们斜率的置信区间,给定置信水平1a0.95,有即 0.2142 b1 0.2762493.10预测l我们利用1968-1987年的数据,估计出了美国的进口支出模型,那么我们能不能对未来的进行支出进行预测呢?比如,我们知道1988年的美国的个人可支配收入为2800美元,那么它1988年的平均进口支出为多少呢?利用我们前面的估计模型,我们可以计算出l1988-261.09+0.2452800425.556l1988在CLRM假设下,是E(Y1988|X)的无偏

16、估计量,但存在预测误差。那么如何估计我们的预测误差呢,我们需要求出预测值的分布。l在CLRM假设下,我们的预测值也是服从正态分布的,因此,我们计算出其均值和方差,则其分布也就得到了。下面,我们看如何求解其均值与方差。503.10预测513.10预测课本(6-58)丢掉平方平方523.10预测值的分布533.10预测值的分布543.10预测值的置信区间l我们知道了*的分布,则可以求解给定置信水平1-a下的置信区间,满足l而对于每一个X,我们都可以计算出一个预测值Y,从而可以计算出其置信区间。从而我们可以得到针对整条总体回归线的真实平均值E(Y|X)的置信区间,或置信带。553.10预测值的置信区

17、间:例子l给定预测值的分布,我们可以计算1988年总体平均消费支出的置信水平为95%的置信区间(425.556-2.101*11.47, 425.556+2.101*11.47)即(401.46, 449.65)其中,自由度为20-2=18,5%显著性水平的双侧分位数ta/2=2.101l如果我们求出总体回归曲线上的所有平均消费支出的置信区间,这些置信区间将组成一个置信带,见下文图。563.10预测值的置信区间:例子95% CI2800425.556401.46449.65从图上可以看出,置信带在 处是最窄。而离样本均值点越远,置信区间会越宽,因此,我们进行预测时,X值不能离均值 太远。* =

18、 -261.09 + 0.245 X57An Example: Determinants of College GPA (wooldridge, p128)lVariables:colGPA, college GPAskipped, the average number of lectures missed per weekACT, achievement test scorehsGPA, high school GPA58An Example: Determinants of College GPA (wooldridge, p128)l1. 高中成绩对大学成绩的影响colGPA = 1.4

19、2 + 0.48 hsGPA (0.3069) (0.0898) se. 4.61 5.67 t 0.000 0.000 p-value n=141 fd=141-2=139 R2=0.1719l高中成绩每提高1分,大学成绩平均来说会增加0.48分。即高中学习好,大学成绩也不会太差。lH0: b1 = 0 H1: b1 0|T|=0.48/0.0898=5.67 ta/2(139)=1.96, 拒绝原假设,说明在5%的水平下,高中成绩的高低显著影响大学成绩。置信区间为(0.30, 0.66)59An Example: Determinants of College GPA (wooldridg

20、e, p128)l高考成绩对大学成绩的影响colGPA= 2.40 + 0.027ACT (0.2642) (0.0109) 9.10 2.49 0.000 0.014 n=141 fd=141-2=139 R2=0.0427l高考成绩每提高2分,大学成绩会增加0.027分。l为0假设t值为2.491.96,尽管大学入学成绩对大学成绩的影响很小,但仍然有影响,因为它在5%的水平下显著不为0。l置信区间为(0.0056, 0.0485)60An Example: Determinants of College GPA (wooldridge, p128)l逃课与大学成绩colGPA= 3.15

21、0.0895 skipped (0.0428)(0.0280) 73.71 -3.20 0.0000.002 n=141 fd=141-2=139 R2=0.0685l每周逃课次数每增加1次,大学平均成绩将下降0.0895分。l我们考察一下,逃课是不是会显著的降低大学成绩呢? 即H0: b1 = 0 H1: b1 0lT=-0.0895/0.0282=-3.20 -1.96,所以我们拒绝原假设,接受备选假设,即逃课显著的降低大学的平均成绩。尽管逃课对大学成绩的影响似乎不是很大,但影响是仍然是很显著的。l其95%的置信区间为(-0.1449, -0.0342)61summarylGoodness of fit: R2lTest of normal distributionHistogramNormal probability plotSK testJarque- Bera TestlReport of our regression modellPrediction

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号