计量经济学导论：ch04 多元回归分析：推断

资源描述

《计量经济学导论：ch04 多元回归分析：推断》由会员分享，可在线阅读，更多相关《计量经济学导论：ch04 多元回归分析：推断（68页珍藏版）》请在金锄头文库上搜索。

1、1多元回归分析：推断 y = b0 + b1x1 + b2x2 + . . . bkxk + u2关于假设检验n考虑一个选举问题：假定在一次选举中有两个候选人A和B。据报道，候选人A已得到42%的选票，候选人B得到58%的选票。姑且把这个百分比看成选民总体的真正百分比。候选人A深信更多的民众会投他的票，因此想调查选举是否有作弊情况，并雇用一个咨询机构随机抽取100名选举人的样本，所收集的样本中有53人投了候选人A的票。这一样本估计值53%明显超过所报告的总体值42%，候选人A应否据此作出结论说选举存在作弊？3n设立一个假设检验（hypothesis test），令代表赞成候选人A的总体真实比例

2、，令所报告的结果为真实的假设，陈述为： H0: =0.42 虚拟假设（null hypothesis） H1: 0.42 对立假设（alternative hypothesis) 在上例中，100个随机样本中究竟有多少人投候选人A的票才能够足以使A能否作出H0错误而H1正确的结论？（合理的勿容置疑的证据）4n假设检验中会犯的两种错误：第类错误：拒绝一个其实是真实的虚拟假设第类错误：未拒绝一个实际上是错误的虚拟假设检验的显著性水平：犯第类错误的概率其含义为：当H0为真实时拒绝H0的概率 5n经典的假设检验要求设定a值，从而量化我们对第类错误的容忍度。通常a值有0.10，0.05，0.0

3、1。n一旦选定显著水平，检验的目标是把第类错误的概率减到最小。即对所有有意义的对立情况使一个检验的功效最大。一个检验的功效是1减去第类错误的概率。数学上表示为：6检验关于正态总体均值的假设n为了相对于一个对立假设而检验一个虚拟假设，需要挑选一个检验统计量和一个临界值。n给定一个统计量，即可定义一个拒绝规则来决定什么时候舍弃H0而选取H1.所有拒绝规则都是拿一个检验统计量的值t来同一个临界值c做比较作为依据的。n拒绝域：所有导致拒绝虚拟假设的t值的全体。7n检验来自一个总体的关于均值的假设。虚拟假设单侧对立假设双侧对立假设8n当样本均值 “足够”地大于时，我们便应拒绝H0而接受H1。如何确

4、定已大到足以在选定的显著水平上拒绝H0？n检验统计量t：在虚拟假设下，随机变量t有一个tn-1分布。n临界值c：5%的显著水平9n拒绝规则： tc （c为tn-1分布中的第100(1-a)百分位数）10双尾检验（two tailed test)n拒绝规则： | t |c 给出100a%显著水平的检验（c为tn-1分布中的第100(1-a/2)百分位数）11 经典线性模型假定n给定高斯-马尔科夫假定，OLS是最优线性无偏估计。 n为了做经典的假设检验，我们需要添加额外一个假定，即MLR.6:u 独立于x1, x2, xk ，且u 服从标准正态分布，即u Normal(0,s2)nMLR.1-

5、MLR.6: 经典线性模型假设（CLM）12经典线性回归假设（续）n在经典线性回归假设下，OLS 不仅是最优线性无偏的，而且是方差最小的无偏估计。n经典线性回归总体假设： y|x Normal(b0 + b1x1 + bkxk, s2)n虽然我们假设u服从正态分布，但有时候并非如此： u中的众多因素可能各有极为不同的总体分布； u是不可观测因素的一个复杂函数，而非线性可加；假定u的正态性，实际上是一个经验性问题。n大样本能够让u近似的满足正态性。13.x1x2简单回归的同方差正态分布E(y|x) = b0 + b1xyf(y|x)Normaldistributions14定理4.1 正态抽样

6、分布15n定理4.1推广： 164.2 t检验17t检验（续）n标准化参数的样本分布使得我们可以进行假设检验。n从虚拟假设开始，如H0: bj=0；如果接受虚拟假设，则意味着在控制其他因素不变的情况下，xj 对 y没有效应。18t检验（续）19t检验：单侧备选假设n除了虚拟假设H0之外，我们还需要一个备选假设H1和一个显著性水平或当H0为真时拒绝它的概率。nH1可以是单侧的，也可以是双侧的。 H1: bj 0 及 H1: bj 0c0a(1 - a)单侧备选假设（续）无法拒绝拒绝22单侧还是双侧假设nt分布是对称的，检验H1: bj 0 是非常直观的，临界值变成负数。n我们可以拒绝虚拟假设，如

7、果t c,则我们无法拒绝虚拟假设。n当bj 的符号在理论中是不明确的话，双侧对立假设就是有用的。n对双侧检验来说，我们是根据a/2来确定临界值，如果t的绝对值大于C，则拒绝H1: bj 0 。23yi = b0 + b1Xi1 + + bkXik + uiH0: bj = 0 H1: bj0c0a/2(1 - a)-ca/2双侧对立假设拒绝拒绝无法拒绝24总结：H0: bj = 0n除非特别说明，对立假设均假定为双侧的。n如果我们拒绝虚拟假设，通常我们会说：“在a %的水平上， xj 在统计上显著异于零。”n如果我们无法拒绝虚拟假设，通常我们说 “在a % 的水平上，xj 在统计上不显著。”2

8、5n例子4.2：学生成绩及学校规模26n例子4.3 大学城GPA的决定因素27检验其他假设nT检验的更一般形式是：H0: bj = aj n在这种情况下，t统计量的表述是28n例子：校园犯罪与注册人数由4.14可见，犯罪对注册人数的估计弹性1.27在对立假设b1 1的方向上。但是否有足够的证据断定b1 1呢？H0：b1=1; H1：b1129计算t检验的p值n事前指定一个显著性水平的不足之处：不存在一个“正确的”的显著性水平；可能隐藏假设检验结果方面的有用信息 t=1.85， c（40，5%）=2.021， c（40，10%）=1.684，n检验p值：给定t统计量的观测值，能拒绝虚拟假设的

9、最小显著性水平是多少？301.t表示一个自由度为n-k-1的t分布随机变量；t表示该检验统计量的数值。2.p值的解释：观察到一个t统计量至少和虚拟假设正确时的t统计量一样大的概率：（以t为临界值时的显著性水平）小p值是拒绝虚拟假设的证据；大p值不能提供拒绝虚拟假设的证据。3132一般情况的拒绝规则na表示检验的显著性水平； p值a，则拒绝虚拟假设；否则，在100a%的显著性水平下，就不能拒绝H0。n单侧对立假设检验p值： 1.考虑参数估计值方向与对立假设的关系； 2.将双侧对立假设的p值除以2即得到单侧对立假设的p值。33统计检验值得注意的问题n当H0未被拒绝时，应该如何表述：我们通常说

10、“在a%的水平上我们不能拒绝H0” 而不能说“在a%的水平上我们接受了H0。”34n经济或实际显著性与统计显著性统计显著性：t值经济显著性： 1.统计显著并不意味着实际作用显著 2.实际作用显著并不意味着统计显著 3.大样本选择较小的显著性水平，反之亦然。35n例子4.6: 401（K）养老金计划的参与率36n例子4.7 在职培训津贴对企业废品率的影响37总结n检查统计显著性：如果该变量是统计显著的，讨论系数的大小，以对其实际或经济上的重要性有所认识。n如果一个变量在通常的显著性水平上不是统计显著的，仍需考察该变量对y是否有预期的影响及其实际的经济重要性，如果重要则计算p值。n一个显著的变

11、量却拥有非预期的符号，并且在经济上具有重要性，则问题更加麻烦。38置信区间n使用经典统计检验的另一个方法是用在双侧检验中同样的临界值构建一个置信区间Another way to use classical statistical testing is 。n 一个对未知参数(1 - a) % 的置信区间定义如下：39n置信区间的上界和下界是：置信区间的含义：如果一次又一次地获得随机样本，每次计算出上界和下界，那么未知的总体参数将在95%的置信区间中出现。40如何构建一个置信区间n需要三个量：n对于95%显著性水平的置信区间，一个简单的拇指法则是：n双侧对立假设的置信区间检验规则： aj 是否落

12、入95%水平的置信区间，落入则无法拒绝，未落入则拒绝。41nExample 4.8 Hedonic Price Model for Houses42检验关于参数的一个线性组合n假设现在不是检验 b1 等于一个常数，而是是否等于另一个参数，即H0 : b1 = b2, and H1 : b1 c55例子：运动员表现及其薪水5657n因为F统计量大于临界值2.6，因此，我们拒绝bavg，hrunsyr和rbisyr对薪水没有影响的假设。n为何bavg，hrunsyr和rbisyr三变量的参数估计值未通过t检验，而其F检验却是显著的？当自变量存在多重共线性时，模型结果难以发现每个变量的偏效应，但却

13、可能发现联合显著性。58F统计量与t统计量的关系n当F统计量检验单个变量的排除性时，等于对应的t统计量的平方。n给定对立假设为双侧， t2n-k-1与F1,n-k-1 拥有同样的分布，两种方法的结果一致。59F统计量的R2 型nSSR很大程度上依赖于度量单位，可以用R2计算F统计量。n依据SSR = SST(1 R2) ,F统计量的R2型为：60续上例，F统计量的R2型为61计算F检验的p值620Fa(1 - a)f(F)拒绝无法拒绝在a显著性水平上拒绝H0，如果 if F 。63回归整体显著性的F统计量n排除性约束的一个特例是检验H0: b1 = b2 = bk = 0，即假设模型中没有任

14、何一个解释变量对y有作用。n既然只有截距项的模型R2 等于零，则整体显著性的F统计量为：64n如果H0被拒绝，则我们得到结论认为模型中的变量的确对y有解释力，意味着回归是总体显著的。n相反，如果我们无法拒绝H0,则没有证据表明模型中的任何一个变量有助于解释y，我们必须需找其他变量来解释y。n因此，我们必须计算F统计量来检验联合显著性，而非仅仅看R2的大小。65检验一般的线性约束nF统计量的基本形式可适用于任何的线性约束，而非仅仅是排除性约束。n先估计受约束模型，再估计不受约束模型，然后记录两个模型的残差平方和n施加约束可以变得很有技巧，类似于重新定义变量。66例子：住房评估价是否理性？6768F 统计量总结n与t统计量一样，F检验的p值可以通过查询F分布图的百分位数计算得到。n输入如下命令，Stata会执行F检验： display fprob(q, n k 1, F)。n当只有一个排除性约束需检验时，F = t2,p值相等。

展开阅读全文

计量经济学导论：ch04 多元回归分析：推断

最新文档