K元线性回归模型.doc－金锄头文库

资源描述

《K元线性回归模型.doc》由会员分享，可在线阅读，更多相关《K元线性回归模型.doc（8页珍藏版）》请在金锄头文库上搜索。

1、第三章 K元线性回归模型一、填空题1. 对于模型，i=1,2,n，一般经验认为，满足模型估计的基本要求的样本容量为_ _ 2. 对于总体线性回归模型，运用最小二乘法欲得到参数估计量，所要求的最小样本容量应满足或至少_。3. 多元线性计量经济学模型的矩阵形式，对应的样本线性回归模型的矩阵形式，模型的最小二乘参数估计量及其方差估计量。 4. 总平方和可以分解为和，可决系数为。5. 多元回归方程中每个解释变量的系数（偏回归系数），指解释变量变化一个单位引起的被解释变量平均变化个单位。6. 线性模型的含义，就变量而言，指的是回归模型变量的；就参数而言，指的是回归模型中参数的。通常

2、线性回归模型指的是。二、问答题1 什么是多元回归模型？它与一元、二元回归模型有何区别？2 极大似然法（maximum likehood）的原理是什么？3 什么是拟合优度（R2）检验？有什么作用？4 可决系数R2低的可能的原因是什么？5 多元回归的判断系数R2具有什么性质？运用R2时应注意什么问题？6 多元线性回归模型的基本假设是什么？试说明在证明最小二乘估计量的无偏性和有效性的过程中，哪些基本假设起了作用？7 说明区间估计的含义。三、实践题1下表给出三变量模型的回归结果：方差来源平方和（SS）自由度（d.f.）均方差(MSS)回归平方和(ESS) (RSS)EEESS(ESSEEES(ES

3、S)65965残差平方和(RSS)总平方和(TSS)6604214要求：（1）样本容量是多少？（2）求RSS？（3）ESS和RSS的自由度各是多少？（4）求和？（5）检验假设：和对无影响。你用什么假设检验？为什么？（6）根据以上信息，你能否确定和各自对的贡献吗？2下面给出依据15个观察值计算得到的数据，其中小写字母代表了各值与其样本均值的离差。，，，，，要求：（1）估计三个多元回归系数；（2）估计它们的标准差；并求出与？（3）估计、95%的置信区间；（4）在下，检验估计的每个回归系数的统计显著性（双尾检验）；（5）给出方差分析表。3考虑以下方程（括号内为估计标准差）：，其中：年的每

4、位雇员的工资和薪水；年的物价水平；年的失业率。要求：（1）对个人收入估计的斜率系数进行假设检验；（2）讨论在理论上的正确性，对本模型的正确性进行讨论；是否应从方程中删除？为什么？4克莱因和戈德伯格曾用1921-1941年与1945-1950年（1942-1944年战争期间略去）美国国内消费C和工资收入W、非工资非农业收入P、农业收入A的共27年时间序列资料，利用普通最小二乘法估计得出了下列回归方程：，式中括号中的数字为相应参数估计量的标准误。试对该模型进行评价，指出其中存在的问题。（显著性水平，已知）5某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为，R2=0.21

5、4式中，edu为劳动力受教育年数，sibs为该劳动力家庭中兄弟姐妹的个数，medu与fedu分别为母亲与父亲受到教育的年数。问（1）sibs是否具有预期的影响？为什么？若medu与fedu保持不变，为了使预测的受教育水平减少一年，需要sibs增加多少？（2）请对medu的系数给予适当的解释。（3）如果两个劳动力都没有兄弟姐妹，但其中一个的父母受教育的年数为12年，另一个的父母受教育的年数为16年，则两人受教育的年数预期相差多少？6以企业研发支出（R&D）占销售额的比重为被解释变量（Y），以企业销售额（X1）与利润占销售额的比重（X2）为解释变量，一个有32个企业的样本估计结果如下：其中括号中为

6、系数估计值的标准差。（1）解释log(X1)的系数。如果X1增加10%，估计Y会变化多少个百分点？这在经济上是一个很大的影响吗？（2）针对R&D强度随销售额的增加而提高这一备择假设，检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。（3）利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响？（3）对X2，参数估计值的t统计值为0.05/0.46=1.087，它比在10%的显著性水平下的临界值还小，因此可以认为它对Y在统计上没有显著的影响。7下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值（括号内为p-值）（如果某项为空，则意味着模型中没有

7、此变量）。数据为美国40个城市的数据。模型如下：式中housing实际颁发的建筑许可证数量，density每平方英里的人口密度，value自由房屋的均值（单位：百美元），income平均家庭的收入（单位：千美元），popchang19801992年的人口增长百分比，unemp失业率，localtax人均交纳的地方税，statetax人均缴纳的州税变量模型A模型B模型C模型DC813 (0.74)-392 (0.81)-1279 (0.34)-973 (0.44)Density0.075 (0.43)0.062 (0.32) 0.042 (0.47)Value-0.855 (0.13)-0.87

8、3 (0.11)-0.994 (0.06)-0.778 (0.07)Income110.41 (0.14)133.03 (0.04)125.71 (0.05)116.60 (0.06)Popchang26.77 (0.11)29.19 (0.06)29.41 (0.001)24.86 (0.08)Unemp-76.55 (0.48)Localtax-0.061 (0.95)Statetax-1.006 (0.40)-1.004 (0.37)RSS4.763e+74.843e+74.962e+75.038e+7R20.3490.3380.3220.3121.488e+61.424e+61.418

9、e+61.399e+6AIC1.776e+61.634e+61.593e+61.538e+6（1）检验模型A中的每一个回归系数在10%水平下是否为零（括号中的值为双边备择p-值）。根据检验结果，你认为应该把变量保留在模型中还是去掉？（2）在模型A中，在10%水平下检验联合假设H0：bi =0(i=1,5,6,7)。说明被择假设，计算检验统计值，说明其在零假设条件下的分布，拒绝或接受零假设的标准。说明你的结论。（3）哪个模型是“最优的”？解释你的选择标准。（4）说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认其是否为正确符号。参考答案一、填空题 1.n30或至少n3（

10、k+1）；2. n30或至少n24；3.，; 4.回归平方和；残差平方和；回归平方和与残差平方和之比。5. ；6.非线性；非线性；变量非线性而参数为线性。二、问答题1. 答：回归模型与一元线性回归模型的区别表现在如下几方面：一是解释变量的个数不同；二是模型的经典假设不同，多元线性回归模型比一元线性回归模型多了“解释变量之间不存在线性相关关系”的假定；三是多元线性回归模型的参数估计式的表达更复杂。2. 答：极大似然法（ML）是不同于OLS法的另一种模型参数估计方法。ML方法需要利用有关模型随机扰动项分布的知识构建似然函数，然后利用使似然函数最大的方法得出参数估计。其基本思路是确定观察到的样本数据

11、最可能来自某个分布，该分布的参数值即为总体参数的估计量。3. 答：所谓拟合优度检验，指对样本回归直线与样本观测值之间拟合程度的检验。如果所有的观测值都落在回归线上，称为“完全拟合”。这种情况很少发生。一般情况下，总会出现围绕在回归直线周围的正或负的残差。通过对残差的分析，有助于衡量回归直线与样本观察值的拟合程度。反映回归模型拟合优劣的一个数量指标是样本可决系数R2，也称判定系数。另一个是对回归模型的F统计检验。估计方程的目的常常不是为了获得高R2，而是要得到可靠的参数估计，以便利用估计结果进行统计推断。注意不要将判断系数作为评价模型优劣的唯一标准。4. 答：可能由于：X不是Y的良好解释变量；模

12、型形式设定有误。一般地，利用时间序列数据估计的模型R2值较高，而利用截面数据估计的模型R2值较低。5. 答：R2的取值取决在01之间。若Y的全部变异都得到了解释，则R2=1，若解释变量没有如何解释能力，有R2=0。在模型中不包含常数项的情况下，R2的值可能超出01范围；是解释变量的非减函数，即增加解释变量不会降低R2，在大多数情况下，R2会增大。在实际工作中，我们可以借助于R2的增减，判断回归模型不同表达形式的优劣。需要注意的是，对于不同因变量的回归模型，比较R2的大小没有任何意义。用同一变量的不同数学表达式作为因变量，R2也是不可比的。时间序列数据建模中如果考虑了滞后的行为反应，导致样本区间

13、发生变动，R2也不可比。6. 答：回归模型的基本假定有：零均值假定、随机项独立同方差假定、解释变量的非随机性假定、解释变量之间不存在线性相关关系假定、随机误差项服从均值为0方差为的正态分布假定。在证明最小二乘估计量的无偏性中，利用了解释变量与随机误差项不相关的假定；在有效性的证明中，利用了随机项独立同方差假定。7. 答：区间估计是指研究用未知参数的点估计值（从一组样本观测值算得的）作为近似值的精确程度和误差范围。三、实践题2.解：其中：同理，可得：，拟合优度为：，查表得，得到，得到的95%的置信区间：的95%的置信区间：，查表得临界值为：则：则拒绝原假设：拒绝原假设：拒绝原假设：（5）

14、方差分析表方差来源平方和自由度均方差回归平方和65963.018232981.509残差平方和79.2507126.6042总平方和66042.269，临界值为3.89值是显著的，所以拒绝零假设。5. 解：（1）预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下，子女越多的家庭，每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义，sibs前的参数估计值-0.094表明，在其他条件不变的情况下，每增加1个兄弟姐妹，受教育年数会减少0.094年，因此，要减少1年受教育的时间，兄弟姐妹需增加1/0.094=10.6个。（2）medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时，母亲每增加1年受教育的机会，其子女作为劳动者就会预期增加0.131年的教育机会。（3）首先计算两人受教育的年数分别为10.36+0.13112+0.21012=14.45210.36+0.13116+0.21016=15.816因此，两人的受教育年限的差别为15.816-14.452=1.3646. 解：（1）log(x1)的系数表明在其他条件不变时，log(x1)变化1

展开阅读全文

K元线性回归模型.doc

最新文档