多元线性回归模型计算分析题

上传人:公**** 文档编号:492708970 上传时间:2022-11-13 格式:DOCX 页数:9 大小:24.71KB
返回 下载 相关 举报
多元线性回归模型计算分析题_第1页
第1页 / 共9页
多元线性回归模型计算分析题_第2页
第2页 / 共9页
多元线性回归模型计算分析题_第3页
第3页 / 共9页
多元线性回归模型计算分析题_第4页
第4页 / 共9页
多元线性回归模型计算分析题_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《多元线性回归模型计算分析题》由会员分享,可在线阅读,更多相关《多元线性回归模型计算分析题(9页珍藏版)》请在金锄头文库上搜索。

1、多元线性回归模型计算分析题1、某地区通过一个样本容量为722的调查数据得到劳动力受教育年数的一个回归方程为 EMBED Equation.3 1 叫二 10.36 0,094肌终 + 0.131me叫 + 0.210沧叫 R2=0.214式中,为劳动力受教育年数,为劳动力家庭中兄弟姐妹的个数,与分别为母亲与父亲受 到教育的年数。问(1)Sibs是否具有预期的影响?为什么?若与保持不变,为了使预测的受教育水平减少 一年,需要增加多少?(2)请对的系数给予适当的解释。(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数均为12年,另 一个的父母受教育的年数均为16年,则两人受教育的年数

2、预期相差多少年2、考虑以下方程(括号内为标准差):(0.080) (0.072)(0.658)其中:年的每位雇员的工资年的物价水平年的失业率要求:(1)进行变量显著性检验;(2)对本模型的正确性进行讨论,是否应从方程中删除?为什么?3、以企业研发支出(R&D)占销售额的比重(单位:)为被解释变量(Y),以企业销售 额(X1)与利润占销售额的比重(X2)为解释变量,一个容量为32的样本企业的估计 结果如下:其中,括号中的数据为参数估计值的标准差。(1)解释ln(X1)的参数。如果X增长10%,估计Y会变化多少个百分点?这在经济上 是一个很大的影响吗?(2)检验R&D强度不随销售额的变化而变化的假

3、设。分别在5%和10%的显著性水平 上进行这个检验。(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?4、假设你以校园内食堂每天卖出的盒饭数量作为被解释变量,以盒饭价格、气温、附近餐 厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析。假 设你看到如下的回归结果(括号内为标准差),但你不知道各解释变量分别代表什么。(2.6)(6.3)(0.61)(5.9)试判定各解释变量分别代表什么,说明理由。5、下表给出一二元模型的回归结果。方差来源平方和(SS)自由度(d.f.)来自回归(ESS)65965来自残差(RSS)总离差(TSS)6604214求:(1)样

4、本容量是多少? RSS是多少? ESS和RSS的自由度各是多少?(2) 和?(3) 检验假设:解释变量总体上对无影响。你用什么假设检验?为什么?(4) 根据以上信息,你能确定解释变量各自对的贡献吗?6、在经典线性回归模型的基本假定下,对含有三个自变量的多元线性回归模型:你想检验的虚拟假设是:。(1) 用的方差及其协方差求出。(2) 写出检验H0:的t统计量。(3) 如果定义,写出一个涉及卩0、e、卩2和卩3的回归方程,以便能直接得到0估计值及 其样本标准差。7、假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数, 以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整

5、个学年收集数据,得到两个 可能的解释性方程:方程A:方程B:其中:一一第i天慢跑者的人数第i天降雨的英寸数一一第i天日照的小时数一一第i天的最高温度(按华氏温度)一一第i天的后一天需交学期论文的班级数请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?8、考虑以下预测的回归方程:其中:为第t年的玉米产量(吨/亩);为第t年的施肥强度(千克/亩);为第t年的降雨 量(毫米)。要求回答下列问题:(1)从和对的影响方面,说出本方程中系数和的含义;(2)常数项是否意味着玉米的负产量可能存在?(3)假定的真实值为,则的估计量是否有偏?为

6、什么?(4)假定该方程并不满足所有的古典模型假设,即参数估计并不是最佳线性无偏估计, 则是否意味着的真实值绝对不等于?为什么?9、已知描述某经济问题的线性回归模型为,并已根据样本容量为32的观察数据计算得,查表得,。(1)求模型中三个参数的最小二乘估计值(2)进行模型的置信度为95%的方程显著性检验(3)求模型参数2的置信度为99%的置信区间。10、下表为有关经批准的私人住房单位及其决定因素的4个模型的估计和相关统计值(括号 内为p值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。 模型如下:式中:housing实际颁发的建筑许可证数量;density每平方英里的人口

7、密度,value自由房屋的均值(单位:百美元);income平均家庭的收入(单位:千美元);popchang19801992年的人口增长百分比;unemp失业率;localtax人均交纳的地方税;statetax人均缴纳的州税。变量模型A模型B模型C模型DC813 (0.74)-392 (0.81)-1279 (0.34)-973 (0.44)Density0.075 (0.43)0.062 (0.32)0.042 (0.47)Value-0.855 (0.13)-0.873 (0.11)-0.994 (0.06)-0.778 (0.07)Income110.41 (0.14)133.03 (

8、0.04)125.71 (0.05)116.60 (0.06)Popchang26.77 (0.11)29.19 (0.06)29.41 (0.001)24.86 (0.08)Unemp-76.55 (0.48)Localtax-0.061 (0.95)Statetax-1.006 (0.40)-1.004 (0.37)RSS4.763e+74.843e+74.962e+75.038e+7R20.3490.3380.3220.3121.488e+61.424e+61.418e+61.399e+6AIC1.776e+61.634e+61.593e+61.538e+6(1) 检验模型A中的每一个回

9、归系数在10%水平下是否为零(括号中的值为双边备择 P-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?(2) 在模型A中,在5%水平下检验联合假设H0:匚=0(i=1,5,6,7)。说明被择假设,计 算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明 你的结论。(3) 哪个模型是“最优的”?解释你的选择标准。(4)说明你对最优模型中参数符号的预期并解释原因,确认其是否为正确符号。答案1、解:1)预期Sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条 件下,子女越多的家庭,每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义,sibs前

10、的参数估计值-0.094表明,在其他条件不 变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受 教育的时间,兄弟姐妹需增加1/0.094=10.6个。(2) medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年 受教育的时间,其子女作为劳动者就会预期增加0.131年的教育时间。(3) 首先计算两人受教育的年数分别为10.36+0.131x12+0.210x12=14.45210.36+0.131x16+0.210x16=15.816因此,两人的受教育年限的差别为15.816-14.452=1.3642、解:1在给定5%显著性水平的情况下,进行

11、t检验。参数的t值:参数的t值:参数的t值:在5%显著性水平下,自由度为19-3-1=15的t分布的临界值为,、的参数显著不为0, 但不能拒绝的参数为0的假设。(2)回归式表明影响工资水平的主要原因是当期的物价水平、失业率,前期的物价水平 对他的影响不是很大,当期的物价水平与工资水平呈正向变动、失业率与工资水平呈相 反变动,符合经济理论,模型正确。可以将从模型删除.3、解:(1) ln(X)的系数表明在其他条件不变时,ln(X)变化1个单位,Y变化的单位数, 即AY=0.32Aln(X1)0.32(AX1/ X由此,如果X1增加10%,Y会增加0.032个百分点。这 在经济上不是一个较大的影响

12、。(2) 针对备择假设斗::检验原假设H。:易知相应的t统计量的值为t=0.32/0.22=1.455。 在5%的显著性水平下,自由度为32-3=29的t分布的临界值为2.045,计算出的t值小 于该临界值,所以不拒绝原假设。这意味着销售额对R&D强度的影响不显著。在10% 的显著性水平下,t分布的临界值为1.699,计算的t值小于该值,不拒绝原假设,意味 着销售额对R&D强度的影响不显著。(3) 对X2,参数估计值的t统计值为0.05/0.46=1.087,它比10%显著性水平下的临界值 还小,因此可以认为它对Y在统计上没有显著的影响。4、解:(1)答案与真实情况是否一致不一定,因为题目未告

13、知是否通过了经济意义检验。 猜测为:为学生数量,为附近餐厅的盒饭价格,为气温,为校园内食堂的盒饭价格(2)理 由是被解释变量应与学生数量成正比,并且应该影响显著;被解释变量应与本食堂盒饭价格 成反比,这与需求理论相吻合;被解释变量应与附近餐厅的盒饭价格成正比,因为彼此有替 代作用;被解释变量应与气温的变化关系不是十分显著,因为大多数学生不会因为气温变化 不吃饭。5、解:(1)样本容量为n=14.+1=15RSS=TSS-ESS=66042-65965=77ESS的自由度为:d.f.= 2RSS 的自由度为:d.f.=n-2-l=12(2)R2=ESS/TSS=65965/66042=0.998

14、8=1-(1- R2)(n-1)/(n-k-1)=1-0.0012*14/12=0.9986(3)应该采用方程显著性检验,即F检验,理由是只有这样才能判断X、X2一起是否 对Y有影响。(4)不能。因为通过上述信息,仅可初步判断X、X2联合起来对Y有线性影响,两者 的变化解释了 Y变化的99.8%。但由于无法知道X, X2前参数的具体估计值,因此还 无法判断它们各自对Y的影响有多大。6、解:(1)(2),其中为的样本标准差。(3)由知,代入原模型得这就是所需的模型,其中估计值及其样本标准差都能通过对该模型进行估计得到。7、解:(1)方程B更合理些。原因是:方程B中的参数估计值的符号与现实更接近些

15、,如 与日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向 变化。(2)解释变量的系数表明该变量的单位变化,在方程中其他解释变量不变的条件下,对 被解释变量的影响,由于在方程A和方程B中选择了不同的解释变量,方程A选择的 是“该天的最高温度”,而方程B选择的是“第二天需交学期论文的班级数”,造成了与 这两个变量之间关系的不同,所以用相同的数据估计相同的变量得到了不同的符号。8、 解:(1)在降雨量不变时,每亩增加1千克肥料将使当年的玉米产量增加0.1吨/亩;在每 亩施肥量不变的情况下,每增加1毫米的降雨量将使当年的玉米产量增加5.33吨/亩。(2)在种地的一年中不施肥也不下雨的现象同时发生的可能性很小所以玉米的负产量 不可能存在事实上,这里的截距无实际意义。(3)如果的真实值为0.4

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号