统计学一元线性回归课后习题答案

上传人:宝路 文档编号:48213375 上传时间:2018-07-11 格式:PPT 页数:53 大小:524.87KB
返回 下载 相关 举报
统计学一元线性回归课后习题答案_第1页
第1页 / 共53页
统计学一元线性回归课后习题答案_第2页
第2页 / 共53页
统计学一元线性回归课后习题答案_第3页
第3页 / 共53页
统计学一元线性回归课后习题答案_第4页
第4页 / 共53页
统计学一元线性回归课后习题答案_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《统计学一元线性回归课后习题答案》由会员分享,可在线阅读,更多相关《统计学一元线性回归课后习题答案(53页珍藏版)》请在金锄头文库上搜索。

1、一元线性回归课后习题讲解-第九组11.1 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用 140130 242150 350155 455140 565150 678154 784165 8100170 9116167 10125180 11130175 12140185产量和费用存在正的线性相关系数(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。r=0.92022)计算产量与生产费用之间的线性相关系数。1 1、提出假设:、提出假设:H H0 0: ;H H1 1: 0 02、计算检验的统计量根据显著性水平根据显著性水平 0.050.05,查

2、,查t t分布表得分布表得t t( (n n- -2)=2.22812)=2.2281由于由于 t t =7.435453=7.435453t t(12-2)=2.2281(12-2)=2.2281, 拒绝拒绝H H0 0,产量与生产费用之间存在着显著的正线性,产量与生产费用之间存在着显著的正线性 相关关系相关关系(3)对相关系数的显著性进行检验( 0.050.05),并说明二者之 间的关系强度。t t(12-2)=2.2281(12-2)=2.228111.2 学生在期末考试之前用于复习的时间(单位:小时)和考 试分数(单位:分)之间是否有关系?为研究这一问题,一位 研究者抽取了由8名学生构

3、成的一个随机样本,取得的数据如 下:复习习 时间时间 X2016342327321822考试试 分数Y6461847088927277复 习 时 间 和 考 试 分 数 存 在 正 的 线 性 相 关 关 系复 习 时 间 和 考 试 分 数 存 在 正 的 线 性 相 关 关 系复习时间和考试分数存在正的线性相关关系要求:(1)绘制复习时间和考试分数的散点图,判断二者之 间的关系形态。r=0.8621(2)计算相关系数,说明两个变量之间的关系强度。11.3、根据一组数据建立的线性回归方程 要求: 1)解释截距 的意义。 1)解释斜率 的意义。 2)当=6时的E(y)1)表示在没有自变量X的影

4、响时其他各种因素对因变 量Y的影响为10 2)斜率的意义在于:自变量X变化对Y影响程度。回 归方程中,当x增加一个单位时,y将减少0.5个单位。 3)x=6时,代入方程,则,y=10-0.5 6=711.4 设SSR=36,SSE=4,n=18要求:1)计算判定系数R2并解释其意义回归直线对观测值的拟合程度为0.9,说明变量Y的 变异性中有90%是由自变量x引起的。2)计算估计标准误差 并解释其意义表示实际值与估计值之间的差异程度是0.511.5一家物流公司的管理人员想研究货物的运输距离和运输时 间的关系,为此,他抽出了公司最近10个卡车的运货记录的随 机样本,得到运送距离(单位:km)和运送

5、时间(单位:天) 的数据如下表:运送距离x825215107055048092013503256701215运送时间 y3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0 (1)绘制运送距离和运送时间的散点图,判断二者之间的关系形 态 (2)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实 际意义。根据图表显示,二者可能存在正线性相关关系 (1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态x与y的简单相关系数是0.9489,两 变量之间呈现高度正相关关系 运送距离x运送时间时间 y运送距离x1运送时

6、间时间 y0.948941(2)计算线性相关系数,说明两个变量之间的关系强度最小二乘估计:y = 0+ 1 x将表中数据代入公式得:=0.118129 =0.003585 y=0.118129 + 0.003585x (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。y关于x的回归方程为y=0.118129 + 0.003585x表示运输距离每增加1公里 ,运送时间平均增加 0.003585天。 11.6 下面是7个地区2000年的人均国内生产总值( GDP)和人均消费水平的统计数据:地区 人均GDP(元) 人均消费水平(元)北京辽宁上海江西河南贵州陕西22 46011 226

7、34 5474 8515 4442 6624 5497 3264 49011 5462 3962 2081 6082 035要求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并 说明二者之间的关系形态。产量和生产费用之间存在着正的线性相关关系(2)计算两个变量之间的线性相关系数,说明两个变量之 间的关系强度。说明两个变量之间高度相关 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际 意义。 y = y = 734.6928 734.6928 + + 0.3086830.308683x x 回归系数的含义:人均GDP每增加1元, 人均消费增加0.309元。(4)计算判

8、定系数,并解释其意义。 人均GDP对人均消费的影响达到99.6%。(5)检验回归方程线性关系的显著性(a=0.05)。提出假设提出假设 H H0 0: 1=0 1=0 人均消费水平与人均人均消费水平与人均GDPGDP之间的之间的 线性关系不显著线性关系不显著 计算检验统计量计算检验统计量F F确定显著性水平确定显著性水平 =0.05=0.05,并根据分子自由度,并根据分子自由度1 1和分母自和分母自 由度由度7-27-2找出临界值找出临界值F F =6.61=6.61 作出决策:若作出决策:若F F F F , ,拒绝拒绝H H0 0,线性关系显著,线性关系显著(6)如果某地区的人均GDP为5

9、 000元,预测其人均消费水平。某地区的人均GDP为5 000元,预测其人均消费 水平为2278.1078元。(7)求人均GDP为5 000元时,人均消费水平95的置信区 间和预测区间。解解:已知已知n n=7=7,t t (7-2)=2.5706(7-2)=2.5706置信区间为置信区间为人均GDP为5 000元时,人均消费水平95的 置信区间为1990.74915,2565.46399 1990.74915t=2.201,拒绝H0,回归 系数显著提出假设提出假设 H H0 0:b b1 = 0 1 = 0 H H1 1:b b1 1 0 0 计算检验的统计量计算检验的统计量3)检验回归系数

10、的显著性(a=0.05)=2.201解:解:已知已知n n=10=10,t t (10-2)=2.306(10-2)=2.306置信区间为置信区间为计算得4)如果航班正点率为80%,估计顾客投诉次数5)求航班正点率为80%,顾客投诉次数95%的置信区间和预测区间已知已知n n=10=10,t t (10-2)=2.306(10-2)=2.306预测区间为预测区间为计算得11.8 下面是20个城 市写字楼出租率和 每平方米月租金的 数据。设月租金为 自变量,出租率为 因变量,用excel进 行回归,并对结果 进行解释和分析。地区编编号出租率(% )每平方米月租金(元)170.699 269.87

11、4 373.483 467.170 570.184 668.765 763.467 873.5105 971.495 1080.7107 1171.286 126286 1378.7106 1469.570 1568.781 1669.575 1767.782 1868.494 197292 2067.976回归统计 Multiple R0.79508 R Square0.632151 Adjusted R Square0.611715 标准误差8.568399 观测值20方差析 dfSSMSFSignificance F 回归分析12271.0362271.03630.933182.8E-0

12、5 残差181321.51473.41746 总计193592.55 Coef fici ents标标准 误误差t StatP- valu eLowe r 95%Uppe r 95%下限 95.0 %上限 95.0 % Interce pt- 94.2 49832.0 7947- 2.93 8010.00 8792- 161. 646- 26.8 534- 161. 646- 26.8 534 X Variabl e 12.53 64920.45 60595.56 17612.8E -051.57 83473.49 46371.57 83473.49 463711.9 某汽车生产商欲了解广告费

13、用(x)对销售量(y)的影响 ,收集了过去12年的有关数据。通过计算得到下面的有关 结果:方差分析表变差来 源dfSSMSFSignificanceF回归2.17E09 残差40158.07 总计111642866. 67参数估计表Coefficients 标准误差tStatPvalueIntercept363.689162.455295.8231910.000168 XVariable11.4202110.07109119.977492.17E09(1)完成上面的方差分析表。变差来 源dfSSMSFSignificanceF回归11602708. 61602708. 6399.1000 06

14、52.17E09残差1040158.074015.807 总计111642866. 67SSR=SST-SSE= 1642866.67-40158.07=1602708.6MSR=SSR/1= 1602708.6MSE=SSE/10= 4015.807F=MSR/MSE=399.1000065(2)汽车销售量的变差中有多少是由于广告费用的变动引起的? 汽车销售量的变差中有97.56%是由于广告费用的变动引起的 (3)销售量与广告费用之间的相关系数是多少? (4)写出估计的回归方程并解释回归系数的实际意义。 回归系数的意义:广告费用每增加一个单位, 汽车销量就增加1.42个单位。(5)检验线性关

15、系的显著性(a0.05)。p=2.17E09,显著。11.10 根据下面的数据建立回归方程,计算残差,判定R2, 估计标准误差se,并分析回归方程的拟合程度。残差估计标准误差se本题判定系数R2=0.937348,可以看出拟合程度 好。判定R211.11 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。 要检验x与y之间的线性关系是否显著,即检验假设:。(1)线性关系检验的统计量F值是多少? 解:(1)SSR的自由度为1;SSE的自由度为n-2=18;F=27(2)给定显著性水平a0.05,Fa是多少?=4.41 (3)是拒绝原假设还是不拒绝原假设? 拒绝原假设,线性关系显著。 (4)假定x与y之间是负相关,计算相关系数r r=0.7746 由于是负相关,因此r=-0.7746(5)检验x与y之间的线性关系是否显著? 从F检验看线性关系显著。 F= 27=4.41 11.12从n=20的样本中得到的有关回归结果是:y=5+3x, =1 =2,要求1)当x=4时,构建y的平均值的95%的置信区间2)当x=4时,构建y的平均值的95%的预测区间11.13 一家公司拥有多家子公司,公司的管理者 想通过广告支出来估计销售收入,为此抽取了8家 子公司,得到广告支出和销售收入的数据如下( 单位:万元)广告 支出 X12.5 3

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号