第十一章一元线性回归分析

上传人:pu****.1 文档编号:556605618 上传时间:2023-11-11 格式:DOCX 页数:16 大小:126.69KB
返回 下载 相关 举报
第十一章一元线性回归分析_第1页
第1页 / 共16页
第十一章一元线性回归分析_第2页
第2页 / 共16页
第十一章一元线性回归分析_第3页
第3页 / 共16页
第十一章一元线性回归分析_第4页
第4页 / 共16页
第十一章一元线性回归分析_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《第十一章一元线性回归分析》由会员分享,可在线阅读,更多相关《第十一章一元线性回归分析(16页珍藏版)》请在金锄头文库上搜索。

1、第十一章一元线性回归11.1从某一行业中随机抽取 12家企业,所得产量与生产费用的数据如下:止业编号产量(台)生产费用(万元)止业编号产量(台)生产费用(万元)140T3078416524215081001703501559116167455140101251805651501113017567815412140185要求:(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。(2)计算产量与生产费用之间的线性相关系数。(3)对相关系数的显著性进行检验(a= 0.05),并说明二者之间的关系强度。 解:利用ExceI的散点图绘制功能,绘制的散点图如下:产量(台)从散点图的形态可知,产量与生

2、产费用之间存在正的线性相关。(2)利用Excel的数据分析中的相关系数功能,得到产量与生产费用的线 性相关系数 r = 0.920232。(3)计算t统计量,得到t = 7.435453,在a= 0.05的显著性水平下,临界 值为2.6337,统计量远大于临界值,拒绝原假设,产量与生产费用之间存在显著 的正 线性相关关系。r大于0.8,咼度相关。11.2学生在期末考试之前用于复习的时间(单位:h)和考试分数(单位:分)之间是否有关系?为研究这一问题,以为研究者抽取了由8名学生构成的一 个随机样本,得到的数据如下:复习时间x考试分数y2064166134842370278832921872227

3、7要求:(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态(2)计算相关系数,说明两个变量之间的关系强度。解:利用ExceI的散点图绘制功能,绘制的散点图如下:考试分数Y从散点图的形态来看,考试分数与复习时间之间似乎存在正的线性相关关 系。(2) r = 0.862109,大于 0.8,高度相关。11.3根据一组数据建立的线性回归方程为 y =10-0.5x要求:(1)解释截距氏的意义。(2) 解释斜率?意义。(3)计算当x = 6时的E(y)。解:(1)在回归模型中,一般不能对截距项赋予意义C(2) 斜率的意义为:当x增加1时,y减小0.5(3) 当 x = 6 时, E(y) =

4、 100.5 * 6 = 7。11.4 设 SSR = 36, SSE = 4, n = 18。要求:(1) 计算判定系数R2并解释其意义。(2) 计算估计标准误差 Se 并解释其意义。解: SST = SSR+SSE = 36+4 = 402R = SSR / SST = 36 /40 = 0.9 意义为自变量可解释因变量变异的 90%,自 因 变量与自变量之间存在很高的线性相关关系。霄=05,这是随机项的标准误差的估计值。11.5 一家物流公司的管理人员想研究货物的运送距离和运送时间的关系,因此他抽出了公司最近10辆卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的

5、数据如下:运送距离x运送时间y8253.52151.010704.05502.04801.09203.013504.53251.56703.012155.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态。(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义解:(1)利用Excel绘制散点图,如下:运送时间y运送时间 y2) 计算的相关系数为 0.9489,这是一个很高的相关系数。(3)用OLS方法估计得到模型参数为凤=0118129,阳0.003585,回归方程为:运送时间 =0.118129 + 0.003*

6、运送距离,意义为:运送距离每增加1km,运送时间增加0.003383天,即0.086小时。116下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP (元)人均消费水平(元)北京224607326辽宁112264490上海3454711546江西48512396河南54442208贵州26621608陕西45492035要求:(1) 人均GDP作自变量,人均消费水平左因变量,绘制散点图,并说明者 之间的关系形态。(2) 计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。( 3) 禾 U 用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

7、 ( 4) 计算判定系数,并解释其意义。( 5) 检验回归方程线性关系的显著性( a= 0.05 )。(6) 如果某地区的人均 GDP 为 5000元,预测其人均消费水平。(7) 求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间解:(1 )利用 Excel 绘制的散点图如下:人均消费水平(元)100012000 1000030006000人幻消费水平(元)4000 2000从散点图来看,人均消费水平与人均Gdp之间存在很强的正线性相关关系。2) r = 0.998,高度相关。(3)用OLS方法估计得到模型参数为?。= 734.69, ?= 0.308,回归方程 为: 人均消费

8、水平 =734.69 + 0.308*人均 GDP,意义为:人均 GDP 每增加1 元,人均消费水平增加 0.31 元,此值即为经 济学 中的边际消费倾向。这里截距可解释为人均GDP为0时,居民的消费支出为734元 /年,即经济学中的自发支出。(4) 判定系数R2 = 0.996,人均消费水平变异的99%可由人均GDP来解释。(5) 这是一个一元线性回归模型,只需要检验斜率系数的显著性即可。斜率 系数的 t 统计量t 二? , Se =0.308/0.0085=36.49, e显著性水平为 0.05,自由度为 7-2=5,临界值为 3.16,统计量远大于临界值, 是高度显著的。(6) 将人均G

9、DP代入到估计的回归方程,计算得到人均消费水平的期望值为2278 元。(7) 查表得 (7 -2)=2.570582,点估计值为 2278 元,标准误差为 247.3035,人均消费水平 95%的置信区间为H 525397172278 一 2.570582*247.3035* 2278 一 287.27V 7 854750849.7即( 1990.73,2565.27。而人均消费水平 95%的预测区间为/1 525397172278 2.570582*247.3035* */112278 _ 697.21V 7854750849.7即区间(1580.79, 2975.21),对个别值的预测精确

10、度比对总体均值的预测低。11.7随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数 进行了调查,所得数据如下:航空公司编号航班止点率( )投诉次数(次)181821276.658376.685475768573874672.293771.272870.812299141810685125要求(1) 绘制散点图,说明二者之间的关系形态。(2) 用航班正点率左自变量,顾客投诉次数左因变量,求出估计的回归方 程并解释回归系数的意义。(3) 检验回归系数的限制性(若0.05 )。(4) 如果航班正点率为 80%,估计顾客投诉次数。(5) 求航班正点率为 80%时,顾客投诉次数 95%的置信

11、区间和预测区间解:(1) 散点图如下。投诉次数从散点图的形态来看,航班正点率与顾客投诉次数之间有负的线性相关关 系。(2) 用Excel回归分析,得到估计的回归方程如下:顾客投诉次数=430.1892 -4.70062*航班正点率斜率系数为-4.70062,表示航班正点率提高1个百分点,顾客投诉次数减少4.7次。符号为负,与理论相符。截距系数一般不赋予意义。(3) 一元回归只要检验斜率系数的显著性即可。斜率西数的t 统计量为t=Js = -4.70062/ 0.947894=4.95902e相应的P值为0001108,小于0.05, t统计量是显著的。(4) 由估计的回归方程,得到果航班正点率

12、为80%,估计顾客投诉次数为430.1892 - 4.70062*80 = 54.1396(次)查表得t 一.2(10 -2)=2.306004,点估计值为54.1396元,标准误差为18.887,故置信区间为H17.139654.1396 _ 2.306004*18.887 ,+=54.1396 _ 16.47989V10 397.024即区间(37.6597,70.61949。而预测区间为54 139606004 18887+110 + 爲396曲13964656756即区间(7.57204,100.7071)11.8下面是 20个城市写字楼由出租率和每平方米月租金的数据。地区编号出租率(

13、)每平万米月租金(兀)170.699269874373483467.170570.1846687657634678735105971.495108071071171.2861262.066137871061469570156878116695751767.78218684941972.0922067.976设月租金为自变量,出租率为因变量,用Excel进行回归,并对结果进行解 释和分析解:回归分析结果如下:SUMMARY OUTPUT 回归统计0.7950Multiple R80.6321R Square51Adjusted R0.6117Square15标准误差2.685819观测值20回归分析1223.1223.130.932.8E-0540340331818129.87.213残差452622352.9总计855Coeffi 标准t StatP-valLower Upper 下限cients误差ue95%95%In tercept49.3173.80512.961.45E41.3236457.31680

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号