第11章相关分析与回归分析

上传人:hs****ma 文档编号:508493997 上传时间:2024-01-31 格式:DOCX 页数:11 大小:48.68KB
返回 下载 相关 举报
第11章相关分析与回归分析_第1页
第1页 / 共11页
第11章相关分析与回归分析_第2页
第2页 / 共11页
第11章相关分析与回归分析_第3页
第3页 / 共11页
第11章相关分析与回归分析_第4页
第4页 / 共11页
第11章相关分析与回归分析_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《第11章相关分析与回归分析》由会员分享,可在线阅读,更多相关《第11章相关分析与回归分析(11页珍藏版)》请在金锄头文库上搜索。

1、11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天) 的数据如下:运送距离x8252151 0705504809201 3503256701 215运送时间y3.51.04.02.01.03.04.51.53.05.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态:(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义 解:(1)25050075010001250x运送距离(km)选送时间天可能存

2、在线性关系。(2)相关性x运送距离(km)y运送时间(天)x 运送距离( km)Pearson 相关性1.949(*)显著性(双侧)0.000N1010y 运送时间(天)Pearson 相关性.949(*)1显著性(双侧)0.000N1010有很强的线性关系。(3)系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)0.1180.3550.3330.748x运送距离(km)0.0040.0000.949& 5090.000a. 因变量: y 运送时间(天)回归系数的含义:每公里增加0.004天。11.6下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数

3、据:地区人均GDP(元)人均消费水平(元)北京22 4607 326辽宁11 2264 490上海34 54711 546江西4 8512 396河南5 4442 208贵州2 6621 608陕西4 5492 035要求:(1) 人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2) 计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3) 利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(4) 计算判定系数,并解释其意义。(5) 检验回归方程线性关系的显著性(a=0.05)。(6) 如果某地区的人均GDP为5 000元,预测其人均消费水

4、平。(7) 求人均GDP为5 000元时,人均消费水平95%的置信区间和预测区间。 解:(1)120001000000800006000040000OO2人均消费水平元010000200003000040000人均GDP (元)可能存在线性关系。(2)相关系数:相关性人均GDP (元)人均消费水平(元)人均GDP (元)Pearson 相关性1.998(*)显著性(双侧)0.000N77人均消费水平(元)Pearson 相关性.998(*)1显著性(双侧)0.000N77*. 在 .01 水平(双侧)上显著相关。 有很强的线性关系。(3)回归方程:系数(a)模型非标准化系数标准化系数t显著性B

5、标准误Beta1(常量)734.693139.5405.2650.003人均GDP (元)0.3090.0080.99836.4920.000a. 因变量: 人均消费水平(元)回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。模型摘要1.998(a)0.9960.996247.303a.预测变量:(常量),人均GDP (元)。人均GDP对人均消费的影响达到99.6%。(5)F 检验:ANOVA(b)模型平方和df均方F显1回归81,444,968.680181,444,968.6801,331.692残差305,795.034561,159.007合计81,750,763.714

6、6a. 预测变量:(常量),人均GDP (元)b. 因变量: 人均消费水平(元)回归系数的检验:t检验系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP (元)0.3090.0080.99836.4920.000a. 因变量: 人均消费水平(元)(6)某地区的人均GDP为5 000元,预测其人均消费水平为2278.10657元。(7)人均GDP为5 000元时,人均消费水平95%的置信区间为1990.74915, 2565.46399,预测 区间为1580.46315, 2975.74999。11.9某汽车生产商欲了

7、解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。 通过计算得到下面的有关结果:方差分析表变差来源dfSSMSFSignificanceF回归11602708.61602708.6399.10000652.17E09残差1040158.074015.807总计11.67参数估计表Coefficients标准误差tStatPvalueIntercept363.689162.455295.8231910.000168XVariablel1.4202110.07109119.977492.17E09要求:(1) 完成上面的方差分析表。(2) 汽车销售量的变差中有多少是由于广告费用的变

8、动引起的?(3) 销售量与广告费用之间的相关系数是多少?(4) 写出估计的回归方程并解释回归系数的实际意义。(5 )检验线性关系的显著性(a=0.05)。解:(2) R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。( 3) r=0.9877。(4) 回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。(5) 回归系数的检验:p=2.17E09Va,回归系数不等于0,显著。 回归直线的检验:p=2.17E09Va,回归直线显著。11.11从20的样本中得到的有关回归结果是:SSR=60, SSE=40。要检验x与y之间的线性关系是否显著,即检验假

9、设:H : P = 0。01(1) 线性关系检验的统计量F值是多少?(2) 给定显著性水平a=0.05, F是多少?a(3) 是拒绝原假设还是不拒绝原假设?(4) 假定x与y之间是负相关,计算相关系数r。(5) 检验x与y之间的线性关系是否显著?解:(1) SSR的自由度为k=1; SSE的自由度为n-k-1=18;SSR 60因此:F= SSE =Z0=27n 一 k 一 118(2) F (1,18)= F (1,18)=4.41a0.05(3) 拒绝原假设,线性关系显著。/SSR y(4) r=;0.6 =0.7746,由于是负相关,因此r=-0.7746SSR + SSE(5) 从F检

10、验看线性关系显著。11.15 随机抽取 7 家超市,得到其广告费支出和销售额数据如下:超市广告费支出(万元)销售额(万元)Al19B232C444D640E1052F1453G2054要求:(1)用广告费支出作自变量X,销售额作因变量y,求出估计的回归方程。 检验广告费支出与销售额之间的线性关系是否显著(a=0.05)。(3)绘制关于x的残差图,你觉得关于误差项 的假定被满足了吗?(4)你是选用这个模型,还是另寻找一个更好的模型?解:(1)系数(a)非标准化系数标准化系数模型B标准误Betat显著性1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8

11、313.3390.021a. 因变量: 销售额(万元)(2)回归直线的 F 检验:ANOVA(b)模型平方和df均方F显著性1回归691.7231691.72311.147.021(a)残差310.277562.055合计1,002.0006a. 预测变量:(常量), 广告费支出(万元)。b. 因变量: 销售额(万元)显著。回归系数的 t 检验系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a. 因变量: 销售额(万元)显著。(3)未标准化残差图10.000005.00000laualseR dezlaraanatsnu0.00000-5.00000-10.00000-15.0000005101520广告费支出(万元)标准化残差图1.000000.00000-1.00000-2.000005101520广告费支出(万元)学生氏标准化残差图:2.000001.000000.00000-1.00000-2.0000005101520广告费支出(万元)看到残差不全相等。(4)应考虑其他模型。可考虑对数曲线模型 y=b0+b1ln(x)=22.471+11.576ln(x)。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号