(完整word版)统计学案例——相关回归分析

上传人:s9****2 文档编号:504424202 上传时间:2023-10-31 格式:DOC 页数:15 大小:603KB
返回 下载 相关 举报
(完整word版)统计学案例——相关回归分析_第1页
第1页 / 共15页
(完整word版)统计学案例——相关回归分析_第2页
第2页 / 共15页
(完整word版)统计学案例——相关回归分析_第3页
第3页 / 共15页
(完整word版)统计学案例——相关回归分析_第4页
第4页 / 共15页
(完整word版)统计学案例——相关回归分析_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《(完整word版)统计学案例——相关回归分析》由会员分享,可在线阅读,更多相关《(完整word版)统计学案例——相关回归分析(15页珍藏版)》请在金锄头文库上搜索。

1、统计学案例相关回归分析案例一质量控制中的简单线性回归分析1、问题的提出某石油炼厂的催化装置通过高温及催化剂对原料的作用进行反应,生成各种产品,其中液化气用途广泛、易于储存运输,所以,提高液化气收率,降低不凝气体产量,成为提高经济效益的关键问题。通过因果分析图和排列图的观察, 发现回流温度是影响液化气收率的主要原因,因此,只有确定二者之间的相关关系,寻找适当的回流温度,才能达到提高液化气收率的目的。经认真分析仔细研究, 确定了在保持原有轻油收率的前提下,液化气收率比去年同期增长1 个百分点的目标,即达到12.24% 的液化气收率。2、数据的收集液化气收率液化气收率序号回流温度()序号回流温度()

2、( % )( % )13613.1164212.323912.8174311.934311.3184610.944311.4194410.453912.3204211.563812.5214112.574311.1224511.184410.8234011.193713.1244611.1104011.9254710.8113413.6264510.5123912.2273812.1134012.2283912.5144111.8294411.5154411.1304510.9目标值确定之后,我们收集了某年某季度的回流温度与液化气收率的30 组数据(如上表),进行简单直线回归分析。3.方法的确

3、立设线性回归模型为y01 x,估计回归方程为y?b0b1 x将数据输入计算机,输出散点图可见,液化气收率y 具有随着回流温度x的提高而降低的趋势。 因此,建立描述 y 与 x 之间关系的模型时, 首选直线型是合理的。从线性回归的计算结果,可以知道回归系数的最小二乘估计值b0=21.263 和 b1=-0.229 ,于是最小二乘直线为y?21.2630.229x这就表明,回流温度每增加1,估计液化气收率将减少0.229% 。( 3)残差分析为了判别简单线性模型的假定是否有效,作出残差图,进行残差分析。从图中可以看到, 残差基本在 -0.5 +0.5 左右,说明建立回归模型所依赖的假定是恰当的。误

4、差项的估计值s=0.388 。( 4)回归模型检验a.显著性检验在 90% 的显著水平下, 进行 t 检验 ,拒绝域为 t=b1/ sb1 t/2=1.7011 。由输出数据可以找到b1 和 sb1 ,t=b1/ s b1=-0.229/0.022=-10.313,于是拒绝原假设,说明液化气收率与回流温度之间存在线性关系。b.拟合度检验判定系数 r2=0.792 。这意味着液化气收率的样本变差大约有80% 可以由它与回流温度的线性关系来解释。r r 2 =-0.89这样, r 值为 y 与 x 之间存在中高度的负线性关系提供了进一步的证据。由于 n30,我们近似确定y 的 90% 置信区间为:

5、y?( z)s =21.263-0.229x 1.282 0.388 = 21.263-0.229x 0.49724、结果分析由回归直线图可知,要保持液化气收率在12.24% 以上,回流温度必须控制在 34以下。 因为装置工艺卡片要求回流温度在 3340 之间, 为确保液化气质量合格,可以将回流温度控制在 33 34之间。为此,应当采取各项有效措施,改善外部操作环境,将液化气收率控制在目标值范围内。案例二:轿车生产与GDP 等关系研究中国的轿车生产是否与GDP 、城镇居民人均可支配收入、城镇居民家庭恩格尔系数、私人载客汽车拥有量、 公路里程等都有密切关系?如果有关系,它们之间是种什么关系?关系

6、强度如何?(数据见中国统计年鉴 )( 1) 分析轿车生产量与私人载客汽车拥有量之间的关系:首先,求的因变量轿车生产量y 和自变量私人载客汽车拥有量x1 的相关系数r=0.992018, 说明两者间存在一定的线性相关关系且正相关程度很强。然后以轿车生产量为因变量y,私人载客汽车拥有量x1 为自变量进行一元线性回归分析,结果如下:由回归统计中的R=0.984101 看出,所建立的回归模型对样本观测值的拟合程度很好;估计出的样本回归函数为:?=1.775687+0.206783x1,说明私人载客汽车拥有量每增加1 万辆,轿车生产量增加2067.83 辆;由上表中 a 和?的 p 值分别是 0.709

7、481543 和 6.60805E-15 ,显然 a 的p 值大于显著性水平 =0.05 ,不能拒绝原假设 =0 ,而?的 p 值远小于显著性水平=0.05 ,拒绝原假设=0,说明私人载客汽车拥有量对轿车生产量有显著影响。(2) 分析轿车生产量与城镇居民家庭恩格尔系数之间的关系:首先,求的因变量轿车生产量y 和自变量城镇居民家庭恩格尔系数x2 的相关系数 r=-0.77499 ,说明两者间存在一定的线性相关关系但负相关程度一般。然后以轿车生产量为因变量y,城镇居民家庭恩格尔系数x2 为自变量进行一元线性回归分析,结果如下:由回归统计中的 R=0.600608 看出,所建立的回归模型对样本观测值

8、的拟合程度一般,综合其相关系数值可知此二者关系不太符合所建立的线性模型,说明二者间没有密切的线性相关关系。(3) 分析轿车生产量与公路里程之间的关系:首先,求的因变量轿车生产量y 和自变量公路里程x3 的相关系数r=0.941214, 说明两者间存在一定的线性相关关系且正相关程度较强。然后以轿车生产量为因变量y,公路里程 x3 为自变量进行一元线性回归分析,结果如下:由回归统计中的R=0.885883 看出,所建立的回归模型对样本观测值的拟合程度较好;估计出的样本回归函数为:?=-125.156+1.403022x3,说明公路里程每增加 1 万公里,轿车生产量增加1.403022 万辆;由上表

9、中 a 和?的 p 值分别是 5.64E-05 和 1.82E-08 ,显然 a 和?的 p 值均远小于显著性水平 =0.05 ,拒绝原假设=0、=0,但由于对两者的影响更为显著,所以可以说明公路里程对轿车生产量有显著影响。(4) 分析轿车生产量与GDP 之间的关系:首先,求的因变量轿车生产量y 和自变量 GDP x4 的相关系数 r=0.939995,说明两者间存在一定的线性相关关系且正相关程度较强。然后以轿车生产量为因变量y,GDP x4 为自变量进行一元线性回归分析,结果如下:由回归统计中的R=0.88359 看出,所建立的回归模型对样本观测值的拟合程度较好; 估计出的样本回归函数为:

10、?=-70.7127+0.001829x4,说明 GDP每增加 1 亿元,轿车生产量增加18.29 辆;由上表中 a 和?的 p 值分别是 0.001534 和 2.11E-08 ,显然 a 和?的 p值均小于显著性水平 =0.05 ,拒绝原假设=0、=0,但由于对两者的影响更为显著,所以可以说明GDP 对轿车生产量有较显著影响。(5) 分析轿车生产量与城镇居民人均可支配收入x5 之间的关系:首先,求的因变量轿车生产量y 和自变量城镇居民人均可支配收入x5 的相关系数 r=0.917695, 说明两者间存在一定的线性相关关系且正相关程度较强。然后以轿车生产量为因变量y,城镇居民人均可支配收入x5 为自变量进行一元线性回归分析,结果如下:由回归统计中的R=0.842164 看出,所建立的回归模型对样本观测值的拟合程度较好; 估计出的样本回归函数为:?=-92.9054+0.032928x5,说明城镇居民人均可支配收入每增加1 元,轿车生产量增加329.28 辆;由上表中 a 和

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 国内外标准规范

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号