回归分析总结

上传人:大米 文档编号:558381168 上传时间:2022-08-14 格式:DOC 页数:5 大小:168KB
返回 下载 相关 举报
回归分析总结_第1页
第1页 / 共5页
回归分析总结_第2页
第2页 / 共5页
回归分析总结_第3页
第3页 / 共5页
回归分析总结_第4页
第4页 / 共5页
回归分析总结_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《回归分析总结》由会员分享,可在线阅读,更多相关《回归分析总结(5页珍藏版)》请在金锄头文库上搜索。

1、第十二章 多元回归分析在许多实际问题中,影响因变量的因素有一个时,我们用一元回归分析解决问题,但是影响因变量的因素往往有多个,此时问题就上升到了一个因变量同多个自变量的多元回归问题.当因变量与自变量之间为线性关系时,我们称之为多元线性回归。多元性性回归分析的原理同一元线性回归基本相同,但计算上要复杂得多.主要知识点:建立的回归模型中回归系数和误差项分别代表的含义:回归系数表示当其他 个自变量不变时,第个自变量一个单位因变量的平均变动量;误差项表示不能由各个自变量与之间的线性关系所解释的变异性。利用软件用最小二乘法对参数进行估计的方法及步骤:在xe中使用“工具“数据分析 “回归” 输入数据区域“

2、确定”,即可得到各参数的估计值,此时便可以写出回归方程.拟合优度的检验方法:方法一:多重判定系数 表示在因变量的总变差中被估计的回归方程所解释的比例; 故越大越好。方法二:估计标准误差 表示根据所建立的回归方程,用自变量来预测因变量时,平均预测误差的大小; 故越小越好,越小说明波动性越小。用软件进行线性关系检验的方法:在Exc中,在“工具”“数据分析” “回归 方差分析一栏中有“SigniicaneF”值(即P值),当时,拒绝原假设;当时,接受原假设。回归系数的检验:检验单个自变量对因变量的影响是否显著,检验步骤同线性关系的检验,检验过程中可能会因为“多重共线性”问题导致某些自变量无法通过检验

3、.检验步骤:第1步:提出假设。对于任意参数有 第2步:计算检验的统计量t。 第步:做出统计决策。 给定显著性水平,根据自由度=n-查t分布表,得的值。若,则拒绝原假设;若,则不拒绝原假设.多重共线性:产生原因:自变量之间的相关性;检验方法: 方法一:检验模型中各对自变量之间是否显著相关,若显著相关则暗示存在多重共线性; 方法二:当模型的线性关系检验(F检验)显著时,几乎所有回归系数的t检验却不显著; 方法三:当回归系数的正负号与预期的相反时也预示着多重共线性的存在;问题的处理:方法一:将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关;方法二:如果要在模型中保留所有的自变量,那就

4、应该: 避免根据t统计量对单个参数进行检验。 对因变量y值得推断(估计或预测)限定在自变量样本值的范围内.利用回归方程进行预测:利用给定的k个自变量,求出因变量y的平均值的预测区间和个别值的预测区间.变量选择:原理:对统计量进行显著性检验,将一个或一个以上的自变量引入模型,如果增加一个自变量会使得残差平方和(S)明显减少,则将该自变量留在模型中,否则剔除.主要方法:1)向前选择2)向后剔除3)逐步回归1、 建立回归模型 回归方程 2、 利用最小二乘法对参数进行估计参数包括3、 写出回归方程4、 方程拟合优度的检验5、 线性关系检验6、 回归系数的检验检验单个自变量对因变量的影响是否显著,检验步

5、骤同线性关系的检验,检验过程中可能会因为“多重共线性”问题导致某些自变量无法通过检验。7、 利用回归方程进行预测 利用给定的个自变量,求出因变量y的平均值的预测区间和个别值的预测区间.8、 变量选择我称之为“模型的简化主要方法 原理:对统计量进行显著性检验,将一个或一个以上的自变量引入模型,如果增加一个自变量会使得残差平方和(SSE)明显减少,则将该自变量留在模型中,否则剔除。9、多重共线性问题 1、产生原因:自变量之间的相关性、检验方法本章知识结构如下: 方法一:多重判定系数 方法二:估计标准误差 多 元回 归 分 析1) 提出假设2) 计算统计量3) 作出决策 a) 向前选择b) 向后剔除

6、c) 逐步回归) 计算各对自变量之间的相关系数,并对各相关系数进行显著性检验;b) 当模型的线性关系进行F检验显著时,几乎所有回归系数的t检验却不显著;c) 回归系数与预期的的相反;本章例题 对于绝大多数的钢种而言,磷是有害的元素之一,要求含磷越低越好,经过试验技术人员发现,高磷钢的效率与高磷钢的出钢量及高磷钢中的Fe含量有一定关系, 所测数据如下表:试验序号出钢量()含量()效率(y)18713.2021。41.584.031.20。0。093014.288。658。06481。61.34283。575。4。973.0810341.88。09101。014。991。48012。981。011

7、96。514.678。12110。615.3.513102.98。83。4设高磷钢的效率为y、高磷钢的出钢量为、高磷钢中的FeO含量为用Exce进行回归,回答下面的问题:(1) 写出估计的回归方程.(2) 在高磷钢的效率的总变差中,被估计的回归方程所解释的比例是多少?(3) 检验回归方程的线性关系是否显著().(4) 检验各回归系数是否显著()。(5) 检验所建立的回归方程是否存在多重共线性。解:用Exel进行回归分析输出如下所示:回归统计MutipleR0。68844Square0。44506Aje R Suare0.34标准误差3.86481观测值13方差分析fSMFSncae F回归分析

8、2133。598166。904.1490。040072残差14.5414754总计1281523Cffcients标准误差veLoer 95p 95%下限 950上限 950%Interce7514389。487361。E05500379.28350799。28377出钢量.2155。074780.11240.049148155.049140。38155FO含量-。42105480。1558-26560。377452。06516.774(1) 由此可得到高磷钢的效率与高磷钢的出钢量及高磷钢中的FeO含量的回归方程:其中回归系数表示,在FO含量不变时,高磷钢的效率每增加一个单位,高磷钢的出钢量将

9、增加0。215485个单位. 表示,在高磷钢的出钢量不变时,高磷钢的效率每增加一个单位,eO含量要降低0.42个单位。(2)在回归统计一栏中有=047456,所以在高磷钢的效率的总变差中,被估计的回归方程所解释的比例是4。75。()在方差分析一栏中有Snificance F(即值)0.7,在的显著性水平下,有,故拒绝原假设,说明高磷钢的效率与高磷钢的出钢量和高磷钢中的Fe含量之间存在显著性的线性关系。()由回归分析输出的结果中的Pvlue(即值)一栏可以看出,只有出钢量对应的回归系数通过了检验。说明在影响高磷钢的效率的两个变量中,只有出钢量的影响是显著的,而高磷钢中的FeO含量则对高磷钢的效率没有显著性影响.出钢量F含量出钢量1F含量。560031()出钢量、FeO含量之间的相关矩阵各相关系数检验的统计量如下表所示:出钢量O含量出钢量1FeO含量0,8783361各相关系数检验的统计量 查表得,由于统计量小于,所以接受原假设,说明两个自变量之间没有显著的相关关系.故不存在多重共线性.文中如有不足,请您指教! /

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号