【2018年整理】spss线性回归分析

上传人:ji****72 文档编号:48676230 上传时间:2018-07-19 格式:PPT 页数:87 大小:1.49MB
返回 下载 相关 举报
【2018年整理】spss线性回归分析_第1页
第1页 / 共87页
【2018年整理】spss线性回归分析_第2页
第2页 / 共87页
【2018年整理】spss线性回归分析_第3页
第3页 / 共87页
【2018年整理】spss线性回归分析_第4页
第4页 / 共87页
【2018年整理】spss线性回归分析_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《【2018年整理】spss线性回归分析》由会员分享,可在线阅读,更多相关《【2018年整理】spss线性回归分析(87页珍藏版)》请在金锄头文库上搜索。

1、 第十章 线性回归分析过程第一节 回归分析概述1.回归方程w回归分析是处理变量x与y之间统计关系的一种统计方法和技术。如果要由x预测y的值,就要利用x与y的观察值,即样本观测值(x1,y1),(x2,y2),(xn,yn)来建立一个公式,当给定x值后,就代入此公式中算出一个y值,这个值就称为y的预测值。w如何建立这个公式?w1.绘制散点图w2.建立线性函数:y= +x2.建立实际问题回归模型的过程w一、根据研究的目的,设置指标变量 w二、搜集整理统计数据 w三、确定理论回归模型的数学形式 w四、模型参数的估计 w五、模型的检验与修改 w六、回归模型的运用具体(社会经济)问题设置指标变量搜集整理

2、数据构造理论模型估计模型参数模型 检验模型运用经济变量控制经济因素分析经济决策预测修改建立 实际 问题 回归 模型 过程第一步:绘制散点图选择估计模型线 性 模 型分 段 模 型曲 线 模 型第二步:建立回归方程线性方程式y= +x中的参数 ,还不知道,这就需要由样本数 据来进行估计,估计出 ,的值后,以估计值分别代替线性方程式中的 ,得到方程 这个方程就称为回归方程。这里因为因变量y与自变量x的关系呈线性关系,因此我们也称 上述方程为线性回归方程, 是线性回归方程所画出的直线在y 轴上的截距 ,为直线的斜率,它们分别被称作回归常数与回归系数。xy第二节 一元线性回归w一元线性回归是描述两个变

3、量之间统计 关系的最简单的回归模型。w例1 假定一保险公司希望确定居民住宅火灾造成的损失数额与该住户到最近的消防站的距离之间的相关关系,以便准确地确 定出保险金额,表1列出了15起火灾事故的损失及火灾发生地与最近的消防站的距离。 距消防站距离3.41.84.62.33.15.50.73.0火灾损损失26.217.831.323.127.536.014.122.3 距消防站距离2.64.32.11.16.14.83.8 火灾损损失19.631.324.017.343.236.426.1一、根据研究的目的,设置指标变量w试验指标:火灾损失 w试验因素:距离消防站的距离 因此建立两个变量: x距离消

4、防站的距离 y火灾损失二、获取相关数据 三、确定理论回归模型的数学形式w1.判断x变量与y变量之间的关系是否为 线性相关关系? 判断方法:1)散点图2)相关系数法 2.如果是显著线性相关关系,可以选择一 元回归方程做为理论回归模型。1)绘制散点图线 性 相 关线 性 回 归 模 型2)相关系数2.一元线性回归模型的数学形式参数的估计(xi,yi)四、模型参数的估计应用Spss软件进行回归参数的估计1、执行Analyze Regression Linear命令,打开对 话框(1)从源文件量 清单中选择一个 数值型变量移入 Dependent框中 ,选择一个变量 作为自变量移入 Independe

5、nt 框 中 (2)点击OK多元线性回归模型一、多元线性回归模型的一般形式二、多元线性回归方程的解释以p2为例。在建立空调机销售量的预测模型时,用y来表示空调机的销 售量,用x1表示空调机的价格,用x2表示消费者可用于支配的收入。 则可以建立二元线性回归模型:三、 回归参数的估计 w回归参数可以应用普通最小二乘估计。 具体计算可以通过spss软件进行。未标准化回归方程为:y=35316.885+6.696x1+0.097x2标准化回归方程为:y=0.809x1+0.18x2四、模型的检验与修改w4.1 相关系数的显著性检验 w4.2 F检验 w4.3 t检验 w4.4 样本决定系数 w4.5

6、残差分析4.1相关系数的显著性检验由于一元线性回归方程讨论的是变量x与y之间的线性关 系,所以我们可以用变量x与y之间的相关系数来检 验回归方程的显著性。 当 r = 0 时,说明变量之间不存在线性相关关系;当 0 F(1,n 2) 就拒绝原假设。回归平方和SSR841.766,残差平方和SSE69.751总平方和SST 841.766 69.751911.517SIG=0.0000.05,拒绝原来的假设,表示所有的回归系数不同时为0,也就是说,回归方程总体达到显著程度,即回归方程是有效的。5.3 t检验w回归方程显著性检验只能检验所有系数是否同时与零有显著性差异。如果检验出所有回归系数不同时

7、为零,仍然不能保证方程中仍存在与零无显著差异的回归系数,也就是说不能保证所有回归系数同时不为零。w回归系数的显著性检验就是要检验是否所有自变量xi对因变量y的影响程度均显著。如果原假设 成立,则因变量y与自变量x1之间并没有真正的线性关系,也就是说 自变量x1的变化对因变量y并没有影响。构造的t检验统计量为:SPSS统计结果中对回归系数是否 显著为0的t检验SPSS统计结果中对多元回归系数 是否显著为0的t检验5.4回归方程的拟合优度检验w就是要检验样本数据点聚集在回归直线周围的密集程度,从而 评价回归方程对样本数据的代表程度。一般用判别系数R2实现 。 w因变量总的变差平方和由自变量引起的因

8、变量变差的平方和 由其他随机因素引起的因变量变差的平方和 w用数学语言表示为:w式中:由自变量引起的变差平方和能够由回归方程表示,称为 回归平方和,由其他随机因素引起的变差平方和无法用回归方 程表示,称为残差平方和或剩余平方和。样本决定系数w由回归平方和与残差平方和的意义我们知道,如果 在总的离差平方和中,回归平方和所占的比重越大 ,则线性回归效果就越好,这说明回归直线与样本 观测值拟合优度就越好;如果残差平方和所占比重 大,则回归直线与样本观测值拟合得就不理想。这 里把回归平方和与总离差平方和之比定义为样本决 定系数,记为:w性质1:决定系数r2是一个回归直线与样本观测值拟合优度的相 对指标

9、,反映了因变量的波动中能用自变量解释的比例。r2的 值总是在0和1之间,也可以用百分数表示。一个线性回归模型 如果充分利用了x的信息,因变量不确定性的绝大部分能由回 归方程解释,则r2越接近于1,拟合优度就越好,反之亦然。 w性质2:回归方程的显著性检验与r2值的大小是一致的,即检验 越显著,r2就越大,但是这种关系并不是完全确定的,在样本 容量n很大时,对高度显著的检验结果仍然可能得到一个小的r2 。导致r2小的可能原因有两个,第一是线性回归不成立,第二 是y与x之间的确符合线性模型,只是误差项方差大导致r2小, 这时在样本容量n很大时,检验结果仍然可能得出线性回归显 著的结论。5.5 残差

10、分析w一个线性回归方程通过了t检验或F检验,只 是表明变量y与x之间的线性关系是显著的, 或者说线性回归方程是有效的,但不能保证 数据拟合得很好,也不能排除由于意外原因 而导致的数据不完全可靠。只有当与模型中 的残差项有关的假定满足时,才表明模型有 效。 w2.5.1 残差的概念:实际观测值y与通过回归 方程给出的回归值之差, w残差ei可以看做是误差项的估计值。5.5.2残差图分析模型的有效性 。w一般认为,如果一个回归模型满足所给出的 基本假定,所有残差应是在e0附近随机变 化,并在变化幅度不大的一条带子内。 w残差图:以自变量x作横轴,以残差为纵坐标 ,将相应的残差点画在直角坐标系上,就

11、可 以得到残差图。具体作法: w1.计算残差:回归分析主对话框中选择save 按钮,Residuals选项下的Unstandardized选 项,按continue,在原数据文件中加入残差 值, w2.画残差图。GraphScatter w例:火灾损失与距离消防站的远近的回归分析回归方程检验的小结1.回归方程是否存在的检验F检验是检验自 变量全体对因变量y是否产生显著影响 2.所有自变量是否都对因变量有显著影响的检 验当一个回归方程通过了F检验之后,并 不能说明这个回归方程中所有的自变量都对 因变量y有显著影响,因此,还要对回归系数 进行检验。 3.回归方差是否有效性的检验样本决定系 数与残差

12、分析。3. 回归系数的区间估计w当我们用最小二乘法得到0,1的点估计后 ,在实际应用中往往还希望给出回归系数的 估计精度,即给出其置信水平为1的置信 区间。这个区间以1的概率包含参数0, 1。置信区间的长度越短,说明估计值与0 ,1接近的程度越好,估计值就越精确。 w应用spss软件计算回归系数的区间估计: 在线性回归对话框中,点击Statistics Confidence interval,这样,在回归系数表 中就增加了回归系数的区间估计。六、回归模型的运用w建立回归模型的目的是为了应用,而预 测和控制是回归模型最重要的应用。 w4.1 单值预测 w4.2 区间预测4.2.1因变量新值的区间

13、预测4.2.2因变量新值的平均值的区间估 计4.3控制问题4.1单值预测w单值预测就是用单个值作为因变量的预 测值。即当x0新值时,求出y0的预测 值。 w单值预测只是一个大概值,我们除了想 知道预测值外,还希望知道预测值的精 度,这就要作区间估计。4.2区间预测w给一个预测范围比只给出单个预测值更 可信,这个问题也就是:应用SPSS软件直接计算预测值1.单值预测:在计算回归之前,把自变量新值 x0输入样本数据中,在回归分析主对话框中 点击Save按钮在save对话框中点击 Predicted ValuesUnstandardized2.因变量新值的区间预测:在save对话框中点 击Predi

14、cted intervalsIndividual3.因变量新值平均值的区间预测在save对话框中点击Predicted intervals mean单值预测区间预测例:火灾损失与距离消防站远近,x0 3.5公里,预测火灾损失额。实习2w1.应用实习1的数据,对回归系数与回归常数做点估 计与区间估计。 w2.预测在贷款余额为380时,不良贷款的估计值和估 计区间。6.一元线性回归模型建立小结w第一步,提出因变量与自变量 w第二步,搜集数据 w第三步,根据数据画散点图 w第四步,设定理论模型 w第五步,用SPSS软件计算,输出计算 结果 w第六步,回归诊断,分析输出结果实习3:w下表为四组数据,分

15、别对此四组数据进 行回归分析,并做显著性检验。 w实验数据文件为:回归显著性比较.sav第一组x第一组y第二组x第二组y第三组x第三组y第四组x第四组y44.2643.145.3986.5855.6854.7455.7385.7667.2466.1366.0887.7174.8277.2676.4488.8486.9588.1486.7788.4798.8198.7797.1187.04108.04109.14107.4685.25118.33119.26117.8185.561210.84129.13128.1587.91 137.58138.741312.7486.89 149.96148

16、.1148.841912.57.多元回归方法w回归自变量的选择是建立回归模型的一 个极为重要的问题。应用spss软件中回 归方法的选择可以进行自变量的选择。 w一、前进法(Forward) w二、后退法(Backward) w三、逐步回归法(Stepwise)一、前进法w前进法的思想是变量由少到多,每次增加一个,直至没有可引 入的变量为止。 w具体作法是首先将全部m个自变量,分别对因变量y建立m个一 元线性回归方程,并分别计算这m个一元回归方程的m个回归 系数的F检验值,选择其中最大的F值,如果此F值大于F的临界 值,则首先将xj引入回归方程,为了方便,设xj就是x1。 w接下来因变量y分别与(x1,x2),(x1,x3),(x1,xm )建立m1个二元线性回归方程,对这m1个回归方程中x2 ,x3,xm的回归系数进行F检验,选择其中最大的引入回归方程

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号