第27章 曲线回归与非线性回归——【SPSS精品教程】

上传人:东****0 文档编号:157951493 上传时间:2020-12-28 格式:PDF 页数:41 大小:758.91KB
返回 下载 相关 举报
第27章 曲线回归与非线性回归——【SPSS精品教程】_第1页
第1页 / 共41页
第27章 曲线回归与非线性回归——【SPSS精品教程】_第2页
第2页 / 共41页
第27章 曲线回归与非线性回归——【SPSS精品教程】_第3页
第3页 / 共41页
第27章 曲线回归与非线性回归——【SPSS精品教程】_第4页
第4页 / 共41页
亲,该文档总共41页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第27章 曲线回归与非线性回归——【SPSS精品教程】》由会员分享,可在线阅读,更多相关《第27章 曲线回归与非线性回归——【SPSS精品教程】(41页珍藏版)》请在金锄头文库上搜索。

1、IBM-SPSS 第第27章章 曲线回归与非线性回归曲线回归与非线性回归 曲线直线化变化方法 曲线直线化法,即利用变量变换的方法,使变换后的两个变量之 间呈直线关系。求出直线回归方程后,再将方程中的变量通过逆变换 还原,求得所求的曲线回归方程。 1多项式曲线多项式曲线y=a+bx+cx2 2对数函数对数函数 y = a + blnx 3指数函数指数函数y = aebx或或y = aeb/x(a 0) 4幂函数幂函数y=axb(a 0) 5双曲线函数双曲线函数 1/y = a+b/x 变量变换后实现线性回归的步骤 对于可以通过变量变换实现线性化的资料,回归的步骤如下: (1)绘制散点图,观测散点

2、图分布特征类似于何种函数类型, (2)按照所选定的函数进行相应的变量转换 (3)对变换后的数据建立直线回归模型 (4)拟合多个相近的模型,然后通过比较各模型的拟合优度挑 选较为合适的模型。 实例详解 对GDP(国内生产总值)的拟合。选取GDP指标为因变量,单位为 百万美元,请根据图27-1所示中1993-2010年GDP数据,建立t-GDP曲线。 (1)用原始数据绘制散点图,如图27-2所示。 由图27-2所示可以看出,两个变量分布曲线类似于指数曲线y=b0b1t, 由图27-3所示观测GDP与Lgt的散点图,两者成直线趋势,可以考虑用最 小二乘法拟合GDP与Lgt的直线回归方程。 计算t的指

3、数值生成新的变量Lgt,操作部骤如下:在菜单中单击 “转换”计算变量,在“目标变量”框中输入“Lgt”作为新变 量名,在“数字表达式”中输入LG10(GDP)作为新的变量值, 单击“确定”按钮。 (2)拟合GDP与Lgt的直线回归方程结果解释 如图27-4所示为模型的拟合优度情况,显示模型的相关系数R为 0.995,决定系数R2为0.913,说明该模型回归的贡献很大,表示 回归模型拟合结果好。 对拟合的模型进行假设检验(见结果图27-5所示),F值为 167.361,P值为0.000,说明这个回归模型试验统计学意义的。 结果图27-6所示中给出了包括常数项在内的参数及检验结果,进 行的是t检验

4、,可见常数项和Lgt均有统计学意义。 建立回归方程为:y=5.8201.875t 曲线回归 曲线直线化变化方法尽管有可能通过一些函数转化方法在一定范围 内将他们的关系转变为线性关系,但这种转化有可能导致更为复杂 的计算或数据关系失真,这时我们可以通过进行曲线拟合(Curve Fitting),曲线拟合是求解反应变量间曲线关系的曲线回归方程的过 程。 实例详解 研究发现,锡克氏试验阴性率随儿童年龄增长而升高。查得山东 某地17岁儿童的资料如图27-10所示,试用曲线回归分析方法拟 合曲线。 (1)打开数据文件“锡克氏试验阴性率与儿童年龄.sav”,数据 库构建如图27-11所示。 (2)单击“图

5、形”|“旧对话框”|“散点/点状”命令,弹出 “散点/点状”对话框,如图27-12所示。 (3)从图27-12所示看到,随着儿童年龄的增加,阴性率呈显著 的上升趋势。但是这种上升趋势并不是线性的,而表现为非线性 的关 系。故可以考虑采用曲线拟合的方法。这里选用二次曲线模 型、三次曲线模型和对数曲线模型。拟合三个模型,将三者拟合 情况进行比较,选择拟合度较好的模型。 1操作步骤操作步骤 在菜单中单击“分析”|“回归”|“曲线估计”命令,在“曲线 估计”对话框选择“阴性率”作为因变量,“儿童年龄”作为 “自变量”,从模型栏中选取“cubic”、“quadratic”、 “logarithmic”,

6、单击“确定”按钮。 2实例结果及分析实例结果及分析 (1)模型描述 图27-13所示是SPSS对曲线拟合结果的初步描述统计,例如自变 量和因变量、估计方程的类型等。 (2)模型汇总及参数估计 图27-14所示模型描述是对进行拟合的样本例数进行说明的信息。 图27-16所示给出了样本数据分别进行三种曲线方程拟合的检验统计量 和相应方程中的参数估计值。对于对数拟合,它的可决系数R2为0.914, F统计量等于52.999,概率P值小于显著性水平0.05,说明该模型有统计 学意义。 对于二次曲线方程和三次方程拟合来说,它对应的可决系数R2分别为 0.971和0.995,模型也显著有效。 虽然上述模型

7、都有显著的统计学意义,但从可决系数的大小可以清晰 看到三种曲线函数方程较其他两种曲线方程拟合效果更好,因此选择 三种曲线方程来描述锡克氏试验阴性率与儿童年龄的关系。 (3)拟合曲线图,如图27-17所示。 最后给出的是实际数据的散点图和三种估计曲线方程的预测图。 从图27-8所示中也进一步说明三次曲线曲线方程的拟合效果最好。 非线性回归 因变量与自变量之间的相互关系可以用线性方程来近似的反应。但是, 在现实生活中,非线性关系大量存在。线性回归模型要求变量之间必 须是线性关系,曲线估 计只能处理能够通过变量变换化为线性关系的 非线性问题,因此这些 方法都有一定的局限性。相反的,非线性回归 可以估

8、计因变量和自变 量之间具有任意关系的模型,用户根据自身需 要可随意设定估计方程的具体形式。 实例详解 假定数据文件图27-24所示中是一家公司在8个周期间的广告费用与 公司收入。公司的老板希望建立一个回归模型用电视广告费用和报 纸广告费用来预测公司收入。以往8周的样本数据如图27-24所示 (单 位:千美元)。请建立回归模型分析。 SPSS模块说明模块说明 1非线性回归非线性回归 单击“分析”|“回归”|“非线性”命令,弹出单“非线性回归” 对话框,如图27-18所示。 (1)选择因变量 在“非线性回归”对话框左侧的候选变量列表框中选择一个变量, 将其添加至“自变量”列表框中,即选择该变量作为

9、非线性回归 分析的因变量。 (2)模式表达式选项框:用于定义非线性回归模型的表达式。 输入的模型至少应包含一个自变量。 (3)函数组选项框:给出了各种可能用到的函数类型。 2“参数”按钮“参数”按钮 单击图27-18所示中的“参数”按钮,则弹出如图27-19所示对话 框。进行迭代计算来确定模型参数,首先必须给定参数的初值。 3“损失”按钮“损失”按钮 定义了参数的起始值后,“损失”按钮和“约束”按钮被激活。单击 “损失”按钮,则弹出如图27-20所示对话框。用户可以在该对话框内设 置损伤函数。 4“约束”按钮“约束”按钮 在主对话框中单击激活的“约束”按钮,则弹出如图27-21所示 对话框。在

10、此对话框内设置对参数的一些限制。 5“保存”按钮“保存”按钮 在主对话框中单击激活的“保存”按钮,则弹出如图27-22所示 对话框。有四个选项:“预测值”、“残差”、“导数”、“损 失函数值”。 6“选项”按钮“选项”按钮 在主对话框中单击激活的“选项”按钮,则弹出如图27-23所示 对话框。 实例详解 假定数据文件图27-24所示中是一家公司在8个周期间的广告费用 与公司收入。公司的老板希望建立一个回归模型用电视广告费用 和报纸广告费用来预测公司收入。以往8周的样本数据如表27-9 所示(单 位:千美元)。请建立回归模型分析。 首先绘制散点矩阵图如图27-25所示。 依据散点矩阵图来判断三个

11、变量之间的关系。散点矩阵图27-25 分为9个子图,它们分别描述了三者之间的变 化。可以看到,每 周营业收入和两种广告费用存在显著线性 关系,观察自变量 电 视广告费用和报纸广告费用之间散点图看到,这两种广告费用之 间也存在显著的影响 关系,这说明了这两个因变量之间可能存在 交叉影响。于是,建立如 下非线性回归方程: y=a+bx1+cx2+dx1x2+ 1操作步骤操作步骤 (1)打开数据文件。 (2)从主菜单栏中选择“分析”“回归”“非线性”命令, 打开“非线性回归”对话框。 (3)将变量“每周营业收入”作为因变量选入“因变量”列表 框。 (4)单击“参数”按钮,打开“非线性回归:参数”对话

12、框。 (5)在此对话框中定义模型参数的起始值。单击“继续”按钮 返回主对话框。 (6)在“模型表达式”文本框中输入a+b电视广告费用+c报纸广 告费用+d电视广告费用报纸广告费用。 (7)单击“保存”按钮,打开“非线性回归:保存”对话框。选择 “残差”项保存新变量,单击“继续”按钮返回主对话框。 (8)单击“选项”打开“非线性回归:选项”对话框。选中“标准无 误的辅助程序估计(B)”复选框,单击“继续”按钮确认并返回主对 话框。 (9)设置完毕,单击“确定”按钮执行上述操作。 2结果及分析 可以看出,经过13次迭代后,模型达到收敛标准,最佳解被找到。 于是,得到每周营业收入关于两种广告费用的预

13、测回归模型为: y=86.531+1.089x-0.667x2+0.724x1x2 图27-27所示给出了整个模型的显著性检验结果,可以看出,决定系数为 0.941,拟合结果比较好。Uncorrected Total为未修正的总误差平方和,其值 等于70338.000,自由度等于8;它被分解成回归平方和70336.501和残差平 方和1.499,自由度分别是4和4。 Corrected Total是经修正的总误差平方和, 其值等于25.500,自由度是7;表的最后一列是均方。 图27-28所示为基于13次辅助程序抽样计算出的各参数的估计值、 标准误差,95%置信区间和相关系数矩阵。 THE END

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号