SPSS—非线性回归(模型表达式)案例解析

资源描述

《SPSS—非线性回归(模型表达式)案例解析》由会员分享，可在线阅读，更多相关《SPSS—非线性回归(模型表达式)案例解析（12页珍藏版）》请在金锄头文库上搜索。

1、SPSS非线性回归(模型表达式)案例解析 2011-11-16 10:56 由简单到复杂，人生有下坡就必有上坡，有低潮就必有高潮的迭起，随着 SPSS 的深入学习，已经逐渐开始走向复杂，今天跟大家交流一下，SPSS 非线性回归，希望大家能够指点一二！非线性回归过程是用来建立因变量与一组自变量之间的非线性关系，它不像线性模型那样有众多的假设条件，可以在自变量和因变量之间建立任何形式的模型非线性，能够通过变量转换成为线性模型称之为本质线性模型，转换后的模型，用线性回归的方式处理转换后的模型，有的非线性模型并不能够通过变量转换为线性模型，我们称之为：本质非线性模型还是以“销售量”和“广告费

2、用”这个样本为例，进行研究，前面已经研究得出：“二次曲线模型”比“线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的趋势变化”，那么“二次曲线”会不会是最佳模型呢？答案是否定的，因为“非线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的变化趋势” 下面我们开始研究：第一步：非线性模型那么多，我们应该选择第一步：非线性模型那么多，我们应该选择“哪一个模型呢？哪一个模型呢？”1：绘制图形，根据图形的变化趋势结合自己的经验判断，选择合适的模型点击“图形”图表构建程序进入如下所示界面：点击确定按钮，得到如下结果：点击确定按钮，得到如下结果：放眼望去放眼望去, , 图形的变化趋势，

3、其实是一条曲线，这条曲线更倾向于图形的变化趋势，其实是一条曲线，这条曲线更倾向于“S“S“ 型曲线，型曲线，我们来验证一下，看我们来验证一下，看“二次曲线二次曲线”和和“S“S 曲线曲线”相比，两者哪一个的拟合度更高！相比，两者哪一个的拟合度更高！点击点击“分析分析回归回归曲线估计曲线估计进入如下界面进入如下界面在在“模型模型”选项中，勾选选项中，勾选”二次项二次项“和和”S“”S“ 两个模型，点击确定，得到如下两个模型，点击确定，得到如下结果：结果：通过通过“二次二次”和和“S“S “ 两个模型的对比，可以看出两个模型的对比，可以看出 S S 模型的拟合度模型的拟合度明显高明显高于于

4、“二次二次”模型的拟合度模型的拟合度（0.9120.912 0.9000.900）不过，几乎接近）不过，几乎接近接着，我们采用接着，我们采用 S S 模型，得到如下所示的结果：模型，得到如下所示的结果：结果分析：结果分析：1 1：从 ANOVA 表中可以看出：总体误差= 回归平方和 + 残差平方和（共计： 0.782） F 统计量为（240.216）显著性 SIG 为（0.000）由于 0.0000,b10, b20,b20, andand b30,b30,时，它符合效益递减规律，我们称之为：时，它符合效益递减规律，我们称之为： MistcherlichsMistcherlichs mod

5、elmodel 第二步：确定各参数的初始值第二步：确定各参数的初始值1 1：b1 参数值的确定，从表达式可以看出：随着”广告费用“的增加，销售量也会增加，最后达到一个峰值，由于：b20, b30 ，随着广告费用的增加： b2*eb3*(b2*eb3*(广告费用）广告费用）会逐渐趋向于“0” 而此时 Y(销售量）将接近于 b1 值，从上图可以看出：Y(销售量）的最大值为 12 点多，接近 13，所以，我们设定 b1 的初始值为 132 2：b2 参数值确定：当 Y(销售量）最小时，此时应该广告费用最小，基本等于 “0”，可以得出：b1+b2= Y(销售量）此时 Y 销售量最小，从图中可以看出

6、：第一个值为 6.7 左右，接近 7 这个值，所以：b2=7-13=-63:3: b3 参数值确定：可以用图中两个分离点的斜率来确定 b3 的值，例如取（x1=2.29,y1=8.71) 和（ x2=5.75, y2=12.74) 通过公式 y2-y1/x2- x1=1.16，（此处可以去整数估计值来算 b3 的值）确定参数初始值和参数范围的方法如下所示：确定参数初始值和参数范围的方法如下所示：1：通过图形确定参数的取值范围，然后在这个范围里选择初始值。 2：根据非线性方程的数学特性进行某些变换后，再通过图形帮助判断初始值的范围。 3：先使用固定的数代替某些参数，以此来确定其它参数的取值

7、范围。 4：通过变量转换，使用线性回归模型来估计参数的初始值第三步：建立模型表达式和选择损失函数第三步：建立模型表达式和选择损失函数点击“分析”回归非线性，进入如下所示界面：如上图中，点击参数，分别添加 b1,b2,b3 进入参数框内，在模型表达式中输入：b1b1 + + b2*Exp(b3*b2*Exp(b3*广告费用）广告费用）（步骤为：（步骤为：选择“函数组”算术Exp 函数），将“销售量”变量拖入“因变量”框内“损失函数”默认选项为“残差平方和” 如果有特需要求，可以自行定义点击“约束”进入如下所示的界面：点击“继续”按钮，此时会弹出警告信息，提示用户是否接受建议, 建议内容为

8、：将采用序列二次编程进行参数估计，点击确定，接受建议即可参数的取值范围指在迭代过程中，将参数限制在有意义的范围区间内，提供两种对参数范围约束的方法：1：线性约束，在约束表达式里只有对参数的线性运算 2：非线性约束，在约束表达式里，至少有一个参数与其它参数进行了乘，除运算，或者自身的幂运算在“保存”选项中，勾选“预测值”和“残差”即可，点击继续点击“选项”得到如下所示的界面：此处的“估计方法”选择“序列二次编程”的方法，此方法主要利用的是双重迭代法进行求解，每一步迭代都建立一个二次规划算法，以此确定优化的方向，把估计参数不断的带入损失函数进行求值运算，直到满足指定的收敛条件为止点击继续

9、，再点击“确定”得到如下所示的结果：上图结果分析：上图结果分析：1：从“迭代历史记录”表中可以看出：迭代了 17 次后，迭代被终止，已经找到最优解此方法是不断地将“参数估计值”代入”损失函数“求解，而损失函数采用的是”残差平方和“最小，在迭代 17 次后，残差平方和达到最小值，最小值为（6.778）此时找到最优解，迭代终止2：从参数估计值”表中可以看出： b1= 12.904 （标准误为 0.610，比较小，说明此估计值的置信度较高） b2=- 11.268 （标准误为：1.5881，有点大，说明此估计值的置信度不太高） b3=- 0.496（标准误为：0.138，很小，说明此估计值的

10、置信度很高）非线性模型表达式为：非线性模型表达式为：Y(Y(销售量）销售量）= = 12.904-11.268*e(-0.496*12.904-11.268*e(-0.496*广告费用）广告费用）3：从“参数估计值的相关性”表中可以看出：b1 和 b3 的相关性较强，b2 和 b1 或 b3 的相关性都相对弱一些，其中 b1 和 b2 的相关性最弱4：从 anova 表中可以看出：R 方 = 1- （残差平方和）/（已更正的平方和） = 0.909，拟合度为 0.909，说明此模型能够解释 90 多的变异，拟合度已经很高了前面已经提到过，S 行曲线的拟合度更高，为（0.916）那到底哪个更合适呢？如果您的数据样本容量够大，我想应该是“非线性模型”的拟合度会更高！其实想想，我们是否可以将其实想想，我们是否可以将“非线性非线性”转换为转换为“线性线性”后，再利用线性模型进后，再利用线性模型进行分析了？行分析了？后期有时间的话，将还是以本例为说明，如何将后期有时间的话，将还是以本例为说明，如何将“非线性非线性”转换转换为为“线性线性”后进行分析！后进行分析！

展开阅读全文