《统计学非线性回归》由会员分享,可在线阅读,更多相关《统计学非线性回归(24页珍藏版)》请在金锄头文库上搜索。
1、第九章第九章非线性回归非线性回归 医学研究中医学研究中X X和和Y Y的数量关系常常不是的数量关系常常不是线性的,如毒物剂量与动物死亡率,人的线性的,如毒物剂量与动物死亡率,人的生长曲线,药物动力学等,都不是线性的。生长曲线,药物动力学等,都不是线性的。如果用线性描述将丢失大量信息,甚至得如果用线性描述将丢失大量信息,甚至得出错误结论。这时可以用出错误结论。这时可以用曲线直线化估计曲线直线化估计(Curve estimationCurve estimation)或)或非线性回归非线性回归(Nonlinear regression) (Nonlinear regression) 方法分析,也称方
2、法分析,也称曲线拟合曲线拟合(Curve(Curve fitting)。 绘制散点图,根据图形和专业知识选取曲线类绘制散点图,根据图形和专业知识选取曲线类型(可同时选取几类)型(可同时选取几类)按曲线类型,作曲线直线化变换按曲线类型,作曲线直线化变换建立直线化的直线回归方程;作假设检验,计建立直线化的直线回归方程;作假设检验,计算决定系数算决定系数将变量还原,写出用原变量表达的曲线方程将变量还原,写出用原变量表达的曲线方程比较决定系数选取比较决定系数选取“最佳最佳”曲线方程曲线方程曲线直线化估计的步骤曲线直线化估计的步骤 曲线形式(根据生物学机制理论决定) 常见的曲线回归方程 对数:幂函数:
3、或 指数函数:多项式: 或 logistic: 或 第一节、利用线性回归拟合曲线例例 上海医科大学微生物学教研室以已知浓度上海医科大学微生物学教研室以已知浓度X的免的免疫球蛋白疫球蛋白A(IgA, g/ml)作火箭电泳作火箭电泳, 测得火箭高度测得火箭高度Y(mm)如表如表1所示。试拟合所示。试拟合Y关于关于X的非线性回归方程。的非线性回归方程。 X Y X Y XXXXlnXlnXlnXlnX (lnX)2 Y2 (lnX)Y 残差平方残差平方 0.2 7.6 -1.6094 0.2 7.6 -1.6094 0.4 12.3 -0.9163 0.4 12.3 -0.9163 0.6 15.7
4、 -0.5108 0.6 15.7 -0.5108 0.8 18.2 -0.2231 0.8 18.2 -0.2231 1.0 18.7 0 1.0 18.7 0 1.2 21.4 0.1823 1.2 21.4 0.1823 1.4 22.6 0.3365 1.4 22.6 0.3365 1.6 23.8 0.4700 1.6 23.8 0.4700合计合计合计合计140.3 -2.2708 140.3 -2.2708 2.5902 57.76 -12.2314 2.5902 57.76 -12.2314 0.8396 151.29 -11.2705 0.8396 151.29 -11.27
5、05 0.2609 246.49 -8.0196 0.2609 246.49 -8.0196 0.0498 331.24 -4.0604 0.0498 331.24 -4.0604 0.0000 349.69 0.0000 0.0000 349.69 0.0000 0.0332 457.96 3.9012 0.0332 457.96 3.9012 0.1132 510.76 7.6049 0.1132 510.76 7.6049 0.2209 566.44 11.1860 0.2209 566.44 11.1860 4.10784.1078 2671.632671.63 -12.8898-12
6、.8898 7.23 12.62 15.77 18.01 19.75 21.16 22.36 23.40 0.1380 0.1017 0.0053 0.0361 1.0921 0.0563 0.0566 0.1597 1.6458(一)绘制散点图,决定曲线类型绘制散点图,决定曲线类型(二)曲线直线化变换(二)曲线直线化变换 =a+blnX (三)建立线性回归方程线性回归方程 回归方程为:回归方程为: =19.7451+7.7771 =19.7451+7.7771 lnXlnX方差分析有统计学意义,方差分析有统计学意义,P P0.00000.0000,F F763.50763.50,表明回归方程
7、有贡献。,表明回归方程有贡献。确定系数为确定系数为0.990.99,表明回归拟合原资,表明回归拟合原资料很好。料很好。用线性回归拟合曲线(例2)表表9- 25名重伤病人的住院天数名重伤病人的住院天数X与预后指数与预后指数Y编编号号1 12 23 34 45 56 67 78 89 9 1010 1111 1212 1313 1414 1515X X2 25 57 7 1010 1414 1919 2626 3131 3434 3838 4545 52525353 6060 6565Y Y5454 5050 4545 3737 3535 2525 2020 1616 1818 13138 8 1
8、1118 84 46 6(一)绘制散点图,决定曲线类型绘制散点图,决定曲线类型(二)曲线直线化变换(三)建立线性回归方程线性回归方程 回归方程为:回归方程为: 4.037-0.0384.037-0.038X X方差分析有统计学意义,方差分析有统计学意义,P P0.00000.0000,F F276.38276.38,表明回归方程有贡献。,表明回归方程有贡献。确定系数为确定系数为0.95510.9551,表明回归拟合原,表明回归拟合原资料较好。资料较好。转换为原方程的另一种形式:转换为原方程的另一种形式: 比较两个回归方程可见,对同一份样本比较两个回归方程可见,对同一份样本采用不同估计方法得到的
9、结果并不相同。采用不同估计方法得到的结果并不相同。主要因为曲线直线化以后的回归只对变主要因为曲线直线化以后的回归只对变换后的换后的Y Y* *( (lnY)lnY)负责负责, , 得到的线性方程可得到的线性方程可使使Y Y* *与其估计值与其估计值 之间的残差平方和最小之间的残差平方和最小, ,并不保证原变量并不保证原变量Y Y与其估计值与其估计值 之间的残之间的残差平方和也是最小。差平方和也是最小。曲线直线化曲线直线化 非线性最小二乘法非线性最小二乘法问题问题:前一个例子只对自变量作对:前一个例子只对自变量作对数变换的数变换的对数曲线对数曲线拟合拟合,能否保证原,能否保证原变量变量Y Y与其
10、估计值与其估计值 之间的残差平方之间的残差平方和也是最小?和也是最小?幂函数曲线幂函数曲线拟合呢?拟合呢?问题问题:如何判断哪个曲线拟合方程更佳?:如何判断哪个曲线拟合方程更佳? 对于例,几个常见曲线拟合得到的决定对于例,几个常见曲线拟合得到的决定系数系数R R2 2如下(如下(曲线直线化曲线直线化):):线性(直线)线性(直线)R R2 2:0.88560.8856 ( ( ( (y = 46.4604 -0.7525 x)y = 46.4604 -0.7525 x)幂曲线幂曲线R2:0.8293 (0.8293 (y = 159.9297 x-0.7191) )对数曲线对数曲线R R2 2
11、:0.9654 (0.9654 (y = 72.2829 -15.9662 Ln(x)y = 72.2829 -15.9662 Ln(x) ) )指数曲线指数曲线R R2 2: 0.9551(0.9551(y = 56.6651 e-0.0380 x) )二项式曲线二项式曲线R R2 2:0.9812(0.9812(y = 55.8221- 1.7103 x +0.0148 x2 ) )问题问题:如何判断那个曲线拟合方程更佳?:如何判断那个曲线拟合方程更佳? 对于例,几个常见曲线拟合得到的决定对于例,几个常见曲线拟合得到的决定系数系数R R2 2如下(如下(非线性回归非线性回归迭代法迭代法):
12、):线性(直线)线性(直线)R R2 2:0.88560.8856 ( ( ( (y = 46.4604 -0.7525 x)y = 46.4604 -0.7525 x)幂曲线幂曲线R2:0.8413 (0.8413 (y = 88.7890 x-0.4662) )对数曲线对数曲线R R2 2:0.9654 (0.9654 (y = 72.2829 -15.9662 Ln(x)y = 72.2829 -15.9662 Ln(x) ) )指数曲线指数曲线R R2 2: 0.9875(0.9875(y = 58.6066 e-0.0396 x) )二项式曲线二项式曲线R R2 2:0.9812(0
13、.9812(y = 55.8221- 1.7103 x +0.0148 x2 ) ) 原变量原变量Y Y与与 (直线或曲线方程得到)间(直线或曲线方程得到)间相关系数的绝对值相关指数相关系数的绝对值相关指数R R线性(直线)线性(直线)R R:X X与与Y Y间相关系数绝对值间相关系数绝对值幂曲线幂曲线R: lnXlnX与与lnYlnY间相关系数绝对值间相关系数绝对值对数曲线对数曲线R R: lnXlnX与与Y Y间相关系数绝对值间相关系数绝对值指数曲线指数曲线R R: X X与与lnYlnY间相关系数绝对值间相关系数绝对值二项式曲线二项式曲线R R: (1 1SSSS残差残差/SS/SS总总
14、)R R的计算的计算(曲线直线化)(曲线直线化) 原变量原变量Y Y与与 (直线或曲线方程得到)间(直线或曲线方程得到)间相关系数的绝对值相关指数相关系数的绝对值相关指数R R线性(直线)线性(直线)R R:X X与与Y Y间相关系数绝对值间相关系数绝对值幂曲线幂曲线R: lnX lnX与与lnYlnY间相关系数绝对值间相关系数绝对值对数曲线对数曲线R R: lnXlnX与与Y Y间相关系数绝对值间相关系数绝对值指数曲线指数曲线R R: X X与与lnYlnY间相关系数绝对值间相关系数绝对值二项式曲线二项式曲线R R: (1 1SSSS残差残差/SS/SS总总)R R的计算的计算(非线性回归)
15、(非线性回归) 散点图辨析散点图辨析 如果条件允许最好采用非线性回如果条件允许最好采用非线性回归(归(Nonlinear Regression)拟合幂)拟合幂函数曲线与指数函数曲线函数曲线与指数函数曲线 注意绘制散点图,并结合专业知注意绘制散点图,并结合专业知识解释识解释采用采用SASSAS进行曲线拟合进行曲线拟合采用采用SPSSSPSS进行曲线拟合进行曲线拟合曲线直线化Analyze Regression Curve Estimation 可选Power 、Logarithmic、Exponential、Quadratic、Cubic 等 非线性回归Analyze Regression Nonlinear 设置模型: Model Expression 参数赋初值:Parameters