《可直线化的非线性回归分析》由会员分享,可在线阅读,更多相关《可直线化的非线性回归分析(60页珍藏版)》请在金锄头文库上搜索。
1、直直线线相相关关直直线线回回归归r r:+ +,两变量间的相关关系同向变化;,两变量间的相关关系同向变化; - -,两变量间的相关关系反向变化。,两变量间的相关关系反向变化。b: +b: +,y y 随随x x的增加的增加( (减少减少) )而增加而增加( (减少减少) ) ; - -, y y 随随x x的增加的增加( (减少减少) )而减少而减少( (增加增加) ) 。联系联系r r与与b b符号相同,都取决于两变量离均差乘积和符号相同,都取决于两变量离均差乘积和SPSP。回归分析和相关分析方向是一致的回归分析和相关分析方向是一致的回归方程的显著性回归方程的显著性回归系数的显著性回归系数的
2、显著性相关系数的显著性相关系数的显著性xy假设检验是等价的假设检验是等价的三者同时显著或不显著,是等价的。由于r的检验可以直接查表,较为简单,可以用其代替对b的假设检验。相关回归可以相互解释相关回归可以相互解释l当当当当SSSSy y不变的情况下,回归平方和的大小决定了相关不变的情况下,回归平方和的大小决定了相关不变的情况下,回归平方和的大小决定了相关不变的情况下,回归平方和的大小决定了相关系数的大小,系数的大小,系数的大小,系数的大小,r r2 2反映出回归平方和在总平方和中所占反映出回归平方和在总平方和中所占反映出回归平方和在总平方和中所占反映出回归平方和在总平方和中所占的比重。的比重。的
3、比重。的比重。l回归平方和越接近总平方和,则回归平方和越接近总平方和,则回归平方和越接近总平方和,则回归平方和越接近总平方和,则r r2 2越接近越接近越接近越接近1 1,回归效,回归效,回归效,回归效果越好。果越好。果越好。果越好。x或y的总变异能够通过y或x以直线回归的关系来估计的比重只占25,其余75的变异无法借助直线回归来估计,说明两变量间的相关关系实际意义不大。 如果如果r r r rr r0.01(24)0.01(24),相关系数极显著,相关系数极显著df=24df=24r r0.01(24)0.01(24) r r2 2y y依依x x的直线回归系数的直线回归系数x x 依依y
4、y的直线回归系数的直线回归系数E 决定系数决定系数r r 2 2也就是也就是y y 依依x x 的回归系的回归系数与数与x x 依依y y 的回归系数的乘积。的回归系数的乘积。E 决定系数反映了两个互为因果关系的决定系数反映了两个互为因果关系的相关变量间直线相关的程度。相关变量间直线相关的程度。回回归相关相关x x可以精确测量、可以精确测量、严格控制严格控制y y服从正态分布。服从正态分布。x x服从正态分布。服从正态分布。y y服从正态分布。服从正态分布。I型回型回归II型回型回归区别区别资料要求不同资料要求不同两变量间两变量间依存变化依存变化的数量关系的数量关系两变量间两变量间相关关系相关
5、关系的数量关系的数量关系回归相关单向xyxy双向应用情况不同应用情况不同& 有些资料用相关表示较适宜,比如兄弟与姐妹有些资料用相关表示较适宜,比如兄弟与姐妹间的身高关系、人的身高与前臂长之间的关系等间的身高关系、人的身高与前臂长之间的关系等资料。资料。& 有些资料用相关和回归都适宜,此时须视研究有些资料用相关和回归都适宜,此时须视研究需要而定。需要而定。& 就一般计算程序来说,是先求出相关系数就一般计算程序来说,是先求出相关系数r r并对并对其进行假设检验,如果其进行假设检验,如果r r显著并有进行回归分析之显著并有进行回归分析之必要,再建立回归方程。必要,再建立回归方程。 回归系数有单位,形
6、式为(依变量单位回归系数有单位,形式为(依变量单位/ /自变量单位),相关系数没有单位。自变量单位),相关系数没有单位。 相关系数的范围在相关系数的范围在-1-1+1+1之间,而回归系之间,而回归系数没有这种限制。数没有这种限制。系数不同系数不同作相关与回归分析要有实际意义。作相关与回归分析要有实际意义。 不要把毫无关联的两个事物或现象用来作不要把毫无关联的两个事物或现象用来作相关或回归分析。相关或回归分析。*l相关分析只是以相关系数来描述两个变量间相互关系相关分析只是以相关系数来描述两个变量间相互关系的密切程度和方向,并不能阐明两事物或现象间存在的密切程度和方向,并不能阐明两事物或现象间存在
7、联系的本质。联系的本质。对相关分析的作用要正确理解。对相关分析的作用要正确理解。*l相关并不一定就是内在关系,切不可单纯依靠相关相关并不一定就是内在关系,切不可单纯依靠相关系数或回归系数的显著性系数或回归系数的显著性“证明证明”内在关系之存在。内在关系之存在。l要证明两事物间的内在关系,必须凭籍专业知识从理要证明两事物间的内在关系,必须凭籍专业知识从理论上加以阐明。但是,当事物间的因果关系未被认识论上加以阐明。但是,当事物间的因果关系未被认识前,相关分析可为理论研究提供线索。前,相关分析可为理论研究提供线索。 1 2 3 4 5 64321 1 2 3 4 5 64321 1 2 3 4 5
8、64321正向直正向直线关系关系负向直向直线关系关系曲曲线关系关系直线关系是两变量间最简单的一种关系。直线关系是两变量间最简单的一种关系。这种关系仅在变量的一定取值范围内可用,范围这种关系仅在变量的一定取值范围内可用,范围过大,散点图就偏离直线,需要借助于曲线描述。过大,散点图就偏离直线,需要借助于曲线描述。如果缩小研究范围,则任意非直线关系最后都可以如果缩小研究范围,则任意非直线关系最后都可以用线性关系来近似,但范围过小,使用上不方便。用线性关系来近似,但范围过小,使用上不方便。 不能对变量间的关系有一个整体上的认识。不能对变量间的关系有一个整体上的认识。 在不同取值范围内还要换用不同的方程
9、。在不同取值范围内还要换用不同的方程。 1 2 3 4 5 64321曲线资料曲线资料直线资料直线资料直线回归方程直线回归方程曲线回归方程曲线回归方程xy第八章 可直线化的 非线性回归分析 非线性回归直线化过程非线性回归直线化过程对数函数曲线对数函数曲线指数函数曲线指数函数曲线幂函数曲线幂函数曲线LogisticLogistic生长曲线生长曲线主要内容主要内容曲线类型的确定曲线类型的确定数据变换数据变换常用曲线回归的直线化常用曲线回归的直线化倒数函数曲线倒数函数曲线(一)曲线类型的确定:(一)曲线类型的确定:单细胞生物生长初期数量单细胞生物生长初期数量酶促反应动力学米氏方程酶促反应动力学米氏方
10、程指数函数指数函数单细胞生物全生长期数量单细胞生物全生长期数量S S 型曲线型曲线双曲线双曲线一、非线性回归直线化过程一、非线性回归直线化过程 通过所获得资料的自然尺度绘制散点图,通过所获得资料的自然尺度绘制散点图,按照散点趋势画出相应的曲线。按照散点趋势画出相应的曲线。 如果有多种曲线类型可供选择,可多做几如果有多种曲线类型可供选择,可多做几次回归,进行比较,从中确定最好的曲线类型。次回归,进行比较,从中确定最好的曲线类型。散点图散点图 确定了曲线类型之后,回归的任务就变成确定了曲线类型之后,回归的任务就变成确定曲线公式中的参数,称为确定曲线公式中的参数,称为曲线拟合曲线拟合。 根据散点图进
11、行直观的比较,选出一种曲根据散点图进行直观的比较,选出一种曲线类型,并将原数据进行转换,将曲线方程直线类型,并将原数据进行转换,将曲线方程直线化,用转换后的数据绘制散点图,若该图形线化,用转换后的数据绘制散点图,若该图形为直线趋势,即表明选取的曲线是恰当的,否为直线趋势,即表明选取的曲线是恰当的,否则将重新进行选择。则将重新进行选择。数据转换数据转换 实际上,只有少数几种简单非线性方程可实际上,只有少数几种简单非线性方程可用这种方法线性化,而绝大多数都是不行的。用这种方法线性化,而绝大多数都是不行的。曲线拟合曲线拟合曲线与实测点曲线与实测点吻合程度吻合程度的高低的高低小小吻合程度高吻合程度高大
12、大吻合程度低吻合程度低相关指数相关指数(1) (1) 回归曲线拟合程度的高低;回归曲线拟合程度的高低;(2) (2) 利用回归方程进行估测的可靠利用回归方程进行估测的可靠程度的高低;程度的高低;直接引入新变量。直接引入新变量。曲线方程数学变换后,再引入新变量。曲线方程数学变换后,再引入新变量。(二)数据变换的方法:(二)数据变换的方法:对数函数:对数函数:幂函数:幂函数:例:例:倒数函数(reciprocal function)二、常用曲线回归的直线化二、常用曲线回归的直线化指数函数(exponential function)对数函数(logarithmic function)幂函数(powe
13、r function)双曲线S形曲线烘烤时间对叶绿素含量的影响烘烤时间对叶绿素含量的影响烘烤时间对叶绿烘烤时间对叶绿素含量的影响素含量的影响 开始增长缓慢,而在以后的某一范围内开始增长缓慢,而在以后的某一范围内迅速增长,达到某限度后,增长又缓慢下来,迅速增长,达到某限度后,增长又缓慢下来,曲线略呈拉长的曲线略呈拉长的“S” S” 。Logistic生长曲线0xy0xyK1+aK起始量起始量终极量终极量y y y y随随随随x x x x的增的增的增的增加而增加加而增加加而增加加而增加K2拐点拐点knee piontknee piont下凹下凹上凸上凸0xyK1+aK12y是累积频率,则是累积频
14、率,则y无限增大的终极量为无限增大的终极量为100(%)。y是生长量或繁殖量时,可限是生长量或繁殖量时,可限3对等距观测值,计算对等距观测值,计算K。x(周次)y(kg)20.3040.8661.7382.2102.47122.67142.80x(周次)y(kg)20.3040.8661.7382.2102.47122.67142.80x(周次)y(kg)20.3040.8661.7382.2102.47122.67142.80x(周次)y(kg)20.3040.8661.7382.2102.47122.67142.80x(周次)y(kg)(2.827-y)/yy=ln(2.827-y)/y)
15、20.30 8.4233 2.1310 40.86 2.2872 0.8273 61.73 0.6341 -0.4555 82.20 0.2850 -1.2553 102.47 0.1445 -1.9342 122.67 0.0588 -2.8336 142.80 0.0096 -4.6415 不是所有非线性方程都能用变量代换线性化。不是所有非线性方程都能用变量代换线性化。即使方程类型不对时,变量代换与线性回归仍可即使方程类型不对时,变量代换与线性回归仍可照常进行,但结果没有任何用途,强行使用会导照常进行,但结果没有任何用途,强行使用会导致错误。致错误。只能使变换后数据的线性方程残差最小,采用线只能使变换后数据的线性方程残差最小,采用线性化方法进行曲线回归后必须进行检验。性化方法进行曲线回归后必须进行检验。