7.2直线回归与相关分析

上传人:夏** 文档编号:569270187 上传时间:2024-07-28 格式:PPT 页数:65 大小:874KB
返回 下载 相关 举报
7.2直线回归与相关分析_第1页
第1页 / 共65页
7.2直线回归与相关分析_第2页
第2页 / 共65页
7.2直线回归与相关分析_第3页
第3页 / 共65页
7.2直线回归与相关分析_第4页
第4页 / 共65页
7.2直线回归与相关分析_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《7.2直线回归与相关分析》由会员分享,可在线阅读,更多相关《7.2直线回归与相关分析(65页珍藏版)》请在金锄头文库上搜索。

1、第三节第三节 可直线化的非线性回归分析可直线化的非线性回归分析n 非线性回归的直线化非线性回归的直线化n 倒数函数曲线倒数函数曲线n 指数函数曲线指数函数曲线n 对数函数曲线对数函数曲线n 幂函数曲线幂函数曲线n Logistic生长曲线生长曲线. 1 2 3 4 5 64321 1 2 3 4 5 64321直线关系直线关系曲线关系曲线关系直线关系是两变量间最简单的一种关系。直线关系是两变量间最简单的一种关系。这种关系仅在变量的一定取值范围内可用,范围过这种关系仅在变量的一定取值范围内可用,范围过大,散点图就偏离直线,需要借助于曲线描述。大,散点图就偏离直线,需要借助于曲线描述。.两变量间的

2、两变量间的非线性非线性关系关系用来表示双变量间的关系有多种曲线。用来表示双变量间的关系有多种曲线。曲线类型曲线类型直线类型直线类型直线回归方程直线回归方程曲线回归方程曲线回归方程.米氏方程米氏方程米氏方程米氏方程n 当反应速度等于最大速度一半时当反应速度等于最大速度一半时,即即V = 1/2 Vmax, Km = S n 上式表示上式表示,米氏常数是反应速度为最大值的一半米氏常数是反应速度为最大值的一半时的底物浓度。米氏常数的单位为时的底物浓度。米氏常数的单位为mol/L。Km 米氏常数米氏常数Vmax 最大反应速度最大反应速度.米氏常数米氏常数Km的意义的意义n n不同的酶具有不同不同的酶具

3、有不同不同的酶具有不同不同的酶具有不同K Kmm值,它是酶的一个重要的特征值,它是酶的一个重要的特征值,它是酶的一个重要的特征值,它是酶的一个重要的特征物理常数。物理常数。物理常数。物理常数。n nK Kmm值只是在固定的底物,一定的温度和值只是在固定的底物,一定的温度和值只是在固定的底物,一定的温度和值只是在固定的底物,一定的温度和pHpH条件下,条件下,条件下,条件下,一定的缓冲体系中测定的,不同条件下具有不同的一定的缓冲体系中测定的,不同条件下具有不同的一定的缓冲体系中测定的,不同条件下具有不同的一定的缓冲体系中测定的,不同条件下具有不同的K Kmm值。值。值。值。n nK Kmm值表示

4、酶与底物之间的亲和程度:值表示酶与底物之间的亲和程度:值表示酶与底物之间的亲和程度:值表示酶与底物之间的亲和程度:K Kmm值大表示值大表示值大表示值大表示亲和程度小,酶的催化活性低亲和程度小,酶的催化活性低亲和程度小,酶的催化活性低亲和程度小,酶的催化活性低; ; K Kmm值小表示亲和程值小表示亲和程值小表示亲和程值小表示亲和程度大度大度大度大, ,酶的催化活性高。酶的催化活性高。酶的催化活性高。酶的催化活性高。 .专业知识、经验或文献确定曲线类型专业知识、经验或文献确定曲线类型单细胞生物生长初期符合指数函数增长,但若考单细胞生物生长初期符合指数函数增长,但若考虑到生长一定时间后,后期生长

5、受到抑制,其生虑到生长一定时间后,后期生长受到抑制,其生长曲线变成长曲线变成“S”形。形。酶促反应动力学中的米氏方程是一种双曲线。酶促反应动力学中的米氏方程是一种双曲线。一、确定曲线类型的方法一、确定曲线类型的方法1.散点图的方法散点图的方法2通过散点图,确定曲线类型。通过散点图,确定曲线类型。如果几种类型可供选择,可多做几次回归,进行如果几种类型可供选择,可多做几次回归,进行比较,再确定曲线类型。比较,再确定曲线类型。.曲线回归的相关指数:曲线回归的相关指数:反映回归曲线拟合度的高低,表示利用曲线回归反映回归曲线拟合度的高低,表示利用曲线回归方程进行估测的可靠程度的高低。方程进行估测的可靠程

6、度的高低。.直接引入新变量直接引入新变量二、数据变换的方法二、数据变换的方法1如如令令x=lgx:.方程变换后再引入新变量方程变换后再引入新变量2如如两边取对数两边取对数令令.常用曲线模型的直线化方法常用曲线模型的直线化方法曲线回归方程曲线回归方程曲线回归方程曲线回归方程经尺度转换的新变量及参数经尺度转换的新变量及参数经尺度转换的新变量及参数经尺度转换的新变量及参数直线化的方程直线化的方程直线化的方程直线化的方程y y x x a a =( =(a a+ +bxbx)/ )/x xy y=yxyx = =a a+ +bxbx =1/( =1/(a a+ +bxbx) )y y=1/=1/y y

7、 = =a a+ +bxbx = =x x/( /(a a+ +bxbx) )y y=x x/ /y y = =a a+ +bxbx = =axax+ +bxbx2 2y y=y y/ /x x = =a a+ +bxbx = =a a+ +b blnlnx x x x=ln=lnx x = =a a+ +bxbx = =a a+ +b blglgx x x x=lg=lgx x = =a a+ +bxbx = =axaxb by y=ln=lny y x x=ln=lnx x a a=ln=lna a = =a a+ +bxbx = =aeaebxbxy y=ln=lny y a a=ln=

8、lna a = =a a+ +bxbx = =axeaxebxbxy y=ln(=ln(y y/ /x x) ) a a=ln=lna a = =a a+ +bxbx =1/( =1/(axaxb b) )y y=ln(1/=ln(1/y y) ) x x=ln=lnx x a a=ln=lna a = =a a + +bxbx .倒数函数曲线(1)x的观测量无的观测量无0值。值。(2)yx应具有专业意义,而不是抽象的量。应具有专业意义,而不是抽象的量。(3)以)以y(y=yx)和)和x为坐标绘制出的散点图有明为坐标绘制出的散点图有明显的直线性。显的直线性。(4)y和和x的相关系数显著。的相关

9、系数显著。.指数函数曲线.对数函数曲线.幂函数曲线.S形曲线形曲线.三三 Logistic生长曲线生长曲线特点特点开始增长缓慢,而在以后的某一范围内迅速增长,开始增长缓慢,而在以后的某一范围内迅速增长,达到某限度后,增长又缓慢下来,曲线略呈拉长的达到某限度后,增长又缓慢下来,曲线略呈拉长的“S”,因此,也称为,因此,也称为S型曲线。型曲线。.0xyK1+aK2K起始量起始量终极量终极量.0xyK1+aK2K拐点拐点下凹上凸.K 值值 y是累积频率时:是累积频率时: y无限增大的终极量应为无限增大的终极量应为100(),可用,可用K=100表示。表示。.y是生长量或繁殖量时:是生长量或繁殖量时:

10、.四、存在问题四、存在问题不是所有非线性方程都能用变量代换线性化。不是所有非线性方程都能用变量代换线性化。即使方程类型不对时,变量代换与线性回归即使方程类型不对时,变量代换与线性回归仍可照常进行,但结果没有任何用途,仍可照常进行,但结果没有任何用途,强行强行使用会导致错误使用会导致错误。只能使变换后数据的线性方程残差最小,采用只能使变换后数据的线性方程残差最小,采用线性化方法进行曲线回归后线性化方法进行曲线回归后必须进行检验必须进行检验。.第四节第四节 多元线性回归分析多元线性回归分析n n一、多元线性回归模型一、多元线性回归模型n n二、多元线性回归方程的建立二、多元线性回归方程的建立n n

11、三、多元回归的假设测验和置信区间三、多元回归的假设测验和置信区间.一、多元线性回归模型一、多元线性回归模型n n多元回归或复回归多元回归或复回归多元回归或复回归多元回归或复回归(multiple regression)(multiple regression):依变量依变量依变量依变量依两个或两个以上自变量的回归。依两个或两个以上自变量的回归。依两个或两个以上自变量的回归。依两个或两个以上自变量的回归。n n ( (一一一一) ) 多元回归的线性模型和多元回归方程式多元回归的线性模型和多元回归方程式多元回归的线性模型和多元回归方程式多元回归的线性模型和多元回归方程式 若依变量若依变量若依变量若

12、依变量y y同时受到同时受到同时受到同时受到m m 个自变量个自变量个自变量个自变量x x1 1、x x2 2、x xm m 的的的的影响,且这影响,且这影响,且这影响,且这m m 个自变量皆与个自变量皆与个自变量皆与个自变量皆与y y成成成成线性线性线性线性关系,则这关系,则这关系,则这关系,则这mm+1+1个变量的关系就形成个变量的关系就形成个变量的关系就形成个变量的关系就形成m m 元线性回归元线性回归元线性回归元线性回归。 .n n 一个一个一个一个mm元线性回归元线性回归元线性回归元线性回归总体总体总体总体的线性数学模型为:的线性数学模型为:的线性数学模型为:的线性数学模型为: 其中

13、,其中,其中,其中, 为为为为随机误差随机误差随机误差随机误差,服从,服从,服从,服从N N( 0( 0, ) )的正态分布,的正态分布,的正态分布,的正态分布, 为为为为离回归方差离回归方差离回归方差离回归方差,其平方,其平方,其平方,其平方根为根为根为根为离回归标准差离回归标准差离回归标准差离回归标准差或或或或回归估计标准误回归估计标准误回归估计标准误回归估计标准误。. 为为为为x x2 2, , x x3 3, , x xmm固定不变时,固定不变时,固定不变时,固定不变时,x x1 1每变动一个每变动一个每变动一个每变动一个单位,单位,单位,单位,y y平均变动的相应单位数,称为平均变动

14、的相应单位数,称为平均变动的相应单位数,称为平均变动的相应单位数,称为x x2 2, , x x3 3, , x xmm固定不变时固定不变时固定不变时固定不变时x x1 1对对对对y y的的的的偏回归系数偏回归系数偏回归系数偏回归系数(partial regression partial regression coefficientcoefficient),),),),简记作简记作简记作简记作 1 1,其,其,其,其样本样本样本样本估计值简记作估计值简记作估计值简记作估计值简记作b b1 1,余下类推。余下类推。余下类推。余下类推。 依次为依次为依次为依次为y y, , x x1 1 , ,

15、x x2 2, , , x xmm的总体平的总体平的总体平的总体平均数,其样本估计值依次为均数,其样本估计值依次为均数,其样本估计值依次为均数,其样本估计值依次为.n n若令若令若令若令 ,则,则,则,则多元线性回归的数学模型为:多元线性回归的数学模型为:多元线性回归的数学模型为:多元线性回归的数学模型为:.n n样本样本样本样本多元线性回归方程为:多元线性回归方程为:多元线性回归方程为:多元线性回归方程为: 或或或或n na a为为为为 的样本估计值,的样本估计值,的样本估计值,的样本估计值,a a可由下式求出:可由下式求出:可由下式求出:可由下式求出:.二二 多元回归统计数的计算多元回归统

16、计数的计算n n同一元直线回归方程一样,多元线性回归方程也同一元直线回归方程一样,多元线性回归方程也同一元直线回归方程一样,多元线性回归方程也同一元直线回归方程一样,多元线性回归方程也可根据可根据可根据可根据最小二乘法最小二乘法最小二乘法最小二乘法建立建立建立建立: :.n n要使要使要使要使Q Q达到最小,就必须使达到最小,就必须使达到最小,就必须使达到最小,就必须使b b1 1, , b b2 2, , ,b bmm的偏微分的偏微分的偏微分的偏微分方程皆等于方程皆等于方程皆等于方程皆等于0 0,即有:,即有:,即有:,即有:. 经整理,得到如下正规方程组:经整理,得到如下正规方程组:经整理

17、,得到如下正规方程组:经整理,得到如下正规方程组:. 则可得如下方程组:则可得如下方程组:则可得如下方程组:则可得如下方程组:.n n这个正规方程组可用矩阵表示为:这个正规方程组可用矩阵表示为:这个正规方程组可用矩阵表示为:这个正规方程组可用矩阵表示为:n n若系数矩阵用若系数矩阵用若系数矩阵用若系数矩阵用A A表示,未知元矩阵用表示,未知元矩阵用表示,未知元矩阵用表示,未知元矩阵用b b表示,常表示,常表示,常表示,常数矩阵用数矩阵用数矩阵用数矩阵用K K表示:表示:表示:表示: AbAb= =K K.n n为求解式中的为求解式中的为求解式中的为求解式中的b b,一般应先求出,一般应先求出,

18、一般应先求出,一般应先求出A A的逆矩阵的逆矩阵的逆矩阵的逆矩阵A A-1-1,令:,令:,令:,令: 式中,式中,式中,式中,A A-1-1是一个是一个是一个是一个mm阶的对称矩阵,即阶的对称矩阵,即阶的对称矩阵,即阶的对称矩阵,即c cij ij= = c cji ji ,由于由于由于由于A A-1-1是是是是A A的逆矩阵,故有:的逆矩阵,故有:的逆矩阵,故有:的逆矩阵,故有: A A-1-1 A A= =I I(单位矩阵)(单位矩阵)(单位矩阵)(单位矩阵).n n由由由由AbAb= =K K 得得得得b b= =A A-1-1K K:n n由此可见,求偏回归系数建立多元线性回归方程,

19、由此可见,求偏回归系数建立多元线性回归方程,由此可见,求偏回归系数建立多元线性回归方程,由此可见,求偏回归系数建立多元线性回归方程,首先要解出系数矩阵首先要解出系数矩阵首先要解出系数矩阵首先要解出系数矩阵A A的逆矩阵的逆矩阵的逆矩阵的逆矩阵A A-1-1,然后由,然后由,然后由,然后由A A-1-1求求求求出出出出b bi i和和和和a a。 A A-1-1可采用表解法求得。可采用表解法求得。可采用表解法求得。可采用表解法求得。 P P216216.三、多元线性回归的假设测验和置信区间三、多元线性回归的假设测验和置信区间(一一) 多元回归方程的估计标准误多元回归方程的估计标准误n n实际观测

20、值实际观测值实际观测值实际观测值y y与多元回归方程的点估计与多元回归方程的点估计与多元回归方程的点估计与多元回归方程的点估计 的差值的的差值的的差值的的差值的平方和称为多元回归方程的平方和称为多元回归方程的平方和称为多元回归方程的平方和称为多元回归方程的离回归平方和离回归平方和离回归平方和离回归平方和,记为,记为,记为,记为Q Qy y/12/12m m 。. 自由度自由度自由度自由度dfdf= =n n-( -(mm+1)=+1)=n n- -mm-1-1 估计标准误为:估计标准误为:估计标准误为:估计标准误为:总平方和总平方和回归平方和回归平方和.(二二) 多元线性回归方程的假设测验多元

21、线性回归方程的假设测验n n H H0 0: 1 1= = 2 2 = = = = mm =0 =0 ;HHA A: i i不全为不全为不全为不全为0 0。 n nSSSSy y = = U Uy y/12/12m m + + Q Qy y/12/12m m ,U Uy y/12/12mm由由由由 x x1 1、x x2 2、x xmm的的的的不同所引起,具有不同所引起,具有不同所引起,具有不同所引起,具有dfdf= =mm;Q Qy y/12/12mm与与与与 x x1 1、x x2 2、x xmm的不同无关,具有的不同无关,具有的不同无关,具有的不同无关,具有dfdf= =n n-( -(

22、mm+1)+1),由之构成的,由之构成的,由之构成的,由之构成的F F 值:值:值:值:. 注意:注意:注意:注意:1 1 多元线性回归关系显著不排斥有更合理的多元非线多元线性回归关系显著不排斥有更合理的多元非线多元线性回归关系显著不排斥有更合理的多元非线多元线性回归关系显著不排斥有更合理的多元非线性回归方程的存在性回归方程的存在性回归方程的存在性回归方程的存在2 2 多元线性回归关系显著不排斥其中存在着与依变量多元线性回归关系显著不排斥其中存在着与依变量多元线性回归关系显著不排斥其中存在着与依变量多元线性回归关系显著不排斥其中存在着与依变量y y无线性关系的自变量,因此有必要无线性关系的自变

23、量,因此有必要无线性关系的自变量,因此有必要无线性关系的自变量,因此有必要对各偏回归系数对各偏回归系数对各偏回归系数对各偏回归系数逐个进行假设检验逐个进行假设检验逐个进行假设检验逐个进行假设检验。只有当多元回归方程自变量的。只有当多元回归方程自变量的。只有当多元回归方程自变量的。只有当多元回归方程自变量的偏回归系数偏回归系数偏回归系数偏回归系数均达到显著均达到显著均达到显著均达到显著时,时,时,时,F F值才有确定的意义。值才有确定的意义。值才有确定的意义。值才有确定的意义。. ( (三三) ) 偏回归系数的假设测验偏回归系数的假设测验 n n偏回归系数的假设测验,就是偏回归系数的假设测验,就

24、是偏回归系数的假设测验,就是偏回归系数的假设测验,就是测验各个偏回归系数测验各个偏回归系数测验各个偏回归系数测验各个偏回归系数b bi i( (i i=1=1,2,2,,mm) )来自来自来自来自 i i=0=0的总体的概率。的总体的概率。的总体的概率。的总体的概率。n nHH0 0: i i=0=0;HHA A: i i00。n n测验方法有两种。测验方法有两种。测验方法有两种。测验方法有两种。.1t 测验测验= sy/12m服从服从服从服从dfdf= =n n-( -(mm+1)+1) 的的的的t t分布,可测验分布,可测验分布,可测验分布,可测验b bi i的显著性。的显著性。的显著性。

25、的显著性。 . 2. F 测验测验U Ui i就是就是就是就是y y对对对对x xi i的的的的偏回归平方和偏回归平方和偏回归平方和偏回归平方和。dfdf=1=1。U Uy y/12/12mm随着随着随着随着mm增多而增大,且增多而增大,且增多而增大,且增多而增大,且U Uy y/12/12( (mm-1)-1)= = U Uy y/12/12mm-U-Ui i.注意注意注意注意: :1 1、t t检验结果和检验结果和检验结果和检验结果和F F检验结果一致检验结果一致检验结果一致检验结果一致.2 2、如各自变量间不相关,即、如各自变量间不相关,即、如各自变量间不相关,即、如各自变量间不相关,即

26、r rij ij=0=0: 如各自变量间有不同程度的相关,即如各自变量间有不同程度的相关,即如各自变量间有不同程度的相关,即如各自变量间有不同程度的相关,即r rij ij00:. 例:两个自变量例:两个自变量例:两个自变量例:两个自变量x x1 1和和和和x x2 2, r r1212=0=0,U Uy y/12/12= =U U1 1+ +U U2 2 r r121200,U Uy y/12/12 U U1 1+ +U U2 2 r r121200,U Uy y/12/12 44时,宜采用一般解法。时,宜采用一般解法。时,宜采用一般解法。时,宜采用一般解法。.(三三) 偏相关系数的假设测验

27、偏相关系数的假设测验 H H0 0: ij ij= 0= 0;HHA A: ij ij00。 df df= =n n- -MM= =n n- -mm-1-1. 实践中,将实践中,将实践中,将实践中,将r rij ij 与一定显著水平与一定显著水平与一定显著水平与一定显著水平 下的临街下的临街下的临街下的临街r r 值相值相值相值相比较:比较:比较:比较: df df= =n n- -MM= =n n- -mm-1-1 r rij ij r r(0.010.01)0.050.05: : r rij ij 为(极)显著为(极)显著为(极)显著为(极)显著 r rij ij r r0.050.05:

28、 : r rij ij 为不显著为不显著为不显著为不显著.(四四) 偏相关与简单相关的区别偏相关与简单相关的区别 偏相关系数和简单相关系数绝对值和符号都可偏相关系数和简单相关系数绝对值和符号都可偏相关系数和简单相关系数绝对值和符号都可偏相关系数和简单相关系数绝对值和符号都可能不同:能不同:能不同:能不同: 研究变量与其它变量成正相关,简单相关系数研究变量与其它变量成正相关,简单相关系数研究变量与其它变量成正相关,简单相关系数研究变量与其它变量成正相关,简单相关系数高于偏相关;高于偏相关;高于偏相关;高于偏相关; 研究变量与其他变量成负相关,简单相关系数研究变量与其他变量成负相关,简单相关系数研究变量与其他变量成负相关,简单相关系数研究变量与其他变量成负相关,简单相关系数低于偏相关。低于偏相关。低于偏相关。低于偏相关。 多变量资料,必须采用多元相关分析!多变量资料,必须采用多元相关分析!.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号