回归及简单相关分析ppt课件

上传人:re****.1 文档编号:567634455 上传时间:2024-07-21 格式:PPT 页数:63 大小:731KB
返回 下载 相关 举报
回归及简单相关分析ppt课件_第1页
第1页 / 共63页
回归及简单相关分析ppt课件_第2页
第2页 / 共63页
回归及简单相关分析ppt课件_第3页
第3页 / 共63页
回归及简单相关分析ppt课件_第4页
第4页 / 共63页
回归及简单相关分析ppt课件_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《回归及简单相关分析ppt课件》由会员分享,可在线阅读,更多相关《回归及简单相关分析ppt课件(63页珍藏版)》请在金锄头文库上搜索。

1、第八章第八章 直线回归与相关直线回归与相关 前面各章我前面各章我们讨论的的问题,都只涉及到一,都只涉及到一个个变量,如体重量,如体重 、日增重、日增重、产仔数、体温、血仔数、体温、血糖糖浓度度 、产奶量奶量 、产毛量或孵化率毛量或孵化率 、发病率病率等。等。 但是,由于客但是,由于客观事物在开展事物在开展过程中相互程中相互联络、相互影响,因此在畜牧、水、相互影响,因此在畜牧、水产等等实验研研讨中中经常要研常要研讨两个或两个以上两个或两个以上变量量间的关系。的关系。 下一张下一张 主主 页页 退退 出出 上一张上一张 最高月最高月产、 猪瘦肉率与背膘厚度、眼肌面猪瘦肉率与背膘厚度、眼肌面猪瘦肉率

2、与背膘厚度、眼肌面猪瘦肉率与背膘厚度、眼肌面积积、胴体、胴体、胴体、胴体长长;绵羊产毛量与体重、胸围、体长绵羊产毛量与体重、胸围、体长 ;黑白花奶牛的一胎黑白花奶牛的一胎305天天产奶量与奶量与、最高日、最高日产天数;天数; 90天产奶量、天产奶量、最高日最高日产猪的增重与饲料耗费;猪的增重与饲料耗费;雏鹅雏鹅重与重与重与重与7070日日日日龄龄重;重;重;重;绵绵羊胸羊胸羊胸羊胸围围与体与体与体与体长长;仔猪初生重与断奶重;仔猪初生重与断奶重;仔猪初生重与断奶重;仔猪初生重与断奶重;例如例如 变量量间的关系有两的关系有两类: 一一类是是变量量间存在着完全确定性的关系,存在着完全确定性的关系,

3、可以用准确的数学表达式来表示。可以用准确的数学表达式来表示。 如如长方形的面方形的面积 S 与与 长a和和 宽b的关系可以表达的关系可以表达为: S=ab。它。它们之之间的关系是确定性的,只需知道了其中两个的关系是确定性的,只需知道了其中两个变量量的的值就可以准确地就可以准确地计算出另一个算出另一个变量的量的值,这类变量量间的关系称的关系称为函数关系。函数关系。 下一张下一张 主主 页页 退退 出出 上一张上一张 另一另一类是是 变 量量 间不存在完全确不存在完全确实定性关定性关系,不能用准确的数学公式来表示。系,不能用准确的数学公式来表示。 如黄牛的体如黄牛的体长与体重的关系;仔猪初生重与体

4、重的关系;仔猪初生重与断奶重的关系;猪瘦肉率与背膘厚度、眼肌与断奶重的关系;猪瘦肉率与背膘厚度、眼肌面面积、胴体、胴体长等的关系等等,等的关系等等,这些些变量量间都存都存在着非常在着非常亲密的关系,但不能由一个或几个密的关系,但不能由一个或几个变量的量的值准确地求出另一个准确地求出另一个变量的量的值。像。像这样一一类关系在生物界中是大量存在的,关系在生物界中是大量存在的,统计学中把学中把这些些变量量间的关系称的关系称为相关关系,把存在相关相关关系,把存在相关关系的关系的变量称量称为相关相关变量。量。 下一张下一张 主主 页页 退退 出出 上一张上一张 相关相关变量量间的关系普通分的关系普通分为

5、两种两种: 一种是因果关系,即一个一种是因果关系,即一个变量的量的变化受另化受另一个或几个一个或几个变量的影响。如仔猪的生量的影响。如仔猪的生长速度受速度受遗传特性、特性、营养程度、豢养管理条件等要素的养程度、豢养管理条件等要素的影响,子代的体高受影响,子代的体高受亲本体高的影响;本体高的影响; 另一种是平行关系,它另一种是平行关系,它们互互为因果或共同因果或共同遭到另外要素的影响。如黄牛的体遭到另外要素的影响。如黄牛的体长和胸和胸围之之间的关系,猪的背膘厚度和眼肌面的关系,猪的背膘厚度和眼肌面积之之间的关的关系等都属于平行关系。系等都属于平行关系。下一张下一张 主主 页页 退退 出出 上一张

6、上一张 统计学上采用回学上采用回归分析分析 regression analysis研研讨呈因果关系的相关呈因果关系的相关变量量间的关的关系。表示系。表示缘由的由的变量称量称为自自变量,表示量,表示结果的果的变量称量称为依依变量。量。 研研讨“一因一果,即一个自一因一果,即一个自变量与一个依量与一个依变量的回量的回归分析称分析称为一元回一元回归分析;分析; 研研讨“多因一果,即多个自多因一果,即多个自变量与一个依量与一个依变量的回量的回归分析称分析称为多元回多元回归分析。分析。 一元回一元回归分析又分分析又分为直直线回回归分析与曲分析与曲线回回归分析两种;多元回分析两种;多元回归分析又分分析又分

7、为多元多元线性性回回归分析与多元非分析与多元非线性回性回归分析两种。分析两种。 下一张下一张 主主 页页 退退 出出 上一张上一张 回回归分析的分析的义务是提示出呈是提示出呈因果关系的相关因果关系的相关变量量间的的联络方方式,建立它式,建立它们之之间的回的回归方程,方程,利用所建立的回利用所建立的回归方程,由自方程,由自变量量缘由来由来预测、控制依、控制依变量量结果。果。 统计学上采用相关分析学上采用相关分析 ( correlation analysis)研研讨呈平行关系的相关呈平行关系的相关变量之量之间的关的关系。系。 对两个两个变量量间的直的直线关系关系进展相关分析称展相关分析称为简单相关

8、分析也叫直相关分析也叫直线相关分析;相关分析; 对多个多个变量量进展相关分析展相关分析时,研,研讨一个一个变量量与多个与多个变量量间的的线性相关称性相关称为复相关分析;研复相关分析;研讨其他其他变量量坚持不持不变的情况下两个的情况下两个变量量间的的线性相性相关称关称为偏相关分析。偏相关分析。 下一张下一张 主主 页页 退退 出出 上一张上一张 第一节第一节 直线回归直线回归 一、直一、直线回回归方程的建立方程的建立 对于两个相关于两个相关变量,一个量,一个变量用量用x表示,表示,另一个另一个变量用量用y表示,假表示,假设经过实验或或调查获得两个得两个变量的量的n对观测值: x1,y1,x2,y

9、2,xn,yn 下一张下一张 主主 页页 退退 出出 上一张上一张 为了直了直观地看出地看出x和和y间的的变化化趋势,可将,可将每一每一对 观 测 值 在在 平平 面直角坐面直角坐标系描点,作系描点,作出散点出散点图 见图8-1。 从散点从散点图图8-1可以看出:可以看出: 两个两个变量量间直直线关系的性关系的性质是正相关是正相关还是是负相关和程度是相关相关和程度是相关亲密密还是不是不亲密;密;下一张下一张 主主 页页 退退 出出 上一张上一张 散点散点图直直观地、定性地表示了两个地、定性地表示了两个变量之量之间的关系。的关系。为了了讨论它它们之之间的的规律性,律性,还必必需根据需根据观测值将

10、其内在关系定量地表达出来。将其内在关系定量地表达出来。 两个两个两个两个变变量量量量间间有关或无关有关或无关有关或无关有关或无关; ;假假假假设设有关有关有关有关, ,两个两个两个两个变变量量量量间间关系关系关系关系类类型,是直型,是直型,是直型,是直线线型型型型还还是曲是曲是曲是曲线线型;型;型;型; 假假设呈因果关系的两个相关呈因果关系的两个相关变量量y(依依变量量)与与x(自自变量量)间的关系是直的关系是直线关系,根据关系,根据n对观测值所描出的散点所描出的散点图,如,如图81b和和图81e所示。所示。 由于依由于依由于依由于依变变量量量量y y的的的的实实践践践践观测值总观测值总是是是

11、是带带有随机有随机有随机有随机误误差,差,差,差,因此依因此依因此依因此依变变量量量量y y的的的的实实践践践践观测值观测值yiyi可用自可用自可用自可用自变变量量量量x x的的的的实实践践践践观测观测值值xixi表示表示表示表示为为:(i=1,2, , n) (i=1,2, , n) 8181其中其中: x 为可以可以观测的普通的普通变量量(也可以是可以也可以是可以观测的随机的随机变量量); y 为可以可以观测的随机的随机变量量; 这就是直就是直线回回归的数学模型。我的数学模型。我们可以根据可以根据实践践观测值对,以及方差以及方差 做出估做出估计。 i为相互独立,且都服从相互独立,且都服从N

12、0, 的随机的随机变量。量。 在在x、y直角坐标平面上可以作出无数直角坐标平面上可以作出无数 条条直线,我们把一切直线中最接近散点图中全部散直线,我们把一切直线中最接近散点图中全部散点的直线用来表示点的直线用来表示x与与y的直线关系,这条直线称的直线关系,这条直线称为回归直线。为回归直线。 下一张下一张 主主 页页 退退 出出 上一张上一张 设回回归直直线的方程的方程为:(8-2) 其中,其中,a是是的估的估计值,b是是的估的估计值。 a、b应使回使回归估估计值 与与实践践观测值y的偏向的偏向平方和最小,即:平方和最小,即: 根据微根据微积分学中的求极分学中的求极值的方法,令的方法,令 Q对a

13、、b的一的一阶偏偏导数等于数等于0,即:,即:最最 小小 整理得关于整理得关于a、b的正规方程组:的正规方程组: 下一张下一张 主主 页页 退退 出出 上一张上一张 解正解正规方程方程组,得:,得:8-38-4 8-3式中的分子是自式中的分子是自变量量x的离均差的离均差 与与 依依 变 量量 y 的的 离离 均均 差差 的的 乘乘 积和和 ,简 称称 乘乘积和,和,记作作 ,分母是自,分母是自变量量x的离均差的离均差 平方和平方和 ,记作作SSX。 a叫做叫做样本回本回归截距,是回截距,是回归直直线与与y轴交点的交点的纵坐坐标,当,当x=0时, =a; b叫做叫做样本回本回归系数,表系数,表

14、示示 x 改改 变一个一个单位,位,y平均改平均改动的数量;的数量;b 的符号的符号反映了反映了x影响影响y的性的性质,b的的绝对值大小反大小反映了映了 x 影响影响 y 的的 程度程度; 的估计值。的估计值。 叫做回归估计值,是当叫做回归估计值,是当x x在在其研在在其研究究 范范 围围 内内 取某一个值时,取某一个值时,y y值平均数值平均数 回回归方程的根本性方程的根本性质: 假假设将将8-4式代入式代入8-2式,得到式,得到回回归方程的另一种方式方程的另一种方式(中心化方式中心化方式): 下一张下一张 主主 页页 退退 出出 上一张上一张 性性质1最小;最小;性性质2;性性质3 回回

15、归 直直 线 通通 过 点点。8-5 【例【例8.1】在四川白鹅的消费性能研讨中,】在四川白鹅的消费性能研讨中,得到如下一组关于雏鹅重得到如下一组关于雏鹅重g与与70日龄重日龄重(g)的数据,试建立的数据,试建立70日龄重日龄重(y)与雏鹅重与雏鹅重(x)的直的直线回归方程。线回归方程。 表表8-1 四川白鹅雏鹅重与四川白鹅雏鹅重与70日龄重测定结果日龄重测定结果 单位:单位:g下一张下一张 主主 页页 退退 出出 上一张上一张 1、作散点、作散点图 以以雏鹅重重x为横坐横坐标,70日日龄重重y为纵坐坐标作散点作散点图,见图8-3。 2、计算回算回归截距截距a,回,回归系数系数b,建立直,建立

16、直线回回归方程方程 首先根据首先根据实践践观测值计算出算出 下下 列数据:列数据: 下一张 主 页 退 出 上一张 进而计算出进而计算出b、a: 得到四川白得到四川白鹅的的70日日龄重重y对雏鹅重重x的的直直线回回归方程方程为: 根据直线回归方程可作出回归直线,见图根据直线回归方程可作出回归直线,见图8-3。从图。从图8-3看出,并不是一切的散点都恰看出,并不是一切的散点都恰好落在回归直线上,这阐明用好落在回归直线上,这阐明用 去估计去估计y是有是有偏向的。偏向的。下一张下一张 主主 页页 退退 出出 上一张上一张 3 3、直、直、直、直线线回回回回归归的偏离度估的偏离度估的偏离度估的偏离度估

17、计计 偏向平方和偏向平方和偏向平方和偏向平方和 的大小表示了的大小表示了的大小表示了的大小表示了实测实测点与回点与回点与回点与回归归直直直直线线偏离的程度,因此偏向平方和又称偏离的程度,因此偏向平方和又称偏离的程度,因此偏向平方和又称偏离的程度,因此偏向平方和又称为为离回离回离回离回归归平方平方平方平方和。和。和。和。统计统计学曾学曾学曾学曾经证经证明:在直明:在直明:在直明:在直线线回回回回归归分析中离回分析中离回分析中离回分析中离回归归平方平方平方平方和的自在度和的自在度和的自在度和的自在度为为n-2n-2。于是可求得离回。于是可求得离回。于是可求得离回。于是可求得离回归归均方均方均方均方

18、为为: 离回离回离回离回归归均方是模型均方是模型均方是模型均方是模型8-18-1中中中中22的估的估的估的估计值计值。 离回离回离回离回归归均方的平方根叫离回均方的平方根叫离回均方的平方根叫离回均方的平方根叫离回归规归规范范范范误误,记为记为 ,即即即即 8-6 离回离回归规范范误Syx的大小表示了回的大小表示了回归直直线与与实测点偏向的程度,即回点偏向的程度,即回归估估测值 与与 实 际观测值y偏向的程度,于是我偏向的程度,于是我们把离回把离回归规范范误Syx用来表示回用来表示回归方程的偏离度。方程的偏离度。 下一张下一张 主主 页页 退退 出出 上一张上一张 以后我们将证明:以后我们将证明

19、: 8-7 利用利用8-7式先计算出式先计算出 ,然后,然后再代入再代入8-6式求式求Syx 。 对于【例于【例8.1】有】有所以所以二、直线回归的显著性检验二、直线回归的显著性检验 假设假设x和和y变量间并不存在直线关系,变量间并不存在直线关系, 但但由由n对观测值对观测值xi,yi也可以根据上面引见也可以根据上面引见的方法求得一个回归方程的方法求得一个回归方程 =a+bx。 显然,显然,这样的回归方程所反响的两个变量间这样的回归方程所反响的两个变量间 的直线关的直线关系是不真实的。系是不真实的。 如何判别直线回归方程所反响如何判别直线回归方程所反响的两个变量间的直线关系的真实性呢?这取决的

20、两个变量间的直线关系的真实性呢?这取决于变量于变量x与与y间能否存在直线关系。我们先讨论间能否存在直线关系。我们先讨论依变量依变量y的变异,然后再作出统计推断。的变异,然后再作出统计推断。下一张下一张 主主 页页 退退 出出 上一张上一张 1、直线回归的变异来源、直线回归的变异来源 图图8-4 的分解图的分解图 从图从图8-4看到:看到: 上式两端平方,然后对一切的上式两端平方,然后对一切的n点求和,那么点求和,那么有有 下一张下一张 主主 页页 退退 出出 上一张上一张 由由 于于所所 以以于于 是是 所以有所以有 8-8 反映了反映了y的总变异程度,称为的总变异程度,称为y的总平方和,记为

21、的总平方和,记为SSy; 反映了由于反映了由于y与与x间存在直线间存在直线关系所引起的关系所引起的y的变异程度,称为回归平方和,的变异程度,称为回归平方和,记为记为SSR; 反映了除反映了除y与与x存在直线关系以外的存在直线关系以外的缘由,包括随机误差所引起的缘由,包括随机误差所引起的y的变异程度,称的变异程度,称为离回归平方和或剩余平方和,记为为离回归平方和或剩余平方和,记为SSr。 8-8式又可表示为:式又可表示为: 8-9 这阐明这阐明y的总平方和剖分为的总平方和剖分为 回归平方和回归平方和 与离与离回归平方和两部分。与此相对应,回归平方和两部分。与此相对应,y的总自在度的总自在度dfy

22、也划分为回归自在度也划分为回归自在度dfr与离回归自在度与离回归自在度dfr两部分,即两部分,即 下一张下一张 主主 页页 退退 出出 上一张上一张 8-10 在直在直线回回归分析中,回分析中,回归自在度等于自自在度等于自变量的个数,量的个数, 即即 ;y 的的 总 自自 由由度度 ;离回;离回归自在度自在度 。于是:。于是: 离回离回归均方均方 , 回回 归 均均 方方 。 2、回、回归关系关系显著性著性检验F检验 x与与y两个两个变量量间能否存在直能否存在直线关系,可用关系,可用F检验法法进展展检验。 无效假无效假设HO:=0,备择假假设HA:0。 在无效假在无效假设成立的条件下,回成立的

23、条件下,回归均方与离回均方与离回归均方的比均方的比值服从服从 和和 的的F分布,分布,所以可以用所以可以用 df1=1,df2=n-2 8-11 下一张下一张 主主 页页 退退 出出 上一张上一张 来检验回归关系即回归方程的显著性。来检验回归关系即回归方程的显著性。 回归平方和还可用下面的公式计算得到:回归平方和还可用下面的公式计算得到: 8-12 (8-13) 根据根据8-9式,可得到离回归平方和计算式,可得到离回归平方和计算公式为:公式为: 下一张下一张 主主 页页 退退 出出 上一张上一张 对于【例对于【例8.1】资料,有】资料,有而而 。于是可以。于是可以列出方差分析表进展回归关系显著

24、性检验。列出方差分析表进展回归关系显著性检验。表表8-2 四川白鹅四川白鹅70日龄重与雏鹅重回归关系日龄重与雏鹅重回归关系 方差分析方差分析 下一张下一张 主主 页页 退退 出出 上一张上一张 由于由于 ,阐明四川白明四川白鹅70日日龄重与重与雏鹅重重间存在极存在极显著的著的直直线关系。关系。 3、回、回归系数的系数的显著性著性检验t检验 采用回采用回归系数的系数的显著性著性检验t检验也可也可检验x与与y间能否存在直能否存在直线关系。回关系。回归系数系数显著性著性检验的无效假的无效假设和和备择假假设为 HO:0,HA:0。 t 检验的的计算公式算公式为: 8-14 8-15 其中,其中,Sb为

25、回回归系数系数规范范误。 对于对于 【例【例8.1】 资资 料料 ,已计算得,已计算得 故有故有 下一张下一张 主主 页页 退退 出出 上一张上一张 当当 ,查t值表,得表,得 因因 , , 否否认HO:0,接受,接受HA:0,即直,即直线回回归系数系数b=21.7122是极是极显著的,著的,阐明四明四川白川白鹅 70 日日龄重重 与与雏鹅重重间存在极存在极显著的直著的直线关系,可用所建立的直关系,可用所建立的直线回回归方程来方程来进展展 预测和控制。和控制。 F检验的结果与检验的结果与t检验的结果一致。检验的结果一致。 现实上,统计学已证明,在直线回归分析现实上,统计学已证明,在直线回归分析

26、中,这二种检验方法是等价的,可任选一种进中,这二种检验方法是等价的,可任选一种进展检验。展检验。 下一张下一张 主主 页页 退退 出出 上一张上一张 特别要指出的是:利用直线回归方程进展预特别要指出的是:利用直线回归方程进展预测或控制时,普通测或控制时,普通 只只 适适 用于原来研讨的范围,用于原来研讨的范围,不能随意把范围扩展,由于在研讨的范围内两变不能随意把范围扩展,由于在研讨的范围内两变量是直线关系,这并不能保证在这研讨范围之外量是直线关系,这并不能保证在这研讨范围之外依然是直线关系。假设需求扩展预测和控制范围,依然是直线关系。假设需求扩展预测和控制范围,那么要有充分的实际根据或进一步的

27、实验根据。那么要有充分的实际根据或进一步的实验根据。利用直线回归方程进展预测或控制利用直线回归方程进展预测或控制 , 一一 般只能般只能内插,不要随便外延。内插,不要随便外延。第二节第二节 直线相关直线相关 进展直展直线相关分析的根本相关分析的根本义务在于根据在于根据x、y的的实践践观测值,计算表示两个相关算表示两个相关变量量x、y间线性相关程度和性性相关程度和性质的的统计量量相相关系数关系数r并并进展展显著性著性检验。下一张下一张 主主 页页 退退 出出 上一张上一张 一、决议系数和相关系数一、决议系数和相关系数 在上一节中曾经证明了等式:在上一节中曾经证明了等式: 从这个等式不难看到:从这

28、个等式不难看到:y与与x直线回归效直线回归效果的好坏取决于回归平方和果的好坏取决于回归平方和 与离与离回归平方和回归平方和 的大小,或者说取决于回归平方和的大小,或者说取决于回归平方和在在y的总平方和的总平方和 中所占的比例的大小。中所占的比例的大小。这个比例越大,这个比例越大,y与与x的直线回归效果就越好,的直线回归效果就越好,反之那么差。反之那么差。 我们把比值我们把比值 叫叫 做做 x 对对 y 的决议系数的决议系数 coefficient of determination,记为,记为 r2,即,即 下一张下一张 主主 页页 退退 出出 上一张上一张 8-24 决决议系数的大小表示了回系

29、数的大小表示了回归方程估方程估测可靠可靠程度的高低,或者程度的高低,或者说表示了回表示了回归直直线拟合度的合度的高低。高低。显然有然有0r21。由于。由于 而而SPxy/SSx是以是以x为自自变量、量、y为依依变量量时的回的回归系数系数byx。 假假设把把y作作为自自变量量 、 x作作为依依变量量 ,那么回,那么回归系数系数 bxy =SPxy/Ssy ,所以决,所以决议系数系数r2等于等于y对x的的回回归系数与系数与 x对y的回的回归系数的乘系数的乘积。这就是就是说,决,决议系数反响了系数反响了x为自自变量、量、y为依依变量和量和y为自自变量量 、 x为依依变量量时两个相关两个相关变量量x与

30、与y直直线相关的信息相关的信息 ,即决,即决议系数表示了系数表示了 两个互两个互为因果关系的相关因果关系的相关变量量间直直线相关的程度。但相关的程度。但决决议系数介于系数介于0和和1之之间,不能反响直,不能反响直线关系的关系的性性质是同向增减或是异向增减。是同向增减或是异向增减。 下一张下一张 主主 页页 退退 出出 上一张上一张 假设求假设求r2的平方根,且取平方根的符号与的平方根,且取平方根的符号与乘积和乘积和SPxy的符号一致,即与的符号一致,即与bxy 、byx的的符号一致,这样求出的平方根既可表示符号一致,这样求出的平方根既可表示y与与x的的直线相关的程度,也可表示直线相关的性质。直

31、线相关的程度,也可表示直线相关的性质。统计学上把这样计算所得的统计量称为统计学上把这样计算所得的统计量称为x与与y的的相关系数相关系数coefficient of correlation,记为记为r,即,即 8-25 8-26 下一张 主 页 退 出 上一张 二、相关系数的计算二、相关系数的计算 【例【例8.6】 计算计算10只绵羊的胸围只绵羊的胸围cm和体重和体重(kg) 的相关系数。的相关系数。 表表8-3 10只绵羊胸围和体重资料只绵羊胸围和体重资料下一张下一张 主主 页页 退退 出出 上一张上一张 根据表根据表8-3所列数据先计算出:所列数据先计算出: 代入代入8-25式得:式得: 即

32、绵羊胸围与体重的相关系数为即绵羊胸围与体重的相关系数为0.8475。 下一张下一张 主主 页页 退退 出出 上一张上一张 三、相关系数的三、相关系数的显著性著性检验 上述根据上述根据实践践观测值计算得来的相关系数算得来的相关系数r是是样本相关系数,本相关系数, 它是双它是双变量正量正态总体中的体中的总体相关系数体相关系数的估的估计值。样本相关系数本相关系数r能否来能否来自自0的的总体,体,还须对样本相关系数本相关系数r 进展展显著性著性检验。 此此 时 无无 效效 假假 设、备 择 假假 设 为HO:=0,HA:0。 与直与直线回回归关系关系显著著性性检验一一样,可采用,可采用t检验法与法与F

33、检验法法对相关相关系数系数r的的显著性著性进展展检验。 t 检验的计算公式为:检验的计算公式为: t= , df=n-2 (8-27) 其中,其中, ,叫做相关系数规范,叫做相关系数规范误。误。 F检验的计算公式为:检验的计算公式为: F= , df1=1,df2=n-2 (8-28)下一张下一张 主主 页页 退退 出出 上一张上一张 统计学家已根据相关系数学家已根据相关系数r显著性著性t检验法法计算出了算出了临界界r值并列出了表格。并列出了表格。 所以所以 可以直接采可以直接采用用查表法表法对相关系数相关系数r进展展显著性著性检验。 详细作法是:作法是: 先先 根根 据据 自自 由由 度度

34、n-2 查临界界 r 值 ( 附附 表表 8 ),得,得 , 。 假假设|r| ,P0.05,那么相关系数,那么相关系数r不不显著,在著,在r的右上方的右上方标志志“ns;假;假设 |r| ,0.01P0.05,那么相关系数,那么相关系数 r 显著,在著,在r的右上的右上方方标志志“*;假;假设|r| , P 0.01, 那么相那么相 关关 系系 数数 r 极极显著,在著,在 r 的右上方的右上方标志志“*。 对于【例对于【例8-6】,由于】,由于 df =n-2=10-2=8,查附表,查附表8得:得: =0.632, =0.765,而,而r=0.8475 ,P0.01,阐明绵羊胸围与体重的相

35、关系数极显著。阐明绵羊胸围与体重的相关系数极显著。 四、相关系数与回归系数的关系四、相关系数与回归系数的关系 从相关系数计算公式的导出可以看到:相关从相关系数计算公式的导出可以看到:相关变量变量x与与y的相关系数的相关系数r是是y对对x的回归系数与的回归系数与x对对y的相关系数的相关系数bxv的几何平均数:的几何平均数:下一张下一张 主主 页页 退退 出出 上一张上一张 阐明直明直线相关分析与回相关分析与回归分析关系非常分析关系非常亲密。密。现实上,它上,它们的研的研讨对象都是呈直象都是呈直线关系关系的相关的相关变量。直量。直线回回归分析将二个相关分析将二个相关变量区量区分分为自自变量和依量和

36、依变量,偏重于量,偏重于寻求它求它们之之间的的联络方式方式直直线回回归方程;直方程;直线相关分析不相关分析不区分自区分自变量和依量和依变量,偏重于提示它量,偏重于提示它们之之间的的联络程度和性程度和性质计算出相关系数。两种分算出相关系数。两种分析所析所进展的展的显著性著性检验都是都是处理理y与与x间能否存能否存在直在直线关系。因此二者的关系。因此二者的检验是等价的。即相是等价的。即相关系数关系数显著著 , 回回归系数亦系数亦显著;著; 相关系数不相关系数不 显著,回归系数也必然不显著。由于利用查表显著,回归系数也必然不显著。由于利用查表法对相关系数进展检验非常简便,因此在实践法对相关系数进展检

37、验非常简便,因此在实践进展直线回归分析时,可用相关系数显著性检进展直线回归分析时,可用相关系数显著性检验替代直线回归关系显著性检验,即可先计算验替代直线回归关系显著性检验,即可先计算出相关系数出相关系数r并对其进展显著性检验,假设检验并对其进展显著性检验,假设检验结果结果r不显著,那么用不着建立直线回归方程;不显著,那么用不着建立直线回归方程;假设假设r显著,再计算回归系数显著,再计算回归系数b、回归截距、回归截距a,建立直线回归方程,此时所建立的直线回归方建立直线回归方程,此时所建立的直线回归方程代表的直线关系是真实的,可利用来进展预程代表的直线关系是真实的,可利用来进展预测和控制。测和控制

38、。下一张下一张 主主 页页 退退 出出 上一张上一张 五、运用直线回归与相关的本卷须知五、运用直线回归与相关的本卷须知 直线回归分析与相关分析在生物科学直线回归分析与相关分析在生物科学研讨领域中已得到了广泛的运用,但在实研讨领域中已得到了广泛的运用,但在实践任务中却很容易被误用或作出错误的解践任务中却很容易被误用或作出错误的解释。为了正确地运用直线回归分析和相关释。为了正确地运用直线回归分析和相关分析这一工具,必需留意以下几点:分析这一工具,必需留意以下几点: 1 1、变量间能否存在相关、变量间能否存在相关、变量间能否存在相关、变量间能否存在相关 直线回归分析和相关分析毕竟是处置变量间关系直线

39、回归分析和相关分析毕竟是处置变量间关系直线回归分析和相关分析毕竟是处置变量间关系直线回归分析和相关分析毕竟是处置变量间关系的数学方法,在将这些方法运用于生物科学研讨时要的数学方法,在将这些方法运用于生物科学研讨时要的数学方法,在将这些方法运用于生物科学研讨时要的数学方法,在将这些方法运用于生物科学研讨时要思索到生物本身的客观实践情况,譬如变量间能否存思索到生物本身的客观实践情况,譬如变量间能否存思索到生物本身的客观实践情况,譬如变量间能否存思索到生物本身的客观实践情况,譬如变量间能否存在直线相关以及在什么条件下会发生直线相关,求出在直线相关以及在什么条件下会发生直线相关,求出在直线相关以及在什

40、么条件下会发生直线相关,求出在直线相关以及在什么条件下会发生直线相关,求出的直线回归方程能否有意义,某性状作为自变量或依的直线回归方程能否有意义,某性状作为自变量或依的直线回归方程能否有意义,某性状作为自变量或依的直线回归方程能否有意义,某性状作为自变量或依变量确实定等等,都必需由生物科学相应的专业知识变量确实定等等,都必需由生物科学相应的专业知识变量确实定等等,都必需由生物科学相应的专业知识变量确实定等等,都必需由生物科学相应的专业知识来决议,并且还要用到生物科学实际中去检验。假设来决议,并且还要用到生物科学实际中去检验。假设来决议,并且还要用到生物科学实际中去检验。假设来决议,并且还要用到

41、生物科学实际中去检验。假设不以一定的生物科学根据为前提,把风马牛不相及的不以一定的生物科学根据为前提,把风马牛不相及的不以一定的生物科学根据为前提,把风马牛不相及的不以一定的生物科学根据为前提,把风马牛不相及的资料随意凑到一块作直线回归分析或相关分析,那将资料随意凑到一块作直线回归分析或相关分析,那将资料随意凑到一块作直线回归分析或相关分析,那将资料随意凑到一块作直线回归分析或相关分析,那将是根本性的错误。是根本性的错误。是根本性的错误。是根本性的错误。 下一张下一张 主主 页页 退退 出出 上一张上一张 2 2、其他变量尽量坚持一致、其他变量尽量坚持一致、其他变量尽量坚持一致、其他变量尽量坚

42、持一致 由于自然界各种事物间的相互联络和相互制约,由于自然界各种事物间的相互联络和相互制约,由于自然界各种事物间的相互联络和相互制约,由于自然界各种事物间的相互联络和相互制约,一个变量的变化通常会遭到许多其它变量的影响,因一个变量的变化通常会遭到许多其它变量的影响,因一个变量的变化通常会遭到许多其它变量的影响,因一个变量的变化通常会遭到许多其它变量的影响,因此,在研讨两个变量间关系时,要求其他变量应尽量此,在研讨两个变量间关系时,要求其他变量应尽量此,在研讨两个变量间关系时,要求其他变量应尽量此,在研讨两个变量间关系时,要求其他变量应尽量坚持在同一程度,否那么,回归分析和相关分析能够坚持在同一

43、程度,否那么,回归分析和相关分析能够坚持在同一程度,否那么,回归分析和相关分析能够坚持在同一程度,否那么,回归分析和相关分析能够会导致完全虚伪的结果。例如研讨人的身高和胸围之会导致完全虚伪的结果。例如研讨人的身高和胸围之会导致完全虚伪的结果。例如研讨人的身高和胸围之会导致完全虚伪的结果。例如研讨人的身高和胸围之间的关系,假设体重固定,身高越高的人,胸围越小,间的关系,假设体重固定,身高越高的人,胸围越小,间的关系,假设体重固定,身高越高的人,胸围越小,间的关系,假设体重固定,身高越高的人,胸围越小,但当体重在变化时,其结果也就会变化。但当体重在变化时,其结果也就会变化。但当体重在变化时,其结果

44、也就会变化。但当体重在变化时,其结果也就会变化。 下一张下一张 主主 页页 退退 出出 上一张上一张 3 3、观测值要尽能够的多、观测值要尽能够的多、观测值要尽能够的多、观测值要尽能够的多 在在在在进进进进展展展展直直直直线线线线回回回回归归归归与与与与相相相相关关关关分分分分析析析析时时时时,两两两两个个个个变变变变量量量量成成成成对对对对观观观观测测测测值值值值应应应应尽尽尽尽能能能能够够够够多多多多一一一一些些些些,这这这这样样样样可可可可提提提提高高高高分分分分析析析析的的的的准准准准确确确确性性性性,普普普普通通通通至至至至少少少少有有有有5 5对对对对以以以以上上上上的的的的观观观

45、观测测测测值值值值。同同同同时时时时变变变变量量量量x x的的的的取取取取值值值值范范范范围围围围要要要要尽尽尽尽能能能能够够够够大大大大一一一一些些些些,这这这这样样样样才才才才容容容容易易易易发发发发现现现现两两两两个个个个变变变变量量量量间间间间的的的的变变变变化化化化关关关关系。系。系。系。 4 4、外推要谨慎、外推要谨慎、外推要谨慎、外推要谨慎 直直直直线线线线回回回回归归归归与与与与相相相相关关关关分分分分析析析析普普普普通通通通是是是是在在在在一一一一定定定定取取取取值值值值区区区区间间间间内内内内对对对对两两两两个个个个变变变变量量量量间间间间的的的的关关关关系系系系进进进进展

46、展展展描描描描画画画画,超超超超出出出出这这这这个个个个区区区区间间间间,变变变变量量量量间间间间关关关关系系系系类类类类型型型型能能能能够够够够会会会会发发发发生生生生改改改改动动动动,所所所所以以以以回回回回归归归归预预预预测测测测必必必必需需需需限限限限制制制制在在在在自自自自变变变变量量量量x x的的的的取取取取值值值值区区区区间间间间以以以以内内内内,外外外外推推推推要要要要谨谨谨谨慎慎慎慎,否否否否那那那那么么么么会会会会得得得得出错误的结果。出错误的结果。出错误的结果。出错误的结果。 下一张下一张 主主 页页 退退 出出 上一张上一张 5、正确了解回归或相关显著与否的含义、正确了

47、解回归或相关显著与否的含义 一一个个不不显显著著的的相相关关系系数数并并不不意意味味着着变变量量x和和y之之间间没没有有关关系系,而而只只需需能能阐阐明明两两变变量量间间没没有有显显著著的的直直线线关关系系;一一个个显显著著的的相相关关系系数数或或回回归归系系数数亦亦并并不不意意味味着着x和和y的的关关系系必必定定为为直直线线,由由于于并并不不排排除除有有可可以以更更好好地地描描画画它它们们关关系系的的非非线线性方程的存在。性方程的存在。 6 6、一个显著的回归方程并不一定具有实际上的预、一个显著的回归方程并不一定具有实际上的预、一个显著的回归方程并不一定具有实际上的预、一个显著的回归方程并不

48、一定具有实际上的预测意义测意义测意义测意义 如如如如 一一一一 个个个个 资资资资 料料料料 x x 、y y 两两两两 个变量间的相关系数个变量间的相关系数个变量间的相关系数个变量间的相关系数 r r =0.5=0.5,在,在,在,在 df = 2 4 df = 2 4 时时时时 ,r0.01(24) = 0. 4 9 6r0.01(24) = 0. 4 9 6,rr0.01(24)rr0.01(24),阐明相关系数极显著。而,阐明相关系数极显著。而,阐明相关系数极显著。而,阐明相关系数极显著。而r2=0.25r2=0.25,即,即,即,即x x变量或变量或变量或变量或y y变量的总变异可以经过变量的总变异可以经过变量的总变异可以经过变量的总变异可以经过y y变量或变量或变量或变量或x x变量以变量以变量以变量以直线回归的关系来估计的比重只占直线回归的关系来估计的比重只占直线回归的关系来估计的比重只占直线回归的关系来估计的比重只占25%25%,其他的,其他的,其他的,其他的 75% 75% 的变异无法借助直线回归来估计。的变异无法借助直线回归来估计。的变异无法借助直线回归来估计。的变异无法借助直线回归来估计。 下一张下一张 主主 页页 退退 出出 上一张上一张

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号