简单线性相关与回归课件

上传人:夏** 文档编号:567712451 上传时间:2024-07-22 格式:PPT 页数:78 大小:2.08MB
返回 下载 相关 举报
简单线性相关与回归课件_第1页
第1页 / 共78页
简单线性相关与回归课件_第2页
第2页 / 共78页
简单线性相关与回归课件_第3页
第3页 / 共78页
简单线性相关与回归课件_第4页
第4页 / 共78页
简单线性相关与回归课件_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《简单线性相关与回归课件》由会员分享,可在线阅读,更多相关《简单线性相关与回归课件(78页珍藏版)》请在金锄头文库上搜索。

1、简单线性相关与回归简单线性相关与回归20122012年年1111月月2929日日简单线性相关与回归课件 在在医医学学科科学学研研究究中中,常常常常要要分分析析两两个个变变量量之之间间的的关关系系,例例如如身身高高和和体体重重、年年龄龄和和血血压压、体体温温和和脉脉搏搏、药药物物剂剂量量和和疗疗效效等等问问题题,因因此此涉涉及及到到研研究究两两个个变变量量的的相相互互关关系系。这这 时时 就就 涉涉 及及 到到 两两 个个 变变 量量 之之 间间 的的 相相 关关(correlation)与与回归回归(regression)。简单线性相关与回归课件简单线性相关与回归简单线性相关与回归Correl

2、ation & Regression相关的意义、概念和种类相关的意义、概念和种类相关图表、相关系数和相关分析相关图表、相关系数和相关分析简单线性回归简单线性回归相关分析和回归分析中应注意的问题相关分析和回归分析中应注意的问题简单线性相关与回归课件相关的意义、概念和种类相关的意义、概念和种类在总体中,如果对变量在总体中,如果对变量x x的每一个数值,相应的每一个数值,相应还有第二个变量还有第二个变量y y的数值,则各对变量的变量的数值,则各对变量的变量值所组成的总体称为二元总体;由二个以上相值所组成的总体称为二元总体;由二个以上相互对应的变量组成的总体,称为多元总体。互对应的变量组成的总体,称为

3、多元总体。二元总体中二元总体中两变量是不是存在关系?两变量是不是存在关系?关系的密切程度如何?关系的密切程度如何?关系的具体形式是什么?关系的具体形式是什么?怎样根据一个变量的变动来估计另一变量的怎样根据一个变量的变动来估计另一变量的变动?变动?简单线性相关与回归课件Correlation相关分析就是对二元总体中确实具有联相关分析就是对二元总体中确实具有联系的标志进行分析。系的标志进行分析。现象总体的依存关系类型:现象总体的依存关系类型:一个变量取一定值时另一个变量有确定值与一个变量取一定值时另一个变量有确定值与之对应,这种变量间一一对应的确定性关系之对应,这种变量间一一对应的确定性关系称为称

4、为函数关系函数关系函数关系函数关系,y = f (x) 。一个变量取一定值时,与之对应的另一个变一个变量取一定值时,与之对应的另一个变量的值虽然不确定,但它按某种规律在一定量的值虽然不确定,但它按某种规律在一定范围内变化,这种变量间的不确定性对应关范围内变化,这种变量间的不确定性对应关系称为系称为相关关系,相关关系,相关关系,相关关系,y = f (x) +(为随机变为随机变量)。量)。简单线性相关与回归课件圆的面积与半径;圆的面积与半径;计件工资总额与零件数量;计件工资总额与零件数量;收入水平与受教育程度;收入水平与受教育程度;看书时间和学习成绩;看书时间和学习成绩;父亲身高与子女身高。父亲

5、身高与子女身高。 函数关系函数关系 v.s. 相关关系相关关系简单线性相关与回归课件相关关系的种类相关关系的种类按相关的因素按相关的因素 单相关单相关 复相关(多元相关;偏相关)复相关(多元相关;偏相关)按相关的形式按相关的形式 线性相关(直线相关)线性相关(直线相关) 非线性相关(曲线相关)非线性相关(曲线相关)按相关的方向按相关的方向 正相关正相关 负相关负相关按相关的程度按相关的程度 完全相关完全相关 不完全相关不完全相关 不相关不相关简单线性相关与回归课件相关关系的散点图(相关关系的散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性

6、相关负线性相关负线性相关负线性相关正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关简单线性相关与回归课件相关分析相关分析 v.s. 相关系数相关系数 相关分析:描述和测度变量间相关关系类型和相关分析:描述和测度变量间相关关系类型和相关程度的分析方法相关程度的分析方法 相关分析的目的:相关分析的目的:通过相关系数通过相关系数来描述和度量来描述和度量两变量线性联

7、系的程度和方向两变量线性联系的程度和方向 所有变量都假定是随机变量,不存在解释变量所有变量都假定是随机变量,不存在解释变量和被解释变量的关系,即不考虑因果关系和被解释变量的关系,即不考虑因果关系 相关系数:对变量之间关系密切程度的度量;相关系数:对变量之间关系密切程度的度量;适用于双变量正态分布(适用于双变量正态分布(Bivariate Normal Distribution)资料)资料简单线性相关与回归课件二元正态分布的概率密度图 当 时二元正态分布的钟形密度曲如下图。简单线性相关与回归课件相关分析相关分析 v.s. 相关系数相关系数连续变量的相关指标:积差相关系数连续变量的相关指标:积差相

8、关系数(Pearsons Correlation Coefficient)总体相关系数:总体相关系数: 样本相关系数:样本相关系数:r相关系数的取值在相关系数的取值在 -1 与与 1 之间。之间。样本相关系数样本相关系数 r 不等于零,并不表示总不等于零,并不表示总体相关系数体相关系数 不等于零,还要作假设检不等于零,还要作假设检验(显著性检验)验(显著性检验)简单线性相关与回归课件相关系数的计算相关系数的计算 X和Y的离均差积和X的离均差平方和简单线性相关与回归课件,令 简单线性相关与回归课件相关系数的特点相关系数的特点 当 r = 0 时,表明X与Y没有线性相关关系。当 时,表明X与Y存在

9、一定的线性相关关系: 若 r 0 表明X与Y为正相关; 若 r 0 表明X与Y为负相关。当 时,表明X与Y完全线性相关: 若 r = 1,称X与Y完全正相关; 若 r = -1,称X与Y完全负相关。简单线性相关与回归课件相关关系的散点图(相关关系的散点图(scatter diagram)r rr = 0 = 0 = 0 r r r 0 0 0 0 0r rr = -1 = -1 = -1r rr = 1 = 1 = 1简单线性相关与回归课件统计检验的必要性:统计检验的必要性: r 0 抽样误差?两总体确实存在相关关系?检验的依据:检验的依据: 如果 x 和 y 都服从正态分布,在总体相关系数

10、= 0 的假设下,与样本相关系数 r 有关的t 统计量服从自由度为n-2 的t 分布: 相关系数的检验 简单线性相关与回归课件 相关系数的假设检验 样本相关系数的标准误查t界值表,得P值简单线性相关与回归课件给定显著性水平,查自由度为 n-2 的临界值t/2(p. 483); 若t t/2,表明相关系数 r 在统计上是显著的,应否定 = 0而接受 0的假设;若 t t/2,还不能拒绝 = 0的假设。 简单线性相关与回归课件例10.1 为研究一种饲料的营养价值,观察10只体重相近的大白鼠的进食量与体重增加的关系。(表10-1,p. 180) 简单线性相关与回归课件直接查 r 表:按自由度=n2直

11、接查 r界值表(p. 499) 相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析简单线性相关与回归课件线性相关中应注意的问题1.线性相关分析仅适用于二元正态分布资料.2.进行分析前先绘制散点图.3.出现异常值(离群值)时慎用相关.4.样本的相关系数接近零并不意味着两变量间一定无相关性.5.相关未必真有内在联系或因果关系.6.分层资料盲目合并易出假象.相关分析应用中应注意的问题简单线性相关与回归课件图a中 有异常值,采用异常点似有相关性; 图b两个无线性关系的分层资料,合并后似有相关性;图c两个分层资料原来均有相关性,合并后似无相关性;图d两个分层资料原来均

12、有正相关,合并后似变为负相关。简单线性相关与回归课件适用条件:资料不服从双变量正态分布不宜作积差相关分析;总体分布型未知,一端或两端是不确定数值(如10岁,65岁)的资料;原始数据用等级表示的资料。Spearman秩相关(rank correlation)简单线性相关与回归课件Spearman等级相关系数1.意义:说明具有线性关系的两变量间相关方向和密切程度的统计指标。2.取值:rs 的数值亦在 -1与 +1之间,正值表示正相关,负值表示负相关。简单线性相关与回归课件3.计算步骤:(1)将X、Y 从小到大分别编秩,相同观察值在同一组取平均秩次。(2)计算秩次差d和d2。 (3)计算等级相关系数

13、rs。简单线性相关与回归课件例:某地研究27岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见下表。简单线性相关与回归课件病人编号 血小板数 秩次 p2 出血症状 秩次 q2 pq X p Y q(1) (2) (3) (4) (5) (6) (7) (8)=(3).(6)1 121 1 1 + 11.5 132.25 11.52 138 2 4 + 9.0 81 183 165 3 9 + 7.0 49 214 310 4 16 - 3.5 12.25 145 426 5 25 + 9.0 81 456 540 6 36 + 9.0 81 547 740 7 49 - 3.5 2.

14、25 24.58 1060 8 64 - 3.5 12.25 289 1260 9 81 - 3.5 12.25 31.510 1290 10 100 - 3.5 12.25 3511 1438 11 121 + 11.5 132.25 126.2512 2004 12 144 - 3.5 12.25 42合计 78 650 - 78 630 451简单线性相关与回归课件利用表利用表11-2中的数据容易算得中的数据容易算得 秩相关系数为负,说明两变量间有负相关关系秩相关系数为负,说明两变量间有负相关关系由样本算得的秩相关系数是否有统计学意义,也应由样本算得的秩相关系数是否有统计学意义,也应做检

15、验做检验简单线性相关与回归课件秩相关系数的统计推断秩相关系数的统计推断检验步骤 1. 建立假设、确定检验水准建立假设、确定检验水准 2. 统计推断统计推断 当当 时,可查时,可查p. 500的的 临界值表,临界值表,若秩相关系数超过临界值,则拒绝若秩相关系数超过临界值,则拒绝 ;当;当 时,也可采用公式式做时,也可采用公式式做t 检验检验简单线性相关与回归课件描述x与y依存关系的直线方程:y 为应变量或因变量(dependent variable) 为当 x 取某一定值时,因变量 y 的平均估平均估计值x 为自变量或解释变量(independent variable, explanatory

16、variable)a 为截距(intercept),当x=0时,y 的平均估计值平均估计值b 为回归系数(regression coefficient):x 每改变一个单位,y 平均平均改变 b 个单位。 简单线性相关与回归课件回归的古典意义回归的古典意义高尔顿高尔顿( (Francis Galton) )遗传学的回归概念遗传学的回归概念 无论高个子或低个子的子女,其身高都无论高个子或低个子的子女,其身高都有向人的平均身高回归的趋势有向人的平均身高回归的趋势(regression toward the mean) 简单线性相关与回归课件 x- 每对夫妇的平均身高(英寸) y- 成年儿子的身高(

17、英寸)xy(xi,yi)给定一个x值,则y服从正态分布xi与yi的均值呈线性关系简单线性相关与回归课件回归的现代意义回归的现代意义一个因变量对若干解释变量依存关系的研究: 由固定的自变量去估计因变量的平均值由固定的自变量去估计因变量的平均值样样样样本本本本总总总总体体体体自变量固定值自变量固定值自变量固定值自变量固定值自变量固定值自变量固定值估计因变估计因变量平均值量平均值简单线性相关与回归课件回归的种类回归的种类按自变量的个数分:按自变量的个数分:一元回归:只有一个自变量,又称简单回一元回归:只有一个自变量,又称简单回归归多元回归:复回归;两个或两个以上自变多元回归:复回归;两个或两个以上自

18、变量量按回归线的形状分:按回归线的形状分:线性回归线性回归直线回归直线回归非线性回归非线性回归曲线回归曲线回归简单线性相关与回归课件简单线性相关与回归课件简单线性相关与回归课件简单线性回归分析一元线性回归模型与一元线性回归方程一元线性回归模型与一元线性回归方程参数的最小二乘估计参数的最小二乘估计离差平方和的分解离差平方和的分解求估计标准误差求估计标准误差回归方程的显著性检验回归方程的显著性检验利用回归方程进行预测利用回归方程进行预测对总体回归方程参数的估计对总体回归方程参数的估计简单线性相关与回归课件简单线性回归方程简单线性回归方程简单线性方程式:简单线性方程式:y=a+bxy=a+bx变量变

19、量 y y 不仅受不仅受 x x 的影响,还受其他随的影响,还受其他随机因素的影响,因此通过相关图,可以机因素的影响,因此通过相关图,可以直观地发现各个相关点并不都落在一条直观地发现各个相关点并不都落在一条直线上,而是在直线上下波动,只呈现直线上,而是在直线上下波动,只呈现线性相关的趋势。线性相关的趋势。我们试图在相关图的散点中引出一条模我们试图在相关图的散点中引出一条模拟的回归直线,以表明两变量拟的回归直线,以表明两变量x x与与y y的关的关系,称为估计回归线:系,称为估计回归线:y=a+bxy=a+bx简单线性相关与回归课件xi简单线性相关与回归课件一元线性回归方程 描描述述 y 的的平

20、平均均值值或或期期望望值值如如何何依依赖赖于于 x 的的方方程程称为回归方程称为回归方程简单线性回归方程的形式如下简单线性回归方程的形式如下 E( y ) = 0+ 1 x 或或 E( y ) = + x 方程的图示是一条直线,因此也称为直线回归方程方程的图示是一条直线,因此也称为直线回归方程 0是回归直线在是回归直线在 y 轴上的截距,是当轴上的截距,是当 x=0 时时 y 的期望值的期望值 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当 x 每每变变动动一一个个单位时,单位时,y 的平均变动值的平均变动值简单线性相关与回归课件一元线性回归模型一元一元线性回归模型可表示为

21、线性回归模型可表示为 y = 0 0 + + 1 1 x + + 或或 y = + + x + + 模型中,模型中,y 是是 x 的线性函数的线性函数(部分部分)加上误差项加上误差项线性部分反映了由于线性部分反映了由于 x 的变化而引起的的变化而引起的 y 的变化的变化误差项误差项 是随机变量是随机变量反反映映了了除除 x 和和 y 之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对 y 的影响的影响是不能由是不能由 x 和和 y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性 0 和和 1 称为模型的参数称为模型的参数简单线性相关与回归课件一元线性回归模型的基本假定零零均

22、均值值假假定定:误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的 x 值,y 的期望值为E ( y ) = 0+ 1 x同方差假定:同方差假定:对于所有的 x 值,的方差2 都相同正正态态性性假假定定:误差项是一个服从正态分布的随机变量,且相互独立相互独立。即N( 0 ,2 )无无自自相相关关假假定定:对于一个特定的 x 值,它所对应的与其他 x 值所对应的不相关对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关,即与 x 不相关简单线性相关与回归课件总体回归函数:样本回归函数:回归分析的目的:用样本回归函数去估计总体回归函数简单线性相关与回归课件样本

23、回归函数与总体回归函数的关系总体回归函数虽然未知,但它是确定的;总体回归函数虽然未知,但它是确定的; 样本回归线随抽样波动而变化,可以有许多条。样本回归线随抽样波动而变化,可以有许多条。 样本回归线是未知总体回归线的近似表现。样本回归线是未知总体回归线的近似表现。 总体回归函数的参数虽未知,但是确定的常数;总体回归函数的参数虽未知,但是确定的常数; 样本回归函数的参数可估计,但是随抽样而变样本回归函数的参数可估计,但是随抽样而变化的随机变量。化的随机变量。 总体回归函数中的随机误差不可直接观测;总体回归函数中的随机误差不可直接观测; 样本回归函数中的残差是只要估计出样本回归样本回归函数中的残差

24、是只要估计出样本回归的参数就可以计算的数值。的参数就可以计算的数值。 简单线性相关与回归课件By F. Galton & K. Pearsony=a+bx样本回样本回归方程归方程简单线性相关与回归课件回归系数的估计回归系数的估计回归系数估计的思想:回归系数估计的思想:u通通过过变变量量样样本本观观测测值值选选择择适适当当方方法法去去近近似似地地估估计回归系数计回归系数u前前提提:随随机机误误差差其其分分布布性性质质不不确确定定,必必须须作作某某些些假假定定,其其估估计计才才有有良良好好性性质质,其其检检验验才才可可进进行行u原原则则:使使参参数数估估计计值值“尽尽可可能能地地接接近近”总总体体

25、参参数真实值数真实值简单线性相关与回归课件一元线性回归模型的基本假定零零均均值值假假定定:误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的 x 值,y 的期望值为E ( y ) = 0+ 1 x同方差假定:同方差假定:对于所有的 x 值,的方差2 都相同正正态态性性假假定定:误差项是一个服从正态分布的随机变量,且相互独立相互独立。即N( 0 ,2 )无无自自相相关关假假定定:对于一个特定的 x 值,它所对应的与其他 x 值所对应的不相关对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关,即与 x 不相关简单线性相关与回归课件参数 的最小二乘估计简单线性

26、相关与回归课件离差平方和的分解(1)因因变变量量 y 的的取取值值是是不不同同的的,y 取取值值的的这这种波动称为变差。变差来源于两个方面:种波动称为变差。变差来源于两个方面:由于自变量由于自变量 x 的取值不同造成的的取值不同造成的除除 x 以以外外的的其其他他因因素素的的影影响响(如如x对对y的的非线性影响、测量误差等非线性影响、测量误差等)(2)对一个具体的观测值来说,变差的大小)对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差可以通过该实际观测值与其均值之差 来表示来表示简单线性相关与回归课件简单线性相关与回归课件离差平方和的分解 (三个平方和的关系)两端平方后求和有

27、两端平方后求和有从图上看有从图上看有 Lyy Lyy = U + Q总变差平方和总变差平方和总变差平方和总变差平方和(LyyLyy)回归平方和回归平方和回归平方和回归平方和(U U)残差平方和残差平方和残差平方和残差平方和(Q Q)简单线性相关与回归课件总平方和(总平方和(Lyy)反映因变量的反映因变量的 n 个观察值与其均值的总离差个观察值与其均值的总离差回归平方和(回归平方和(U)反反映映自自变变量量 x 的的变变化化对对因因变变量量 y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x 与与 y 之之间间的的线线性性关关系系引引起的起的 y 的取值变化,也称为可解释的平方和的

28、取值变化,也称为可解释的平方和残差平方和(残差平方和(Q)反反映映除除 x 以以外外的的其其他他因因素素对对 y 取取值值的的影影响响,也也称为不可解释的平方和或剩余平方和称为不可解释的平方和或剩余平方和离差平方和的分解 (三个平方和的关系)简单线性相关与回归课件 回归系数的最小二乘估计回归系数的最小二乘估计基本思想: 希望所估计的 偏离实际观测值 的残差 越小越好。取残差平方和 (Q)作为衡量 与 偏离程度的标准。最小二乘准则估计式: 简单线性相关与回归课件 最小二乘估计的性质高斯.马尔可夫定理 前提: 在基本假定满足时最小二乘估计是因变量的线性函数线性函数 最小二乘估计是无偏估计无偏估计,

29、即 在所有的线性无偏估计中,回归系数的最小二乘估计的方差最小方差最小。 结论:回归系数的最小二乘估计是最佳线性无偏估计最佳线性无偏估计简单线性相关与回归课件最小二乘法概念要点(1)使因变量的观察值与估计值之间的离差平)使因变量的观察值与估计值之间的离差平方和达到最小求得回归模型中的参数估计值方和达到最小求得回归模型中的参数估计值(2)用用最最小小二二乘乘法法拟拟合合的的直直线线来来代代表表 x 与与 y 之之间间的的关关系系与与实实际际数数据据的的误误差差比比其其他他任任何何直直线线都小都小简单线性相关与回归课件X P (X,Y)Y简单线性相关与回归课件 求 和 依据最小二乘法(method

30、of least square)原理 ,即 最小简单线性相关与回归课件简单线性相关与回归课件直线回归方程图示: 在自变量 x 的实测全距范围内任取相距较远且易读的两个 x 值,代入回归方程式,求出两个 ,两点连一直线即可。简单线性相关与回归课件线性回归的统计推断回归系数的假设检验 (1)方差分析 SS总 = SS回归 + SS剩余 SS总SS回归=简单线性相关与回归课件例5计算例4100米与400米成绩之间的相关系数与一元线性回归方程。简单线性相关与回归课件线性回归的统计推断回归方程的假设检验:线性关系的检验回归系数的检验参数估计:回归方程的可信区间 预测值范围简单线性相关与回归课件简单线性相

31、关与回归课件线性关系的检验方差分析Y的总变异X和Y的线性关系引起的变异误差引起的变异,其它随机因素对 Y的影响回归平方和误差平方和简单线性相关与回归课件XP (X,Y)YX和Y的线性关系引起的变异误差引起的变异,其它随机因素对Y的影响XP (X,Y)YY的总变异Y的总变异Y的总变异误差引起的变异,其它随机因素对Y的影响误差引起的变异,其它随机因素对Y的影响X和Y的线性关系引起的变异P (X,Y)P (X,Y)P (X,Y)X和Y的线性关系引起的变异误差引起的变异,其它随机因素对Y的影响误差引起的变异,其它随机因素对Y的影响简单线性相关与回归课件回归系数检验的基本思想如果如果X与与Y无线性回归关

32、系,则无线性回归关系,则SS回归回归和和SS剩余剩余都是其他随机因素对都是其他随机因素对Y的影响引起的影响引起的,由此,的,由此,MS回归回归MS剩余剩余,总体回归系,总体回归系数数= =0,反之,反之, 0。所以用。所以用F检验对检验对X与与Y之间有无回归关系进行检验。之间有无回归关系进行检验。简单线性相关与回归课件总的自由度:n-1 (总例数减1)回归自由度:1 (自变量个数)误差自由度:n-2 (总的自由度减去回归自由度)df1= 1, df2= n-2 查 F 界值表,得 P 值简单线性相关与回归课件具体分析步骤:1.建立假设检验2.计算检验统计量3.查F界值表并作结论 ,则P ,不拒

33、绝H0 简单线性相关与回归课件回归系数检验:t检验法基本思想同样本均数与总体均数的比较基本思想同样本均数与总体均数的比较 t-检验检验 Sb 是样本回归系数的标准误,反映样本回归系数与是样本回归系数的标准误,反映样本回归系数与总体回归系数之间的抽样误差,总体回归系数之间的抽样误差,SY*X 为剩余标准差,为剩余标准差,表示表示Y对于回归直线的离散程度对于回归直线的离散程度简单线性相关与回归课件具体分析步骤:1.建立假设:H0:=0 H1:0 =0.052.计算检验统计量:3.查t 界值表, 得 P值,根据=0.05检验水准下结论。简单线性相关与回归课件(1)影响Y取值的,除X外,还有其它不可忽

34、略因素。(2)Y与X关系不是线性的,而存在其它关系。(3)Y与X不存在关系。回归方程无统计学意义原因简单线性相关与回归课件描述X和Y之间依存变化的数量关系利用回归方程进行预测预报 用容易测量的指标估计不易测量的指标利用回归方程获得精度更高的医学参考值范围利用回归方程进行统计控制线性回归方程的应用简单线性相关与回归课件作回归分析一定要有实际意义回归分析之前首先应绘制散点图 异常点:是指偏离既定模型的数据点(即y空间的异常点)。高杠杆点:是指远离数据主体的点(即x空间的异常点)。强影响点:对统计推断影响特别大的点。异常点和高杠杆点都可能是强影响点,处理办法: 剔除 在此点补做实验 数据变换线性回归

35、分析中应注意的问题简单线性相关与回归课件考虑建立线性回归模型的基本假定回归方程建立在样本数据的基础上,受样本区间的限制,不可随意外推对于回归方程进行预测估计时,只能根据 x 估计 y,不能根据 y 估计 x两变量间的直线关系不一定是因果关系,也可能是伴随关系线性回归分析中应注意的问题简单线性相关与回归课件相关分析与回归分析的联系共同的研究对象:都是对变量间相关关系的分析只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析相关分析中相关系数的确定建立在回归分析的基础上简单线性相关与回归课件

36、回归系数回归系数b b与相关系数与相关系数r r的关系的关系r 的绝对值越大,散点图中的点越趋向于一条直线,的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。表明两变量的关系越密切,相关程度越高。b 的绝对值越大,回归直线越陡,说明当的绝对值越大,回归直线越陡,说明当X变化一个变化一个单位时,单位时,Y的平均变化就越大。的平均变化就越大。r 与与b 的符号一致。的符号一致。r 为正时,为正时,b 也为正;也为正;r 为负时,为负时,b 也为负。也为负。r 与与b 的假设检验结果一致的假设检验结果一致 ,可用,可用r 的显著检验代替的显著检验代替b 的显著性检验。的显著性检验。简单线性相关与回归课件对决定系数(coefficient of determination)的理解简单线性相关与回归课件下回分解下回分解多重线性回归多重线性回归简单线性相关与回归课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号