《线性相关与回归》PPT课件.ppt

上传人:枫** 文档编号:575796898 上传时间:2024-08-18 格式:PPT 页数:37 大小:334.52KB
返回 下载 相关 举报
《线性相关与回归》PPT课件.ppt_第1页
第1页 / 共37页
《线性相关与回归》PPT课件.ppt_第2页
第2页 / 共37页
《线性相关与回归》PPT课件.ppt_第3页
第3页 / 共37页
《线性相关与回归》PPT课件.ppt_第4页
第4页 / 共37页
《线性相关与回归》PPT课件.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《《线性相关与回归》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《线性相关与回归》PPT课件.ppt(37页珍藏版)》请在金锄头文库上搜索。

1、 线性相关与回归线性相关与回归(LinearCorrelation&Regression)线性相关与回归线性相关与回归线性相关线性相关线性回归线性回归线性相关与回归的区别和联系线性相关与回归的区别和联系一、线性相关的基本概念一、线性相关的基本概念二、线性相关系数二、线性相关系数三、相关系数的显著性检验三、相关系数的显著性检验四、进行线性相关分析的注意事项四、进行线性相关分析的注意事项线性相关线性相关(linear correlation) 一、线性相关的基本概念一、线性相关的基本概念 为直观地判断两个变量之间的关系,可在直角坐标系中把为直观地判断两个变量之间的关系,可在直角坐标系中把每对(每对

2、(X Xi i,Y,Yi i)值所代表的点绘出来,形成散点图值所代表的点绘出来,形成散点图。例如例如1212名名男青年身高与前臂长资料绘制的散点图如图所示:男青年身高与前臂长资料绘制的散点图如图所示: 若一个若一个变变量量X X由小到大(或由大到小),另由小到大(或由大到小),另一一变变量量Y Y亦相亦相应应地由小到大或由大到小,地由小到大或由大到小,则则两个两个变变量的散点量的散点图图呈直呈直线趋势线趋势,称,称“共共变变”,也也就是就是这这两个两个变变量之量之间间有有“相关关系相关关系”。 男青年身高与前臂男青年身高与前臂长长散点呈直散点呈直线趋势线趋势,即男,即男青年身材高,前臂亦青年身

3、材高,前臂亦长长,说说明身高与前臂明身高与前臂长长之之间间存在存在线线性相关关系性相关关系, ,称称为为直直线线相关。相关。 散点图中点的分布即线性相关的性质和相关之间的密切程散点图中点的分布即线性相关的性质和相关之间的密切程度度: 1.: 1.正相关正相关 2.2.负相关负相关 3.3.无相关无相关 二、线性相关系数二、线性相关系数 线性相关系数是说明具有直线关系的两个变量间相关密切线性相关系数是说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。程度和相关方向的统计量。 皮尔森皮尔森(Pearson)(Pearson)相关系数的计算公式为:相关系数的计算公式为: 相关系数相关系数

4、r r 没有测量单位,其数值为没有测量单位,其数值为-1 -1 r 11 相关系数的计算方法相关系数的计算方法 例例10.1 10.1 随机抽取随机抽取1111名男青年,分别测量身高和前臂长,名男青年,分别测量身高和前臂长,如下表,试计算身高与前臂长之间的相关系数。如下表,试计算身高与前臂长之间的相关系数。 编号身高(cm)前臂长(cm)XYX2Y2(X)(Y)1 170 47 7990 2890022092 173 42 7266 2992917643 160 44 7040 2560019364 155 41 6355 2402516815 173 47 8131 2992922096 1

5、88 50 9400 3534425007 178 47 8366 3168422098 183 46 8418 3348921169 180 49 8820 32400240110 165 43 7095 27225184911 166 44 3174 285612116合计18915008618532608122810三、相关系数的显著性检验三、相关系数的显著性检验 根据样本资料计算出来的相关系数同样存在抽样根据样本资料计算出来的相关系数同样存在抽样误差。即假设在一个误差。即假设在一个 X X 与与 Y Y 无关的总体中作随无关的总体中作随机抽样,由于抽样误差的影响,所得的样本相关机抽样,

6、由于抽样误差的影响,所得的样本相关系数也常常不等于零。系数也常常不等于零。因此要作总体相关系数因此要作总体相关系数是否为零的假设检验。是否为零的假设检验。 常用的检验方法有两种常用的检验方法有两种: : 1.1.按自由度直接查按自由度直接查附表附表1111的界值表的界值表,得到,得到P P 值。值。2.2.用假设检验法,计算统计量用假设检验法,计算统计量 ,其公式为:,其公式为: 例例10.110.1所得的所得的 值检验男青年身高与值检验男青年身高与前臂长之间是否存在相关关系前臂长之间是否存在相关关系? ?四、进行线性相关分析的注意事项四、进行线性相关分析的注意事项 双向性双向性:两个两个变变

7、量之量之间间的关系是双向的关系是双向的。可先的。可先绘绘制散点制散点图图,呈,呈现现出直出直线趋势线趋势时时,再作分析。,再作分析。 正正态态性性:两个:两个变变量都服从正量都服从正态态分布。如分布。如果不服从正果不服从正态态分布,先分布,先变换变换,使之正,使之正态态化,再化,再计计算相关系数。算相关系数。四、进行线性相关分析的注意事项四、进行线性相关分析的注意事项 抽样性抽样性:样样本相关系数与本相关系数与总总体相关系数之体相关系数之间间存存在着抽在着抽样误样误差。要判断两个事物之差。要判断两个事物之间间有无相关及有无相关及相关的密切程度,必相关的密切程度,必须须作假作假设检验设检验。四、

8、进行线性相关分析的注意事项四、进行线性相关分析的注意事项 相关相关- -因果不等性:因果不等性:两个事物之两个事物之间间的关系既可能的关系既可能是依存因果关系,也可能是依存因果关系,也可能仅仅是相互伴随的数量关是相互伴随的数量关系。决不可因系。决不可因为为两事物两事物间间的相关系数有的相关系数有统计统计学意学意义义,就,就认为认为两者之两者之间间存在着因果关系,要存在着因果关系,要证证明两明两事物事物间间确确实实存在因果关系,必存在因果关系,必须须凭借凭借专业专业知知识识加加以以阐阐明。明。 线性回归的基本概念线性回归的基本概念线性回归方程的计算线性回归方程的计算线性回归方程的显著性检验线性回

9、归方程的显著性检验进行线性回归分析的注意事项进行线性回归分析的注意事项线性回归(线性回归(linear regression)linear regression)一、线性回归的基本概念一、线性回归的基本概念 相关是分析两个正态变量相关是分析两个正态变量 X X 与与 Y Y 之间的互相关系,分不清之间的互相关系,分不清X X与与 Y Y 何者为自变量,何者为因变量。何者为自变量,何者为因变量。 假设变量假设变量X X 、Y Y 中,当中,当X X 改变时,改变时,Y Y 相应改变,当两个变量相应改变,当两个变量之间存在着直线关系时,不仅可以用相关系数之间存在着直线关系时,不仅可以用相关系数 r

10、 r 表示变量表示变量Y Y 与与 X X 线性关系的密切程度,也可用一个直线方程来表示线性关系的密切程度,也可用一个直线方程来表示 Y Y 与与 X X 的线性数量关系。的线性数量关系。这样得出的直线方程叫做线性回归方程。这样得出的直线方程叫做线性回归方程。直线回归方程是按照最小二乘法原则直线回归方程是按照最小二乘法原则(leastsquaresmethod)求出的,即:使各散点到直线的纵求出的,即:使各散点到直线的纵向距离的平方和最小。向距离的平方和最小。即:即:最小。最小。X X二、线性回归方程的计算二、线性回归方程的计算 例例10.3 10.3 温度对蛙的心率的影响,得到表中温度对蛙的

11、心率的影响,得到表中资料,试资料,试进行回归分析进行回归分析。对象对象温度(温度(X X) 心率心率(Y Y) XY XY X X2 2Y Y2 212510425241144161213611663612148141126419651022220100484612232761445297143244819610248162946425684191832576324102410203468040011561122337264841089合计合计1322463622202466101.1.根据表根据表10-210-2数据绘制散点图,如下图所示数据绘制散点图,如下图所示:2.2.计算回归系数与常数

12、项计算回归系数与常数项 在本例中: 则,回归方程为3. 3. 作回归直线作回归直线三、线性回归方程的显著性检验三、线性回归方程的显著性检验对线性回归方程要进行假设检验,就是要检验对线性回归方程要进行假设检验,就是要检验b b是否为是否为=0=0的总体中的一个随机样本。该假的总体中的一个随机样本。该假设检验通常用设检验通常用方差分析方差分析或者或者t t 检验检验,两者的检,两者的检验效果等价。验效果等价。 对例对例10.3的回归方程用的回归方程用t检验进行假设检验检验进行假设检验(1 1)建立假设检验)建立假设检验 =0=0 00 =0.05 =0.05(2)计算统计量)计算统计量V =112

13、=9 (3 3)确定)确定P P值作结论值作结论根据根据 V =9, 3.250, P 0.01,拒绝拒绝H H0 0, 四、进行线性回归分析的注意事项四、进行线性回归分析的注意事项 关联性关联性:只有将两个内在有联系的变量放在:只有将两个内在有联系的变量放在一起进行回归分析才是有意义的。一起进行回归分析才是有意义的。 顺序性顺序性:若有因果关系,以:若有因果关系,以“因因”的变量为的变量为X X , ,以以“果果”的变量为的变量为Y Y 。若无因果关系,则。若无因果关系,则应以易于测定、较为稳定或变异较小者为应以易于测定、较为稳定或变异较小者为X X 。 正态性正态性:因变量是正态变量,自变

14、量既可以:因变量是正态变量,自变量既可以是随机变量(是随机变量(IIII型回归模型,两个变量应该都型回归模型,两个变量应该都服从正态分布),也可以是给定的量(服从正态分布),也可以是给定的量(I I型回型回归模型,与每个归模型,与每个X X 取值相对应的变量取值相对应的变量Y Y必须服必须服从正态分布),如果数据不符合要求,在进行从正态分布),如果数据不符合要求,在进行回归分析前,必须先进行变量的变换。回归分析前,必须先进行变量的变换。 抽样性抽样性:回归方程建立后必须作假设检:回归方程建立后必须作假设检验,只有经假设检验拒绝了无效假设,验,只有经假设检验拒绝了无效假设,回归方程才有意义。回归

15、方程才有意义。 限制性限制性:使用回归方程计算估计值时,:使用回归方程计算估计值时,不可把估计的范围扩大到建立方程时的不可把估计的范围扩大到建立方程时的自变量的取值范围之外。自变量的取值范围之外。 线性相关和回归的区别与联系线性相关和回归的区别与联系 线性相关与回归的区别线性相关与回归的区别 相关系数只适用于双正态变量;回归分相关系数只适用于双正态变量;回归分析中,因变量是正态变量,自变量既可析中,因变量是正态变量,自变量既可是随机变量,也可以是给定的量。是随机变量,也可以是给定的量。 线性相关表示相互关系是双向的;回归线性相关表示相互关系是双向的;回归则反映两个变量之间的依存关系,是单则反映

16、两个变量之间的依存关系,是单向的。向的。 线性相关与回归的联系线性相关与回归的联系 同一资料的相关与回归分析,相关系数同一资料的相关与回归分析,相关系数r r与回归系数与回归系数b b正负号是相同的。正负号是相同的。 r r,b b要进行假设检验。通过数学推导,对同一样本可要进行假设检验。通过数学推导,对同一样本可以得出以得出 r r 与与 b b 互化的公式,假设检验等价。互化的公式,假设检验等价。 相关回归可以互相解释。相关回归可以互相解释。R R 的平方称为确定系数的平方称为确定系数 (coefficient of determinationcoefficient of determination)应用确定系数,也可以从回归的角度对相关程度做进应用确定系数,也可以从回归的角度对相关程度做进一步的了解。一步的了解。线性相关与回归的联系线性相关与回归的联系谢谢!谢谢!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号