《最新相关与回归》由会员分享,可在线阅读,更多相关《最新相关与回归(65页珍藏版)》请在金锄头文库上搜索。
1、相关与回归相关与回归相关与回归两变量间的相关分析与回归分析两变量间的相关分析与回归分析相关与回归 相关关系与确定性关系的比较相关关系与确定性关系的比较两变量间的相关分析两变量间的相关分析直线相关分析直线相关分析相关与回归 直线直线相关分析的基本概念相关分析的基本概念相关分析是研究变量或变量集合之间数量协同变化关系密切程相关分析是研究变量或变量集合之间数量协同变化关系密切程度和方向的统计方法。度和方向的统计方法。当两个数值变量之间出现如下情况:当一个变量增大,另一个当两个数值变量之间出现如下情况:当一个变量增大,另一个也随之增大也随之增大( (或减少或减少) ),我们称这种现象为共变,也就是有相
2、关,我们称这种现象为共变,也就是有相关关系。关系。若两个变量同时增加或减少,变化趋势是同向的,则两变量之若两个变量同时增加或减少,变化趋势是同向的,则两变量之间的关系为正相关间的关系为正相关( (positive correlationpositive correlation) );若一个变量增加;若一个变量增加时,另一个变量减少,变化趋势是反向的,则称为负相关时,另一个变量减少,变化趋势是反向的,则称为负相关( (negative correlationnegative correlation) )。 相关的方向相关的方向两变量间的相关分析两变量间的相关分析直线相关分析直线相关分析相关与回归
3、 两个两个相关关系的图示(散点图)相关关系的图示(散点图)yx两变量间的相关分析两变量间的相关分析直线相关分析直线相关分析相关与回归 直线直线相关分析的资料要求相关分析的资料要求两变量间的相关分析两变量间的相关分析直线相关分析直线相关分析相关与回归 相关系数(直线相关关系的测度)相关系数(直线相关关系的测度)用用以以说说明明具具有有直直线线关关系系的的两两个个变变量量间间相相关关关关系系的的密密切切程程度度和和相相关关方方向向的的指指标标,称称为为相相关关系系数数(correlation coefficient),又又称称为为积积差差相相关关系系数数(coefficient of produc
4、t-moment correlation),),Pearson相关系数相关系数 。两变量间的相关分析两变量间的相关分析直线相关分析直线相关分析相关与回归 相关系数(直线相关关系的测度)相关系数(直线相关关系的测度)两变量间的相关分析两变量间的相关分析直线相关分析直线相关分析相关与回归相关系数没有量纲相关系数没有量纲, 且且-1 r 1。当。当r0,且,且H0(=0)被拒绝时,认为两变)被拒绝时,认为两变量之间呈正相关关系;当量之间呈正相关关系;当r0: 回归线与纵轴交点在原点上方。a 0: 回归线与纵轴交点在原点下方。a =0: 回归线通过原点。o统计学意义a 表示自变量X取值为0时相应Y条件
5、均数的估计值。oa的单位与Y值相同o当X可能取0时,a才有实际意义。 线性回归模型中参数的几何意义线性回归模型中参数的几何意义截距截距a:两变量间的回归分析两变量间的回归分析直线相关分析直线相关分析相关与回归XY回归系数:回归系数: 线性回归模型中参数的几何意义线性回归模型中参数的几何意义两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析b b表示自变量表示自变量X X变化一个单位时应变量变化一个单位时应变量Y Y的平均改变量。的平均改变量。b越大,表示越大,表示Y随随X变化越快,直线越陡峭变化越快,直线越陡峭相关与回归o 等方差(equal variance)或标准差相等:标准差相
6、等:对于任何X值,随机变量Y的标准 差 Y|X相等;隐含着不论x取何值,y都具有相同的方差(对于所有的自变量x,残差 的条件方差为 ,且为常数)。 o 独立独立 INDEPENDENCE 每一观察值之间彼此独立(在给定自变量x的条件下,残差的条件期望值为零,本假设又称零均值假设);该条件实际上隐含着:各随机误差项互不相关;随机误差项与相应的自变量x不相关。 o线性线性 LINEARITY: 反应变量均数 与X间呈直线关系 o 给定X时,Y正态分布(normal): 对于任何给定的 X, Y 服从正态分布,均数为 Y|X,标准差为 Y|X,该条件实际隐含着误差项服从正态分布(随机误差,即残差服从
7、均值为零,方差为的正态分布)。 线性回归模型的建模假设线性回归模型的建模假设两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析相关与回归 直线回归分析的步骤直线回归分析的步骤例题例题1:某克山病区:某克山病区10名健康儿童头发与全血中的硒含量名健康儿童头发与全血中的硒含量1000ppm(百万分(百万分之一)如下,试建立发硒(之一)如下,试建立发硒(x)与血硒()与血硒(y)之间的回归模型?)之间的回归模型?两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析相关与回归 直线回归分析的步骤直线回归分析的步骤两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析1 绘制散点
8、图:绘制散点图:同相关分析,即同相关分析,即在直角坐标系内绘制散点图。在直角坐标系内绘制散点图。若散点图呈直线趋势时,建立若散点图呈直线趋势时,建立直线回归方程;直线回归方程;若散点图呈曲线趋势,进行曲若散点图呈曲线趋势,进行曲线拟合;线拟合;若散点图显示无任何趋势,则若散点图显示无任何趋势,则不必进行分析。不必进行分析。本例,散点图呈直线趋本例,散点图呈直线趋势时,可建立直线回归势时,可建立直线回归方程。方程。相关与回归 直线回归分析的步骤直线回归分析的步骤两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析2 2 建立直线回归方程建立直线回归方程实际上是求出回归方程中的回归系数实际
9、上是求出回归方程中的回归系数b和截距和截距a:求回归系数求回归系数b b和截距和截距a a的方法有最小二乘法、高斯牛顿法、麦的方法有最小二乘法、高斯牛顿法、麦夸特法、牛顿法、梯度法、正割法等等。这里重点给大家介夸特法、牛顿法、梯度法、正割法等等。这里重点给大家介绍最小二乘法。绍最小二乘法。相关与回归 从上图得知,要使从上图得知,要使 能够最好地代能够最好地代表表y y和和x x在数量上的互变关系,必须使在数量上的互变关系,必须使yx0xiyi( yi- )实际观察值与估计值之差两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤2 2 建立直线回归
10、方程建立直线回归方程最小二乘法的基本原理:最小二乘法的基本原理:相关与回归分别对上式的a和b求偏导:两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤2 2 建立直线回归方程建立直线回归方程用最小二乘法求回归方程:用最小二乘法求回归方程:解方程组,得到回归系数解方程组,得到回归系数b和截距和截距a:相关与回归 直线回归分析的步骤直线回归分析的步骤两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析2 2 建立直线回归方程建立直线回归方程本例:本例:相关与回归 直线回归分析的步骤直线回归分析的步骤两变量间的回归分析两变量间的回归分析直线回归
11、分析直线回归分析3 3 绘制回归线绘制回归线 本例:本例:相关与回归总体一元线性回归总体一元线性回归总体一元线性回归总体一元线性回归方程方程方程方程: :样本一元线性回归方程:样本一元线性回归方程:样本一元线性回归方程:样本一元线性回归方程:以样本统计量估计总体参数以样本统计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距对对于于直直线线回回归归分分析析,回回归归系系数数的的假假设设检检验验,也也是是直直线线回回归归方方程程的的假假设设检检验验。由由于于抽抽样样误误差差的的存存在在,回回归归系系数数b往往往往不不等等于于总总体体回回归归系系数数 ,要要判判断断是是否否来来自自 0的的总总
12、体体,也也必必须须进进行行假假设设检检验验。常常用用的的回回归归系系数数的的假假设设检检验验有有方方差差分分析和析和 t 检验。检验。(要估计的回归方程要估计的回归方程)(实际计算的回归方程)(实际计算的回归方程)(实际计算的回归方程)(实际计算的回归方程)两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤4 4 回归系数的假设检验回归系数的假设检验 相关与回归总体总体0总体总体 0样本样本b0两变量有直线关系两变量无直线关系?两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤4 4 回归系数的假设
13、检验回归系数的假设检验 相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤4 4 回归系数的假设检验回归系数的假设检验方差分析法方差分析法 Y总变异的分解总变异的分解(1)建立假设,确定)建立假设,确定 H0: =0,即两变量无直线关系,即两变量无直线关系H1:0,即两变量有直线关系,即两变量有直线关系 =0.05(2)求统计量)求统计量F相关与回归剩余剩余(误差误差)平方和平方和回归回归平方和平方和总离差平方和总离差平方和相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤4 4
14、 回归系数的假设检验回归系数的假设检验方差分析法方差分析法 (2)求统计量)求统计量F相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤4 4 回归系数的假设检验回归系数的假设检验方差分析法方差分析法 (2)求统计量)求统计量F三个平方和的意义:三个平方和的意义: 相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤4 4 回归系数的假设检验回归系数的假设检验方差分析法方差分析法 (2)求统计量)求统计量F本例:本例:(3)确定)确定P值,做出结论值,做出结论相关与回归两变量间的回
15、归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤4 4 回归系数的假设检验回归系数的假设检验t t 检验法检验法 (2)求统计量)求统计量t相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤4 4 回归系数的假设检验回归系数的假设检验t t 检验法检验法 (2)求统计量)求统计量t本例:本例:(3)确定)确定P值,做出结论值,做出结论查t界值表,得到P0.05两种方法的等价性:两种方法的等价性:相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步
16、骤5 5 直线回归方程直线回归方程拟合效果评价拟合效果评价本例:本例:R2=0.7595本例:调整本例:调整R2=0.7295相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤6 6 直线回归方程的区间估计直线回归方程的区间估计相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤6 6 直线回归方程的区间估计直线回归方程的区间估计(1) 总体回归系数和总体截距的可信区间估计总体回归系数和总体截距的可信区间估计本例:本例:总体回归系数的总体回归系数的95%的可信区间为(的可信区间为(
17、0.1276, 0.3440)本例:本例:总体截距的总体截距的95%的可信区间为(的可信区间为(-15.2341, 1.2735)相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤6 6 直线回归方程的区间估计直线回归方程的区间估计(2) 总体均数总体均数 的可信区间估计的可信区间估计 相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤6 6 直线回归方程的区间估计直线回归方程的区间估计(2) 总体均数总体均数 的可信区间估计的可信区间估计 相关与回归两变量间的回归分析两变量间的
18、回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤6 6 直线回归方程的区间估计直线回归方程的区间估计(3) 个体个体Y值的预测区间值的预测区间 相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的步骤直线回归分析的步骤6 6 直线回归方程的区间估计直线回归方程的区间估计(3) 个体个体Y值的预测区间值的预测区间 相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的注意事项直线回归分析的注意事项相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线回归分析的应用直线回归分析的应用相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线相关与直线回归的区别与联系直线相关与直线回归的区别与联系相关与回归两变量间的回归分析两变量间的回归分析直线回归分析直线回归分析 直线相关与直线回归的区别与联系直线相关与直线回归的区别与联系相关与回归THANK YOU感谢聆听,批评指导2020