线性相关与回归分析

上传人:鲁** 文档编号:495813252 上传时间:2023-09-18 格式:DOC 页数:10 大小:67.50KB
返回 下载 相关 举报
线性相关与回归分析_第1页
第1页 / 共10页
线性相关与回归分析_第2页
第2页 / 共10页
线性相关与回归分析_第3页
第3页 / 共10页
线性相关与回归分析_第4页
第4页 / 共10页
线性相关与回归分析_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《线性相关与回归分析》由会员分享,可在线阅读,更多相关《线性相关与回归分析(10页珍藏版)》请在金锄头文库上搜索。

1、第十章相关与回归分析第一节 简单线性相关分析一、简单线性相关(直线相关)的概念:二、相关关系的种类:(一)按相关程度划分可分为完全相关、不完全相关、和不相关(二)按相关方向划分可分为正相关和负相关(三)按相关的形式划分可分为线形相关和非线形相关(四)按变量多少划分可分为单相关、复相关和偏相关三、相关分析相关分析一般可以借助相关系数与相关图来进行相关分析。(一)相关系数1简单相关系数的含义 反映两个变量之间线性相关密切程度和相关方向的统计测定,它 是其他相关系数形成的基础。2简单相关系数的计算(6.17)6.18)r_(x - x )(y - y)Q (x x)2 工(y y)2或化简为:r _

2、工x 丁卜)、n 乙 x 2 x上 飞 n 乙 y 2 护3相关系数的性质(1)相关系数的取值范围在T和+1之间,即:-lWrW 1。(2)计算结果,若r为正,则表明两变量为正相关;若r为负,则表明两变量为负相关。(3)相关系数r的数值越接近于1 (-1或+1),表示相关系数 越强;越接近于0,表示相关系数越弱。如果r=1或-1,则表示两 个现象完全直线性相关。如果r=0,则表示两个现象完全不相关(不 是直线相关)。(4)判断两变量线性相关密切程度的具体标准为:0 r 0.3,称为微弱相关;0.3 ir 05,称为低度相关;0.5r0.8,称为显著相关;0.8ri称为咼度相关。(二)相关图相关

3、图又称散点图。它是以直角坐标系的横轴代表标量X,纵轴 代表标量Y,将两个变量间相对应的变量值用坐标点的形式描绘出来, 用来反映两变量之间相关关系的图形。四. 相关系数的假设检验1目的:相关系数检验的目的是判断两变量的总体是否有相关 关系。检验样本相关系数r是否总体相关系数为0的总体,如概率p 0.05,认为两变量存在相关关系。2方法:有t检验和查表法。(1) t检验法:统计量计算为:v = n-2r,1 - r 2 n - 2(2)查表法:是直接查相关系数界值表得到相应的概率p。统计量 r绝对值越大,p越小。第二节 简单线性回归分析一、回归分析的概念与种类二、一元线性回归1. 一元线性回归模型

4、y = B +B x + 0 12. 一元线性回归方程Y = a+hX3回归模型的前提条件1)线性:是指反应变量Y的总体平均值与自变量X呈线性关系;2)独立性:任意两个观察值之间相互独立;3)正态性:是指对于给定的X值,其对应的Y值的总体和线性 模型的误差项均服从正态分布;(均服从均数为0的正态分布)4)等方差性:无论X如何取值,Y都有相同的方差。4.回归方程的检验回归方程的显著性检验检验自变量和因变量之间的线性关系是否显著。具体方法是将 回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验 来分析二者之间的差别是否显著,如果是显著的,两个变量之间存在 线性关系;如果不显著,

5、两个变量之间不存在线性关系。 SS总=SS回+SS剩SS为回归平方和,它反映在Y的总变异中,由于X与Y的直线 回关系,而使得Y变异减小的部分,也即在总平方和中可以用X解释的 部分。SS越大,说明回归效果越好。回SS为剩余平方和,它反映X对Y的线性影响之外的因素,对Y 乘匚的总变异的影响,也即在总平方和中无法用X解释的部分oSS越小,乘J 说明直线回归的估计误差越小。回归系数的显著性检验b t 二- S b1对于一元线性回归,回归方程的显著性检验与回归系数的显著性检验是等价的。可通过方差分析或t检验进行。三、相关与回归分析应用注意事项2直线相关与回归的区别与联系(1)区别: 相关分析要求两个变量

6、均服从正态分布,而回归分析则有两种不同的模型。I型回归:定X后对y进行测量,y须服从正态分布;II型 回归:x,y均须服从正态分布,如体重依身高的变动关系。 对于同一资料,只能计算一个相关系数,而II型回归可以计算由x 推y和由y推X的两个回归方程,但两者不是反函数的关系。 回归反映两变量间的依存关系,相关反映两变量间的相互关系。有 相关联系不一定是因果联系。(2)联系: 同一资料r与b符号相同。 同一资料r与b的假设检验结果是等价的。 r与b可以互相换算。 相关是相互关系,双方向,-lWrW+l,无单位,有相关不一定有回 归;回归是依存关系,单方向, 无限, 有单位,有回归一定有相关。第三节

7、 秩相关秩相关又称等级相关,是一种用等级数据进行直线相关分析的非 参数统计方法,适用于双变量不服从正态分布的资料;总体分布型未 知;等级资料或无确切数值资料。秩相关用等级相关系数r表示密切程度及方向。其取值范围为-1WrW+1; r0为正相关,rV0为负相关;r=0,表示无线性相关关系, 为零相关。第十一章多重线性回归一基本概念:多重线性回归的概念:1多重线性回归是研究多个自变量与一个因变量之间线性依存 关系的方法。2多重线性相关(复相关)是研究多个变量与一个变量线性相 关关系的方法。3多元线性回归是研究多个自变量与多个因变量线性依存关系 的方法。4多元线性相关是研究多个变量与多个变量之间线性

8、相关关系 的方法。5偏相关是研究在多个变量中消除其它变量影响后一变量与另一变量的相关关系。二、多重线性回归模型1. 意义:多重线性回归模型用于研究一个被解释变量(因变量)受多个解释变量(自变量)的影响,多重线性回归模型与一元线性回归模型基本类似,只不过解释变量由一个增加到两个以上,被解释变 量y与多个解释变量x,xx之间存在线性关系。1 2 k2模型与方程:假定被解释变量y与多个解释变量x,xx之间具有线性关 1 2 k+B x+8)01系,建立多重线性回归模型为:y = B +B x + B x +B x + 80 1 1 2 2 k k其中y为被解释变量,x为k个解释变量,B为偏(部分)回

9、归 jj系数,为随机误差项。被解释变量y的期望值与解释变量x的多重线性回归方程为:F = a + bX + b X + b X1 1 2 2 k k参数估计的方法:一般需要计算机软件完成。如以儿子身高为因变量,父、母身高和体育锻炼次数为自变量,建立方程如下Y = 0.244x +0.566x +0.224x1233多重线性回归模型的假设(条件):1、因变量Y和解释变量X之间是线性关系;2、X是自变量,并在两个或多个自变量之间没有精确的线性关系;3、误差项的所有观测值的期望值为0,方差相等;4、误差项的观测值之间相互独立,不相关;5、误差项服从正态分布。三、参数与参数估计:1参数估计方法:参数估

10、计方法是最小二乘法。一般用统计软 件完成。2偏回归系数B (b):表示除X外的其他自变量固定时,X改i iii变一个单位后Y的平均变化。3. 标准回归系数:偏回归系数因各自变量值的单位不同,不能直 接比较其大小。对变量值作标准化变换,得到的回归系数为标准回归 系数,可直接比较其大小,反映各自变量对因变量的贡献大小。四、多重回归的假设检验:1.回归方程(模型)的假设检验:检验模型是否成立,或方程 是否有意义。1)方差分析:2)总体复相关系数的假设检验2. 回归系数的假设检验:b - 0t 二 iSE (b )13. 确定系数计算:确定系数为:R2二住二1 -竺SS SSTTSS= SS + SS

11、T E R总离差平方和=残差平方和+ 回归平方和R2表示总变差中由多元回归方程“解释”的比例;R2可解释模型的拟合优度,残差平方和越小,决定系数越接近1,回 归方程的拟合程度越好。四回归分析中的变量筛选:五多重回归分析的主要用途:六多重回归分析的一般步骤: 七多重相关和偏相关:应用条件:同简单线性相关一样,仅当X,X2,,Y为多元正态分布的随机变量时才能考虑相关分析。1.复相关系数(多重相关系数):多重相关的实质就是Y的实际观察值与由k个自变量预测的y值的相关。也既复相关系数反映一个因变量与一组自变量之间的相关程度。前面计算的确定系数是Y与Y相关系数的平方,那么复相关系数就是确定系数的平方根。R R22. 偏相关系数(部分相关系数):部分相关系数反映校正其它变 量后某一变量与另一变量的相关关系,校正的意思可以理解为假定其 它变量都取值为均数。计算公式:r 一 r r12,3 J(1 r 2)(1 - r 2)13233. 偏相关系数的假设检验:用 t 检验。总体中扣除q个变量影响的偏相关系数为p(-q),样本中相应的 偏相关系数为 r(-q)。检验假设:H0: p(-q)=0,片:p(-q)#Q可采用统计量:r n q 2 t -4J1 r 2(q)v=n-q-2偏相关系数的假设检验等同于偏回归系数的t检验。复相关系数的假设检验等同于回归方程的方差分析。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号