统计学第九周简单回归分析李琳琳老师ppt课件

上传人:夏** 文档编号:592636460 上传时间:2024-09-21 格式:PPT 页数:63 大小:1.47MB
返回 下载 相关 举报
统计学第九周简单回归分析李琳琳老师ppt课件_第1页
第1页 / 共63页
统计学第九周简单回归分析李琳琳老师ppt课件_第2页
第2页 / 共63页
统计学第九周简单回归分析李琳琳老师ppt课件_第3页
第3页 / 共63页
统计学第九周简单回归分析李琳琳老师ppt课件_第4页
第4页 / 共63页
统计学第九周简单回归分析李琳琳老师ppt课件_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《统计学第九周简单回归分析李琳琳老师ppt课件》由会员分享,可在线阅读,更多相关《统计学第九周简单回归分析李琳琳老师ppt课件(63页珍藏版)》请在金锄头文库上搜索。

1、第第 十十 章章简简 单单 回回 归归 分分 析析 第一节第一节 简单线形回归简单线形回归 第二节第二节 线形回归的运用线形回归的运用 主要内容主要内容学习目的 了解回归分析的根本思想。熟习线性回归的根本步骤;求解回归方程中参数估计量a和b值所遵照的战略最小二乘原那么。掌握简单线性回归的根本概念;回归模型的前提假设;回归系数的含义、计算方法及假设检验。教 学 重 点w线性回归模型的前提假设w线性回归分析的根本步骤w回归方程的解释第第 一节一节简简 单单 线线 性性 回回 归归 Linear Regression Analysis 为研讨大气污染一氧化氮NO的浓度能否遭到汽车流量、气候情况等要素

2、的影响,选择24个工业程度相近的一个交通点,统计单位时间过往的汽车数千辆,同时在低空一样高度测定了该时间段平均气温、空气湿度 、风速m/s以及空气中一氧化氮NO的浓度 ,数据如表10-1所示。 【例【例10.1】 函数关系:它反映着景象之间严厉的数量化依存关系,也称确定性的依存关系。如正方形的面积和边长的关系。 回归关系:变量之间存在着不确定、不严厉的依存关系,即对于一个变量的某个数值,可以有另一变量的假设干数值与之相对应 在这种关系中,对于变量的每一个数值,都有一个或几个确定的值与之严厉对应。 回归关系的几个例子子女身高y与父亲身高x之间的关系收入程度y与受教育程度x之间的关系体重y与身高x

3、1 、胸围x2 之间的关系体外表积y与体重x之间的关系商品销售额y与广告费支出x之间的关系一、回归分析的根本概念一、回归分析的根本概念w回归Regression1.变量间关系不能用函数关系准确表达2.一个变量的取值不能由另一个变量独一确定3.当变量 x 取某个值时,变量 y 的取值能够有几个4.各观测点分布在直线周围 回归分析回归分析Regression analysisRegression analysis从一组样本数据出发,确定变量之间的数学关从一组样本数据出发,确定变量之间的数学关系式;系式;对这些关系式的可信程度进展各种统计检验,对这些关系式的可信程度进展各种统计检验,并从影响某一特定

4、变量的诸多变量中找出具有并从影响某一特定变量的诸多变量中找出具有统计学意义的变量;统计学意义的变量;利用所求的关系式,根据一个或几个变量的取利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给值来预测或控制另一个特定变量的取值,并给出这种预测或控制的准确程度。出这种预测或控制的准确程度。自变量与因变量自变量与因变量自变量自变量independent variable) : 能独立自在变化的变量能独立自在变化的变量 普通用普通用X表示表示因变量因变量dependent variable): 非独立的、受其它变量影响的变量非独立的、受其它变量影响的变量 普通用普通用Y表

5、示表示cx与与y确定原那么确定原那么 回归模型分类回归模型分类 a) 按变化趋势:按变化趋势: 线性回归模型线性回归模型 非线性回归模型非线性回归模型按自变量个数:按自变量个数: 简单线性回归模型简单线性回归模型 多重线性回归模型多重线性回归模型 w一元线性回归模型一元线性回归模型w描画描画y y 如何依赖于如何依赖于x x 和误差项和误差项 的方程称为回的方程称为回归模型归模型w一元线性回归模型可表示为一元线性回归模型可表示为wy y 是是 x x 的线性函数的线性函数( (部分部分) )加上误差项加上误差项w线性部分反映了由于线性部分反映了由于 x x 的变化而引起的的变化而引起的 y y

6、 的的变化变化w误差项误差项 是随机变量,反映了除是随机变量,反映了除 x x 和和 y y 之之间的线性关系之外的随机要素对间的线性关系之外的随机要素对 y y 的影响,是的影响,是不能由不能由 x x 和和 y y 之间的线性关系所解释的变异之间的线性关系所解释的变异性性w0 0 和和 1 1 称为模型的参数称为模型的参数二、简单线性回归分析w回归模型的根本假设1.线性linear)2.独立independent)3.正态 (normal)4.等方差equal variance)线性线性linear)指反响变量指反响变量Y的总体平均值的总体平均值与自变量与自变量X呈线性关系。呈线性关系。独

7、立独立independent)指恣意两个察看值相指恣意两个察看值相互独立。互独立。正态正态 (normal)假定线性模型的误差项服假定线性模型的误差项服从正态分布从正态分布 。等方差等方差equal variance)是指在自变量是指在自变量X取值范围内,不论取值范围内,不论X取什么值,取什么值,Y都具有都具有一样的方差。一样的方差。 图1 回归模型前提假设表示图u回归分析的方法步骤回归分析的方法步骤绘制散点图绘制散点图求回归系数和常数项求回归系数和常数项回归系数和常数项的假设检验回归系数和常数项的假设检验列出回归方程,并进展假设检验列出回归方程,并进展假设检验回归方程的解释回归方程的解释一绘

8、制散点图一绘制散点图图2 车流量与空气中NO浓度关系散点图 从散点图可见:从散点图可见:车流量与空气中车流量与空气中NO浓度有线性关浓度有线性关系,可以思索做系,可以思索做线性回归分析。线性回归分析。二求回归系数和常数项二求回归系数和常数项系数估计公式:系数估计公式: 回归方程:回归方程:本例中b=0.1584; a=-0.3参数参数的意的意义:假:假设自自变量量X添加添加1个个单位,反响位,反响变量量Y的平均的平均值便添加便添加个个单位。位。 =0,阐明明Y与与X之之间并不存在并不存在线性关系;性关系; 0,阐明明Y与与X之之间存在存在线性关系。性关系。理由:从理由:从=0的的总体抽得体抽得

9、样本,本,计算出的回算出的回归系系数数b很能很能够不不为零。零。方法:回方法:回归系数的假系数的假设检验可可经过t检验实现。三回归系数和常数项的假设检验三回归系数和常数项的假设检验t检验检验四回归方程的假设检验四回归方程的假设检验目的:检验求得的回归方程在总体中能目的:检验求得的回归方程在总体中能否成立;否成立;方法:单要素方差分析。方法:单要素方差分析。因变量 y 的取值是不同的,y 取值的这种动摇称为变异。变异来源:因自变量 x 的取值不同呵斥的除 x 以外的其他要素(如x对y的非线性影响、丈量误差等)的影响对一个详细的观测值来说,变异的大小可以经过该实践观测值与其均值之差 来表示u变异变

10、差及其分解变异变差及其分解x xy yy y SST = SSR + SSE总总平方和平方和平方和平方和(SST)(SST)回回回回归归平方和平方和平方和平方和(SSR)(SSR)残差平方和残差平方和残差平方和残差平方和(SSE)(SSE)SST是指没有利用X的信息时,Y察看值的变异;SSE反响回归方程未能解释的那部分变异;SSR反响回归方程解释的那部分变异。决议系数(R2= SSR/ SST,反响了Y的总变异中回归关系所能解释的百分比, R2越大,阐明构建的回归方程越好。 表3 简单线性回归模型方差分析表 查F界界值表,得表,得P0.05,阐明构建的明构建的回回归方程具有方程具有统计学意学意

11、义。 研研讨阐明,明, 车流量和空气中流量和空气中NO浓度度存在着存在着线性依存关系:性依存关系:车流量每添加流量每添加100辆0.1千千辆,空气中空气中NO浓度平均度平均能能够添加添加0.01584五回归方程的解释五回归方程的解释线性回归分析的线性回归分析的SPSS过程:过程:Analyze Regression LinearDependent list框 YIndependent list框 X1OK【电脑实现】SPSS线性回归分析:线性回归分析: 1. 数据录入数据录入2.线性回归分析的步骤线性回归分析的步骤:3. 结果及结果输出:结果及结果输出: 第第 二二 节节 线线 形形 回回 归

12、归 的的 应应 用用直线回归方程的运用一定量描画两变量之间的依存关系。一定量描画两变量之间的依存关系。二利用回归方程进展预测。二利用回归方程进展预测。三利用回归方程进展统计控制。三利用回归方程进展统计控制。 一、一、 总体回归线的总体回归线的95% 置信带置信带 二、个体二、个体Y预测值的区间估计预测值的区间估计 总体中,当XP为某一固定值时,个体Y值围绕着对应于XP值的总体均数动摇,其分布的规范差按下式估计:即即 图5 空气中NO浓度Y与车流量X回归 线的95%置信带与Y个体值的95%预测带三、三、 统计控制:控制:例:例: 该城市城市为降低空气中降低空气中NO的含量,的含量,拟对车流量流量

13、进展适当的控制,根据空展适当的控制,根据空气气污染指数分染指数分级,要求空气中氮氧化,要求空气中氮氧化合物含量不超越合物含量不超越0.1000.15010-6 。知回归方程知回归方程答:答:故该城市单位时间内车流量应控制在故该城市单位时间内车流量应控制在1500辆以内,辆以内,最多不超越最多不超越1800辆,否那么会导致轻度污染的发生。辆,否那么会导致轻度污染的发生。简单线性回归分析的本卷须知简单线性回归分析的本卷须知 1.要留意实践意义;2.绘制散点图察看两变量的关系以及找出异常点;3.留意自变量和因变量的变化范围。小结 相关分析是用来描画两变量的相关关系,当两变量满足双变量正态分布时,可以

14、计算Pearson积差相关系数,假设有任何一个变量不满足正态分布或为等级资料,需计算Spearman等级相关系数。而回归分析是用来描写两变量的依存关系,它要求资料满足LINE线性、独立、正态和等方差,二者之间既有联络又有区别。 【案例讨论】w年龄与身高预测研讨。某地调查了年龄与身高预测研讨。某地调查了418岁男孩岁男孩与女孩身高,数据见下表,试描画男孩与女孩身与女孩身高,数据见下表,试描画男孩与女孩身高与年龄间的关系,并预测高与年龄间的关系,并预测10.5岁、岁、16.5岁、岁、19岁与岁与20岁男孩与女孩的身高。岁男孩与女孩的身高。 表表10-4 10-4 某地男孩与女孩平均身高与年龄的调查

15、数据某地男孩与女孩平均身高与年龄的调查数据采用采用SPSS对身高与年龄进展回归分析,结果如表对身高与年龄进展回归分析,结果如表10-5和和表表10-6所示。所示。 表表10-5 男孩身高对年龄的简单线性回归分析结果男孩身高对年龄的简单线性回归分析结果估计值标准误tPconstant83.73631.882444.48390.0000age5.27480.167631.47980.0000估计值标准误tPconstant88.43263.280026.96110.0000age4.53400.292015.52900.0000表12-6 女孩身高对年龄的简单线性回归分析结果 经拟合简单线性回归模

16、型,t检验结果提示回归方程有非常显著的统计学意义。 结果提示,拟合效果非常好,故可以为: 1男孩与女孩的平均身高随年龄线性递增,年龄每增长1岁,男孩与女孩身高分别平均添加5.27,4.53,男孩生长速度快于女孩的生长速度。 2按照回归方程预测该地男孩10.5、16.5、19和20岁的平均身高依次为.12、170.77、183.96和189.23,该地女孩10.5、16.5、19和20岁的平均身高依次为.04、163.24、174.58和179.11. 针对以上分析结果,请思索: 1分析过程能否符合回归分析的根本规范? 2回归模型能反映数据的变化规律吗? 3拟合结果和根据回归方程而进展的预测有问

17、题吗? 4男孩生长速度快于女孩生长速度的推断能否有根据?案例辨析案例辨析 未绘制散点图,盲目进展简单未绘制散点图,盲目进展简单线性回归分析;假设实践资料反映两变线性回归分析;假设实践资料反映两变量之间呈现某种曲线变化趋势,用简单量之间呈现某种曲线变化趋势,用简单线性回归方程去描画其变化规律就是不线性回归方程去描画其变化规律就是不妥当的。妥当的。正确做法正确做法 分析战略:作散点图,选择曲分析战略:作散点图,选择曲线类型,合理选择模型,统计预测。线类型,合理选择模型,统计预测。 图3 身高对年龄的不同曲线类型女孩1作散点图 图4 身高对年龄的不同曲线类型男孩由图3,4 可见,随着年龄的添加,身高也添加,但呈曲线变化趋势,1516岁后,添加趋势逐渐趋于平缓。因此适宜于拟合曲线回归方程。2选择曲线类型,进展统计分析,几种曲线方程拟合结果如下。 结果摘要:1模型参数估计Dependent Variable: 男孩身高The independent variable is 年龄。 3选择合理的模型,列出回归方程。 4统计预测。思索题1运用直线回归和相关分析时应留意哪些问题?2简述线性回归分析与线性相关的区别与联络。3. 举例阐明如何利用回归方程进展统计预测和控制。4. 回归分析时怎样确定因变量与自变量?

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号