10简单回归分析

上传人:小** 文档编号:56536765 上传时间:2018-10-13 格式:PPT 页数:61 大小:919KB
返回 下载 相关 举报
10简单回归分析_第1页
第1页 / 共61页
10简单回归分析_第2页
第2页 / 共61页
10简单回归分析_第3页
第3页 / 共61页
10简单回归分析_第4页
第4页 / 共61页
10简单回归分析_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《10简单回归分析》由会员分享,可在线阅读,更多相关《10简单回归分析(61页珍藏版)》请在金锄头文库上搜索。

1、生物医学研究的统计方法 第10章,第 十 章 简 单 回 归 分 析,生物医学研究的统计方法 第10章,第一节 简单线形回归第二节 线形回归的应用,主要内容,生物医学研究的统计方法 第10章,学习目标,了解回归分析的基本思想。 熟悉线性回归的基本步骤;求解回归方程中参数估计量a和b值所遵循的策略最小二乘原则。 掌握简单线性回归的基本概念;回归模型的前提假设;回归系数的含义、计算方法及假设检验。,生物医学研究的统计方法 第10章,教 学 重 点,线性回归模型的前提假设 线性回归分析的基本步骤 回归方程的解释,生物医学研究的统计方法 第10章,第 一节 简 单 线 性 回 归Linear Regr

2、ession Analysis,生物医学研究的统计方法 第10章,为研究大气污染一氧化氮(NO)的浓度是否受到汽车流量、气候状况等因素的影响,选择24个工业水平相近的一个交通点,统计单位时间过往的汽车数(千辆),同时在低空相同高度测定了该时间段平均气温()、空气湿度() 、风速(m/s)以及空气中一氧化氮(NO)的浓度( ),数据如表10-1所示。,【例10.1】,生物医学研究的统计方法 第10章,表10-1 24个城市交通点空气中NO浓度监测数据,生物医学研究的统计方法 第10章,资料类型:定量资料; 研究目的:了解一氧化氮浓度与汽车流量、气候状况等因素之间的依存关系。,【案例解析】,生物医

3、学研究的统计方法 第10章,一、回归分析的基本概念,回归(Regression),变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围,生物医学研究的统计方法 第10章,函数关系:它反映着现象之间严格的数量化依存关系,也称确定性的依存关系。如正方形的面积和边长的关系。,回归关系:变量之间存在着不确定、不严格的依存关系,即对于一个变量的某个数值,可以有另一变量的若干数值与之相对应,在这种关系中,对于变量的每一个数值,都有一个或几个确定的值与之严格对应。,生物医学研究的统计方法 第10章,回归关系的几个

4、例子,父亲身高y与子女身高x之间的关系 收入水平y与受教育程度x之间的关系 体重y与身高x1 、胸围x2 之间的关系 体表面积y与体重x之间的关系 商品销售额y与广告费支出x之间的关系,生物医学研究的统计方法 第10章,回归分析(Regression analysis) 从一组样本数据出发,确定变量之间的数学关系式; 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出具有统计学意义的变量; 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。,生物医学研究的统计方法 第10章,自变量与因变量 自变量(indepe

5、ndent variable) :能独立自由变化的变量一般用X表示 因变量(dependent variable):非独立的、受其它变量影响的变量一般用Y表示 c)x与y确定原则,生物医学研究的统计方法 第10章,回归模型分类a) 按变化趋势:线性回归模型非线性回归模型 按自变量个数:简单线性回归模型多重线性回归模型,生物医学研究的统计方法 第10章,一元线性回归模型描述y 如何依赖于x 和误差项 的方程称为回归模型 一元线性回归模型可表示为y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差项 是随机变量,反映了除 x 和 y 之间的线性关系之外

6、的随机因素对 y 的影响,是不能由 x 和 y 之间的线性关系所解释的变异性 0 和 1 称为模型的参数,生物医学研究的统计方法 第10章,二、简单线性回归分析,回归模型的基本假设,1.线性(linear) 2.独立(independent) 3.正态 (normal) 4.等方差(equal variance),生物医学研究的统计方法 第10章,线性(linear)指反应变量Y的总体平均值与自变量X呈线性关系。 独立(independent)指任意两个观察值互相独立。 正态 (normal)假定线性模型的误差项服从正态分布 。 等方差(equal variance)是指在自变量X取值范围内,

7、不论X取什么值,Y都具有相同的方差。,生物医学研究的统计方法 第10章,图1 回归模型前提假设示意图,生物医学研究的统计方法 第10章,回归分析的方法步骤,绘制散点图,求回归系数和常数项,回归系数和常数项的假设检验,列出回归方程,并进行假设检验,回归方程的解释,生物医学研究的统计方法 第10章,(一)绘制散点图,图2 车流量与空气中NO浓度关系散点图,从散点图可见:车流量与空气中NO浓度有线性关系,可以考虑做线性回归分析。,生物医学研究的统计方法 第10章,(二)求回归系数和常数项,生物医学研究的统计方法 第10章,系数估计公式:,回归方程:,生物医学研究的统计方法 第10章,生物医学研究的统

8、计方法 第10章,本例中 b=0.1584; a=-0.1353,生物医学研究的统计方法 第10章,参数的意义:若自变量X增加1个单位,反应变量Y的平均值便增加个单位。=0,说明Y与X之间并不存在线性关系;0,说明Y与X之间存在线性关系。 理由:从=0的总体抽得样本,计算出的回归系数b很可能不为零。 方法:回归系数的假设检验可通过t检验实现。,(三)回归系数和常数项的假设检验,生物医学研究的统计方法 第10章,t检验,生物医学研究的统计方法 第10章,生物医学研究的统计方法 第10章,(四)回归方程的假设检验,目的:检验求得的回归方程在总体中是否成立; 方法:单因素方差分析。,生物医学研究的统

9、计方法 第10章,因变量 y 的取值是不同的,y 取值的这种波动称为变异。变异来源: 因自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 对一个具体的观测值来说,变异的大小可以通过该实际观测值与其均值之差 来表示,变异(变差)及其分解,生物医学研究的统计方法 第10章,生物医学研究的统计方法 第10章,生物医学研究的统计方法 第10章,SST是指没有利用X的信息时,Y观察值的变异; SSE反应回归方程未能解释的那部分变异; SSR反应回归方程解释的那部分变异。 决定系数(R2)= SSR/ SST,反应了Y的总变异中回归关系所能解释的百分比, R2

10、越大,说明构建的回归方程越好。,生物医学研究的统计方法 第10章,表3 简单线性回归模型方差分析表,生物医学研究的统计方法 第10章,查F界值表,得P0.05,说明构建的回归方程具有统计学意义。研究表明, 车流量和空气中NO浓度存在着线性依存关系:车流量每增加100辆(0.1千辆),空气中NO浓度平均可能增加0.01584,(五)回归方程的解释,生物医学研究的统计方法 第10章,线性回归分析的SPSS过程:,Analyze Regression Linear Dependent list框 Y Independent list框 X1 OK,生物医学研究的统计方法 第10章,线性回归分析的结果

11、:,生物医学研究的统计方法 第10章,第 二 节 线 形 回 归 的 应 用,生物医学研究的统计方法 第10章,一、 总体回归线的95% 置信带 二、个体Y预测值的区间估计,生物医学研究的统计方法 第10章,一、 总体回归线的95% 置信带,生物医学研究的统计方法 第10章,生物医学研究的统计方法 第10章,二、个体Y预测值的区间估计,总体中,当XP为某一固定值时,个体Y值围绕着对应于XP值的总体均数波动,其分布的标准差按下式估计:,生物医学研究的统计方法 第10章,即,生物医学研究的统计方法 第10章,图5 空气中NO浓度(Y)与车流量(X)回归 线的95%置信带与Y个体值的95%预测带,生

12、物医学研究的统计方法 第10章,直线回归方程的应用,(一)定量描述两变量之间的依存关系。 (二)利用回归方程进行预测。 (三)利用回归方程进行统计控制。,生物医学研究的统计方法 第10章,简单线性回归分析的注意事项,1.要注意实际意义; 2.绘制散点图观察两变量的关系以及找出异常点; 3.注意自变量和因变量的变化范围。,生物医学研究的统计方法 第10章,小结,相关分析是用来描述两变量的相关关系,当两变量满足双变量正态分布时,可以计算Pearson积差相关系数,如果有任何一个变量不满足正态分布或为等级资料,需计算Pearson等级相关系数。而回归分析是用来刻画两变量的依存关系,它要求资料满足LI

13、NE(线性、独立、正态和等方差),二者之间既有联系又有区别。,生物医学研究的统计方法 第10章,生物医学研究的统计方法 第10章,生物医学研究的统计方法 第10章,【案例讨论】,年龄与身高预测研究。某地调查了418岁男孩与女孩身高,数据见下表,试描述男孩与女孩身高与年龄间的关系,并预测10.5岁、16.5岁、19岁与20岁男孩与女孩的身高。,表10-4 某地男孩与女孩平均身高与年龄的调查数据,生物医学研究的统计方法 第10章,采用SPSS对身高与年龄进行回归分析,结果如表10-5和表10-6所示。表10-5 男孩身高对年龄的简单线性回归分析结果,?,生物医学研究的统计方法 第10章,?,表12

14、-6 女孩身高对年龄的简单线性回归分析结果,生物医学研究的统计方法 第10章,经拟合简单线性回归模型,t检验结果提示回归方程有非常显著的统计学意义。 结果提示,拟合效果非常好,故可认为:(1)男孩与女孩的平均身高随年龄线性递增,年龄每增长1岁,男孩与女孩身高分别平均增加5.27,4.53,男孩生长速度快于女孩的生长速度。(2)依照回归方程预测该地男孩10.5、16.5、19和20岁的平均身高依次为139.12、170.77、183.96和189.23,该地女孩10.5、16.5、19和20岁的平均身高依次为136.04、163.24、174.58和179.11.,生物医学研究的统计方法 第10

15、章,针对以上分析结果,请考虑:(1)分析过程是否符合回归分析的基本规范?(2)回归模型能反映数据的变化规律吗?(3)拟合结果和依据回归方程而进行的预测有问题吗?(4)男孩生长速度快于女孩生长速度的推断是否有依据?,生物医学研究的统计方法 第10章,案例辨析 未绘制散点图,盲目进行简单线性回归分析;若实际资料反映两变量之间呈现某种曲线变化趋势,用简单线性回归方程去描述其变化规律就是不妥当的。 正确做法 分析策略:作散点图,选择曲线类型,合理选择模型,统计预测。,生物医学研究的统计方法 第10章,图3 身高对年龄的不同曲线类型(女孩),(1)作散点图,生物医学研究的统计方法 第10章,图4 身高对

16、年龄的不同曲线类型(男孩),生物医学研究的统计方法 第10章,由图3,4 可见,随着年龄的增加,身高也增加,但呈曲线变化趋势,1516岁后,增加趋势逐渐趋于平缓。因此适合于拟合曲线回归方程。 (2)选择曲线类型,进行统计分析,几种曲线方程拟合结果如下。,生物医学研究的统计方法 第10章,结果摘要: (1)模型参数估计 Dependent Variable: 男孩身高,The independent variable is 年龄。,生物医学研究的统计方法 第10章,(3)选择合理的模型,列出回归方程。 (4)统计预测。,生物医学研究的统计方法 第10章,思考题,1应用直线回归和相关分析时应注意哪些问题? 2简述线性回归分析与线性相关的区别与联系。 3. 举例说明如何利用回归方程进行统计预测和控制。 4. 回归分析时怎样确定因变量与自变量?,生物医学研究的统计方法 第10章,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号