数学实验:线性回归

上传人:第** 文档编号:48882150 上传时间:2018-07-21 格式:PPT 页数:82 大小:5.16MB
返回 下载 相关 举报
数学实验:线性回归_第1页
第1页 / 共82页
数学实验:线性回归_第2页
第2页 / 共82页
数学实验:线性回归_第3页
第3页 / 共82页
数学实验:线性回归_第4页
第4页 / 共82页
数学实验:线性回归_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《数学实验:线性回归》由会员分享,可在线阅读,更多相关《数学实验:线性回归(82页珍藏版)》请在金锄头文库上搜索。

1、专题 线性回归模型第一节 相关关系 基本概念第二节 一元线性回归分析第三节 一元回归模型的检验第四节 一元非线性回归分析第五节 多元线性回归分析学习目标 回归分析是一种常用的统计分析方法。 通过本专题的学习要求了解相关的概念、类 型 学会一元线性回归分析方法。 学会非线性回归基本方法 会对多元回归变量进行筛选变量相关的概念变量间的关系 (函数关系) 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完 全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为

2、因变量 各观测点落在一条线上 x xy y变量间的关系 (函数关系) 函数关系的例子函数关系的例子 某种商品的销售额某种商品的销售额( (y y) )与销售量与销售量( (x x) )之间的关之间的关 系可表示为系可表示为 y y = = p p x x ( (p p 为单价为单价) ) 圆的面积圆的面积(S)(S)与半径之间的关系可表示为与半径之间的关系可表示为 S S = = R R2 2 企业的原材料消耗额企业的原材料消耗额( (y y) )与产量与产量( (x x1 1) ) 、单位产单位产 量消耗量消耗( (x x2 2) ) 、原材料价格原材料价格( (x x3 3) )之间的关系

3、可之间的关系可 表示为表示为: : y y = = x x1 1 x x2 2 x x3 3变量间的关系 (相关关系) 变量间有一定关系.各观 测点分布在直线周围 变量间关系不能用函数 关系精确表达 一个变量 y 的取值不能 由另一个变量 x 唯一确 定 x xy y变量间的关系 (相关关系) 相关关系的例子相关关系的例子 商品的消费量商品的消费量( (y y) )与居民收入与居民收入( (x x) )之间的关系之间的关系 (+)(+) 收入水平收入水平( (y y) )与受教育程度与受教育程度( (x x) )之间的关系之间的关系 (+)(+) 父亲身高父亲身高( (y y) )与子女身高与

4、子女身高( (x x) )之间的关系之间的关系 (+)(+) 粮食亩产量粮食亩产量( (y y) )与施肥量与施肥量( (x x1 1) ) 、降雨量、降雨量( (x x2 2) ) 、温度、温度( (x x3 3) )之间的关系之间的关系 学习成绩学习成绩( (y y) )与迟到次数与迟到次数( (x x) ) 之间的关系之间的关系 (-)(-)相关关系的图示 不相关不相关 负线性相关负线性相关 正线性相关正线性相关 非线性相关非线性相关 完全负线性相关完全负线性相关完全正线性相关完全正线性相关 第二节 简单线性回归分析一. 一元线性回归模型二. 参数的最小二乘估计 三. 预测及应用 四.

5、回归方程的显著性检验什么是回归分析? (内容) 从一组样本数据出发,确定变量之间的数学 关系式 对这些关系式的可信程度进行各种统计检验 ,并从影响某一特定变量的诸多变量中找出 哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的 取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度回归模型的类型一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量回归模型多元回归一元回归线性 回归非线性 回归线性 回归非线性 回归回归模型与回归方程 当只涉及一个自变量时称为一元回归 若因变量 y 与自变量 x 之间为线性关系时称为 一元线性回归 对于具有线性关系的两个

6、变量,可以用一条线 性方程来表示它们之间的关系 描述因变量 y 如何依赖于自变量 x 和误差项e 的方程称为回归模型y = 1 x e一元线性回归模型(概念要点)一元线性回归模型(概念要点)一个自变量的简单线性回归模型 y = 1 x e 模型中,y 是 x 的线性函数(部分)加上误差项e 线性部分反映了由于 x 的变化而引起的 y 的 变化 误差项 e 是随机变量 反映了除 x 和 y 之间的线性关系之外的随机因 素对 y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异 性 0 和 1 称为模型的参数一元线性回归模型 (基本假定) 误差项e是一个期望值为0的随机变量,即E(e)=0

7、 E ( y ) = 0+ 1 x 对于所有的 x 值,e的方差2 都相同 误差项e相互独立。独立性意味着对于一个特定的 x 值,它所对应的e与其他 x 值所对应的e不相关回归方程简单线性回归方程的形式如下y = 0+ 1 x 方程的图示是一条直线,因此也称为直线回方程的图示是一条直线,因此也称为直线回 归方程归方程 0 0是回归直线在是回归直线在 y y 轴上的截距,是当轴上的截距,是当 x x=0 =0 时时 y y 的期望值的期望值 1 1是直线的斜率,表示当是直线的斜率,表示当 x x 每变动一个单位每变动一个单位 时,时,y y 的平均变动值的平均变动值 0 0 , , 1 1都称为

8、回归系数都称为回归系数估计(经验)的回归方程3.3. 简单线性回归中估计的回归方程为简单线性回归中估计的回归方程为2. 2. 用样本统计量用样本统计量 和和 代替回归方程中的未知参代替回归方程中的未知参 数数 和和 ,就得到了,就得到了估计的回归方程估计的回归方程1. 1. 总体回归参数总体回归参数 和和 是未知的,必需利用样本数是未知的,必需利用样本数据据 去估计去估计参数 0 和 1 的估计 最小二乘估计 (Least Squares Estmate)最小二乘法(概念要点)1. 1. 使因变量的观察值与估计值之间的离差平方和使因变量的观察值与估计值之间的离差平方和 达到最小来求得达到最小来

9、求得 和和 的方法。即的方法。即2. 2. 用最小二乘法拟合的直线来代表用最小二乘法拟合的直线来代表x x与与y y之间的之间的 关系与实际数据的误差比其他任何直线都小关系与实际数据的误差比其他任何直线都小最小二乘法 (图示)x xy y( (x xn n , , y yn n) )( (x x1 1 , , y y1 1) )( (x x2 2 , , y y2 2) )( (x xi i , , y yi i) )e ei i = = y yi i- -y yi i令最小二乘法(求解)要求最小二乘法( 和 的计算公式) 根据最小二乘法的要求,可得解得根据最小二乘法的要求,可得解得 和和 的

10、标的标 准解如下准解如下若记则上式可记为:一元回归模型的检验相关关系的测度 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简 单相关系数 若相关系数是根据总体全部数据计算的,称 为总体相关系数,记为 若是根据样本数据计算的,则称为样本相关 系数,记为 r(3) 相关系数检验法相关关系的测度 (相关系数) 样本相关系数的计算公式或或化简为化简为相关关系的测度 (相关系数取值及其意义) r 的取值范围是 -1,1 |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系 -1 r r r ,拒绝,拒绝HH0 0 若若 r r =

11、0.05(n-2)=0.553,表明 人均消费金额与人均国民收入之间有十分显著的 线性相关关系例、我国宏观经济中的边际消费倾向分析?提出问题:居民消费在经济的持续发展中有着重要 的作用,居民合理的消费模式和居民适度的消费 规模有利于经济持续健康的增长,而且这也是人 民生活水平的具体体现。什么是影响居民消费支 出的最主要因素?影响因素与消费水平的数量关 系是什么?所得得数量关系的可靠性如何?今后 的发展趋势怎么样? 研究范围:全国各省市2002年城市居民家庭平均每人每年消费的横截面数据模型。数据:从2002年中国统计年鉴中得到 地 区城市居民家庭平均每人每年消费 支出(元) Y城市居民人均年可支

12、配收入( 元) X北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北10284.60 7191.96 5069.28 4710.96 4859.88 5342.64 4973.88 4462.08 10464.00 6042.60 8713.08 4736.52 6631.68 4549.32 5596.32 4504.68 5608.9212463.92 9337.56 6679.68 5234.35 6051.06 6524.52 6260.16 6100.56 13249.80 8177.64 11715.60 6032.40 918

13、9.36 6334.64 7614.36 6245.40 6788.52(接上页数据表)地 区城市居民家庭平均每人每年消费 支出(元) Y 城市居民人均年可支配收入 (元) X 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆5574.72 8988.48 5413.44 5459.64 6360.24 5413.08 4598.28 5827.92 6952.44 5278.04 5064.24 5042.52 6104.92 5636.406958.56 11137.20 7315.32 6822.72 7238.04 6610.80 5944.08 7240.56 8079.12 6330.84 6151.44 6170.52 6067.44 6899.64经济预测之点预测 西部地区的城市居民人均年可支配收入第一步争 取达到1000美元(按当时的汇率即人民币8270元), 代入模型得 第二步再争取达到1500美元(即人民币12405元), 利用所估计的模型可预测这时城市居民可能达到的 人均年消费支出水平回归模型应用一元非线性回归一、指数函数两边取对数,得令引进误差项,则得一元线性回归模型( 10.63 )二、幂函数两边取对数,得令引进误差项,则得一元线性回归模型( 10.65 )三、双曲函数令引进误差项,则得一元线性回

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号