2017-2018学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用课件 新人教A版选修2-3

上传人:恋** 文档编号:128624411 上传时间:2020-04-21 格式:PPT 页数:84 大小:3.01MB
返回 下载 相关 举报
2017-2018学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用课件 新人教A版选修2-3_第1页
第1页 / 共84页
2017-2018学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用课件 新人教A版选修2-3_第2页
第2页 / 共84页
2017-2018学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用课件 新人教A版选修2-3_第3页
第3页 / 共84页
2017-2018学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用课件 新人教A版选修2-3_第4页
第4页 / 共84页
2017-2018学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用课件 新人教A版选修2-3_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《2017-2018学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用课件 新人教A版选修2-3》由会员分享,可在线阅读,更多相关《2017-2018学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用课件 新人教A版选修2-3(84页珍藏版)》请在金锄头文库上搜索。

1、第三章统计案例3 1回归分析的基本思想及其初步应用 主题1回归分析的概念及回归方程1 在 必修3 中学习的利用最小二乘法估计计算得出的回归方程是什么 提示 2 在回归方程中与线性回归模型中y bx a e中真实值a b之间是否存在误差 它是否引起预报值与真实值y之间存在误差 提示 在回归方程中 和为斜率和截距的估计值 由于样本不一样 其值可能不一样 所以它们与真实值a b之间存在误差 这种误差会引起预报值与真实值y之间存在误差 结论 回归直线方程1 回归分析 1 函数关系 函数关系是一种 关系 例如正方形的周长C 4a 周长C与边长a之间就是一种确定性关系 对于自变量 边长 的每一个确定的值

2、都有唯一确定的周长与之相对应 确定性 2 相关关系 当自变量取值一定时 因变量的取值带有一定的 的两个变量之间的关系 相关关系是一种 关系 回归分析 对具有相关关系的两个变量进行统计分析的一种常用方法 随机性 非确定性 2 回归直线方程对于一组具有线性相关关系的数据 x1 y1 x2 y2 xn yn 回归直线y bx a的斜率和截距的最小二乘估计公式分别为 其中 称为样本点的中心 微思考 1 现实生活中的两个变量有哪些关系 线性回归模型是用来刻画哪类变量间的模型 提示 现实生活中的两个变量关系主要有确定性关系与非确定性关系 线性回归模型是用来刻画非确定性关系的模型 2 回归分析中 利用线性回

3、归方程求出的函数值是否一定为真实值 提示 不一定是真实值 利用线性回归方程求的值 在很多时候是个预报值 例如 人的体重与身高存在一定的线性关系 但体重除了受身高的影响外 还受其他因素的影响 如饮食 是否喜欢运动等 3 线性回归方程能否用散点图中的某两点来确定 提示 不能用散点图中过某两点的直线方程来作为线性回归方程 由散点图易发现样本点散布在某一条直线附近 而不是一条直线上 不能用一次函数y bx a描述它们之间的关系 因此用线性回归模型y bx a e来表示 其中a b可以由最小二乘法估计 就是a b的估计值 主题2模型拟合效果的衡量1 线性回归模型是函数关系吗 提示 不是 回归模型是刻画一

4、组数据的整体趋势 回归模型中的y由x和随机误差e共同确定 即x只能解释部分y的变化 因此它不是函数关系 2 一个模型建立的好坏一般如何来衡量呢 提示 可以用yi 即残差的值来估计一个模型建立的好坏 当残差越小时 说明模型越好 反之 模型建立的不好 结论 刻画回归模型效果的概率及方法1 相关概念 1 残差 数据点和它在回归直线上相应位置的差i 1 2 3 n 称为相应于点 xi yi 的残差 2 残差图 利用图形来分析残差特性 作图时 为残差 可以选为样本编号 或身高数据 或体重的估计值等 这样作出的图形称为残差图 纵坐标 横坐标 2 回归模型模拟效果的判断方法 合适 越窄 越小 解释变量 预报

5、变量 越好 微思考 1 有时散点图的各点并不集中在一条直线的附近 仍然可以按照求回归直线方程的步骤求回归直线 显然这样的回归直线没有实际意义 用残差能否判断建立的回归模型是否合理 提示 残差能对x y的线性相关性进行检验 残差可以发现原始数据中的可疑数据 如果残差点比较均匀地落在水平的带状区域中说明选用的模型较为合适 2 残差分析与计算R2的值来刻画模型函数的模拟效果有什么区别 提示 残差分析只能从图形中直观感觉上得出结论 而计算R2的值是用数据说话 即一个是从形上 一个是从数上说明 预习自测 1 下列两个变量之间的关系不是函数关系的是 A 角度和它的余弦值B 正方形的边长和面积C 正n边形的

6、边数和内角度数和D 人的年龄和身高 解析 选D 函数关系是两变量之间有确定性的关系 选项A B C都是函数关系 而人的年龄和身高不具备确定性关系 不是函数关系 2 线性回归方程必过定点 A 0 0 B 0 C 0 D 解析 选D 因为 所以 3 线性回归模型y bx a e中 e为随机误差 则E e 解析 由线性回归模型y bx a e定义可知 E e 0 答案 0 4 对某城市进行职工人均工资水平x 千元 与居民人均消费水平y 千元 统计调查后知 y与x具有线性相关关系 满足线性回归方程y 0 6x 1 5 若该城市居民人均消费水平为7 5 千元 则可以估计该城市人均消费额占人均工资收入的百

7、分比约为 解析 因为y与x具有线性相关关系 满足线性回归方程y 0 6x 1 5 该城市居民人均消费水平为y 7 5 由7 5 0 6x 1 5 得x 10 所以可以估计该城市的职工人均工资水平为10 所以可以估计该城市人均消费额占人均工资收入的百分比约为 100 75 答案 75 5 为了对某校高三 1 班9月月考成绩进行分析 在全班同学中随机抽出5位 他们的数学分数 物理分数 化学分数 均已折算为百分制 对应如表 1 求这5位同学中数学和物理分数都不小于85分的概率 2 从散点图分析 y与x z与x之间都有较好的线性相关关系 分别求y与x z与x的线性回归方程 并用相关指数比较所求回归模型

8、的拟合效果 解析 1 这5位同学中数学和物理分数都不小于85分 共有2人 故概率为P 2 设y与x z与x的线性回归方程分别是 根据所给的数据 可以计算出 81 0 8 85 13 86 0 6 85 35 所以 0 8x 13 0 6x 35 所以 02 02 1 2 22 1 2 6 所以 2 2 22 12 02 1 2 10 又y与x z与x的相关指数是R2 1 0 964 R 2 1 0 90 故回归模型 0 8x 13比回归模型 0 6x 35的拟合的效果好 类型一求回归直线方程 典例1 在一段时间内 某种商品的价格x 万元 和需求量y t 之间的一组数据为 1 画出散点图 2 求

9、出y对x的线性回归方程 3 如果价格定为1 9万元 预测需求量大约是多少 解题指南 1 根据表中的数据 在直角坐标系中画出散点图 2 将表中所给的数据代入公式 求出y对x的线性回归方程y bx a 3 当价格定为1 9万元 即x 1 9 代入线性回归方程 即可预测需求量 解析 1 散点图如图所示 2 采用列表的方法计算与 所以y对x的线性回归方程为 28 1 11 5x 3 当x 1 9时 28 1 11 5 1 9 6 25 t 所以价格定为1 9万元时 需求量大约是6 25t 方法总结 求线性回归方程的三个步骤 1 画散点图 由样本点是否呈条状分布来判断两个量是否具有线性相关关系 2 求回

10、归系数 若存在线性相关关系 则求回归系数 3 写方程 写出线性回归方程 并利用线性回归方程进行预测说明 巩固训练 2017 汉口高二检测 某车间为了规定工时定额 需要确定加工零件所花费的时间 为此做了4次试验 得到数据如下 1 在给出坐标系中画出表中数据的散点图 2 求y关于x的回归方程y bx a 3 试预测加工10个零件需要的时间 解析 1 散点图如图所示 2 由题中表格数据得 3 5 3 5 由公式计算得 0 7 1 05 所以所求线性回归方程为 0 7x 1 05 3 当x 10时 0 7 10 1 05 8 05 所以预测加工10个零件需要8 05小时 补偿训练 某个服装店经营某种服

11、装 在某周内获纯利润y 元 与该周每天销售这种服装件数x之间的一组数据关系见表 已知 1 求 2 判断纯利润y 元 与每天销售件数x之间是否线性相关 如果线性相关 求出回归方程 解析 1 2 画出散点图知 y与x有线性相关关系 设回归直线方程 6 4 75 51 36 所以回归方程为 4 75x 51 36 类型二线性回归分析 典例2 1 甲 乙 丙 丁四位同学各自对A B两变量做回归分析 分别得到散点图与残差平方和如下表 哪位同学的试验结果体现拟合A B两变量关系的模型拟合精度高 A 甲B 乙C 丙D 丁 2 为研究质量x 单位 g 对弹簧长度y 单位 cm 的影响 对不同质量的6个物体进行

12、测量 数据如表所示 作出散点图 并求线性回归方程 求出R2 进行残差分析 解题指南 1 可依据残差平方和与回归模型效果的关系处理 2 通过残差表或残差图进行残差分析 解析 1 选D 根据线性相关的知识 散点图中各样本点带状分布越均匀 同时保持残差平方和越小 对于已经获取的样本数据 R2表达式中为确定的数 则残差平方和越小 R2越大 由回归分析建立的线性回归模型的拟合效果越好 由试验结果知丁要好些 2 散点图如图所示 5 10 15 20 25 30 17 5 7 25 8 12 8 95 9 90 10 9 11 8 9 487 2275 1076 2 计算得 0 183 6 285 所求线性

13、回归方程为 0 183x 6 285 列表如下 所以所以 R2 1 0 9991 回归模型的拟合效果较好 由残差表中的数值可以看出第3个样本点的残差比较大 需要确认在采集这个数据的时候是否有人为的错误 如果有的话 需要纠正数据 重新建立回归模型 由表中数据可以看出残差点比较均匀地落在不超过0 15的狭窄的水平带状区域中 说明选用的线性回归模型的精度较高 由以上分析可知 弹簧长度与质量成线性关系 延伸探究 1 第 2 题在条件不变的情况下 画出残差图 解析 如图所示 2 当x 35时 估计y的值 解析 当x 35时 y 6 285 0 183 35 12 69 方法总结 刻画回归效果的三种方式

14、1 残差图法 残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适 2 残差平方和法 残差平方和越小 模型的拟合效果越好 3 R2法 越接近1 表明回归的效果越好 补偿训练 2017 郑州高二检测 收集一只棉铃虫的产卵数y与温度x的几组数据后发现两个变量有相关关系 并按不同的曲线来拟合y与x之间的回归方程 并算出了对应相关指数R2如下表 则这组数据模型的回归方程的最好选择应是 A 19 8x 463 7B e0 27x 3 84C 0 367x2 202D 解析 选B 用相关指数R2来刻画回归效果 R2的值越接近1 说明模型的拟合效果越好 类型三非线性回归分析 典例3 2017 太原高二

15、检测 下表为收集到的一组数据 1 作出x与y的散点图 并猜测x与y之间的关系 2 建立x与y的关系 预报回归模型并计算残差 3 利用所得模型 预报x 40时y的值 解题指南 1 画出散点图 确定两变量x y是否线性相关 由散点图得x y之间的回归模型 2 进行拟合 预报回归模型 求回归方程 解析 1 作出散点图如图 从散点图可以看出x与y不具有线性相关关系 根据已有知识可以发现样本点分布在某一条指数函数曲线y c1的周围 其中c1 c2为待定的参数 2 对两边取对数把指数关系变为线性关系 令z lny 则有变换后的样本点应分布在直线z bx a a lnc1 b c2 的周围 这样就可以利用线

16、性回归模型来建立y与x之间的非线性回归方程了 数据可以转化为 求得回归直线方程为 0 272x 3 849 所以 e0 272x 3 849 残差 3 当x 40时 e0 272x 3 849 1131 方法总结 解决非线性回归问题的方法及步骤 1 确定变量 确定解释变量为x 预报变量为y 2 画散点图 通过观察散点图并与学过的函数 幂函数 指数函数 对数函数 二次函数 作比较 选取拟合效果好的函数模型 3 变量置换 通过变量置换把非线性回归问题转化为线性回归问题 4 分析拟合效果 通过计算相关指数等来判断拟合效果 5 写出非线性回归方程 巩固训练 2017 贵阳高二检测 研究 刹车距离 对于安全行车及分析交通事故责任都有一定的作用 所谓 刹车距离 就是指行驶中的汽车 从刹车开始到停止 由于惯性的作用而又继续向前滑行的一段距离 为了测定某种型号汽车的刹车性能 车速不超过140km h 对这种汽车进行测试 测得的数据如表 1 以车速为x轴 以刹车距离为y轴 在给定坐标系中画出这些数据的散点图 2 观察散点图 估计函数的类型 并确定一个满足这些数据的函数表达式 3 该型号汽车在国道上发生了

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号