2018年秋高中数学 第1章 统计案例 1.1 回归分析的基本思想及其初步应用学案 新人教a版选修1-2

上传人:小** 文档编号:93469160 上传时间:2019-07-22 格式:DOC 页数:11 大小:343KB
返回 下载 相关 举报
2018年秋高中数学 第1章 统计案例 1.1 回归分析的基本思想及其初步应用学案 新人教a版选修1-2_第1页
第1页 / 共11页
2018年秋高中数学 第1章 统计案例 1.1 回归分析的基本思想及其初步应用学案 新人教a版选修1-2_第2页
第2页 / 共11页
2018年秋高中数学 第1章 统计案例 1.1 回归分析的基本思想及其初步应用学案 新人教a版选修1-2_第3页
第3页 / 共11页
2018年秋高中数学 第1章 统计案例 1.1 回归分析的基本思想及其初步应用学案 新人教a版选修1-2_第4页
第4页 / 共11页
2018年秋高中数学 第1章 统计案例 1.1 回归分析的基本思想及其初步应用学案 新人教a版选修1-2_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《2018年秋高中数学 第1章 统计案例 1.1 回归分析的基本思想及其初步应用学案 新人教a版选修1-2》由会员分享,可在线阅读,更多相关《2018年秋高中数学 第1章 统计案例 1.1 回归分析的基本思想及其初步应用学案 新人教a版选修1-2(11页珍藏版)》请在金锄头文库上搜索。

1、1.1回归分析的基本思想及其初步应用学习目标:1.了解随机误差、残差、残差图的概念(重点)2.会通过分析残差判断线性回归模型的拟合效果(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法(难点)自 主 预 习探 新 知1回归分析的相关概念(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(2)回归直线方程方程x是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中,是待定参数,其最小二乘估计分别为:其中i,i,(,)称为样本点的中心(3)线性回归模型样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数

2、ybxa来描述它们之间的关系,而是用线性回归模型ybxae来表示,其中a和b为模型的未知参数,e称为随机误差,自变量x称为解释变量,因变量y称为预报变量思考:在线性回归模型ybxae中,e产生的原因主要有哪几种?提示随机误差产生的原因主要有以下几种:(1)所用的确定性函数不恰当引起的误差;(2)忽略了某些因素的影响;(3)存在观测误差2残差的概念对于样本点(x1,y1),(x2,y2),(xn,yn)而言,它们的随机误差为eiyibxia,i1,2,n,其估计值为iyiiyixi,i1,2,n,i称为相应于点(xi,yi)的残差3刻画回归效果的方式残差图作图时纵坐标为残差,横坐标可以选为样本编

3、号,或身高数据,或体重估计值等,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高残差平方和残差平方和为(yii)2,残差平方和越小,模型的拟合效果越好相关指数R2R21,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示模型的拟合效果越好基础自测1思考辨析(1)相关指数R2越小,线性回归方程的拟合效果越好()(2)在线性回归模型中,e是bxa预报真实值y的随机误差,它是一个可观测的量()(3)线性回归方程x必过样本点的中心(,)()答案(1)(2)(3)2甲、乙、丙、

4、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:甲乙丙丁R20.980.780.500.85建立回归模型拟合效果最好的同学是() 【导学号:48662000】A甲B乙C丙 D丁A相关指数R2越大,表示回归模型的拟合效果越好3甲、乙、丙、丁4位同学各自对A、B两变量做回归分析,分别得到散点图与残差平方和(yii)2如表所示:甲乙丙丁散点图残差平方和115106124103_(填“甲”“乙”“丙”“丁”)同学的试验结果体现拟合A、B两变量关系的模型拟合精度高丁根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获

5、取的样本数据,R2表达式中(yi)2为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果就越好,由试验结果知丁要好些4设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中正确的是_(填序号). 【导学号:48662001】(1)y与x具有正的线性相关关系;(2)回归直线过样本点的中心(,);(3)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;(4)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.(1)

6、(2)(3)回归方程中x的系数为0.850,因此y与x具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(,),(2)正确;依据回归方程中的含义可知,x每变化1个单位,相应变化约0.85个单位,(3)正确;用回归方程对总体进行估计不能得到肯定结论,故(4)不正确合 作 探 究攻 重 难求线性回归方程某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图(要求:点要描粗);(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.

7、 【导学号:48662002】解(1)如图:(2)iyi6283105126158,9,4,6282102122344,0.7, 40.792.3,故线性回归方程为0.7x2.3.(3)由(2)中线性回归方程当x9时,0.792.34,预测记忆力为9的同学的判断力约为4.规律方法求线性回归方程的基本步骤:(1)列出散点图,从直观上分析数据间是否存在线性相关关系.(2)计算:(3)代入公式求出x中参数,的值.(4)写出线性回归方程并对实际问题作出估计.提醒:只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.跟踪训练1某种产品的广告费用支出x与销售额y(单元:百万元

8、)之间有如下的对应数据:x/百万元24568y/百万元3040605070(1)画出散点图;(2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额解(1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i12345合计xi2456825yi3040605070250xiyi601603003005601 380x416253664145所以,5,50,145,iyi1 380.于是可得6.5, 506.5517.5.所以所求的线性回归方程为6.5x17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时,6.51017.582.5(百万元),即广告

9、费用支出为10百万元时,销售额大约为82.5百万元线性回归分析为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析. 【导学号:48662003】解(1)散点图如图(51015202530)17.5,(7.258.128.959.9010.911.8)9.487,2 275,iyi1 076.2,计算得,0.183,6.285,所求回归直线方程为0.183x6.285.(2)列表如下:yii0.050.

10、0050.080.0450.040.025yi2.241.370.540.411.412.31所以(yii)20.013 18,(yi)214.678 4.所以,R210.999 1,回归模型的拟合效果较好(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系规律方法“相关指数R2、残差图”在回归分析中的作用1相关指数R2是用来刻画回归效果的,由R21可知

11、,R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好2残差图也是用来刻画回归效果的,判断依据是残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报的精度也越高跟踪训练2关于x与y有如下数据:x24568y3040605070有如下的两个线性模型:(1)6.5x17.5;(2)7x17.试比较哪一个拟合效果更好解由(1)可得yii与yi的关系如下表:yii0.53.5106.50.5yi201010020(yii)2(0.5)2(3.5)2102(6.5)20.52155,(yi)2(20)2(10)2102022021 000.R110.845.由(

12、2)可得yii与yi的关系如下表:yii15893yi201010020(yii)2(1)2(5)282(9)2(3)2180,(yi)2(20)2(10)2102022021 000.R110.82,由于R0.845,R0.82,0.8450.82,RR.(1)的拟合效果好于(2)的拟合效果非线性回归分析探究问题1已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?x123y35.9912.01y32x1; ylog2x;y4x; yx2.提示:观察散点图中样本点的分布规律可判断样本点分布在曲线y32x1附近所以模拟效果最好的为.2如何将上题函数变换为线性函数?提示:将y32

13、x1两边取自然对数得ln yln 3(x1)ln 2.令则原方程变为yln 3xln 2ln 2ln xln 2.这样y与x成线性函数关系为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图,根据散点图判断:yabx与yc1ec2x哪一个作为繁殖的个数y关于时间x变化的回归方程类型为最佳?(给出判断即可,不必说明理由)(xi)2(xi)(yi)(xi)(zi)3.562.833.5317.5596.50512.09其中ziln yi;i.(2)根据(1)的判断最佳结果及表中的数据,建立y关于x的回归方程. 【导学号:48662004】参考公式:,.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号