高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3

上传人:小** 文档编号:97733031 上传时间:2019-09-06 格式:DOC 页数:10 大小:13.69MB
返回 下载 相关 举报
高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第1页
第1页 / 共10页
高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第2页
第2页 / 共10页
高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第3页
第3页 / 共10页
高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第4页
第4页 / 共10页
高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3》由会员分享,可在线阅读,更多相关《高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3(10页珍藏版)》请在金锄头文库上搜索。

1、3.1回归分析的基本思想及其初步应用学习目标重点、难点1.能知道用回归分析处理两个变量之间的不确定关系的统计方法2会利用散点图分析两个变量是否存在相关关系会用残差及R2来刻画线性回归模型的拟合效果3能记住建立回归模型的方法和步骤;能知道如何利用线性回归模型求非线性回归模型.重点:建立变量之间的线性回归方程,能根据散点图初步判断两个变量之间是否具有线性关系难点:1.会求线性回归方程2掌握建立回归模型的步骤,会选择回归模型,特别是非线性回归模型.1线性回归模型(1)函数关系是一种_关系,而相关关系是一种_关系(2)回归分析是对具有_关系的两个变量进行统计分析的一种常用方法(3)对于一组具有线性相关

2、关系的数据(x1,y1),(x2,y2),(xn,yn),回归直线的斜率和截距的最小二乘估计公式分别为_其中(,)称为_(4)线性回归模型ybxae,其中e称为_,a和b是模型的未知参数,自变量x称为_,因变量y称为_预习交流1如果记录了x,y的几组数据分别为(0,1),(1,4),(2,7),(3,10),则y关于x的线性回归直线必过点()A(2,2)B(1.5,2)C(1,2) D(1.5,5.5)2残差的概念对于样本点(x1,y1),(x2,y2),(xn,yn)而言,它们的随机误差为ei_,i1,2,n,其估计值为i_,i1,2,n,i称为相应于点(xi,yi)的残差3回归模型拟合效果

3、的刻画类别残差图法残差平方和法R2法特点残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和(yii)2越小,模型的拟合效果越好R2_表示_对于_变化的贡献率,R2越接近于_,表示回归的效果越好预习交流2怎么理解散点图和相关指数的关系?4建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程x)(4)按一定规则(如最小二乘法)估计回归方程中的参

4、数(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等)若存在异常,则检查数据是否有误,或模型是否合适等预习交流3用回归方程求预报值应注意哪些问题?答案:1(1)确定性非确定性(2)相关(3),样本点的中心(4)随机误差解释变量预报变量预习交流1:提示:D2yibxiayiiyixi31解释变量预报变量1预习交流2:提示:散点图可以说明变量间有无线性相关关系,只能粗略地说明两个变量之间关系的密切程度,而相关指数R2能精确地描述两个变量之间的密切程度预习交流3:提示:(1)回归方程只适用于所研究的样本的总体(2)所建立的回归方程一般都有时间性(3)样本的取值范围

5、会影响回归方程的适用范围(4)不能期望回归方程得到的预报值就是预报变量的精确值事实上,它是预报变量的可能取值的平均值在预习中,还有哪些问题需要你在听课时加以关注?请在下列表格中做个备忘吧!我的学困点我的学疑点一、求线性回归方程某工厂18月份某种产品的产量与成本的统计数据见下表:月份12345678产量(吨)5.66.06.16.47.07.58.08.2成本(万元)130136143149157172183188以产量为x,成本为y.(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程思路分析:画出散点图,观察图形的形状得x与y是否具有线性相关关系把数值代入回归系数公式求回

6、归方程某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:x35404550y56412811(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程(方程的斜率保留一个有效数字)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性

7、时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义二、线性回归分析某运动员训练次数与运动成绩之间的数据关系如下:次数(x)3033353739444650成绩(y)3034373942464851(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算R2,并说明其含义思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合的效果和R2的含义1(2011山东高考,文8)某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程x中的为9.4,据此

8、模型预报广告费用为6万元时销售额为()A63.6万元B65.5万元C67.7万元 D72.0万元2在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:x(元)1416182022y(件)1210753且知x与y具有线性相关关系,求出y对x的回归直线方程,并说明拟合效果的好坏“相关指数R2、残差图”在回归分析中的作用:(1)相关指数R2是用来刻画回归效果的,由R21可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高, 回归方程预报精度越高三、非线性回归分

9、析下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值思路分析:先由数值表作出散点图,然后根据散点的形状模拟出近似函数,进而转化为线性函数,由数值表求出回归函数在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521试建立y与x之间的回归方程非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合

10、得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决答案:活动与探究1:解:(1)由表画出散点图,如图所示(2)从图上可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表.序号xiyixyxiyi15.613031.3616 900728.026.013636.0018 496816.036.114337.2120 449872.346.414940.9622 201953.657.015749.0024 6491 099.067.517256.2529 5841 290.078.018364.0033 4891 46

11、4.088.218867.2435 3441 541.654.81 258382.02201 1128 764.56.85,157.25.22.17,157.2522.176.855.39,故线性回归方程为22.17x5.39.迁移与应用:解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关设回归直线为x,由题知42.5,34,则求得3.34(3)42.5161.5.3x161.5.(2)依题意有P(3x161.5)(x30)3x2251.5x4 845324 845.当x42时,P有最大值,约为426.即预测销售单价为42元时,能获得最大日销售利润活动与

12、探究2:解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系(2)39.25,40.875,12 656,13 731,iyi13 180,1.041 5,0.003 875,线性回归方程为1.041 5x0.003 875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适(4)计算得相关指数R20.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的迁移与应用:1.B解析:9.49.1,回归方程为9.4x9.1.令x6,得9.469.165.5(万元)2解:(141618

13、2022)18,(1210753)7.4,1421621822022221 660,122102725232327,iyi14121610187205223620,1.15.7.41.151828.1,回归直线方程为1.15x28.1.列出残差表为:yii00.30.40.10.2yi4.62.60.42.44.4(yii)20.3,(yi)253.2,R210.994.故R20.994说明拟合效果较好活动与探究3:解:(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线yc1ec2x的周围,其中c1,c2为待定的参数(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号