2018-2019年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3

上传人:小** 文档编号:93466712 上传时间:2019-07-22 格式:DOC 页数:11 大小:2.16MB
返回 下载 相关 举报
2018-2019年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第1页
第1页 / 共11页
2018-2019年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第2页
第2页 / 共11页
2018-2019年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第3页
第3页 / 共11页
2018-2019年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第4页
第4页 / 共11页
2018-2019年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《2018-2019年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3》由会员分享,可在线阅读,更多相关《2018-2019年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案 新人教a版选修2-3(11页珍藏版)》请在金锄头文库上搜索。

1、31 回归分析的基本思想及其初步应用 教材研读 预习教材P8088,思考以下问题 1什么是回归分析? 2什么是线性回归模型? 要点梳理 1回归分析 (1)回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法 (2)回归方程的相关计算 对于两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)设其回归直线方程为x,其中,是待定参数,由最小二乘法得 , . (3)线性回归模型 线性回归模型,其中a,b为模型的未知参数,通常e为随机变量,称为随机误差x称为解释变量,y称为预报变量 2线性回归分析 (1)残差:对于样本点(xi,yi)(i1,2,n)的随机

2、误差的估计值iyii称为相应于点(xi,yi)的残差,(yii)2称为残差平方和 (2)残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图 (3)R21越接近1,表示回归的效果越好 自我诊断 判断(正确的打“”,错误的打“”) 1残差平方和越小,线性回归方程的拟合效果越好( ) 2在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上( ) 3R2越小,线性回归方程的拟合效果越好( ) 答案 1. 2. 3. 思考:求线性回归方程的步骤是什么? 提示:列表表示xi,yi,xiyi,x; 计算,iyi; 代入公式

3、计算,的值; 写出线性回归方程 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据 x 6 8 10 12 y 2 3 5 6 (1)请画出上表数据的散点图;(要求:点要描粗) (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力 思路导引 先画散点图,再求回归系数,写出方程 解 (1)如图: (2)iyi6283105126158, 9, 4, 6282102122344, 0.7, 40.792.3, 故线性回归方程为0.7x2.3. (3)由(2)中线性回归方程当x9时,0.792.34,预测记

4、忆力为9的同学的判断力约为4. 求线性回归方程的三个步骤 (1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系 (2)求回归系数:若存在线性相关关系,则求回归系数 (3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明 【温馨提示】 对回归直线的四点说明 (1)回归直线过点(,) (2)回归直线的截距a和斜率b都是通过样本估计而得的,存在着误差,这种误差可能导致预报结果的偏差 (3)线性回归方程yabx中的b表示x增加1个单位时,y的平均变化量为b,而a表示y不随x的变化而变化的部分 (4)可以利用线性回归方程yabx预报在x取某个值时,y的估计值 跟踪训练 (链接教

5、材P81例1)某种产品的广告费用支出x与销售额y(单位:百万元)之间有如下的对应数据: x/百万元 2 4 5 6 8 y/百万元 30 40 60 50 70 (1)画出散点图; (2)求线性回归方程; (3)试预测广告费用支出为10百万元时的销售额 解 (1)散点图如图所示: (2)列出下表,并用科学计算器进行有关计算: i 1 2 3 4 5 合计 xi 2 4 5 6 8 25 yi 30 40 60 50 70 250 xiyi 60 160 300 300 560 1380 x 4 16 25 36 64 145 所以,5,50,x145, xiyi1380. 于是可得6.5, 5

6、06.5517.5. 所以所求的线性回归方程为6.5x17.5. (3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时, 6.51017.582.5(百万元), 即广告费用支出为10百万元时,销售额大约为82.5百万元 题型二 线性回归分析 思考:如何用残差图、残差平方和、相关指数R2分析模型拟合效果? 提示:残差图的带状区域的宽度越窄,模型拟合精度越高;残差平方和越小,模型拟合效果越好;R2越接近于1,模型拟合效果越好 假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下: x 15.0 25.8 30.0 36.6 44.4 y 39.4 42.9 42.9

7、 43.1 49.2 (1)以x为解释变量,y为预报变量,作出散点图; (2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗; (3)计算各组残差,并计算残差平方和; (4)求R2,并说明残差变量对有效穗的影响占百分之几? 解 (1)散点图如下 (2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系 设回归方程为x,30.36,43.5, x5101.56,y9511.43. 1320.66,2921.7296, xiyi6746.76. 则0.29,34.70. 故所求的回归直线方程为0.29x34.70. 当x5

8、6.7时,0.2956.734.7051.143. 估计成熟期有效穗为51.143. (3)由于ixi,可以算得iyii分别为10.35,20.718,30.5,42.214,51.624,残差平方和:8.43. (4)(yi)250.18,故R210.832.所以解释变量小麦基本苗数对总效应约贡献了83.2%,残差变量贡献了约183.2%16.8%. (1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差1,2,n来判断模型拟合的效果 (2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归

9、方程预报精确度越高 跟踪训练 为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示: x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8 (1)作出散点图并求线性回归方程 (2)求出R2. (3)进行残差分析 解 (1)作出散点图如图所示: (51015202530)17.5. (7.258.128.959.9010.911.8)9.487, x2275,xiyi1076.2, 计算得,0.183,6.285, 所求回归直线方程为6.2850.183x. (2)列表如下: yii 0.05 0.0

10、05 0.08 0.045 0.04 0.025 yi 2.24 1.37 0.54 0.41 1.41 2.31 所以(yii)20.01318, (yi)214.6784. 所以,R210.9991. 所以回归模型的拟合效果较好 (3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量具有线性关系 (链接教材P86例2)某地区六年来轻工业产品利润总额y与年次x的试

11、验数据如下表所示: 年次x 1 2 3 4 5 6 利润总额y 11.35 11.85 12.44 13.07 13.59 14.41 由经验知,年次x与利润总额y(单位:亿元)近似有如下关系:yabxe0.其中a,b均为正数,求y关于x的回归方程 思路导引 解答此题可根据散点图选择恰当的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可 解 对yabxe0两边取自然对数,得lnylnae0xlnb,令zlny,则z与x的数据如下表: x 1 2 3 4 5 6 z 2.43 2.47 2.52 2.57 2.61 2.67 由zl

12、nae0xlnb及最小二乘法公式,得 lnb0.0477,lnae02.378, 即2.3780.0477x,故10.81.05x. 非线性回归问题的处理方法 一般地,有些非线性回归模型通过变换可以转化为线性回归模型,即借助于线性回归模型研究呈非线性回归关系的两个变量之间的关系: (1)如果散点图中的点分布在一个直线状带形区域,可以选用线性回归模型来建模; (2)如果散点图中的点分布在一个曲线状带形区域,要先对变量作适当的变换,再利用线性回归模型来建模 (3)非线性回归方程的求法: 根据原始数据(x,y)作出散点图; 根据散点图,选择恰当的拟合函数; 作恰当的变换,将其转化成线性函数,求线性回

13、归方程; 在的基础上通过相应的变换,即可得非线性回归方程 (4)非线性相关问题常见的几种线性变换: 在实际问题中,常常要根据一批实验数据绘出曲线,当曲线类型不具备线性相关关系时,可以根据散点分布的形状与已知函数的图象进行比较,确定曲线的类型,再作变量替换,将曲线改为直线下面是几种容易通过变量替换转化为直线的函数模型: ya,令yy,x,则有yabx; yaxb,令ylny,xlnx,alna,则有yabx; yaebx,令ylny,xx,alna,则有yabx; yae,令ylny,x,alna,则有yabx; yablnx,令yy,xlnx,则有yabx; ybx2a,令yy,xx2,则有y

14、bxa. 跟踪训练 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值 (xi )2 (wi )2 (xi )(yi) (wi )(yi) 46.6 563 6.8 289.8 1.6 1469 108.8 表中wi,wi. (1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程 (3)已

15、知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题: 年宣传费x49时,年销售量及年利润的预报值是多少? 年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归线vu的斜率和截距的最小二乘估计分别为:,. 解 (1)由散点图的变化趋势可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型 (2)令w,先建立y关于w的线性回归方程 由于68, 563686.8100.6, 所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668. (3)由(2)知,当x49时,年销售量y的预报值100.668576.6, 年利润z的预报值576.60.24966.32. 根据(2)的结果知,年利润z的预报值 0.2(100.668)xx13.620.12. 所以当6.8,即x46.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号