高中数学选修12常考题型:回归分析的基本思想及其初步应用

上传人:shaoy****1971 文档编号:108688304 上传时间:2019-10-25 格式:DOC 页数:10 大小:273KB
返回 下载 相关 举报
高中数学选修12常考题型:回归分析的基本思想及其初步应用_第1页
第1页 / 共10页
高中数学选修12常考题型:回归分析的基本思想及其初步应用_第2页
第2页 / 共10页
高中数学选修12常考题型:回归分析的基本思想及其初步应用_第3页
第3页 / 共10页
高中数学选修12常考题型:回归分析的基本思想及其初步应用_第4页
第4页 / 共10页
高中数学选修12常考题型:回归分析的基本思想及其初步应用_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《高中数学选修12常考题型:回归分析的基本思想及其初步应用》由会员分享,可在线阅读,更多相关《高中数学选修12常考题型:回归分析的基本思想及其初步应用(10页珍藏版)》请在金锄头文库上搜索。

1、回归分析的基本思想及其初步应用【知识梳理】1回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,即自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报2线性回归模型(1)线性回归模型ybxae,其中a和 b是模型的未知参数,e称为随机误差自变量x称为解释变量,因变量y称为预报变量(2)在回归方程x中,.其中i,i, (,)称为样本点的中心3残差分析(1)残差:样本点(xn,yn)的随机误差eiyibxi

2、a,其估计值为iyiiyixi,i称为相应于点(xi,yi)的残差(residual)(以上i1,2,n)(2)残差图:作图时,纵坐标为残差,横坐标可以选为样本编号,或xi数据,或yi数据,这样作出的图形称为残差图(3)残差分析:残差分析即通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果,其步骤为:计算残差画残差图在残差图中分析残差特性残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高4相关指数我们可以用相关指数R2来刻画回归的效果,其计算公式是:R21.R2越大,残差平方和(yii)2越小,即模型的拟

3、合效果越好;R2越小,残差平方和(yii)2越大,即模型的拟合效果越差在线性回归模型中,R2的取值范围为0,1,R2表示解释变量对于预报变量变化的贡献率,1R2表示随机误差对于预报变量变化的贡献率R2越接近于1,表示回归的效果越好【常考题型】题型一、线性回归分析【例1】炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼时间的关系如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x(0.01%)104180190177147134150191204121y(min)1002002101851551

4、35170205235125(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?(2)求回归方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?解(1)以x轴表示含碳量,y轴表示冶炼时间,作散点图如图所示:从图中可以看出,各点散布在一条直线附近,即它们线性相关(2)列出下表,并用科学计算器进行计算:i12345678910xi104180190177147134150191204121yi100200210185155135170205235125xiyi10 40036 00039 90032 74522 78518 09025 50039 15547 94015 1251

5、59.8,172,265 448,iyi287 640设所求的回归方程为x,1.267,30.47.所以所求的回归方程为1.267x30.47.(3)当x160时,1.26716030.47173(min),即冶炼时间大约为173 min.【类题通法】求线性回归方程的步骤(1)列表表示xi,yi,xiyi;(2)计算,iyi;(3)代入公式计算,的值;(4)写出回归直线方程【对点训练】某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)试根据数据预报广告费支出1 000万元的销售额;(2)若广告费支出1 000万元的实际销

6、售额为8 500万元,求误差解:(1)从画出的散点图(图略)可看出,这些点在一条直线附近,可以建立销售额y对广告费支出x的线性回归方程由题中数据计算可得5,50,由公式计算得6.5,17.5,所以y对x的线性回归方程为6.5x17.5.因此,对于广告费支出为1 000万元(即10百万元),由线性回归方程可以预报销售额为6.51017.582.5(百万元)(2)8 500万元即85百万元,实际数据与预报值的误差为8582.52.5(百万元)题型二、残差分析【例2】某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:编号12345678910零件数x/个10

7、2030405060708090100加工时间y/分626875818995102108115122(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你认为这个模型能较好地刻画零件数和加工时间的关系吗?解(1)根据表中数据画出散点图,如图所示由图可看出,这些点在一条直线附近,可以用线性回归模型来拟合数据计算得加工时间对零件数的线性回归方程为0.668x54.93.残差数据如下表:编号12345残差0.390.290.030.650.67编号678910残差0.010.310.370.050.27 (2)以零件数为横坐标,残差为纵坐标画出残差图如图所示由图可知,残差点分

8、布较均匀,即用上述回归模型拟合数据效果很好但需注意,由残差图可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误【类题通法】残差分析应注意的问题利用残差分析研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据然后通过图形来分析残差特性,用残差1,2,n来判断原始数据中是否存在可疑数据,用R2来刻画模型拟合的效果【对点训练】已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x1416182022y1210753求y关于x的回归直线方程,并说明回归模型拟合效果的好坏解:(1416182

9、022)18,(1210753)7.4,1421621822022221 660,iyi14121610187205223620,所以1.15,7.41.151828.1,所以所求回归直线方程是1.15x28.1.列出残差表:yii00.30.40.10.2yi4.62.60.42.44.4所以(yii)20.3,(yi)253.2,R210.994,所以回归模型的拟合效果很好.题型三、非线性回归分析【例3】在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521试建立y与x之间的回归方程解作出变量y与x之间的散点图如图所示由图可知变量y与x近似地呈反比例函数关

10、系设y,令t,则ykt.由y与x的数据表可得y与t的数据表:t4210.50.25y1612521作出y与t的散点图如图所示由图可知y与t呈近似的线性相关关系又1.55,7.2,iyi94.25,21.312 5,4.134 4,7.24.134 41.550.8,4.134 4t0.8.所以y与x的回归方程是0.8.【类题通法】非线性回归分析的步骤非线性回归问题有时并不给出经验公式这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决其一般步骤为:【

11、对点训练】某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式UAebt(b0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V100755540302015101055试求:电压U对时间t的回归方程(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解:对UAebt两边取对数得ln Uln Abt,令yln U,aln A,xt,则yabx,y与x的数据如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.6根据表中数据画出散点图,如图所示,从图中可以看出,y

12、与x具有较好的线性相关关系,由表中数据求得5,3.045,由公式计算得0.313,4.61,所以y对x的线性回归方程为0.313x4.61.所以ln 0.313t4.61,即e0.313t4.61e0.313te4.61,因此电压U对时间t的回归方程为e0.313te4.61.【练习反馈】1四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()ABC D解析:选D中y与

13、x负相关而斜率为正,不正确;中y与x正相关而斜率为负,不正确2关于回归分析,下列说法错误的是()A在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B线性相关系数可以是正的也可以是负的C在回归分析中,如果r21或r1,说明x与y之间完全线性相关D样本相关系数r(1,1)解析:选D样本的相关系数应满足1r1.3在研究气温和热茶销售杯数的关系时,若求得相关指数R20.85,则表明气温解释了_的热茶销售杯数变化,而随机误差贡献了剩余的_,所以气温对热茶销售杯数的效应比随机误差的效应大得多解析:由相关指数R2的意义可知,R20.85表明气温解释了85%,而随机误差贡献了剩余的15%.答案:85%15%4若施肥量x(kg)与小麦产量y(kg)之间的回归直线方程为2504x,当施肥量为50 kg时,预计小麦产量为_

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号