人教版 高中数学【选修 21】第一章统计案例学案

上传人:人*** 文档编号:512052323 上传时间:2023-09-09 格式:DOC 页数:37 大小:2.20MB
返回 下载 相关 举报
人教版 高中数学【选修 21】第一章统计案例学案_第1页
第1页 / 共37页
人教版 高中数学【选修 21】第一章统计案例学案_第2页
第2页 / 共37页
人教版 高中数学【选修 21】第一章统计案例学案_第3页
第3页 / 共37页
人教版 高中数学【选修 21】第一章统计案例学案_第4页
第4页 / 共37页
人教版 高中数学【选修 21】第一章统计案例学案_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《人教版 高中数学【选修 21】第一章统计案例学案》由会员分享,可在线阅读,更多相关《人教版 高中数学【选修 21】第一章统计案例学案(37页珍藏版)》请在金锄头文库上搜索。

1、人教版高中数学精品资料 高中数学 第一章 统计案例学案 新人教A版选修1-2_1.1回归分析的基本思想及其初步应用线性回归方程导入新知1回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,即自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报2线性回归模型(1)线性回归模型ybxae,其中a和 b是模型的未知参数,e称为随机误差自变量x称为解释变量,因变量y称为预报变量(2)在回归方程x中,.其中i,i

2、, (,)称为样本点的中心化解疑难线性回归方程中系数的含义(1)是回归直线的斜率的估计值,表示x每增加一个单位,y的平均增加单位数,而不是增加单位数(2)当0时,变量y与x具有正的线性相关关系;当0时,变量y与x具有负的线性相关关系.线性回归分析导入新知1残差分析(1)残差:样本点(xn,yn)的随机误差eiyibxia,其估计值为iyiiyixi,i称为相应于点(xi,yi)的残差(residual)(以上i1,2,n)(2)残差图:作图时,纵坐标为残差,横坐标可以选为样本编号,或xi数据,或yi数据,这样作出的图形称为残差图(3)残差分析:残差分析即通过残差发现原始数据中的可疑数据,判断所

3、建立模型的拟合效果,其步骤为:计算残差画残差图在残差图中分析残差特性残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高2相关指数我们可以用相关指数R2来刻画回归的效果,其计算公式是:R21.R2越大,残差平方和(yii)2越小,即模型的拟合效果越好;R2越小,残差平方和(yii)2越大,即模型的拟合效果越差在线性回归模型中,R2的取值范围为0,1,R2表示解释变量对于预报变量变化的贡献率,1R2表示随机误差对于预报变量变化的贡献率R2越接近于1,表示回归的效果越好化解疑难残差分析的注意点在残差图中,可疑数据的特征

4、表现为:(1)个别样本点的残差过大,即大多数的残差点比较均匀地落在水平的带状区域中,而个别残差点偏离该区域过于明显,需要确认在采集这些样本点的过程中是否有人为的错误,如果采集数据有错误,那么需要纠正,然后重新利用线性回归模型拟合数据;如果数据采集没有错误,那么需要寻找其他原因(2)残差图有异常,即残差呈现不随机的规律性,此时需要考虑所采用的线性回归模型是否合适线性回归分析例1炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼时间的关系如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x(0.01

5、%)104180190177147134150191204121y(min)100200210185155135170205235125(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?(2)求回归方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?解(1)以x轴表示含碳量,y轴表示冶炼时间,作散点图如图所示:从图中可以看出,各点散布在一条直线附近,即它们线性相关(2)列出下表,并用科学计算器进行计算:i12345678910xi104180190177147134150191204121yi100200210185155135170205235125xiyi10 4003

6、6 00039 90032 74522 78518 09025 50039 15547 94015 125159.8,172,265 448,iyi287 640设所求的回归方程为x,1.267,30.47.所以所求的回归方程为1.267x30.47.(3)当x160时,1.26716030.47173(min),即冶炼时间大约为173 min.类题通法求线性回归方程的步骤(1)列表表示xi,yi,xiyi;(2)计算 ,iyi;(3)代入公式计算,的值;(4)写出回归直线方程活学活用某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y304060

7、5070(1)试根据数据预报广告费支出1 000万元的销售额;(2)若广告费支出1 000万元的实际销售额为8 500万元,求误差解:(1)从画出的散点图(图略)可看出,这些点在一条直线附近,可以建立销售额y对广告费支出x的线性回归方程由题中数据计算可得5,50,由公式计算得6.5,17.5,所以y对x的线性回归方程为6.5x17.5.因此,对于广告费支出为1 000万元(即10百万元),由线性回归方程可以预报销售额为6.51017.582.5(百万元)(2)8 500万元即85百万元,实际数据与预报值的误差为8582.52.5(百万元)残差分析例2某车间为了规定工时定额,需要确定加工零件所花

8、费的时间,为此进行了10次试验,测得的数据如下:编号12345678910零件数x/个102030405060708090100加工时间y/分626875818995102108115122(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你认为这个模型能较好地刻画零件数和加工时间的关系吗?解(1)根据表中数据画出散点图,如图所示由图可看出,这些点在一条直线附近,可以用线性回归模型来拟合数据计算得加工时间对零件数的线性回归方程为0.668x54.93.残差数据如下表:编号12345残差0.390.290.030.650.67编号678910残差0.010.310.37

9、0.050.27(2)以零件数为横坐标,残差为纵坐标画出残差图如图所示由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好但需注意,由残差图可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误类题通法残差分析应注意的问题利用残差分析研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据然后通过图形来分析残差特性,用残差1,2,n来判断原始数据中是否存在可疑数据,用R2来刻画模型拟合的效果活学活用已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x1416182022y1210

10、753求y关于x的回归直线方程,并说明回归模型拟合效果的好坏解:(1416182022)18,(1210753)7.4,1421621822022221 660,iyi14121610187205223620,所以1.15,7.41.151828.1,所以所求回归直线方程是1.15x28.1.列出残差表:yii00.30.40.10.2yi4.62.60.42.44.4所以(yii)20.3,(yi)253.2,R210.994,所以回归模型的拟合效果很好.非线性回归分析例3在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521试建立y与x之间的回归方程解作出

11、变量y与x之间的散点图如图所示由图可知变量y与x近似地呈反比例函数关系设y,令t,则ykt.由y与x的数据表可得y与t的数据表:t4210.50.25y1612521作出y与t的散点图如图所示由图可知y与t呈近似的线性相关关系又1.55,7.2,iyi94.25,21.312 5,4.134 4,7.24.134 41.550.8,4.134 4t0.8.所以y与x的回归方程是0.8.类题通法非线性回归分析的步骤非线性回归问题有时并不给出经验公式这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变

12、量变换,把问题化为线性回归分析问题,使之得到解决其一般步骤为:活学活用某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式UAebt(b0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V100755540302015101055试求:电压U对时间t的回归方程(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解:对UAebt两边取对数得ln Uln Abt,令yln U,aln A,xt,则yabx,y与x的数据如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.

13、61.6根据表中数据画出散点图,如图所示,从图中可以看出,y与x具有较好的线性相关关系,由表中数据求得5,3.045,由公式计算得0.313,4.61,所以y对x的线性回归方程为0.313x4.61.所以ln 0.313t4.61,即e0.313t4.61e0.313te4.61,因此电压U对时间t的回归方程为e0.313te4.61.典例下列现象的线性相关程度最高的是()A某商店的职工人数与商品销售额之间的相关系数为0.87B流通费用率与商业利润率之间的相关系数为0.94C商品销售额与商业利润率之间的相关系数为0.51D商品销售额与流通费用率之间的相关系数为0.81解析|r|越接近于1,相关程度越高答案B易错防范1本题易错误地认为r越接近于1,相

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号