高中数学:1.1回归分析 学案 (北师大选修1-2)

上传人:小** 文档编号:57510980 上传时间:2018-10-22 格式:DOC 页数:9 大小:745KB
返回 下载 相关 举报
高中数学:1.1回归分析 学案 (北师大选修1-2)_第1页
第1页 / 共9页
高中数学:1.1回归分析 学案 (北师大选修1-2)_第2页
第2页 / 共9页
高中数学:1.1回归分析 学案 (北师大选修1-2)_第3页
第3页 / 共9页
高中数学:1.1回归分析 学案 (北师大选修1-2)_第4页
第4页 / 共9页
高中数学:1.1回归分析 学案 (北师大选修1-2)_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《高中数学:1.1回归分析 学案 (北师大选修1-2)》由会员分享,可在线阅读,更多相关《高中数学:1.1回归分析 学案 (北师大选修1-2)(9页珍藏版)》请在金锄头文库上搜索。

1、1.1 回归分析自学目标自学目标 (1)通过实例引入线性回归模型,感受产生随机误差的原因; (2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问 题的线性回归方程 重点,难点重点,难点 线性回归模型的建立和线性回归系数的最佳估计值的探求方法 学习过程学习过程 一问题情境1 情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计 当 x=时的位置 y 的值时刻x/s12345678位置观测值y/cm5.547.5210.0211.7315.6916.1216.9821.06根据数学3(必修) 中的有关内容,解决这个问题的方法是:

2、先作散点图,如下图所示: 从散点图中可以看出,样本点呈直线趋势,时间x与位置观测值 y 之间有着较好的线性 关系因此可以用线性回归方程来刻画它们之间的关系根据线性回归的系数公式,1221( )nii i ni ix ynxy b xn xaybx 可以得到线性回归方为$3.53612.1214yx,所以当9x 时,由线性回归方程可以估计其位置值为$22.6287y 2问题:在时刻9x 时,质点的运动位置一定是22.6287cm吗?来源:学+科+网 Z+X+X+K 二学生活动 思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x与y之 间的关系,y的值不能由x完全确定,它们之间是统

3、计相关关系,y的实际值与估计值 之间存在着误差 三建构数学 1线性回归模型的定义:我们将用于估计y值的线性函数abx作为确定性函数; y的实际值与估计值之间的误差记为,称之为随机误差;将yabx称为线性回归模型说明:(1)产生随机误差的主要原因有: 所用的确定性函数不恰当引起的误差; 忽略了某些因素的影响; 存在观测误差(2)对于线性回归模型,我们应该考虑下面两个问题:模型是否合理(这个问题在下一节课解决) ;在模型合理的情况下,如何估计a,b? 2探求线性回归系数的最佳估计值:对于问题,设有n对观测数据( ,)iix y(1,2,3, )inL,根据线性回归模型,对于每一个ix,对应的随机误

4、差项()iiiyabx,我们希望总误差越小越好,即要使21ni i越小越好所以,只要求出使21( ,)()nii iQyx 取得最小值时的,值作为a,b的估计值,记为$a,b$注:这里的i就是拟合直线上的点,iix abx到点,iiiP x y的距离用什么方法求$a,b$?回忆数学 3(必修) “24 线性回归方程”P71“热茶问题”中求a,b的方法: 最小二乘法利用最小二乘法可以得到$a,b$的计算公式为$1122211()()()( )nniiii ii nnii iixxyyx ynxy b xxxn xaybx $,来源:Z#xx#k.Com其中11ni ixxn,11ni iyyn由

5、此得到的直线$yabx$就称为这n对数据的回归直线,此直线方程即为线性回归方程其中$a,b$分别为a,b的估计值,$a称为回归截距,b$称为回归系数,$y称为回归值在前面质点运动的线性回归方程$3.53612.1214yx中,$3.5361a ,2.1214b $3 线性回归方程$yabx$中$a,b$的意义是:以$a为基数,x每增加 1 个单位,y相应地平均增加b$个单位;4 化归思想(转化思想) 在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业 知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为 线性回归方程,从而确定未知参数下面列举出一些

6、常见的曲线方程,并给出相应的化为线性回归方程的换元公式(1)byax,令 yy,1 xx,则有yabx来源:Zxxk.Com(2)byax,令lnyy,lnxx,lnaa,则有yabx(3)bxyae,令lnyy, xx,lnaa,则有yabx(4)b xyae,令lnyy,1 xx,lnaa,则有yabx(5)lnyabx,令 yy,lnxx,则有yabx四数学运用 1例题:例 1下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国 2004年的人口数年份1949 1954 1959 1964 1969 1974 1979 1984 1989 1994 1999人口数/

7、百万54260367270580790997510351107 11771246解:为了简化数据,先将年份减去1949,并将所得值用x表示,对应人口数用y表示,得到下面的数据表: x05101520253035404550y5426036727058079099751035110711771246 来源:Zxxk.Com作出11个点, x y构成的散点图, 由图可知,这些点在一条直线 附近,可以用线性回归模型yabx来表示它们之间的关系 根据公式(1)可得$14.453,527.591.ba$这里的$, a b$分别为, a b的估计值,因此线性回归方程为$527.591 14.453yx由于

8、2004年对应的55x ,代入线性回归方程$527.591 14.453yx可得$1322.506y (百万) ,即2004年的人口总数估计为 13.23 亿.例 2 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的 人均资本x(万元)与人均产出y(万元)的数据:人均 资本 x/万元345.56.578910.511.514人均 产出y/万元4.124.678.6811.0113.0414.4317.5025.4626.6645.20(1)设y与x之间具有近似关系byax(, a b为常数) ,试根据表中数据估计a和b的值;(2)估计企业人均资本为16万元时的人均产出(精

9、确到0.01) 分析:根据x,y所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理但由对数运算的性质可知,只要对byax的两边取对数,就能将其转化为线性关系解(1)在byax的两边取常用对数,可得lglglgyabx,设lg yz,lgaA,lg xX,则zAbX相关数据计算如图327所示仿照问题情境可得A,b的估计值A,b$分别为0.2155,1.5677,Ab $由$lg0.2155a 可得$0.6088a ,即a,b的估计值分别为0.6088和1.5677(2)由(1)知$1.56770.6088yx样本数据及回归曲线的图形如图328(见书本102P 页)当16x 时,

10、$1.56770.6088 1647.01y (万元) ,故当企业人均资本为16万元时,ABCDEFGHIJK1人均资 本x/万 元345.56.578910.511.5142人均产 出y/万 元4.124.678.6811.0113.0414.4317.525.4626.6645.23lgXx0.477120.602060.740360.812910.84510.903090.954241.021191.06071.146134lgzy0.61490.669320.938521.041791.115281.159271.243041.405861.425861.65514人均产值约为47.0

11、1万元回归分析(2)自学目标自学目标 (1)通过实例了解相关系数的概念和性质,感受相关性检验的作用; (2)能对相关系数进行显著性检验,并解决简单的回归分析问题; (3)进一步了解回归的基本思想、方法及初步应用 重点,难点重点,难点 相关系数的性质及其显著性检验的基本思想、操作步骤 学习过程学习过程 一问题情境 1情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可 以用作预测和估计吗? 来源来源: :学学* *科科* *网网 2问题:思考、讨论:求得的线性回归方程是否有实际意义 二学生活动 对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线 性回

12、归方程未必有实际意义左图中的散点明显不在一条直线附近,不能进行线性拟合, 求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可 以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确 地刻画线性相关关系呢? 这就是上节课提到的问题,即模型的合理性问题为了回答这个问题,我们需要 对变量x与y的线性相关性进行检验(简称相关性检验) 三建构数学 1相关系数的计算公式:对于x,y随机取到的n对数据( ,)iix y(1,2,3, )inL,样本相关系数r的计算公式为112222221111()()()()( ) )( ) )nniiii iinnnniii

13、i iiiixxyyx ynxy rxxyyxn xyn y 22相关系数r的性质:(1)| 1r ;0246810051015系列10246810051015系列1(2)|r越接近与 1,x,y的线性相关程度越强;(3)|r越接近与 0,x,y的线性相关程度越弱可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关 3对相关系数r进行显著性检验的步骤:相关系数r的绝对值与 1 接近到什么程度才表明利用线性回归模型比较合理呢?这需 要对相关系数r进行显著性检验 对此,在统计上有明确的检验方法,基本步骤是:(1)提出统计假设0H:变量x,y不具有线性相关关系;(2)如果以95%的把握作出

14、推断,那么可以根据1 0.950.05与2n(n是样本容量)在附录2(教材 P111)中查出一个r的临界值0.05r(其中1 0.950.05称为检验水平) ; (3)计算样本相关系数r;(4)作出统计推断:若0.05|rr,则否定0H,表明有95%的把握认为变量y与x之间具有线性相关关系;若0.05|rr,则没有理由拒绝0H,即就目前数据而言,没有充分理由认为变量y与x之间具有线性相关关系说明:1对相关系数r进行显著性检验,一般取检验水平0.05,即可靠程度 为95% 2这里的r指的是线性相关系数,r的绝对值很小,只是说明线性相关程度低,不一定 不相关,可能是非线性相关的某种关系3这里的r是

15、对抽样数据而言的有时即使| 1r ,两者也不一定是线性相关的故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释 4对于上节课的例 1,可按下面的过程进行检验:(1)作统计假设0H:x与y不具有线性相关关系;(2)由检验水平0.05与29n在附录2中查得0.050.602r;(3)根据公式 2得相关系数0.998r ;(4)因为0.9980.602r ,即0.05rr,所以有95的把握认为x与y之间具有线性相关关系,线性回归方程为$527.591 14.453yx是有意义的四数学运用 1例题:例 1下表是随机抽取的8对母女的身高数据,试根据这些数据探讨y与x之间的关系母亲身高/x cm154157158159160161162163女儿身高/y cm155156159162161164 来源:学科网165166解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近, 因为154 1571638159.25x

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号