高中数学第一章统计案例1.1回归分析的基本思想及初步应用1课件新人教A版.ppt

上传人:新** 文档编号:569985065 上传时间:2024-08-01 格式:PPT 页数:19 大小:419.50KB
返回 下载 相关 举报
高中数学第一章统计案例1.1回归分析的基本思想及初步应用1课件新人教A版.ppt_第1页
第1页 / 共19页
高中数学第一章统计案例1.1回归分析的基本思想及初步应用1课件新人教A版.ppt_第2页
第2页 / 共19页
高中数学第一章统计案例1.1回归分析的基本思想及初步应用1课件新人教A版.ppt_第3页
第3页 / 共19页
高中数学第一章统计案例1.1回归分析的基本思想及初步应用1课件新人教A版.ppt_第4页
第4页 / 共19页
高中数学第一章统计案例1.1回归分析的基本思想及初步应用1课件新人教A版.ppt_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《高中数学第一章统计案例1.1回归分析的基本思想及初步应用1课件新人教A版.ppt》由会员分享,可在线阅读,更多相关《高中数学第一章统计案例1.1回归分析的基本思想及初步应用1课件新人教A版.ppt(19页珍藏版)》请在金锄头文库上搜索。

1、1.1回归分析的基本思想及其初步应用(一)回归分析的基本思想及其初步应用(一)回归直线方程回归直线方程对于两个变量,当对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的自变量取值一定时,因变量的取值带有一定随机性的 两个变量之间的关系叫做两个变量之间的关系叫做相关关系相关关系。2、相关关系的相关关系的定义定义:一一.回顾复习回顾复习1、两个变量的关系、两个变量的关系不确定性关系不确定性关系确定性关系确定性关系函数关系函数关系线性相关线性相关非线性相关非线性相关相关关系相关关系不相关关系不相关关系正相关(增)正相关(增)负相关(减)负相关(减)注:1)对具有相关关系的两个变量进行统计

2、分析的方法叫回归分析。对具有相关关系的两个变量进行统计分析的方法叫回归分析。 2)函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况 如:人的身高与年龄;产品的成本与生产数量如:人的身高与年龄;产品的成本与生产数量如:人的身高与年龄;产品的成本与生产数量如:人的身高与年龄;产品的成本与生产数量 商品的销售额与广告费;家庭的支出与收入。等等商品的销售额与广告费;家庭的支出与收入。等等商品的销售额与广告费;家庭的支出与收入。等等商品的销售额与广告费;家庭的支出与收入。等等问题问题1:正方形的面积:正方形的面

3、积y与正方形的边长与正方形的边长x之间之间 的的函数关系函数关系是是y = x2确定性关系确定性关系问题问题2:某水田水稻产量:某水田水稻产量y与施肥量与施肥量x之间是否有一个确之间是否有一个确 定性的关系?定性的关系?例如:在例如:在 7 块并排、形状大小相同的试验田上进行施肥量对水块并排、形状大小相同的试验田上进行施肥量对水 稻产量影响的试验,得到如下所示的一组数据:稻产量影响的试验,得到如下所示的一组数据:施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455一一.回顾复习回顾复习10 20 30 40 50

4、500450400350300施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy施化肥量施化肥量水稻产量水稻产量10 20 30 40 50500450400350300发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探索探索2:在这些点附近可画直线不止一条,哪条直线最能代表:在这些点附近可画直线不止一条,哪条直线最能代表 x与与y之间的关系呢?之间的关系呢?施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445

5、 450 455xy散点图散点图施化肥量施化肥量水稻产量水稻产量探索探索1:水稻产量:水稻产量y与施肥量与施肥量x之间大致有何规律?之间大致有何规律?对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据其回归直线方程为其回归直线方程为 此直线叫做回归直线。此直线叫做回归直线。其回归方程的截距和斜率的最小二乘估计公式分别为:其回归方程的截距和斜率的最小二乘估计公式分别为:2)、对两个变量进行的线性分析叫做)、对两个变量进行的线性分析叫做线性回归分析线性回归分析。3.线性回归直线方程:线性回归直线方程:最最小小二二乘乘估估计计注:注:1)回归直线方程)回归直线方程 恒过恒过样本中心样本中心

6、点点4.求回归直线方程的步骤:求回归直线方程的步骤:(3)代入公式)代入公式(4)写出直线方程为)写出直线方程为y=bx+a,即为所求的回归直线方程。即为所求的回归直线方程。5.回归分析的基本步骤回归分析的基本步骤:画散点图画散点图求回归方程求回归方程预报、决策预报、决策练习练习1:下表提供了某厂节油降耗技术发行后生产甲产品过程下表提供了某厂节油降耗技术发行后生产甲产品过程中记录的产量中记录的产量x(吨吨)与相应的生产能耗与相应的生产能耗y(吨标准煤吨标准煤)的几组对应数的几组对应数据据.(1)请画出上表数据的散点图;请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出请根据上

7、表提供的数据,用最小二乘法求出y关于关于x的线性的线性回归方程回归方程(3)已知该厂技改前已知该厂技改前100吨甲产品的生产能耗为吨甲产品的生产能耗为90吨标准煤,试吨标准煤,试根据根据(2)求出的线性回归方程,预测生产求出的线性回归方程,预测生产100吨甲产品的生产能吨甲产品的生产能耗比技改前降低多少吨标准煤?耗比技改前降低多少吨标准煤?(参考数值:(参考数值:32.5+43+54+64.566.5)x3456y2.5344.5例例1 1、某大学中随机选取某大学中随机选取8 8名女大学生,其身高和体重数据如名女大学生,其身高和体重数据如下表所示下表所示. .编号编号1 12 23 34 45

8、 56 67 78 8身高身高/cm/cm165165165165157157170170175175165165155155170170体重体重/kg/kg48485757505054546464616143435959(1)画出散点图)画出散点图(2)根据女大学生的身高预报体重的回归方程,)根据女大学生的身高预报体重的回归方程,(3)预报一名身高为)预报一名身高为172cm的女大学生的体重的女大学生的体重.解:解:1.确定变量:确定变量: 由于问题中要求根据身高预报体重,因此选取身高为自变由于问题中要求根据身高预报体重,因此选取身高为自变量量x,体重为因变量,体重为因变量y2. 2. 作散

9、点图;作散点图;3.设回归方程:设回归方程:由散点图可知,样本点呈条状分布,身高和体重有由散点图可知,样本点呈条状分布,身高和体重有较好的线性相关关系,因此可以用线性回归方程来近似的刻画它们之间较好的线性相关关系,因此可以用线性回归方程来近似的刻画它们之间的关系的关系.故设回归直线方程为故设回归直线方程为因此,对于身高因此,对于身高172cm的女大学生,由线性回归方程可以预报其的女大学生,由线性回归方程可以预报其体重为:体重为:是斜率的估计值,说明身高是斜率的估计值,说明身高x每增加每增加1个单位时,个单位时,体重体重y就增加就增加0.849个单位,这表明体重与身高具个单位,这表明体重与身高具

10、有正的线性相关关系有正的线性相关关系.4.4.求回归方程:求回归方程:5.根据回归方程作出预报根据回归方程作出预报.有故所求线性回归方程为:故所求线性回归方程为:思考思考1:如何描述两个变量之间线性相关关系的强弱?如何描述两个变量之间线性相关关系的强弱?1)用相关系数用相关系数r来衡量两个变量之间线性相关关系的强弱来衡量两个变量之间线性相关关系的强弱相关系数相关系数 2)相关系数的性质相关系数的性质: (1)|r|1 (2)正相关;负相关)正相关;负相关 (3)|r|越接近于越接近于1,x与与y相关程度越强;相关程度越强; |r|越接近于越接近于0,x与与y相关程度越弱相关程度越弱问题:问题:

11、达到怎样程度,达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?线性相关呢?它们的相关程度怎样呢?通常:通常:r r-1,-0.75-1,-0.75-负相关很强负相关很强; ; r r0.75,10.75,1正相正相关很强关很强; ; r r-0.75,-0.3-0.75,-0.3-负相关一般负相关一般; ; r r0.3, 0.750.3, 0.75正相关一般正相关一般; ; r r-0.25, 0.25-0.25, 0.25-相关性较弱相关性较弱; ; 注注:通常,通常,r0.75,认为两个变量有很强的相关性,认为两个变量有很强的相关性相关关系的测度相关关系的测度(相关系数取值及其意义

12、)-1.0+1.00-0.5+0.5完全负相关完全负相关完全负相关完全负相关无线性相关无线性相关无线性相关无线性相关完全正相关完全正相关完全正相关完全正相关负相关程度增加负相关程度增加负相关程度增加负相关程度增加r正相关程度增加正相关程度增加正相关程度增加正相关程度增加本例中本例中,由上面公式可求得由上面公式可求得r=0.7980.75表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型 有意义的有意义的.、当、当 时,时,x x与与y y为完全线性相关,它们之间存在确定的函数关系。为完全线性相关,它们之间存在确定的函数关系。

13、、当、当 时,表示时,表示x x与与y y存在着一定的线性相关,存在着一定的线性相关, r r的绝对值越大,越接近于的绝对值越大,越接近于1 1,表示,表示x x与与y y直线相关程度越高,反之越低。直线相关程度越高,反之越低。练习练习2:某种产品的零件数某种产品的零件数x与加工时间与加工时间y之间有如表所示数据之间有如表所示数据:零件数零件数X24568加工时间加工时间y(分分钟钟)3040605070(1)求线性回归方程求线性回归方程;思考思考2:身高为身高为172cm的女大学生的体重一定是的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?吗?如果不是,你能解析一下原

14、因吗?答:身高为答:身高为172cm的女大学生的体重不一定是的女大学生的体重不一定是60.316kg,但一般可以认,但一般可以认为她的体重接近于为她的体重接近于60.316kg或在或在60.316kg 左右。即,用这个回归方程不。即,用这个回归方程不能给出每个身高为能给出每个身高为172cm的女大学生的体重的预测值,只能给出她们平的女大学生的体重的预测值,只能给出她们平均体重的值。均体重的值。 从散点图看到,样本点散布在某一条直线的附近,而不是在一条直线上,从散点图看到,样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数所以不能用一次函数y=bx+a描述它们关系。描述它们关系

15、。 我们可以用下面的线性回归模型来表示:我们可以用下面的线性回归模型来表示:y=bx+a+e, (其中(其中a和和b为模型的未知参数,为模型的未知参数,e称为随机误差)。称为随机误差)。思考思考3:产生随机误差项产生随机误差项e的原因是什么?的原因是什么?随机误差随机误差e e的来源的来源( (可以推广到一般):可以推广到一般):1、其它因素的影响:影响体重y 的因素不只是身高x,可能还包括遗传基因、饮食习惯、生长环境等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高 y 的观测误差。以上三项误差越小,说明我们的回归模型的拟合效果越好。以上三项误差越小,说明我们的回归模型的拟合效果越

16、好。函数模型:回归模型: 函数模型:因变量函数模型:因变量y完全由自变量完全由自变量x确定确定 线性回归模型线性回归模型y=bx+a+e增加了随机误差项增加了随机误差项e,因变量,因变量y的值由自变量的值由自变量x和和随机误差项随机误差项e共同确定,即共同确定,即自变量自变量x只能解析部分只能解析部分y的变化的变化。 在统计中,我们也把自变量在统计中,我们也把自变量x称为解析变量,因变量称为解析变量,因变量y称为预报变量。称为预报变量。因此,一次函数模型是线性回归模型的特殊形式,因此,一次函数模型是线性回归模型的特殊形式, 线性回归模型是一次函数模型的一般形式线性回归模型是一次函数模型的一般形式.思考思考4:函数模型与回归模型之间的差别?函数模型与回归模型之间的差别?1.确定变量;确定变量; 2.作散点图,判断相关关系;作散点图,判断相关关系;3.设回归方程;设回归方程;4.求回归方程;求回归方程;5.根据回归方程作出预报根据回归方程作出预报.小结:线性回归分析的基本步骤:小结:线性回归分析的基本步骤:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题 > 高中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号