高考数学总复习 11.4 统计案例课件

上传人:我**** 文档编号:143897729 上传时间:2020-09-03 格式:PPT 页数:61 大小:1.28MB
返回 下载 相关 举报
高考数学总复习 11.4 统计案例课件_第1页
第1页 / 共61页
高考数学总复习 11.4 统计案例课件_第2页
第2页 / 共61页
高考数学总复习 11.4 统计案例课件_第3页
第3页 / 共61页
高考数学总复习 11.4 统计案例课件_第4页
第4页 / 共61页
高考数学总复习 11.4 统计案例课件_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《高考数学总复习 11.4 统计案例课件》由会员分享,可在线阅读,更多相关《高考数学总复习 11.4 统计案例课件(61页珍藏版)》请在金锄头文库上搜索。

1、11.4 统计案例 要点梳理 1.回归分析 (1)定义:对具有 的两个变量进行统计 分析的一种常用方法. (2)随机误差:线性回归模型用y=bx+a+e表示,其 中a和b为模型的 , 称为随机误差. (3)样本点的中心 在具有线性相关关系的数据(x1,y1), (x2,y2), ,(xn,yn)中,回归方程的截距和斜率的最小二乘 估计公式分别为:,相关关系,未知参数,e,基础知识 自主学习,其中 称 为样本点的中心. (4)相关系数,.,r=,当r 0时,表明两个变量 ; 当r 0时,表明两个变量 . r 的绝对值越接近于1,表明两个变量的线性相关性 .r 的绝对值越接近于0时,表明两个变量之

2、间 .通常|r|大于 时,认 为两个变量有很强的线性相关性.,正相关,负相关,越强,几乎不存在线性相关关系,0.75,2.残差分析 (1)总偏差平方和 把每个效应(观测值减去总的平均值)的平方加起来即: . (2)残差 数据点和它回归直线上相应位置的差异(yi- ) 是 的效应,称 为残差. (3)残差平方和 .,随机误差,3.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 ,像这类变量称为分类变量.,(4)相关指数 R2= . R2的值越大,说明残差平方和 ,也就是说模型 的拟合效果越好.在线性回归模型中,R2表示解释变 量对预报变量变化的贡献率,R2越接近于1,表示回 归的效果

3、越好.,越小,不同类别,(2)列联表:列出两个分类变量的 ,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为 22列联表,频数表,构造一个随机变量K2= , 其 中n= 为样本容量. (3)独立性检验 利用随机变量 来确定是否能以一定把握认为“两 个分类变量 ”的方法称为两个分类变量的独 立性检验.,a+b+c+d,K2,有关系,基础自测 1.相关系数度量() A.两个变量之间线性相关关系的强度 B.散点图是否显示有意义的模型 C.两个变量之间是否存在因果关系 D.两个变量之间是否存在关系 解析 相关系数来衡量两个变量之间线

4、性相关关系的强弱.,A,2.甲、乙、丙、丁四位同学各自对A、B两变量的线性 相关性作试验,并用回归分析方法分别求得相关系 数r与残差平方和m如下表:,则哪位同学的试验结果体现A、B两变量更强的线性 相关性?() A.甲B.乙C.丙D.丁 解析 r0且丁最接近1,残差平方和越小,相关性 越高,故选D.,D,3.已知x、y之间的数据如表所示,则回归直线过点() A.(0,0) B.( ,0) C.(0, ) D.( , ) 解析 回归直线过样本点的中心( , ).,D,4.下列说法中正确的有:若r0,则x增大时,y也相应 增大;若r0,则x增大时,y也相应增大;若r=1 或r=-1,则x与y的关系

5、完全对应(有函数关系),在 散点图上各个点均在一条直线上( ) A. B. C. D. 解析 若r0,表示两个相关变量正相关,x增大时,y 也相应增大,故正确.r0,表示两个变量负相关, x增大时,y相应减小,故错误.|r|越接近1,表示两 个变量相关性越高,|r|=1表示两个变量有确定的关系 (即函数关系),故正确.,C,5.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 的(有关,无关). 解析 K2=27.6310.828, 有99.9%的把握认为“打鼾与患心脏病有关”.,有关,题型一 线性回归分析 【例1】

6、假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:,已知 (1)求 , ; (2)对x,y进行线性相关性检验;,x,题型分类 深度剖析,(3)如果x与y具有线性相关关系,求出线性回归方程; (4)估计使用年限为10年时,维修费用约是多少? (1)先根据已知计算相关系数r,判断是否具有相关关系. (2)再利用公式求出回归方程进行回归分析. 解 (1),思维启迪,(2)步骤如下: 作统计假设H0:x与y不具有线性相关关系. n-2=3时,r0.05=0.878. =112.3-545=12.3, =90-542=10, =140.8-125=15.8, r= |r|=0

7、.9870.878,即|r|r0.05, 所以有95%的把握认为“x与y之间具有线性相关关 系”,去求线性回归方程是有意义的.,所以线性回归方程为 =1.23x+0.08. (4)当x=10时, =1.2310+0.08=12.38(万元), 即估计使用10年时,维修费用约为12.38万元. 在解决具体问题时,要先进行相关性检 验,通过检验确认两个变量是否具有线性相关关系. 若它们之间具有相关关系,再求回归方程,否则, 即使求出回归方程也是毫无意义的,而且用其估计和 预测的量也是不可信的.,探究提高,知能迁移1 测得某国10对父子身高(单位:英寸) 如下:,(1)对变量y与x进行相关性检验;

8、(2)如果y与x之间具有线性相关关系,求线性回归 方程; (3)如果父亲的身高为73英寸,估计儿子的身高.,解 (1),因为r的值较大,所以y与x之间具有很强的线性相关 关系. (2)设回归方程为,故所求的回归方程为 =0.464 6x+35.974 7. (3)当x=73时, =0.464 673+35.974 769.9. 所以当父亲身高为73英寸时,估计儿子身高约为69.9 英寸.,题型二 非线性回归分析 【例2】下表是某年美国旧轿车价格的调查资料,以x表示轿车的使用年数,y表示相应的年均价格,求y关于x的回归方程.,由已知表格先画出散点图,可以看出随 着使用年数的增加,轿车的平均价格在

9、递减,但不 在一条直线附近.但据此认为y与x之间具有线性相关 关系是不科学的,要根据图形的形状进行合理转化, 转化成线性关系的变量间的关系.,思维启迪,解 作出散点图如图所示.,可以发现,各点并不是基本处于一条直线附近,因 此,y与x之间应是非线性相关关系.与已学函数图象 比较,用 来刻画题中模型更为合理,令 ,则 ,题中数据变成如下表所示:,相应的散点图如图所示,从图中可以看出,变换的 样本点分布在一条直线附近,因此可以用线性回归 方程拟合.,由表中数据可得r-0.996.|r|0.75.认为x与z之 间具有线性相关关系,由表中数据得 -0.298, 8.165,所以 =-0.298x+8.

10、165,最后回代 =ln ,即 =e-0.298x+8.165为所求. 非线性回归问题有时并不给出经验公式. 这时我们可以画出已知数据的散点图,把它与学过 的各种函数(幂函数、指数函数、对数函数等)图 象作比较,挑选一种跟这些散点拟合得最好的函数, 然后采用适当的变量置换,把问题化为线性回归分 析问题,使之得到解决.,探究提高,知能迁移2 在试验中得到变量y与x的数据如下表:,试求y与x之间的回归方程,当x0=40时,预测y0的值. 解 作散点图如图所示,从散点图可以看出,两个 变量x,y不呈线性相关关系.根据学过的函数知识, 样本点分布的曲线可能有两种情况.,(1)指数函数曲线y=c1 ;

11、(2)二次函数曲线y=c3x2+c4. 对于(1),问题变为如何估计待定参数c1,c2,可通 过对数变换把指数关系变为线性关系,那么令 则,作散点图如图所示.,列表,从图中可以看出x与z有很强的线性相关性. 由表中的数据得到线性回归方程 =0.277x-3.992. 所以,变量y关于x的指数回归方程为 =e0.277x-3.992. 对于(2),问题变为如何估计待定参数c3,c4,那么令 t=x2,则y=c3t+c4. 列表,从图中可以看出,y与t不宜用线性回归方程来拟合.,为比较两个模型的拟合效果,用线性回归模型拟合表 中的数据,可得到y关于t的线性回归方程为 0.357t-177.08.

12、所以,变量y关于x的二次回归方程为 0.357x2-177.08. 利用残差比较两个回归方程的拟合效果.,列表,计算残差平方和 812.759, 13 669.063. 因此,指数模型的拟合效果远远优于二次模型,应 选用指数模型. 所以,当x0=40时,y0=e0.27740-3.9921 197.510.,题型三 独立性检验 【例3】(12分)在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效? (1)先由已知作出调查数据的列联表. (2)再根据列联表画出二维条形图,并进行分析. (3)

13、利用独立性检验作出判断.,思维启迪,解 根据题目所给的数据作出如下的列联表:,4分 根据列联表作出相应的二维条形图,如图所示.,6分,从二维条形图来看,在男人中患色盲的比例 要比在女人中患色盲的比例 要大,其差值为 差值较大,因而我们可以认为“性 别与患色盲是有关的”,8分 根据列联表中所给的数据可以有 a=38,b=442,c=6,d=514,a+b=480,c+d=520, a+c=44,b+d=956,n=1 000, 代入公式K2= 得K2= 10分,由于K2=27.110.828,所以我们有99.9%的把握 认为性别与患色盲有关系. 这个结论只对所调查的480名男人和520名女人有

14、效. 12分 利用图形来判断两个变量之间是否有关 系,可以画出三维柱形图,也可以画出二维条形图, 从图形上只可以粗略地估计两个分类变量的关系, 可以结合所求的数值来进行比较.作图应注意单位统 一、图形准确,但它不能给出我们两个分类变量有 关或无关的精确的可信程度,若要作出精确的判断, 可以作独立性检验的有关计算.,探究提高,知能迁移3 在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动. (1)根据以上数据建立一个22列联表; (2)画

15、出二维条形图; (3)检验休闲方式是否与性别有关,可靠性有多大.,解 (1)22列联表如图:,休闲方式,性别,(2)二维条形图如图:,(3)假设休闲方式与性别无关,则 K2= 所以有理由认为休闲方式与性别无关是不合理的, 即我们有97.5%的把握认为休闲方式与性别有关.,方法与技巧 1.线性回归分析以散点图为基础,具有很强的直观性,有散点图作比较时,拟合效果的好坏可由直观性直接判断,没有散点图时,只须套用公式求r,R2再作判断即可. 2.独立性检验没有直观性,必须依靠K2的观测值k作判断.,思想方法 感悟提高,失误与防范 1.r的大小只说明是否相关并不能说明拟合效果的好坏,R2才是判断拟合效果

16、好坏的依据. 2.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K22.706应判断为没有充分证据显示X与Y有关系,而不能作为小于90%的量化值来判断.,一、选择题 1.下列四个命题: 线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱; 残差平方和越小的模型,模型拟合的效果越好; 用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好; 在推断H:“X与Y有关系”的论述中,用三维柱形图,只要主对角线上两个柱形高度的比值与副对角线上的两个柱形高度的比值相差越大,H成立的可能性就越大.,定时检测,其中真命题的个数是() A.1B.2C.3D.4 解析 r有正负,应为|r|越大,相关性越强. 正确. R2越大,拟合效果越好. 应为高度积的差的绝对值越大,H成立的可能性就 越大,故选A.,A,2.对两个变量y与x进行回归分析,分别选择不同的模型, 它们的相关系数r如下,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 初中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号