(全国通用)2018高考数学大一轮复习第九篇统计与统计案例第3节变量的相关性与统计案例课件理

上传人:san****019 文档编号:86811265 上传时间:2019-03-25 格式:PPT 页数:47 大小:17.35MB
返回 下载 相关 举报
(全国通用)2018高考数学大一轮复习第九篇统计与统计案例第3节变量的相关性与统计案例课件理_第1页
第1页 / 共47页
(全国通用)2018高考数学大一轮复习第九篇统计与统计案例第3节变量的相关性与统计案例课件理_第2页
第2页 / 共47页
(全国通用)2018高考数学大一轮复习第九篇统计与统计案例第3节变量的相关性与统计案例课件理_第3页
第3页 / 共47页
(全国通用)2018高考数学大一轮复习第九篇统计与统计案例第3节变量的相关性与统计案例课件理_第4页
第4页 / 共47页
(全国通用)2018高考数学大一轮复习第九篇统计与统计案例第3节变量的相关性与统计案例课件理_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《(全国通用)2018高考数学大一轮复习第九篇统计与统计案例第3节变量的相关性与统计案例课件理》由会员分享,可在线阅读,更多相关《(全国通用)2018高考数学大一轮复习第九篇统计与统计案例第3节变量的相关性与统计案例课件理(47页珍藏版)》请在金锄头文库上搜索。

1、第3节 变量的相关性与统计案例,最新考纲,考点专项突破,知识链条完善,解题规范夯实,知识链条完善 把散落的知识连起来,【教材导读】 1.变量的相关关系与变量的函数关系有什么区别? 提示:相关关系是一种不确定关系,函数关系是确定关系. 2.如何判断两个变量间的线性相关关系? 提示:散点图中点的分布从整体上看大致在一条直线附近,或者通过计算相关系数作出判断. 3.独立性检验的基本步骤是什么? 提示:列出22列联表,计算k值,根据临界值表作出结论.,知识梳理,1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. (2

2、)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的这种相关关系为负相关. 2.回归方程与回归分析 (1)线性相关关系与回归直线 如果散点图中点的分布从整体上看大致在 附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. (2)回归方程 最小二乘法:使得样本数据的点到回归直线的 最小的方法叫做最小二乘法.,一条直线,距离的平方和,(3)回归分析 定义:对具有 的两个变量进行统计分析的一种常用方法.,相关关系,正,负,越强,越弱,3.独立性检验 (1)独立性检验的有关概念 分类变量 可用变量的不同“值”表示个体

3、所属的 的变量称为分类变量.,不同类别,22列联表 假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,(2)独立性检验 利用随机变量K2= (其中n=a+b+c+d为样本容量)来判断“两个分类变量有关系”的方法称为独立性检验. 步骤如下:,计算随机变量K2的观测值k,查表确定临界值k0:,如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2k0);否则,就认为在犯错误的概率不超过P(K2k0)的前提下不能 推断“X与Y有关系”.,【拓展提升】 1.线性回归直线的斜率为正(负)时,两个变量正(负)相关. 2.线性回归直线一定

4、经过样本点的中心.,对点自测,1.设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的(如图),以下结论中正确的是( ) (A)x和y正相关 (B)x和y的相关系数为直线l的斜率 (C)x和y的相关系数在-1到0之间 (D)当n为偶数时,分布在l两侧的样本点的个数一定相同,C,解析:根据回归直线可知变量x,y负相关,且由l的斜率知相关系数在 (-1,0)之间.故选C.,2.某饮料店的日销售收入y(百元)与当天的平均气温x()之间有下列5组样本数据,D,解析:负相关,且过样本点的中心(0,2.8),可知为选项D中方程.故选D.,B,(

5、A)68.2 (B)68 (C)69 (D)67,4.某产品的广告费用x与销售额y的统计数据如表:,答案:73.5,5.为了判断中学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22列联表:,则在犯错误的概率不超过 的前提下认为“喜欢足球与性别有关”.,答案:0.005,考点专项突破 在讲练中理解知识,变量的相关性,考点一,解析:完全的线性关系,且为负相关,故其相关系数为-1.故选A.,反思归纳,两个具有相关关系的变量之间,可以从散点图直观看出是否具有较好的线性相关关系,定量的方法就是计算相关系数,相关系数的绝对值越接近1,其线性相关关系越强.,【即时训练】 (2015湖北卷)已知

6、变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) (A)x与y正相关,x与z负相关 (B)x与y正相关,x与z正相关 (C)x与y负相关,x与z负相关 (D)x与y负相关,x与z正相关,解析:由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关,故选C.,回归分析,考点二,【例2】 (2016石家庄质量检测)为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如表:,解: (2)年利润z=x(8.6

7、9-1.23x)-2x=-1.23x2+6.69x, 所以x2.72时,年利润最大.,反思归纳,(1)求回归直线方程要注意正确使用公式、注意题目对精确度的要求;(2)由得出的回归直线方程作出的预测是近似的.,【即时训练】 (2016广东广州质检)某种商品价格与该商品日需求量之间的几组对照数据如表:,(1)求y关于x的线性回归方程;,解: (2)由(1)知当x=40元/kg时, =-0.3240+14.4=1.6(kg), 故当价格x=40元/kg时,日需求量y的预测值为1.6 kg.,独立性检验,考点三,【例3】 导学号 18702548 某商场对甲、乙两种品牌的牛奶进行为期100天的营销活动

8、,为调查这100天的日销售情况,用简单随机抽样抽取10天进行统计,以日销售数量(单位:件)作为样本,样本数据的茎叶图如图.已知该样本中,甲品牌牛奶日销量的平均数为48,乙品牌牛奶日销量的中位数为43,将日销量不低于50件的日期称为畅销日.,(1)求出x,y的值;,(2)以10天的日销量为样本,估计100天的日销量,请完成这两种品牌100天日销量的22列联表,并判断是否有99%的把握认为品牌与畅销日天数有关. 附:K2= (其中n=a+b+c+d为样本容量),反思归纳 (1)统计中要注意表达数据的几个图表:频数分布表、频率分布表、频率分布直方图、茎叶图、列联表等;(2)独立性检验类似反证法,即在

9、假设其无关的情况下,得出其假设成立为小概率事件,从而否定其假设,得出两个分类变量有关,并且得出其结论成立的概率.,【即时训练】 现对某市工薪阶层关于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入的频数分布及对“楼市限购令”赞成人数如表.,由以上统计数据填22列联表并判断是否能够在犯错误的概率不超过0.01的前提下认为月收入以55百元为分界点对“楼市限购令”的态度有差异.,解:22列联表,k= 6.276.635. 所以不能够在犯错误的概率不超过0.01的前提下认为月收入以55百元为分界点对“楼市限购令”的态度有差异.,备选例题,【例1】 (2014全国卷)某地区2007年至2013

10、年农村居民家庭人均纯收入y(单位:千元)的数据如下表:,(1)求y关于t的线性回归方程;,(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.,【例2】 (2015全国卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,(1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?

11、(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;,(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x,根据(2)的结果回答下列问题: 年宣传费x=49时,年销售量及年利润的预报值是多少?,年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为,【例3】 (2016安徽十校二模)为提高学生对读书的重视,让更多的人畅游于书海中,从而获得更多的知识,某高中的校学生会开展了主题为“让阅读成为习惯,让思考伴随人生”的实践活动.校学生会实践部的同学随

12、机抽查了学校的40名高一学生,通过调查他们是喜欢读纸质书还是喜欢读电子书,来了解在校高一学生的读书习惯,得到如下列联表:,(1)根据上表,能否有99%的把握认为是否喜欢读纸质书与性别有关系?,(2)从被抽查的16名不喜欢读纸质书的学生中随机抽取2名学生,求抽到男生人数的分布列及其数学期望E(). 参考公式:K2= ,其中n=a+b+c+d. 下面的临界值供参考:,【例4】 (2016河南许昌二次调研)某校高二年级共有学生1 000名,其中走读生750名,住宿生250名,现采用分层抽样的方法从该年级抽取100名学生进行问卷调查.根据问卷取得了这100名学生每天晚上有效学习时间(单位:分钟)的数据

13、,按照以下区间分为八组:0,30),30,60),60,90),90,120),得到频率分布直方图(部分)如图.,(1)如果把“学生晚上有效学习时间达到两小时”作为是否充分利用时间的标准,对抽取的100名学生,完成下列22列联表;并判断能否在犯错误的概率不超过0.05的前提下认为学生利用时间是否充分与走读、住宿有关?,参考公式:K2= . 参考列表:,解: (1)列联表如表,(2)若在第组、第组、第组中共抽出3人调查影响有效利用时间的原因,记抽到“有效学习时间少于60分钟”的学生人数为X,求X的分布列和数学期望.,解题规范夯实 把典型问题的解决程序化,【典例】 (12分) (2016全国卷) 如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.,(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.,审题指导,满分展示:,答题模板:第一步:得出具有相关关系的两个变量的样本数据; 第二步:利用已知公式求相关系数、回归直线方程的系数,得出回归直线方程; 第三步:利用回归直线方程进行预测,解决实际问题.,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号