(全国通用)2018高考数学 9.4 变量间的相关关系与统计案例课件

上传人:san****019 文档编号:86825784 上传时间:2019-03-25 格式:PPT 页数:81 大小:1.54MB
返回 下载 相关 举报
(全国通用)2018高考数学 9.4 变量间的相关关系与统计案例课件_第1页
第1页 / 共81页
(全国通用)2018高考数学 9.4 变量间的相关关系与统计案例课件_第2页
第2页 / 共81页
(全国通用)2018高考数学 9.4 变量间的相关关系与统计案例课件_第3页
第3页 / 共81页
(全国通用)2018高考数学 9.4 变量间的相关关系与统计案例课件_第4页
第4页 / 共81页
(全国通用)2018高考数学 9.4 变量间的相关关系与统计案例课件_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《(全国通用)2018高考数学 9.4 变量间的相关关系与统计案例课件》由会员分享,可在线阅读,更多相关《(全国通用)2018高考数学 9.4 变量间的相关关系与统计案例课件(81页珍藏版)》请在金锄头文库上搜索。

1、第四节 变量间的相关关系与统计案例,【知识梳理】 1.必会知识 教材回扣 填一填 (1)回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方 法;判断相关性的常用统计图是:_;统计量有:_(取 值范围-1,1)、相关指数等.,散点图,相关系数,(2)线性回归方程 两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为 其中, 是回归方程的_, 是在y轴上的截距.,斜率,(3)独立性检验 22列联表: 假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为:,a+b,b+d,K2统计量: K

2、2= (其中n=a+b+c+d为样本容量).,2.必备结论 教材提炼 记一记 (1)从散点图看相关性: 正相关:样本点分布在从_的区域内; 负相关:样本点分布在从_的区域内.,左下角到右上角,左上角到右下角,(2)从相关系数看相关性: 当r0时,表明两个变量正相关; 当r0.75时具有较强的相关性.,越弱,越强,(3)从相关指数看相关性: R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好. 3.必用技法 核心总结 看一看 统计思想的应用:结论都是估计结果,不是精确结果.,【小题快练】 1

3、.思考辨析 静心思考 判一判 (1)相关关系的两个变量是非确定关系.( ) (2)散点图中的点越集中,两个变量的线性相关性越强.( ) (3)对于分类变量X与Y,它们的随机变量K2的观测值越小.“X与Y有关联”的把握程度越大.( ),【解析】(1)正确.相关关系不是确定关系. (2)错误.散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线性分布时,两个变量相关关系越强. (3)错误.K2越大,“X与Y有关联”的把握程度越大. 答案:(1) (2) (3),2.教材改编 链接教材 练一练 (1)(选修2-3P81例1改编)若8名学生的身高和体重数据如下表:,第3名学生的体重漏填,但线

4、性回归方程是 =0.849x-85.712,则第3名学生的体重估计为 .,【解析】设第3名学生的体重为a,根据样本点的中心一定在回归 直线上,可得 解得a50. 答案:50 kg,(2)(选修2-3P97习题3.2T1改编)为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的22列联表:,则在犯错误的概率不超过 的前提下认为喜爱打篮球与性别 有关. 附:K2=,【解析】由公式可得K28.3337.879,故填0.005. 答案:0.005,3.真题小试 感悟考题 试一试 (1)(2014湖北高考)根据如下样本数据,得到的回归方程为 =bx+a,则( ) A.a0

5、,b0,b0 C.a0,【解析】选A.画出散点图如图所示,y的值大致随x的增加而减小,所以b0.,(2)(2015兰州模拟)如表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数 据,根据表提供的数据,求出y关于x的线性回归方程为 =0.7x+0.35, 则下列结论错误的是( ),A.产品的生产能耗与产量呈正相关 B.t的取值必定是3.15 C.回归直线一定过(4.5,3.5) D.A产品每多生产1吨,则相应的生产能耗约增加0.7吨,【解析】选B.由题意, 因为 =0.7x+0.35, 所以 =0.74.5+0.35=3.5, 所以t=43.

6、5-2.5-4-4.5=3,故选B.,(3)(2015泉州模拟)已知某产品连续4个月的广告费用x1(千元) 与销售额y1(万元),经过对这些数据的处理,得到如下数据信息: 广告费用x和销售额y之间具有较强的线性相关关系; 回归直线方程 中的 =0.8(用最小二乘法求得). 那么,广告费用为6千元时,可预测销售额约为( ) A.3.5万元 B.4.7万元 C.4.9万元 D.6.5万元,【解析】选B.因为 所以 因为回归直线方程 所以 所以 x=6时,可预测销售额约为4.7万元.故选B.,考点1 相关关系的判断 【典例1】(1)已知变量x,y呈线性相关关系,回归方程为 =0.5+2x,则变量x,

7、y呈( ) A.线性正相关关系 B.由回归方程无法判断其正负相关 C.线性负相关关系 D.非常强的相关关系,(2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:,则哪位同学的试验结果体现A、B两变量有更强的线性相关性( ) A.甲 B.乙 C.丙 D.丁 【解题提示】(1)看随x的变化y的变化趋势. (2)利用相关系数和残差平方和的意义判断.,【规范解答】(1)选A.因为 =20,所以变量x,y呈线性正相关关系. (2)选D.在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关

8、系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性,故选D.,【互动探究】题(1)中,x增加3个单位,y的变化是 . 【解析】因为是正相关关系,所以y增加6个单位. 答案:增加6个单位,【规律方法】线性相关关系与函数关系的区别 (1)函数关系中的两个变量间是一种确定性关系.例如,正方形面积S与边长x之间的关系S=x2就是函数关系. (2)相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如,商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提.,【变式训练】1.两个变量y与x的回归模型中

9、,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是( ) A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 【解析】选A.相关指数R2越大,拟合效果越好.,2.对于给定的两个变量的统计数据,下列说法正确的是( ) A.都可以分析出两个变量的关系 B.都可以用一条直线近似表示两者的关系 C.都可以作出散点图 D.都可以用确定的表达式表示两者的关系 【解析】选C.给出一组样本数据,总可以作出相应的散点图,故C正确,但不一定能分析出两个变量的关系,故A不正确,更不一定符合线性相关,不

10、一定用一条直线近似表示,故B不正确,两个变量的统计数据不一定有函数关系,故D不正确.故选C.,【加固训练】1.下列命题:线性回归方法就是由样本点去寻找一 条贴近这些样本点的直线的数学方法;利用样本点的散点图可以 直观判断两个变量的关系是否可以用线性关系表示;通过回归直 线 及回归系数 ,可以估计和预测变量的取值和变化趋 势.其中正确的命题是( ) A. B. C. D.,【解析】选D.线性回归方法就是由样本点去寻找一条贴近这些样本点 的直线的数学方法,找拟合效果最好的直线,故正确,利用样本点的 散点图可以直观判断两个变量的关系是否可以用线性关系表示,正 确,通过回归直线 及回归系数 ,可以估计

11、和预测变量的取值和变化趋势,正确,综上可知正确,故选D.,2.某棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如表所示的一组数据(单位:kg).,(1)画出散点图. (2)判断是否具有相关关系.,【解析】(1)散点图如图所示.,(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与棉花产量y具有线性相关关系.,考点2 独立性检验 【典例2】(1)某高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如表:,为了判断主修统计专业是否与性别有关系,根据表中的数据,得到 K2= 4.844. 因为K23.84

12、1,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 .,(2)(2014辽宁高考改编)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:,根据表中数据,问是否在犯错误的概率不超过5%的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”. 已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. 附:K2=,【解题提示】(1)对照临界值表判断. (2)代入公式求出K2值再判断;利用古典概型的概率公式求解.,【规范解答】(1)因为P(K23.841)=0.05,4.8

13、443.841, 所以判断出错的可能性不超过5%. 答案:不超过5% (2)将22列联表中的数据代入计算公式, 得K2= 由于4.7623.841,所以在犯错误的概率不超过5%的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.,从5名数学系学生中抽取3人的一切可能结果所组成的基本事件为下列10个: (a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2), (a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3), (a2,b2,b3),(b1,b2,b3),其中ai(i=1,2)表示喜欢甜品的学生,bj(j=1,2,

14、3)表示不喜欢甜品的学生, 这10个基本事件的出现是等可能的. 抽取3人,至多有1人喜欢甜品的事件为以下7个: (a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2), (a2,b1,b3),(a2,b2,b3),(b1,b2,b3), 从这5名学生中随机抽取3人,至多有1人喜欢甜品的概率为,【规律方法】解独立性检验的应用问题的关注点 (1)两个明确: 明确两类主体. 明确研究的两个问题. (2)两个关键: 准确画出22列联表; 准确理解K2. 提醒:准确计算K2的值是正确判断的前提.,【变式训练】(2014安徽高考改编)某高校共有学生15000人,其中男生10

15、500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).,(1)应收集多少位女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率 分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4, (4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动时间超过4小时的概率.,(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时.请完成每周平均体育运动时间与性别的列联表,并判断是否在犯错误的概率不超过5%的前提下认为“该校学生的每周平均体育

16、运动时间与性别有关”. 附:K2=,【解题提示】分清样本总体、个体的概念,识别频率分布直方图,正确列出列联表求解,本题属于容易题.,【解析】(1)300 =90, 所以应收集90位女生的样本数据. (2)由频率分布直方图得2(0.150+0.125+0.075+0.025)=0.75, 所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75. (3)由(2)知,300位学生中有3000.75=225人的每周平均体育运动时间超过4个小时,75人的每周平均体育运动时间不超过4个小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别的列联表如下:,每周平均体育运动时间与性别列联表,结合列联表可算得K2的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号