(新课改省份专用)2020版高考数学一轮复习 第九章 统计与统计案例 第二节 变量的相关性与统计案例讲义(含解析)

上传人:F****n 文档编号:114990590 上传时间:2019-11-12 格式:DOC 页数:11 大小:2.65MB
返回 下载 相关 举报
(新课改省份专用)2020版高考数学一轮复习 第九章 统计与统计案例 第二节 变量的相关性与统计案例讲义(含解析)_第1页
第1页 / 共11页
(新课改省份专用)2020版高考数学一轮复习 第九章 统计与统计案例 第二节 变量的相关性与统计案例讲义(含解析)_第2页
第2页 / 共11页
(新课改省份专用)2020版高考数学一轮复习 第九章 统计与统计案例 第二节 变量的相关性与统计案例讲义(含解析)_第3页
第3页 / 共11页
(新课改省份专用)2020版高考数学一轮复习 第九章 统计与统计案例 第二节 变量的相关性与统计案例讲义(含解析)_第4页
第4页 / 共11页
(新课改省份专用)2020版高考数学一轮复习 第九章 统计与统计案例 第二节 变量的相关性与统计案例讲义(含解析)_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《(新课改省份专用)2020版高考数学一轮复习 第九章 统计与统计案例 第二节 变量的相关性与统计案例讲义(含解析)》由会员分享,可在线阅读,更多相关《(新课改省份专用)2020版高考数学一轮复习 第九章 统计与统计案例 第二节 变量的相关性与统计案例讲义(含解析)(11页珍藏版)》请在金锄头文库上搜索。

1、第二节变量的相关性与统计案例突破点一回归分析1变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关2两个变量的线性相关回归直线从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线回归方程回归方程为x,其中, 最小二乘法通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这

2、一方法叫做最小二乘法相关系数当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性一、判断题(对的打“”,错的打“”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系()(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()答案:(1)(2)(3)二、填空题1已知x,y的取值如下表,从散点图可以看出y与x具有线性相关关系,且回归方程

3、为0.95x,则_.x0134y2.24.34.86.7答案:2.62两个变量y与x的回归模型中,分别选择了4个不同模型,经计算得到它们的相关系数r的值如下表,其中拟合效果最好的模型是_.模型模型1模型2模型3模型4r0.980.800.500.25答案:模型13已知变量x,y之间具有线性相关关系,其回归方程为3x,若i17, i4,则的值为_答案:2考法一相关关系的判断例1(1)(2019福建泉州月考)在下列各图中,两个变量具有相关关系的图是()ABC D(2)(2019昆明一中一模)若对于变量x的取值为3,4,5,6,7时,变量y对应的值依次分别为4.0,2.5,0.5,1,2;若对于变量

4、u的取值为1,2,3,4时,变量v对应的值依次分别为2,3,4,6,则变量x和y,变量u和v的相关关系是()A变量x和y是正相关,变量u和v是正相关B变量x和y是正相关,变量u和v是负相关C变量x和y是负相关,变量u和v是负相关D变量x和y是负相关,变量u和v是正相关解析(1)为函数关系;为正相关关系;为负相关关系;没有明显相关性(2)变量x增加,变量y减少,所以变量x和y是负相关;变量u增加,变量v增加,所以变量u和v是正相关,故选D.答案(1)C(2)D方法技巧判断相关关系的2种方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系如果所有的样本点都落在某一直线

5、附近,变量之间就有线性相关关系(2)相关系数法:利用相关系数判定,|r|越趋近于1相关性越强考法二线性回归分析例2(2018全国卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并

6、说明理由解(1)利用模型,可得该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,可得该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:()从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的

7、变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分)方法技巧1回归直线方程中系数的2种求法(1)公式法:利用公式,求出回归系数,.(2)待定系数法:利用回归直线过样本点中心(,)求系数2回归分析的2种策略(1)利用回归方程进行预测

8、:把回归直线方程看作一次函数,求函数值(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数.1.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A BC D解析:选D正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为.2.二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数

9、据:使用年数x234567售价y201286.44.43zln y3.002.482.081.861.481.10z关于x的折线图,如图所示:(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;(2)求y关于x的回归方程,并预测某辆A型号二手车当使用年数为9年时售价约为多少(,小数点后保留两位有效数字)参考公式:,r .参考数据:iyi187.4,izi47.64,139,4.18, 13.96,1.53,ln 1.460.38.解:(1)由题意,知(234567)4.5,(32.482.081.861.481.10)2,又izi47.64,4.18,1.53,r

10、0.99,z与x的相关系数大约为0.99,说明z与x的线性相关程度很高(2)0.36,20.364.53.62,z与x的线性回归方程是0.36x3.62,又zln y,y关于x的回归方程是e0.36x3.62.令x9,得e0.3693.62e0.38,ln 1.460.38,1.46,即预测某辆A型号二手车当使用年数为9年时售价约为1.46万元突破点二独立性检验1分类变量变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量2列联表列出两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为y1y2总计x

11、1ababx2cdcd总计acbdabcdK2(其中nabcd为样本容量),可利用独立性检验判断表来判断“X与Y的关系”一、判断题(对的打“”,错的打“”)(1)事件X,Y关系越密切,则由观测数据计算得到的K2的值越大()(2)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀()答案:(1)(2)二、填空题1下面是22列联表:y1y2总计x1a2173x2222547总计b46120则表中a,b的值分别为_解析:a2173,a52,又a22b,b74.答案:52,742为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学

12、生,得到如下22列联表:理科文科男1310女720已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到K2的观测值k4.844.则认为选修文科与性别有关系出错的可能性为_答案:5%3(2019阜阳质检)某班主任对全班30名男生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多总计喜欢玩电脑游戏12820不喜欢玩电脑游戏2810总计141630该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过_答案:0.05典例(2018全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方

13、式的效率,选取40名工人,将他们随机分成两组,每组20人第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2,解(1)第二种生产方式的效率更高理由如下:()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80 min;用第二种生产方

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 小学教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号