2018年高考数学总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文

上传人:san****019 文档编号:86619084 上传时间:2019-03-22 格式:PPT 页数:40 大小:2.64MB
返回 下载 相关 举报
2018年高考数学总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第1页
第1页 / 共40页
2018年高考数学总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第2页
第2页 / 共40页
2018年高考数学总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第3页
第3页 / 共40页
2018年高考数学总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第4页
第4页 / 共40页
2018年高考数学总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《2018年高考数学总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文》由会员分享,可在线阅读,更多相关《2018年高考数学总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文(40页珍藏版)》请在金锄头文库上搜索。

1、第 6 讲,回归分析与独立性检验,1变量间的关系,(1)常见的两变量之间的关系有两类:一类是函数关系,另 一类是相关关系;与函数关系不同,相关关系是一种非确定性 关系,(2)将样本中 n 个数据点(xi,yi)(i1,2,n)描在平面直 角坐标系中,表示两个变量关系的一组数据的图形叫做散点图,(3)正相关、负相关,在散点图中,点散布在从左下角到右上角的区域,对于两,个变量的这种相关关系称为正相关,在散点图中,点散布在从左上角到右下角的区域,两个变,量的这种相关关系称为负相关,2回归分析,(1)定义:对具有相关关系的两个变量进行统计分析的一种,常用方法,(2)线性相关关系:,观察散点图的特征,如

2、果散点图中点的分布从整体上看大 致在一条直线附近,我们就称这两个变量之间具有线性相关关 系,这条直线叫做回归直线,(3)回归直线的求法:,样本点的中心,当 r0 时,表明两个变量_,负相关,r 的绝对值越接近于 1,表明两个变量的线性相关性越强 r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关 关系通常|r|大于 0.75 时,认为两个变量有很强的线性相关性,(5)相关指数:,R2 的值越大,说明残差平方和越小,也就是说模型的拟合 效果越好在线性回归模型中,R2 表示解释变量对于预报变量 变化的贡献率,R2 越接近于 1,表示回归的效果越好 3独立性检验 (1)分类变量:变量的不同

3、“值”表示个体所属的不同类 别,像这类变量称为分类变量,(2)列联表:列出两个分类变量的频数表,称为列联表假 设有两个分类变量X 和Y,它们的可能取值分别为x1,x2和y1, y2,其样本频数列联表(称为 22 列联表)为,22 列联表,abcd,(3)独立性检验: 利用随机变量 K2 来判断“两个分类变量有关系”的方法 称为独立性检验,1有关线性回归的说法,不正确的是(,),D,A相关关系的两个变量是非确定关系 B散点图能直观地反映数据的相关程度 C回归直线最能代表线性相关的两个变量之间的关系 D散点图中的点越集中,两个变量的相关性越强,2(2013 年湖北)四名同学根据各自的样本数据研究变

4、量 x, y 之间的相关关系,并求得回归直线方程,分别得到以下四个 结论:,其中一定不正确的结论的序号是(,),D,A,B,C,D,3通过随机询问 110 名性别不同的大学生是否爱好某项运 动,得到如下的列联表:,附表:,参照附表,得到的正确结论是(,),A,A有 99%以上的把握认为“爱好该项运动与性别有关” B有 99%以上的把握认为“爱好该项运动与性别无关” C在犯错误的概率不超过 0.1%的前提下,认为“爱好该 项运动与性别有关” D在犯错误的概率不超过 0.1%的前提下,认为“爱好该 项运动与性别无关”,P(K2k),4(2013 年广东江门一模)某产品的广告费用 x 与销售额 y

5、的统计数据如下表:,65.5,考点 1,线性回归分析,例 1:已知 x 与 y 之间的几组数据如下表:,答案:C,【互动探究】 1(2014年湖北)根据如下样本数据:,解析:依题意,画散点图,如图 D42,两个变量负相关,,图 D42,答案:A,考点 2,独立性检验,例 2:(2014 年安徽)某高校共有 15 000 人,其中男生有 10 500 人,女生有 4500 人,为调查该校学生每周平均体育运动时 间的情况,采用分层抽样的方法,收集 300 位学生每周平均体 育运动时间的样本数据(单位:小时) (1)应收集多少位女生样本数据? (2)根据这 300 个样本数据,得到学生每周平均体育运

6、动时 间的频率分布直方图(如图 9-6-1),其中样本数据分组区间为: 0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周 平均体育运动时间超过 4 个小时的概率,图 9-6-1,(3)在样本数据中,有 60 位女生的每周平均体育运动时间 超过 4 个小时请完成每周平均体育运动时间与性别的列联表, 并判断是否有 95%的把握认为“该校学生的每周平均体育运动 时间与性别有关”,解:(1)应收集女生样本数据为 300,4500 15 000,90.,(2)由频率分布直方图,得 12(0.1000.025)0.75,所 以该校学生每周平均体育运动时间超过 4 个小时的概率

7、为 0.75.,P(K2k0),(3)由(2)知,300 名学生中有 3000.75225 名学生每周平 均体育运动时间超过 4 个小时,75 名学生每周平均体育运动时 间不超过 4 个小时,又因为该数据中有男生 210 名,女生 90 名, 根据题意列表如下:,每周平均体育运动时间与性别列联表,因此有 95%的把握认为“该校学生的每周平均体育运动时 间与性别有关”,【规律方法】解决独立性检验问题的一般步骤: 制作列联表;,要精确到小数点后三位; 查表得出结论,要选择满足条件P(K2k0)的 k0 作为拒 绝域的临界值,【互动探究】 2(2014 年江西)某人研究中学生的性别与成绩、视力、智

8、商、阅读量这 4 个变量之间的关系,随机抽查 52 名中学生,得 到统计数据如表 1 至表 4,这与性别有关联的可能性最大的变,量是(,),A成绩,B视力,C智商,D阅读量,答案: D,考点 3,回归分析的综合运用,例 3:某兴趣小组欲研究昼夜温差大小与患感冒人数多少 之间的关系,他们分别到气象局与某医院抄录了 1 至 6 月份每 月 10 日的昼夜温差情况与因患感冒而就诊的人数,得到如下资 料:,该兴趣小组确定的研究方案是:先从这六组数据中选取 2 组,用剩下的 4 组数据求线性回归方程,再用被选取的 2 组数 据进行检验 (1)求选取的 2 组数据恰好是相邻两个月的概率; (2)若选取的是

9、 1 月与 6 月的两组数据,请根据 2 至 5 月份 的数据,求出 y 关于 x 的线性回归方程ybxa; (3)若由线性回归方程得到的估计数据与所选出的检验数 据的误差均不超过 2 人,则认为得到的线性回归方程是理想的, 试问该小组所得线性回归方程是否理想?,(2)回归分析是处理变量相关关系的一种数学方法主要解 决:确定特定量之间是否有相关关系,如果有,就找出它们 之间的数学表达式;根据一组观察值,预测变量的取值及判 断变量取值的变化趋势;求出回归直线方程,【互动探究】,3已知 x,y 之间的一组数据如下表:,答案:l2,易错、易混、易漏,对回归分析的理解,例题:(2015 年广东广州调研

10、)某位同学进行寒假社会实践 活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的 关系进行分析研究,他分别记录了 1 月 11 日至 1 月 15 日的白 天平均气温(单位:)与该奶茶店的这种饮料销量(单位:杯), 所得数据如下表:,(1)若从这 5 组数据中随机抽出 2 组,求抽出的 2 组数据恰 好是相邻 2 天数据的概率;,解:(1)设“选取的 2 组数据恰好是相邻 2 天数据”为事件 A. 所有基本事件(m,n)(其中m,n 为1 月份的日期数)有(11,12), (11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14), (13,15),(14,15),共 10 种,事件 A 包括的基本事件有(11,12),(12,13),(13,14),(14,15), 共 4 种,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号