高考数学一轮总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文

上传人:shaoy****1971 文档编号:110460921 上传时间:2019-10-30 格式:PPT 页数:47 大小:1.26MB
返回 下载 相关 举报
高考数学一轮总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第1页
第1页 / 共47页
高考数学一轮总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第2页
第2页 / 共47页
高考数学一轮总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第3页
第3页 / 共47页
高考数学一轮总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第4页
第4页 / 共47页
高考数学一轮总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《高考数学一轮总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文》由会员分享,可在线阅读,更多相关《高考数学一轮总复习 第九章 概率与统计 第6讲 回归分析与独立性检验课件 文(47页珍藏版)》请在金锄头文库上搜索。

1、第6讲,回归分析与独立性检验,1.变量间的关系,(1)常见的两变量之间的关系有两类:一类是函数关系,另 一类是相关关系;与函数关系不同,相关关系是一种非确定性 关系.,(2)将样本中 n 个数据点(xi,yi)(i1,2,n)描在平面直 角坐标系中,表示两个变量关系的一组数据的图形叫做散点图.,(3)正相关、负相关.,在散点图中,点散布在从左下角到右上角的区域,对于两,个变量的这种相关关系称为正相关.,在散点图中,点散布在从左上角到右下角的区域,两个变,量的这种相关关系称为负相关.,2.回归分析,(1)定义:对具有相关关系的两个变量进行统计分析的一种,常用方法.,(2)线性相关关系:,观察散点

2、图的特征,如果散点图中点的分布从整体上看大 致在一条直线附近,我们就称这两个变量之间具有线性相关关 系,这条直线叫做回归直线.,(3)回归直线的求法:,对于一组具有线性相关关系的数据(x1,y1),(x2,y2),,的方法,即求回归直线,使得样本数据的点到它的距离的平方,和最小,这一方法叫做最小二乘法,则回归直线方程,的系数为:,样本点的中心,(4)线性相关强度的检验:,当 r0 时,表明两个变量正相关; 当 r0 时,表明两个变量_. r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关 关系.通常|r|大于 0.75 时,认为

3、两个变量有很强的线性相关性. (5)相关指数:,R2 的值越大,说明残差平方和越小,也就是说模型的拟合 效果越好.在线性回归模型中,R2 表示解释变量对于预报变量变 化的贡献率,R2 越接近于 1,表示回归的效果越好.,负相关,3.独立性检验,(1)分类变量:变量的不同“值”表示个体所属的不同类,别,像这类变量称为分类变量.,(2)列联表:列出两个分类变量的频数表,称为列联表.假设 有两个分类变量 X 和 Y,它们的可能取值分别为x1,x2和y1, y2,其样本频数列联表(称为 22 列联表)为,22 列联表,构造一个随机变量 K2 ,n(adbc)2 (ab)(cd)(ac)(bd),,其中

4、 n,_为样本容量.,abcd,(3)独立性检验: 利用随机变量 K2 来判断“两个分类变量有关系”的方法 称为独立性检验.,1.下面是 22 列联表:,则表中 a,b 的值分别为(,),C,A.94,72,B.52,50,C.52,74,D.74,52,解析:a2173,a52.又 a22b,b74.,2.(2013 年湖北)四名同学根据各自的样本数据研究变量 x, y 之间的相关关系,并求得回归直线方程,分别得到以下四个 结论:,其中一定不正确的结论的序号是(,),D,A.,B.,C.,D.,n(adbc)2,3.通过随机询问 110 名性别不同的大学生是否爱好某项运 动,得到如下的列联表

5、:,由 K2,算得, (ab)(cd)(ac)(bd),K2,110(40302020)2 60506050,7.8.,附表:,参照附表,得到的正确结论是(,),A,A.有 99%以上的把握认为“爱好该项运动与性别有关” B.有 99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项 运动与性别有关” D.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项 运动与性别无关”,4.(2012 年新课标)在一组样本数据(x1,y1),(x2,y2),(xn, yn)(n2,x1,x2,xn 不全相等)的散点图中,若所有样本点,的样本相关系数为

6、(,),D,A.1,B.0,C.,1 2,D.1,解析:由题设知,这组样本数据完全正相关,故其相关系 数为 1.故选 D.,(xi,yi)(i1,2,n)都在直线 y x1上,则这组样本数据,考点 1,线性回归分析,例 1:已知 x 与 y 之间的几组数据如下表:,答案:C,【互动探究】 1.(2014 年湖北)根据如下样本数据:,解析:依题意,画散点图,如图 D57,两个变量负相关,,图 D57,答案:A,考点 2,独立性检验,例 2:(2014 年安徽)某高校共有 15 000 人,其中男生有 10 500 人,女生有 4500 人,为调查该校学生每周平均体育运动时 间的情况,采用分层抽样

7、的方法,收集 300 位学生每周平均体 育运动时间的样本数据(单位:小时). (1)应收集多少位女生样本数据? (2)根据这 300 个样本数据,得到学生每周平均体育运动时 间的频率分布直方图(如图 9-6-1),其中样本数据分组区间为: 0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估计该校学生每周平 均体育运动时间超过 4 个小时的概率.,图 9-6-1,(3)在样本数据中,有 60 位女生的每周平均体育运动时间 超过 4 个小时.请完成每周平均体育运动时间与性别的列联表, 并判断是否有 95%的把握认为“该校学生的每周平均体育运动 时间与性别有关”.,附:K2,n(ad

8、bc)2 . (ab)(cd)(ac)(bd),解:(1)应收集女生样本数据为 300,4500 15 000,90.,(2)由频率分布直方图,得 12(0.1000.025)0.75,所 以该校学生每周平均体育运动时间超过 4 个小时的概率为 0.75.,(3)由(2)知,300 名学生中有 3000.75225 名学生每周平 均体育运动时间超过 4 个小时,75 名学生每周平均体育运动时 间不超过 4 个小时,又因为该数据中有男生210 名,女生90 名, 根据题意列表如下:,每周平均体育运动时间与性别列联表,结合列联表计算 K2,n(adbc)2 (ab)(cd)(ac)(bd),300

9、(456030165)2 4.7623.841. 7522521090,因此有 95%的把握认为“该校学生的每周平均体育运动时 间与性别有关”.,【规律方法】解决独立性检验问题的一般步骤: 制作列联表;,利用公式 K2,n(adbc)2 (ab)(cd)(ac)(bd),计算,近似计算,要精确到小数点后三位; 查表得出结论,要选择满足条件 P(K2k0)的k0作为拒 绝域的临界值.,【互动探究】 2.(2014 年江西)某人研究中学生的性别与成绩、视力、智 商、阅读量这 4 个变量之间的关系,随机抽查 52 名中学生,得 到统计数据如表 1 至表 4,则与性别有关联的可能性最大的变,量是(,)

10、,表 1,成绩,表 2 表 3,视力 智商,表 4,A.成绩 C.智商,阅读量 B.视力 D.阅读量,解 析 : 由公式 K2 ,n(adbc)2 (ab)(cd)(ac)(bd),计算得,A.,5282 16362032,,B.,521122 16362032,,C.,52962 16362032,,,D.,524082 16362032,.显然 D 的值最大,说明阅读量与性别有关联,的可能性最大. 答案:D,考点 3 回归分析的综合运用,例 3:(2015 年新课标)某公司为确定下一年度投入某种 产品的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单 位:t)和年利润 z(单位:

11、千元)的影响,对近 8 年的宣传费 xi 和,年销售量 yi(i1,2,8)数据作了初步处理,得到下面的散,点图(如图 9-6-2)及一些统计量的值.,图 9-6-2,(1)根据散点图判断,yabx 与 ycd ,哪一个适宜 作为年销售量 y 关于年宣传费 x 的回归方程类型(给出判断即 可,不必说明理由);,(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方,程;,(3)已知这种产品的年利润 z 与 x,y 的关系为 z0.2yx ,,根据(2)的结果回答下列问题:,当年宣传费 x49 时,年销售量及年利润的预报值是多 少? 当年宣传费 x 为何值时,年利润的预报值最大? 附

12、:对于一组数据(u1,v1),(u2,v2),(un,vn),其回 归直线u 的斜率和截距的最小二乘估计分别为,(2)回归分析是处理变量相关关系的一种数学方法.主要解 决:确定特定量之间是否有相关关系,如果有,就找出它们 之间的数学表达式;根据一组观察值,预测变量的取值及判 断变量取值的变化趋势;求出回归直线方程.,【互动探究】,3.(2014 年新课标)某地区 2007 年至 2013 年农村居民家,庭纯收入 y(单位:千元)的数据如下表:,(1)求 y 关于 t 的线性回归方程;,(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农 村居民家庭人均纯收入的变化情况,并预

13、测该地区 2015 年农村 居民家庭人均纯收入.,附:回归直线的斜率和截距的最小二乘法估计公式分别为:,(2)由(1)知, 0.50,故 2007 年至 2013 年该地区农村居,民家庭人均纯收入逐年增加,平均每年增加 5000 元. 将 2015 年的年份代号 t9 带入(1)中的回归方程, 得 0.592.36.8.,故预测该地区 2015 年农村居民家庭人均纯收入为 6800 元.,易错、易混、易漏,对回归分析的理解,例题:(2015 年广东广州调研)某位同学进行寒假社会实践 活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的 关系进行分析研究,他分别记录了 1 月 11 日至 1

14、月 15 日的白 天平均气温(单位:)与该奶茶店的这种饮料销量(单位:杯), 所得数据如下表:,(1)若从这 5 组数据中随机抽出 2 组,求抽出的 2 组数据恰,好是相邻 2 天数据的概率;,正解:(1)设“选取的 2 组数据恰好是相邻 2 天数据”为事 件 A. 所有基本事件(m,n)(其中m,n 为1月份的日期数)有(11,12), (11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14), (13,15),(14,15),共 10 种. 事件A 包括的基本事件有(11,12),(12,13),(13,14),(14,15), 共 4 种.,1.求回归方程,关键在于正确求出系数 a,b,由于 a,b 的 计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生 错误.(注意回归直线方程中一次项系数为 b,常数项为 a,这与 一次函数的习惯表示不同),2.回归分析是处理变量相关关系的一种数学方法.主要解 决:确定特定量之间是否有相关关系,如果有,就找出它们 之间的数学表达式;根据一组观察值,预测变量的取值及判 断变量取值的变化趋势;求出回归直线方程.,3.独立性检验中统计量 K2 的观测值 k 的计算公式很复杂, 在解题中易混淆一些数据的意义,代入公式时出错,而导致整 个计算结果出错.,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号