2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理

上传人:猪子****y 文档编号:101155401 上传时间:2019-09-26 格式:PPT 页数:64 大小:4.37MB
返回 下载 相关 举报
2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理_第1页
第1页 / 共64页
2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理_第2页
第2页 / 共64页
2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理_第3页
第3页 / 共64页
2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理_第4页
第4页 / 共64页
2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理》由会员分享,可在线阅读,更多相关《2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理(64页珍藏版)》请在金锄头文库上搜索。

1、第11讲 回归分析与独立性检验,1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. (1)了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用. (2)了解回归的基本思想、方法及其简单应用.,1.变量间的关系,(1)常见的两变量之间的关系有两类:一类是函数关系,,另一类是相关关系.与函数关系不同,相关关系是一种非确定性 关系.,(2)将样本中n个数据点(xi,yi)(i1,2,n)描在平面直 角坐标系中,表示两个变量关

2、系的一组数据的图形叫做散点图.,(3)正相关、负相关.,在散点图中,点散布在从左下角到右上角的区域,两个,变量的这种相关关系称为正相关.,在散点图中,点散布在从左上角到右下角的区域,两个,变量的这种相关关系称为负相关.,2.回归分析,(1)定义:对具有相关关系的两个变量进行统计分析的一种,常用方法.,(2)线性相关关系:,观察散点图的特征,如果散点图中点的分布从整体上看大 致在一条直线附近,我们就称这两个变量之间具有线性相关关 系,这条直线叫做回归直线.,(3)回归直线的求法:,对于一组具有线性相关关系的数据(x1,y1),(x2,y2),,得到回归直线的方法,即求回归直线,使得样本数据的点到

3、它 的距离的平方和最小,这一方法叫做最小二乘法,则回归直线,样本点的中心,(4)线性相关强度的检验:,当 r0 时,表明两个变量正相关;,当 r0 时,表明两个变量_.,负相关,r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关 关系.通常|r|大于 0.75 时,认为两个变量有很强的线性相关性.,(5)相关指数:,R2 的值越大,说明残差平方和越小,也就是说模型的拟合 效果越好.在线性回归模型中,R2 表示解释变量对于预报变量变 化的贡献率,R2 越接近于 1,表示回归的效果越好.,3.独立性检验,(1)分类变量:变量的不同“

4、值”表示个体所属的不同类,别,像这类变量称为分类变量.,(2)列联表:列出两个分类变量的频数表,称为列联表.假设 有两个分类变量 X 和 Y,它们的可能取值分别为x1,x2和y1, y2,其样本频数列联表(称为 22 列联表)为,22 列联表,n_为样本容量.,(3)独立性检验: 利用随机变量 K2 来判断“两个分类变量有关系”的方法 称为独立性检验.,abcd,1.第 31 届夏季奥林匹克运动会,中国获 26 金,18 银,26 铜共 70 枚奖牌居奖牌榜第二,并打破 3 次世界纪录.由此许多 人认为中国进入了世界体育强国之列,也有许多人持反对意见. 有网友为此进行了调查,在参加调查的 25

5、48 名男性公民中有 1560 名持反对意见,2452 名女性公民中有 1200 人持反对意见, 在运用这些数据说明中国的奖牌数与中国进入体育强国有无关,),系时,用什么方法最有说服力( A.平均数与方差 C.独立性检验,B.回归直线方程 D.概率,解析:由于参加讨论的公民按性别被分成了两组,而且每 一组又被分成了两种情况:认为有关与无关,故该资料取自完 全随机统计,符合 22 列联表的要求.故用独立性检验最有说 服力.,答案:C,解析:因为变量 x 和 y 正相关,则回归直线的斜率为正,,故可以排除选项 C 和 D.,因为样本点的中心在回归直线上,把点(3,3.5)分别代入选 项 A 和 B

6、 中的直线方程进行检验,可以排除 B.故选 A.,答案:A,3.对四组数据进行统计,获得以下关于其相关系数的比较,,正确的是(,),A,图 9-6-1,A.r2r40r3r1 B.r4r20r1r3 C.r4r20r3r1 D.r2r40r1r3,D,考点 1,相关关系判断,例 1:已知 x 与 y 之间的几组数据如下表:,答案:C,【互动探究】 1.根据如下样本数据:,解析:依题意,画散点图,如图 D102,两个变量负相关,,图 D102,答案:A,2.某数学老师身高 176 cm,他爷爷、父亲和儿子的身高分 别是 173 cm、170 cm 和 182 cm.因儿子的身高与父亲的身高有 关

7、,该老师用线性回归分析的方法预测他孙子的身高为_cm. 解析:由题意,得父亲身高 x cm 与儿子身高 y cm 对应关 系如下表:,答案:185,考点 2,回归分析的综合运用,例 2:(2015 年新课标)某公司为确定下一年度投入某种 产品的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单 位:t)和年利润 z(单位:千元)的影响,对近 8 年的宣传费 xi和 年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点 图(如图 9-6-2)及一些统计量的值. 图 9-6-2,(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方,程;,(3)已知这种产品的年利润 z

8、 与 x,y 的关系为 z0.2yx, 根据(2)的结果回答下列问题: 当年宣传费 x49 时,年销售量及年利润的预报值是多 少? 当年宣传费 x 为何值时,年利润的预报值最大?,(2)回归分析是处理变量相关关系的一种数学方法.主要解 决:确定特定量之间是否有相关关系,如果有,就找出它们 之间的数学表达式;根据一组观察值,预测变量的取值及判 断变量取值的变化趋势;求出回归直线方程.,【互动探究】,3.已知某蔬菜商店买进的土豆 x(单位:吨)与出售天数 y(单,位:天)之间的关系如下表所示:,(1)请根据上表数据在所给网格纸中绘制散点图;,图 9-6-3,解:(1)散点图如图 D103:,图 D

9、103,(3)由(2)可知当 x40 时,y0.68400.0827, 故买进土豆 40 吨,预计可销售 27 天.,考点 3,独立性检验,例3:2017年5月,来自“一带一路”沿线的20国青年评选出了中国的“新四大发明”:高铁、扫码支付、共享单车和网购.为拓展市场,某调研组对甲、乙两个品牌的共享单车在5个城市的用户人数进行统计,得到如下数据:,(1)如果共享单车用户人数超过5百万的城市称为“优质潜力城市”,否则“非优”,请据此判断是否有85%的把握认为“优质潜力城市”与共享单车品牌有关?,(2)如果不考虑其他因素,为拓展市场,甲品牌要从这5个城市中选出3个城市进行大规模宣传. 在城市被选中的

10、条件下,求城市也被选中的概率; 以X表示选中的城市中用户人数超过5百万的个数,求随机变量X的分布列及数学期望E(X). 下面临界值表供参考:,解:(1)根据题意列出22列联表如下:,所以没有85%的理由认为“优质潜力城市”与“共享单车”品牌有关.,【规律方法】解决独立性检验问题的一般步骤: 制作列联表;,要精确到小数点后三位; 查表得出结论,要选择满足条件P(K2k0)的k0作为 拒绝域的临界值.,【互动探究】 4.某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量之间的关系,随机抽查 52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最大的变量是( ),表 1,

11、成绩,表 2 表 3 智商,视力,表 4,A.成绩 C.智商,阅读量 B.视力 D.阅读量,答案:D,易错、易混、易漏,对回归分析的理解,例题:基于移动互联技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验.某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,结果如下表:,(1)请在给出的坐标纸中作出散点图,并用相关系数说明可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系;,图9114,(2)求y关于x的线性回归方程,并预测该公司2018年2月份的市场占有率; (3)根据调研数据,公司决定再采购一批单车扩大市

12、场,现有采购成本分别为1000元/辆和800元/辆的A,B两款车型报废年限各不相同.考虑到公司的经济效益,该公司决定先对两款单车各100辆进行科学模拟测试,得到两款单车使用寿命频数表如下:,经测算,平均每辆单车每年可以为公司带来收入500元.不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且用频率估计每辆单车使用寿命的概率,以每辆单车产生利润的期望值为决策依据.如果你是该公司的负责人,你会选择采购哪款车型?,解:,图9115,(1)散点图如图9115所示:,(3)用频率估计概率,A款单车的利润X的分布列为: E(X)5000.100.35000.410000.2350(元). B款单车的利润Y的分布列为: E(Y)3000.152000.47000.3512000.1400(元). 以每辆单车产生利润的期望值为决策依据,故应选择B款车型.,【方法点拨】判断两个变量是否线性相关及相关程度通常 有两种方法:利用散点图直观判断;将相关数据代入相关 系数 r 公式求出 r,然后根据 r 的大小进行判断.求线性回归方 程时在严格按照公式求解时,一定要注意计算的准确性.,【互动探究】,图 9-11-6,答案:D,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号