2018届高三数学二轮复习第一篇专题突破专题七概率与统计刺第1讲统计与统计案例文

上传人:繁星 文档编号:88234143 上传时间:2019-04-21 格式:PPT 页数:53 大小:1.96MB
返回 下载 相关 举报
2018届高三数学二轮复习第一篇专题突破专题七概率与统计刺第1讲统计与统计案例文_第1页
第1页 / 共53页
2018届高三数学二轮复习第一篇专题突破专题七概率与统计刺第1讲统计与统计案例文_第2页
第2页 / 共53页
2018届高三数学二轮复习第一篇专题突破专题七概率与统计刺第1讲统计与统计案例文_第3页
第3页 / 共53页
2018届高三数学二轮复习第一篇专题突破专题七概率与统计刺第1讲统计与统计案例文_第4页
第4页 / 共53页
2018届高三数学二轮复习第一篇专题突破专题七概率与统计刺第1讲统计与统计案例文_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《2018届高三数学二轮复习第一篇专题突破专题七概率与统计刺第1讲统计与统计案例文》由会员分享,可在线阅读,更多相关《2018届高三数学二轮复习第一篇专题突破专题七概率与统计刺第1讲统计与统计案例文(53页珍藏版)》请在金锄头文库上搜索。

1、第1讲 统计与统计案例,考情分析,总纲目录,考点一 抽样方法 1.简单随机抽样的特点是从总体中逐个抽取.适用范围:总体中的个 体数较少.,2.系统抽样的特点是将总体均分成几部分,按事先确定的规则在各部分 中抽取.适用范围:总体中的个体数较多.,3.分层抽样的特点是将总体分成几层,分层进行抽取.适用范围:总体由 差异明显的几部分组成.,典型例题 (1)(2017陕西西安六校联考)某班对八校联考成绩进行分析,利用随 机数表抽取样本时,先将60个同学按01,02,03,60进行编号,然后从随 机数表第9行第5列的数开始向右读,则选出的第6个个体的编号是 ( ) (注:下面摘取了随机数表的第8行和第9

2、行) 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79(第8行) 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54(第9行) A.07 B.25 C.42 D.52,(2)(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品, 产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法 从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件. 答

3、案 (1)D (2)18,解析 (1)依题意得,依次选出的个体的编号分别是12,34,29,56,07,52, 因此选出的第6个个体的编号是52,选D. (2)应从丙种型号的产品中抽取60 =18(件).,方法归纳 抽样方法主要有简单随机抽样、系统抽样和分层抽样三种,这三种抽样 方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽 到的概率都是相等的,都等于样本容量与总体个体数的比值.,跟踪集训 1.(2017江西南昌第一次模拟)某校为了解学生学习的情况,采用分层抽 样的方法从高一1 000人、高二1 200人、高三n人中抽取81人进行问卷 调查,已知高二被抽取的人数为30,那么n=

4、 ( ) A.860 B.720 C.1 020 D.1 040,答案 D 根据分层抽样方法,得81 =30,可得n=1 040. 故选D.,2.已知某商场新进3 000袋奶粉,为检测是否达标,现采用系统抽样的方 法从中抽取150袋进行检测,将3 000袋奶粉按1,2,3 000随机编号,若第 一组抽出的号码是11,则第六十一组抽出的号码为 .,答案 1 211,解析 由题意知抽样间隔k= =20,因为第一组抽出的号码是11,则 第六十一组抽出的号码为11+6020=1 211.,考点二 用样本估计总体(高频考点) 命题点,1.用样本的频率分布估计总体分布;,2.用样本的数字特征估计总体的数字

5、特征.,1.频率分布直方图的两个结论 (1)小长方形的面积=组距 =频率. (2)各小长方形的面积之和等于1.,2.统计中的四个数字特征 (1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据 的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即 = (x1+x2+xn). (4)方差与标准差 方差:s2= (x1- )2+(x2- )2+(xn- )2. 标准差:s= .,典型例题 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查 了40个用户,根据用户对产品的满意度评分,得

6、到A地区用户满意度评分 的频率分布直方图和B地区用户满意度评分的频数分布表.,B地区用户满意度评分的频数分布表,(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比 较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出 结论即可);,(2)根据用户满意度评分,将用户的满意度分为三个等级: 估计哪个地区用户的满意度等级为不满意的概率大,说明理由.,解析 (1) 通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满 意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满,意度评分比较集中,而A地区用户满意度评分比较分散. (2)A地区用户的满意度等级为不满意的

7、概率大. 记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B 地区用户的满意度等级为不满意”. 由直方图得P(CA)的估计值为(0.01+0.02+0.03)10=0.6, P(CB)的估计值为(0.005+0.02)10=0.25. 所以A地区用户的满意度等级为不满意的概率大.,方法归纳 (1)关于平均数、方差的计算 样本数据的平均数与方差的计算关键在于准确记忆公式,要特别注意区 分方差与标准差,不能混淆,标准差是方差的算术平方根. (2)求解频率分布直方图中相关数据的两个注意点 小长方形的面积表示频率,其纵轴是 ,而不是频率. 各组数据频率之比等于对应小长方形的高度之比

8、.,跟踪集训 1.(2017课标全国,2,5分)为评估一种农作物的种植效果,选了n块地作 试验田.这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中 可以用来评估这种农作物亩产量稳定程度的是 ( ) A.x1,x2,xn的平均数 B.x1,x2,xn的标准差 C.x1,x2,xn的最大值 D.x1,x2,xn的中位数,答案 B 统计问题中,体现数据的稳定程度的指标为数据的方差或 标准差.故选B.,2.(2017湖北武汉武昌调研)我国是世界上严重缺水的国家,城市缺水问 题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生 活用水定额管理制度,即确定一个合理的居民月用

9、水量标准x(吨),月用 水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解全 市居民用水量的分布情况,通过抽样,获得了某年100位居民的月均用水 量(单位:吨),将数据按照0,0.5,(0.5,1,(4,4.5分成9组,制成了如图所 示的频率分布直方图.,(1)求频率分布直方图中a的值; (2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数, 并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x 的值,并说明理由.,解析 (1)由(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)0.5=1,解得a =0

10、.30. (2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率 为(0.12+0.08+0.04)0.5=0.12. 则估计全市80万居民中月均用水量不低于3吨的人数为800 0000.12= 96 000. (3)前6组的频率之和是(0.08+0.16+0.30+0.40+0.52+0.30)0.5=0.88 0.85, 前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)0.5=0.730.85, 2.5x3, 由0.3(x-2.5)=0.85-0.73,解得x=2.9.,因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.,考点三 回

11、归分析 1.线性回归方程 方程 = x+ 称为线性回归方程,其中 = , = - ,( , )称为 样本点的中心. 2.样本数据的相关系数r r= 反映样本数据的相关程度,|r|越大,相关性越强.典型例题,(2017课标全国,19,12分)为了监控某种零件的一条生产线的生产过 程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸 (单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:,经计算得 = xi=9.97,s= = 0.212, 18.439, (xi- )(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2, 16. (1)求(xi,i

12、)(i=1,2,16)的相关系数r,并回答是否可以认为这一天生产的 零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以 认为零件的尺寸不随生产过程的进行而系统地变大或变小); (2)一天内抽检零件中,如果出现了尺寸在( -3s, +3s)之外的零件,就认 为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生 产过程进行检查.,(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ii)在( -3s, +3s)之外的数据称为离群值,试剔除离群值,估计这条生产 线当天生产的零件尺寸的均值与标准差.(精确到0.01) 附:样本(xi,yi)(i=1,2,n)的

13、相关系数 r= . 0.09.,解析 (1)由样本数据得(xi,i)(i=1,2,16)的相关系数为r= = -0.18. 由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进 行而系统地变大或变小. (2)(i)由于 =9.97,s0.212,由样本数据可以看出抽取的第13个零件的尺 寸在( -3s, +3s)以外,因此需对当天的生产过程进行检查. (ii)剔除离群值,即第13个数据,剩下数据的平均数为 (169.97-9.22)= 10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02. =160.2122+169.9721 591.134, 剔除第13个数据,

14、剩下数据的样本方差为 (1 591.134-9.222-1510.022)0.008, 这条生产线当天生产的零件尺寸的标准差的估计值为 0.09.,1.求线性回归方程的步骤 (1)计算 , ; (2)计算 xiyi, ; (3)计算 = = ; = - ; (4)写出线性回归方程 = x+ .,方法归纳,注意 样本点的中心( , )必在回归直线上.,2.相关系数r 当r0时,表明两个变量正相关; 当r0时,表明两个变量负相关. r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接 近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时, 认为两个变量有很强的线性

15、相关性.跟踪集训,(2016课标全国,18,12分)下图是我国2008年至2014年生活垃圾无害化 处理量(单位:亿吨)的折线图. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加 以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾 无害化处理量.,附注: 参考数据: yi=9.32, tiyi=40.17, =0.55, 2.646. 参考公式:相关系数r= , 回归方程 = + t中斜率和截距最小二乘估计公式分别为: = , = - .,解析 (1)由折线图中数据和附注中参考数据得 =4, (ti- )2=28, =0.55, (t

16、i- )(yi- )= tiyi- yi=40.17-49.32=2.89, r 0.99. 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而 可以用线性回归模型拟合y与t的关系. (2)由 = 1.331及(1)得 = = 0.10, = - =1.331-0.1040.93.,所以y关于t的回归方程为 =0.93+0.10t. 将2016年对应的t=9代入回归方程得: =0.93+0.109=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.,考点四 独立性检验 1.22列联表 设两个变量A,B,每一个变量都可以取两个值,变量A:A1,A2,变量B:B1,B2,则 22列联表如下:,2.K2的计算公式 K2= (其中n=a+b+c+d).,3.两个分类变量A和B是否有关系的判断方法 (1)当K22.706时,没有充分的证据判

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号