全国通用2018届高考数学一轮总复习第十二章概率与统计12.5统计与统计案例课件理新人教b版

上传人:san****019 文档编号:86356115 上传时间:2019-03-19 格式:PPT 页数:33 大小:2.40MB
返回 下载 相关 举报
全国通用2018届高考数学一轮总复习第十二章概率与统计12.5统计与统计案例课件理新人教b版_第1页
第1页 / 共33页
全国通用2018届高考数学一轮总复习第十二章概率与统计12.5统计与统计案例课件理新人教b版_第2页
第2页 / 共33页
全国通用2018届高考数学一轮总复习第十二章概率与统计12.5统计与统计案例课件理新人教b版_第3页
第3页 / 共33页
全国通用2018届高考数学一轮总复习第十二章概率与统计12.5统计与统计案例课件理新人教b版_第4页
第4页 / 共33页
全国通用2018届高考数学一轮总复习第十二章概率与统计12.5统计与统计案例课件理新人教b版_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《全国通用2018届高考数学一轮总复习第十二章概率与统计12.5统计与统计案例课件理新人教b版》由会员分享,可在线阅读,更多相关《全国通用2018届高考数学一轮总复习第十二章概率与统计12.5统计与统计案例课件理新人教b版(33页珍藏版)》请在金锄头文库上搜索。

1、12.5 统计与统计案例,高考理数,一、随机抽样 1.简单随机抽样 一般地,设一个总体含有N个个体,从中逐个 不放回 地抽取n个个体作为样本(nN),如果每 次抽取时总体内的各个个体被抽到的 机会都相等 ,就把这种抽样方法叫做简单随机抽样. 最常用的简单随机抽样的方法有两种: 抽签法 和 随机数法 . 2.系统抽样 当总体中的个体比较多时,首先把总体分成均衡的若干部分,然后按照事先确定的规则,从每一 部分中抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样. 3.分层抽样 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量 的个体,将各层取出的个体合在

2、一起作为样本,这种抽样方法是分层抽样.,知识清单,二、用样本估计总体 1.用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图 频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度来表示数 据分布的规律.它可以使我们看到整个样本数据的频率分布情况. 绘制频率分布直方图的步骤: 求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图. (2)频率分布折线图 连结频率分布直方图中 各小长方形上端的中点 ,就得到频率分布折线图. (3)茎叶图 一般地,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 2.用样本的数字特征估计总体的数字特征 (1)众数:一

3、组数据中出现次数最多的数. (2)中位数:将数据从小到大(或从大到小)排列,若有奇数个数,则最中间的数是中位数;若有偶数 个数,则中间两数的平均数是中位数.,(3)平均数: = ,反映了一组数据的平均水平. (4)标准差: s= ,反映了样本数据的离散程度. (5)方差:s2= (x1- )2+(x2- )2+(xn- )2 ,反映了样本数据的离散程度. 三、变量间的相关关系及回归分析 1.相关关系:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相 关关系.与函数关系不同,相关关系是一种不确定关系. 2.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可

4、直观地判断两变量 的关系是否可以用线性关系表示.若这些点散布在从左下角到右上角的区域,则称两个变量 正相关 ;若这些点散布在从左上角到右下角的区域,则称两个变量 负相关 .,3.回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析.在线性回归模型y= bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统 计中,我们把自变量x称为解释变量,因变量y称为预报变量. 4.回归方程: = x+ ,其中 = , = - ,它主要用来估计和预测取值,从而获得对这两 个变量之间整体关系的了解. 5.相关系数: ,它主要用于相关量的显著性检验,以衡量它们

5、之间的线 性相关程度.当r0时,表示两个变量正相关;当r0时,表示两个变量负相关.|r|越接近1,表明两个 变量的线性相关性 越强 ;当|r|接近0时,表明两个变量间几乎不存在 线性相关关系 . 四、独立性检验 1.分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 2.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值 分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:,可构造一个随机变量 K2= ,其中n=a+b+c+d为样本容量.,3.独立性检验 利用随机变量、独立性假设来确定是否一定有把握认为“两个分类变量

6、有关系”的方法称为 两个分类变量的独立性检验. 两个分类变量X和Y是否有关系的判断方法: 当K22.706时,没有充分的证据判定变量X,Y有关联,可以认为X,Y没有关联; 当K22.706时,有90%的把握判定变量X,Y有关联; 当K23.841时,认为X与Y无关; 当K23.841时,有95%的把握说X与Y有关; 当K26.635时,有99%的把握说X与Y有关; 当K210.828时,有99.9%的把握说X与Y有关.,【知识拓展】 1.随机抽样,2.用样本估计总体 用样本估计总体,包括用“形”与“数”两个方面.用“形”就是利用样本数据列出频率分布 表、画出频率分布直方图和频率折线图.用“数”

7、就是用样本的数字特征来反映总体的某个方 面的特征,最常用的是借助平均数、众数、中位数、标准差和方差等数字特征来估计数据的平 均水平和离散、波动的程度.它们是同一组数据的频率分布的不同表现形式. 3.对回归分析的理解 回归分析是处理变量相关关系的一种数学方法,它主要解决三个问题: (1)确定两个变量之间是否有相关关系,如果有,就找出它们之间贴近的数学表达式; (2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势; (3)求出回归直线方程.,简单随机抽样的方法有:抽签法和随机数法. 系统抽样的步骤:将总体中的个体随机编号;将编号分段;在第1段中用简单随机抽样确定 起始的个体编号;按照事先研

8、究的规则抽取样本. 分层抽样的步骤:分层;按比例确定每层抽取个体的个数;各层抽样(方法可以不同);合 成样本. 例1 (2016河南龙子湖一模,17,12分)我省城乡居民社会养老保险个人年缴费分100,200,300,40 0,500,600,700,800,900,1 000(单位:元)十个档次,某社区随机抽取了50名村民,按缴费在100500 元,6001 000元,以及年龄在2039岁,4059岁之间进行了统计,相关数据如下:,突破方法,方法1 抽样方法,(1)用分层抽样的方法从缴费在100500元之间的村民中随机抽取5人,则应从年龄在2039 岁之间的村民中抽取几人? (2)从缴费在1

9、00500元之间抽取的5人中,随机选取2人进行到户走访,求这2人的年龄都在4059 岁之间的概率. 解析 (1)设应从年龄在2039岁之间的村民中抽取x人,则 = ,解得x=2. 所以应从年龄在2039岁之间的村民中抽取2人. (2)设从缴费在100500元之间抽取的5人中,年龄在2039岁之间的2人为A,B,在4059岁之间的3 人为a,b,c, 则随机选取2人的情况有(A,B),(A,a),(A,b),(A,c),(B,a),(B,b),(B,c),(a,b),(a,c),(b,c),共10种. 年龄都在4059岁之间的有(a,b),(a,c),(b,c),共3种, 则所求概率P= . 1

10、-1 (2016广西南宁三模,5,5分)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们 随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中, 编号在1450内的人做问卷A,编号在451750内的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为 ( ) A.7 B.9 C.10 D.15 答案 C 解析 由题意可知系统抽样中每一组的样本数为 =30,因为第一组抽取的样本号码为9,所以 第k组抽取的样本号码应该为9+30(k-1)(kN*).由4519+30(k-1)750,得16k25(kN*), 所以k=16,17,25,共1

11、0个,即应该有10人做问卷B.,从频率分布直方图中得出有关数据的方法: (1)频率=组距 ; (2)频率比=小长方形的高的比; (3)众数:最高小长方形底边中点的横坐标; (4)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标; (5)平均数:每个小长方形的面积乘小长方形底边中点的横坐标之和. 例2 (2014吉林延吉一模,19,12分)从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察 竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形 的高的比是13642,最后一组的频数是6.,方法2 频率分布直方图的应用,请结合频率分布直方图,

12、解答下列问题: (1)样本的容量是多少? (2)列出频率分布表; (3)成绩落在哪个范围内的人数最多?并求该小组的频数、频率; (4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比. 解析 (1)由于各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于 1,那么各组的频率分别为 , , , , .设该样本容量为n,则 = ,解得n=48.,(2)由以上得频率分布表如下:,(3)成绩落在70.5,80.5)之间的人数最多,该组的频数和频率分别是18和 . (4)不低于60分的学生占总人数的百分比约为 100%=93.75%. 2-1 (2014广东,17,13分)随机观

13、测生产某种零件的某工厂25名工人的日加工零件数(单位:件), 获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如下:,(1)确定样本频率分布表中n1,n2, f1和f2的值; (2)根据上述频率分布表,画出样本频率分布直方图; (3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35的 概率. 解析 (1)n1=7,n2=2, f1=0.28, f2=0.08. (2)样本频率分布直方图如图所示.,(3)根据样

14、本频率分布直方图,得每人的日加工零件数落在区间(30,35的概率为0.2,设所取的4人 中,日加工零件数落在区间(30,35的人数为,则B(4,0.2),P(1)=1-P(=0)=1-(1-0.2)4=1-0.409 6 =0.590 4, 所以4人中,至少有1人的日加工零件数落在区间(30,35的概率为0.590 4.,1.制作茎叶图的方法:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者 共用一个茎,茎按从小到大的顺序由上到下列出. 2.估计数字特征,给定两组数据的茎叶图,“重心”下移者平均数较大,数据集中者方差较小. 例3 (2014山东东营二模,10,4分)甲、乙两名同学

15、在5次数学考试中,成绩统计图用茎叶图表示 如图所示,若甲、乙两名同学的平均成绩分别用 、 表示,则下列结论正确的是 ( ) A. ,且甲比乙成绩稳定 B. ,且乙比甲成绩稳定 C. ,且甲比乙成绩稳定 D. ,且乙比甲成绩稳定,方法3 茎叶图的应用,解析 =90, =88,甲同学的成绩的方差是 (1+4+0+1+4)=2,乙同学的成绩的方差是 (25+0+ 1+1+9)=7.2,故甲同学的成绩比乙的稳定. 答案 A 3-1 (2016宁夏银川一中4月月考,19,12分)为了解某地高中生身高情况,研究小组在该地高中生 中随机抽出30名高中生的身高制成如图所示的茎叶图(单位:cm). 若身高在17

16、5 cm以上(包括175 cm)定义为“高个子”,身高在175 cm以下(不包括175 cm)定义为 “非高个子”.,(1)如果用分层抽样的方法从“高个子”和“非高个子”中共抽取5人,再从这5人中选2人,求至 少有一人是“高个子”的概率; (2)用样本估计总体,把频率作为概率,若从该地所有高中生(人数很多)中选3人,用表示所选3人 中“高个子”的人数,试写出的分布列,并求的数学期望. 解析 (1)根据茎叶图知,抽取的30名学生中有“高个子”12人,“非高个子”18人,用分层抽样 的方法抽取5人,又 = ,所以抽中的“高个子”有12 =2人,“非高个子”有18 =3人. 从这5人中选2人,用事件A表示“至少有一名高个子被选中”,则它的对立事件 表示“没 有高个子被选中”,则P(A)=1-P( )=1- =1- = . 因此,至

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号