2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt

上传人:cl****1 文档编号:569967349 上传时间:2024-08-01 格式:PPT 页数:48 大小:1.26MB
返回 下载 相关 举报
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt_第1页
第1页 / 共48页
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt_第2页
第2页 / 共48页
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt_第3页
第3页 / 共48页
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt_第4页
第4页 / 共48页
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt》由会员分享,可在线阅读,更多相关《2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt(48页珍藏版)》请在金锄头文库上搜索。

1、专题七概率统计专题七概率统计7.17.1统计与统计案例统计与统计案例3命题热点一命题热点二命题热点三命题热点四频率分布直方图的应用【思考】 观察频率分布直方图能得到哪些信息?例1某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图4命题热点一命题热点二命题热点三命题热点四B地区用户满意度评分的频数分布表 5命题热点一命题热点二命题热点三命题热点四(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及

2、分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图6命题热点一命题热点二命题热点三命题热点四(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.7命题热点一命题热点二命题热点三命题热点四解 (1)B地区用户满意度评分的频率分布直方图通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.8命题热点一命题热点二命题热点三命题热点四(2)A地区用户的满意度等级为不满意的概率大.记CA表示事件:

3、“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(CA)的估计值为(0.01+0.02+0.03)10=0.6,P(CB)的估计值为(0.005+0.02)10=0.25.所以A地区用户的满意度等级为不满意的概率大.9命题热点一命题热点二命题热点三命题热点四10命题热点一命题热点二命题热点三命题热点四对点训练1某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),30,40),80,90,并整理得到如下频率分布直方图:11命题热点一命题热点二命题

4、热点三命题热点四(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.12命题热点一命题热点二命题热点三命题热点四(2)根据题意,样本中分数不小于50的频率为

5、(0.01+0.02+0.04+0.02)10=0.9,分数在区间40,50)内的人数为100-1000.9-5=5.所以总体中分数在区间40,50)内的人数估计为400 =20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04) 10100=60,所以样本中分数不小于70的男生人数为60 =30.所以样本中的男生人数为302=60,女生人数为100-60=40,男生和女生人数的比例为6040=32.所以根据分层抽样原理,总体中男生和女生人数的比例估计为32.13命题热点一命题热点二命题热点三命题热点四用样本的数字特征估计总体【思考1】 样本有哪些数字特征?这些数字特征反

6、映了样本数据的什么情况?【思考2】 茎叶图刻画数据有哪些优点及不足?14命题热点一命题热点二命题热点三命题热点四例2为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图.考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.B.C.D. 答案解析解析关闭 答案解析关闭15命题热点一命题热点二命题热

7、点三命题热点四题后反思1.样本的数字特征主要有:中位数、众数、平均数、标准差、方差,中位数、平均数、众数反映了这组数据的集中程度,反映了样本数据的总体水平;而标准差、方差反映这组数据的波动情况,标准差或方差越大,波动越大.2.茎叶图刻画数据的优点:(1)所有数据信息都可由茎叶图看到;(2)茎叶图便于记录和表示,能反映数据在各段上的分布情况.3.茎叶图刻画数据的不足:茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.16命题热点一命题热点二命题热点三命题热点四对点训练2某市为了考核甲、乙两部门的工作情况,随机访问了50名市民.根据这50名市民对

8、这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.17命题热点一命题热点二命题热点三命题热点四解 (1)由所给茎叶图知,50名市民对甲部门的评分由小到大排序,排在第25,26名的是75,75,则样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50名市民对乙部门的评分由小到大排序,排在第25,26名的是66,68,则样本中位数为,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,5

9、0名市民对甲、乙部门的评分高于90的比率分别为,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.18命题热点一命题热点二命题热点三命题热点四(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低,评价差异较大.(注:利用其他统计量进行分析,结论合理的也可)19命题热点一命题热点二命题热点三命题热点四回归方程的求法及回归分析【思考】 两个变量具备什么关系才能用线性回归方程来预测?如何判断两个变量具有这种关系?

10、例3某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.20命题热点一命题热点二命题热点三命题热点四21命题热点一命题热点二命题热点三命题热点四(1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回

11、答下列问题:当年宣传费x=49时,年销售量及年利润的预报值是多少?当年宣传费x为何值时,年利润的预报值最大?22命题热点一命题热点二命题热点三命题热点四23命题热点一命题热点二命题热点三命题热点四24命题热点一命题热点二命题热点三命题热点四题后反思当两个变量之间具有相关关系时,才可通过线性回归方程来估计和预测.对两个变量的相关关系的判断有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强.25命题热点一命题热点二命题热点三命题热点四对点训练3(2018全国,文18)下图是某地

12、区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.26命题热点一命题热点二命题热点三命题热点四为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型: =-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型: =99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解 (1)利用模型,该地区2018年的环境基础设施投资额的预测值为 =

13、-30.4+13.519=226.1(亿元).利用模型,该地区2018年的环境基础设施投资额的预测值为 =99+17.59=256.5(亿元).27命题热点一命题热点二命题热点三命题热点四(2)利用模型得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律

14、呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.28命题热点一命题热点二命题热点三命题热点四(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分)29命题热点一命题热点二命题热点三命题热点四独立性检验【思考】 独立性检验有什么用途?例4某高校共有学生15000名,其中男生1050

15、0名,女生4500名.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:h).30命题热点一命题热点二命题热点三命题热点四(1)应收集多少名女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动时间超过4h的概率;31命题热点一命题热点二命题热点三命题热点四(3)在样本数据中,有60名女生的每周平均体育运动时间超过4h,请完成每周平均体育运动时间与性别列联表,能否在犯

16、错误的概率不超过0.05的前提下认为该校学生每周平均体育运动时间与性别有关系?32命题热点一命题热点二命题热点三命题热点四解 (1)300 =90,所以应收集90名女生的样本数据.(2)由频率分布直方图得1-2(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4h的概率的估计值为0.75.(3)由(2)知,3000.75=225(人),则有225人每周平均体育运动时间超过4h,75人每周平均体育运动时间不超过4h.因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表33命题热点一命题热点二命

17、题热点三命题热点四结合列联表可算得所以,能在犯错误的概率不超过0.05的前提下认为该校学生的每周平均体育运动时间与性别有关系.34命题热点一命题热点二命题热点三命题热点四题后反思利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式计算随机变量的观测值k,k值越大,说明“两个变量有关系”的可能性越大.35命题热点一命题热点二命题热点三命题热点四对点训练4海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分

18、布直方图如下:旧养殖法36命题热点一命题热点二命题热点三命题热点四新养殖法37命题热点一命题热点二命题热点三命题热点四(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:,38命题热点一命题热点二命题热点三命题热点四解 (1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表由于15.7056.

19、635,故有99%的把握认为箱产量与养殖方法有关.39命题热点一命题热点二命题热点三命题热点四(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.40规律总结拓展演练1.对于频率分布表和频率分布直方图,在计数和计算时一定要准确,在绘制小长方形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据

20、的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若x1,x2,xn的平均数为,方差为s2,则ax1+b,ax2+b,axn+b的平均数为,方差为a2s2.41规律总结拓展演练4.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的长方形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.5.回归分析是处理变量相关关系的一种数学方法.主要解决:(1

21、)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.6.根据K2的值可以判断两个分类变量有关的可信程度.42规律总结拓展演练1.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 答案解析解析关

22、闭由题图可知2014年8月到9月的月接待游客量在减少,故A错误. 答案解析关闭A43规律总结拓展演练2.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7A解析 甲组数据为56,62,65,70+x,74;乙组数据为59,61,67,60+y,78.若两组数据的中位数相等,则65=60+y,所以y=5.又两组数据的平均值相等,所以56+62+65+70+x+74=59+61+67+65+78,解得x=3.44规律总结拓展演练3.已知一组数据4.7,4.8,5.1,5.4,

23、5.5,则该组数据的方差是.答案 0.1 解析 这组数据的平均数为(4.7+4.8+5.1+5.4+5.5)=5.1,方差为(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2=0.1.45规律总结拓展演练4.某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:46规律总结拓展演练(1)记A为事件:“一续保人本年度的保费不高于基本保费”,求P(A)的估计值;(2)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;(3)求续保人本年度平均保费的估计值.47规律总结拓展演练48

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题 > 高中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号