《2023版 大一轮 数学 人教A版 新教材(京津琼鲁鄂渝湘闽粤冀浙)第2节 用样本估计总体》由会员分享,可在线阅读,更多相关《2023版 大一轮 数学 人教A版 新教材(京津琼鲁鄂渝湘闽粤冀浙)第2节 用样本估计总体(23页珍藏版)》请在金锄头文库上搜索。
1、第 2 节用样本估计总体知识分类落实 回扣知识夯实基础知识梳理1.画频率分布直方图的步骤(1)求极差:极差是一组数据中最大值与最小值的差.(2)决定组距与组数:当样本容量不超过100时,常分成51 2组,一般取等长组距,并旦组距应力求“取整”.(3)将数据分组.(4)列频率分布表:一般分四列,即分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是L频率(5)画频率分布直方图:横轴表示样本数据,纵轴表示蠡.小长方形的面积=组距乂频就率=频率.各小长方形的面积和等于1.2.其它统计图表统计图表主要应用扇形图直观描述各类数据占总数的比例条形图和直方图直观描述不同类别或分组数据的频数和频率
2、折线图描述数据随时间的变化趋势3.总体百分位数的估计(1)第百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有心的数据小于或等于这个值,且至少有(100p)%的数据大于或等于这个值.(2)计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=Xp%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第2项数据;若 i 是整数,则第P百分位数为第i项与第(i+1)项数据的平均数.4.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把个数据按大小顺序排列,处于最中间位置的一个数据(
3、或最中间两个数据的平均数)叫做这组数据的中位数.平均数:把团 也2:+劭称为动,,这个数的平均数.(4)标准差与方差:设一组数据汨,X 2,X3,,%的平均数为;,则这组数据的标准差和方差分别是S=yl(XLX)2+(X 2 -X)+(X X)2 ,1 一 一 一52=(X|X)2+(X2-X)2H-X)2.常用结论与微点提醒1 .频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2 .平均数、方差的公
4、式推广(1)若数据 x i,X2,X”的平均数为x,那么 mx2-a,mx3+a,,mxn+a的平均数是mx+a.(2)若数据X I,X2,,,X 的方差为5 2,那么数据x i+a,X2-a,,x“+a的方差也为s 2;数据o r i,oxi,o r”的方差为屋5 2.诊断自测思考辨析1.判断下列结论正误(在括号内打“J ”或“义”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(2)一组数据的方差越大,说明这组数据越集中.()频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.()(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()答 案
5、(1)J(2)X(3)V (4)V解 析(1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误.方差越大,这组数据越离散.(3)正确.小矩形的面积=组距X=频率.教材衍化2.下列一组数据的第25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A.3.2 B.3.0C.4.4 D.2.5答 案 A解 析 把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=1 0X25%=2.5,不是整数,则第3个数据3.2是第25百分位数.3.若某校高一年级8 个班参加合唱比赛
6、的得分分别为87,89,90,91,92,93,94,9 6,则这组数据的中位数和平均数分别是()A.91.5 和 91.5 B.91.5 和 92C.91 和 91.5 D.92 和 92答 案 A解 析 这组数据由小到大排列为87,89,90,91,92,93,94,96,91+92二中位数是一一=91.5,丁 87+89+90+91 +92+93+94+96平均数%=-=91.5.O考题体验4.(2020.全国n 卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1 200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某
7、日积压500份订单未配货,预计第二天的新订单超过1 600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者()A.1 0 名 B.1 8 名 C.24 名 D.32 名答 案 B解析 由题意,第二天完成积压订单及当日订单的配货的概率不小于0.95,即第二天确保完成新订单1 600份,减去超市每天能完成的1 200份,再加上积压的500份,共 有 1 6001 200+500=900(份),至少需要志愿者900+50=1 8(名).5.(2020全国HI卷)设一组样本数据如,及,的方差为国01,则数据lOxi,
8、1 0X2,,IO*”的方差为()A.0.01 B.0.1 C.1 D.1 0答 案 C解析 IOA-I,1 0 x2,,lOx”的方差为 IO?x o.(n=i.故选 C.6.(2020.新高考海南卷)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A.62%B.56%C.46%D.42%答 案 C解析 如图,用 Venn图表示该中学喜欢足球和游泳的学生所占的比例之间的关系,设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为羽 则(60%x)+(82%x)+x=96%,
9、解得 x=46%.故选 C.厂足球 乙、82%-xZ考点分层突破 考 点 聚 焦 题型剖析考点一频率分布直方图师生共研【例 1】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了 1 00名学生,记录他们的分数,将数据分成7组:20,30),30,40),,80,90.并整理得到如下频率分布直方图:频率().020.01O 2()30 40 50 60 70 8()9()分数(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5 人,试估计总体中分数在区间 40,50)内的人数;(3)已知样本中有一
10、半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解(1)根据频率分布直方图可知,样本中分数不小于7 0 的频率为(0.02+0.04)X 1 0=0.6,所以样本中分数小于70的频率为1 0.6=04所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)X 1 0=0.9,故样本中分数小于50的频率为0.1,故分数在区间 40,50)内的人数为1 00X0.1 5=5.所以总体中分数在区间 40,50)内的人数估计为400X=20.(3)
11、由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)X1 0X1 00=60.所以样本中分数不小于70的男生人数为60 x1=30.所以样本中的男生人数为30X2=60,女生人数为1 0060=40,男生和女生人数的比例为60:40=3:2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3:2.感 悟 升 华 1.频率分布直方图的性质.(1)小长方形的面积=组距X=频率;(2)各小长方形的面积之和等于1;(3)小长方形的高=2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.【训 练 1】某公司为了解用户对其产品的满意度,从 A,3两地区分别随机调查了 4 0 个
12、用户,根据用户对产品的满意评分,得 到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.A地区用户满意度评分的频率分布直方图0.0400.0350.0300.0250.0200.0150.0100.005频率湎O 40 5()60 70 8()9()100 满意度评分图B地区用户满意度评分的频率分布表在图中作出8地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图满意度评分分组 5 0,6 0)6 0,7 0)7 0,8 0)8 0,9 0)9 0,1 0 0 频数
13、281 41 06(2)根据用户满意度评分,将用户和满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.满意度评分低 于 7 0 分7 0 分 到 8 9 分不低于9 0 分满意度等级不满意满意非常满意解(1)作出频率分布直方图如图:频率组距().04()().035().03()0.0250.02()().015().01()().005O 50 6()70 80 9()10()满意度评分通过两地区用户满意度评分的频率分布直方图可以看出,8 地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A 地区用户满意度评分比较分散.(2
14、)A地区用户的满意度等级为不满意的概率大.记CA表示事件:“A 地区用户的满意度等级为不满意”;CB表示事件:“5 地区用户的满意度等级为不满意”.由直方图得P(CA)的估计值为(0.01+0.02+0.03)X 1 0=0.6,P(CB)的估计值为(0.005+0.02)X 1 0=0.25.所以A 地区用户的满意度等级为不满意的概率大.考点二统计图表及应用多维探究角度1 扇形图 例 2某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:种植收入第三产业 收 入0其他收
15、入种植收入第三产业2嬴收入v s d其他收入养殖收入建设前经济收入构成比例养殖收入建设后经济收入构成比例则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答 案 A解析 法一 设新农村建设前经济收入为。,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04”,养殖收入为0.3a.新农村建设后种植收入为0.7 4 a,其他收入为0.1 a,养殖收入为0.6 a,养殖收入与第三产业收入的总和为1.1 6 a,所以
16、新农村建设后,种植收入减少是错误的.法 二 因 为0.6 ”连接).答案 SS2S3解 析 根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较远,表现的最分散,标准差最大,乙的数据分布均匀,不如甲组中偏离平均值大,标准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最集中,方差最小,故 S1S2S3.三 解答题10.共享单车入住泉州一周年以来,因 其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5000份调查问卷,回收到有效问卷3125份,现从中随机抽取80份,分别对使用者的年龄段、26 3 5 岁使用者的使用频率、26 35岁使用者的满意度进行汇总,得到如下三个表格:表(一)表(二)使用者年龄段2 5 岁以下2 6 岁 3 5 岁36岁 45岁4 5 岁以上人数20401010表(三)使用频率0 6 次/月7-14次/月15 22次/月23 31次/月人数510205(1)依据上述表格完成下列三个统计图形:频率 使用者年龄段频率条形图满意度非常满意(9-10)满意(8