《版导与练一轮复习文科数学课件:第九篇 统计与统计案例必修3、选修12 第2节 用样本估计总体》由会员分享,可在线阅读,更多相关《版导与练一轮复习文科数学课件:第九篇 统计与统计案例必修3、选修12 第2节 用样本估计总体(47页珍藏版)》请在金锄头文库上搜索。
1、第第2 2节用样本估计总体节用样本估计总体 考纲展示考纲展示 1.1.了解分布的意义和作用了解分布的意义和作用, ,能根据频率分布能根据频率分布表画频率分布直方图、频率折线图、茎叶表画频率分布直方图、频率折线图、茎叶图图, ,体会它们各自的特点体会它们各自的特点. .2.2.理解样本数据标准差的意义和作用理解样本数据标准差的意义和作用, ,会计会计算数据标准差算数据标准差. .3.3.能从样本数据中提取基本的数字特征能从样本数据中提取基本的数字特征( (如如平均数、标准差平均数、标准差),),并做出合理的解释并做出合理的解释. .4.4.会用样本的频率分布估计总体分布会用样本的频率分布估计总体
2、分布, ,会用样本的基本数字特征估计总体的会用样本的基本数字特征估计总体的基本数字特征基本数字特征, ,理解用样本估计总体的理解用样本估计总体的思想思想. .5.5.会用随机抽样的基本方法和样本估会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问计总体的思想解决一些简单的实际问题题. .知识链条完善知识链条完善考点专项突破考点专项突破知识链条完善知识链条完善 把散落的知识连起来把散落的知识连起来知识梳理知识梳理1.1.作频率分布直方图的步骤作频率分布直方图的步骤2.2.频率分布折线图和总体密度曲线频率分布折线图和总体密度曲线(1)(1)频率分布折线图频率分布折线图: :连接频率分布
3、直方图中各小长方形上端的连接频率分布直方图中各小长方形上端的 , ,就得频就得频率分布折线图率分布折线图. .(2)(2)总体密度曲线总体密度曲线: :随着随着 的增加的增加, ,作图时所分的组数增加作图时所分的组数增加, , 减减小小, ,相应的频率折线图会越来越接近于一条光滑曲线相应的频率折线图会越来越接近于一条光滑曲线, ,即总体密度曲线即总体密度曲线. .中点中点样本容量样本容量组距组距3.3.茎叶图茎叶图定义定义是统计中用来表示数据的一种图是统计中用来表示数据的一种图, ,茎是指中间的一列数茎是指中间的一列数, ,叶就是从茎的旁边生叶就是从茎的旁边生长出来的数长出来的数画法画法对于样
4、本数据较少对于样本数据较少, ,且分布较为集中的一组数据且分布较为集中的一组数据: :若数据是两位整数若数据是两位整数, ,则将十位则将十位数字作茎数字作茎, ,个位数字作叶个位数字作叶; ;若数据是三位整数若数据是三位整数, ,则将百位、十位数字作茎则将百位、十位数字作茎, ,个位个位数字作叶数字作叶. .样本数据为小数时做类似处理样本数据为小数时做类似处理. .对于样本数据较少对于样本数据较少, ,且分布较为集中的两组数据且分布较为集中的两组数据, ,关键是找到两组数据共有的关键是找到两组数据共有的茎茎优缺点优缺点用茎叶图表示数据的优点是用茎叶图表示数据的优点是(1)(1)所有的信息都可以
5、从茎叶图中得到所有的信息都可以从茎叶图中得到; ;(2)(2)便于记录和读取便于记录和读取, ,能够展示数据的分布情况能够展示数据的分布情况. .缺点是当样本数据较多或数据缺点是当样本数据较多或数据位数较多时位数较多时, ,茎叶图就显得不太方便茎叶图就显得不太方便4.4.样本的数字特征样本的数字特征数字数字特征特征定义定义特点特点众数众数在一组数据中出现次数最多的数据在一组数据中出现次数最多的数据体现了样本数据的最大集中点体现了样本数据的最大集中点, ,不受极端值的影响不受极端值的影响, ,而且可能而且可能不唯一不唯一中位数中位数将一组数据按大小顺序依次排列将一组数据按大小顺序依次排列, ,处
6、在处在最中间位置的一个数据最中间位置的一个数据( (或最中间两个或最中间两个数据的平均数数据的平均数) )中位数不受极端值的影响中位数不受极端值的影响, ,仅仅利用了排在中间数据的信息利用了排在中间数据的信息【重要结论重要结论】1.1.频率分布直方图中各个小矩形的面积之和为频率分布直方图中各个小矩形的面积之和为1,1,纵轴的单位是频率除以组距纵轴的单位是频率除以组距的商的商, ,各组数据的频率比等于各小长方形的高度之比各组数据的频率比等于各小长方形的高度之比. .2.2.在频率分布直方图中在频率分布直方图中, ,各组的中点值乘以各组的频率之和即为样本数据平各组的中点值乘以各组的频率之和即为样本
7、数据平均值的估计值均值的估计值. .3.3.在频率分布直方图中在频率分布直方图中, ,垂直于横轴的直线如果把各个小矩形的面积等分垂直于横轴的直线如果把各个小矩形的面积等分, ,则则其对应的数据即为中位数的估计值其对应的数据即为中位数的估计值. .对点自测对点自测1.1.( (教材改编题教材改编题) )一个容量为一个容量为3232的样本的样本, ,已知某组样本的频率为已知某组样本的频率为0.25,0.25,则该组样本则该组样本的频数为的频数为( ( ) )(A)4 (A)4 (B)8 (B)8 (C)12 (C)12 (D)16(D)16解析解析: :由由32320.25=8.0.25=8.故选
8、故选B.B.B B2.2.(2018(2018山西四校联考山西四校联考) )某学校组织学生参加数学测试某学校组织学生参加数学测试, ,成绩的频率分布直方成绩的频率分布直方图如图图如图, ,数据的分组依次为数据的分组依次为20,40),40,60),60,80),80,100,20,40),40,60),60,80),80,100,若低于若低于6060分分的人数是的人数是15,15,则该班的学生人数是则该班的学生人数是( ( ) )B B(A)45(A)45(B)50(B)50(C)55(C)55(D)60(D)603.3.(2017(2017全国全国卷卷) )为评估一种农作物的种植效果为评估一
9、种农作物的种植效果, ,选了选了n n块地作试验田块地作试验田. .这这n n块块地的亩产量地的亩产量( (单位单位:kg):kg)分别为分别为x x1 1,x,x2 2, ,x,xn n, ,下面给出的指标中可以用来评估这种下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是农作物亩产量稳定程度的是( ( ) )(A)x(A)x1 1,x,x2 2, ,x,xn n的平均数的平均数(B)x(B)x1 1,x,x2 2, ,x,xn n的标准差的标准差(C)x(C)x1 1,x,x2 2, ,x,xn n的最大值的最大值(D)x(D)x1 1,x,x2 2, ,x,xn n的中位数的中位数
10、B B解析解析: :标准差衡量样本的稳定程度标准差衡量样本的稳定程度, ,故选故选B.B.4.4.(2018(2018临沂二模临沂二模) )某公司某公司1616个销售店某月销售产品数量个销售店某月销售产品数量( (单位单位: :台台) )的茎叶图如的茎叶图如图图, ,已知数据落在已知数据落在18,2218,22中的频率为中的频率为0.25,0.25,则这组数据的中位数为则这组数据的中位数为. .答案答案: :27275.5.(2018(2018扬州模拟扬州模拟) )对一批产品的长度对一批产品的长度( (单位单位: :毫米毫米) )进行抽样检测进行抽样检测, ,样本容量样本容量为为400,400
11、,如图为检测结果的频率分布直方图如图为检测结果的频率分布直方图, ,根据产品标准根据产品标准, ,单件产品长度在区单件产品长度在区间间25,30)25,30)的为一等品的为一等品, ,在区间在区间20,25)20,25)和和30,35)30,35)的为二等品的为二等品, ,其余均为三等品其余均为三等品, ,则样本中三等品的件数为则样本中三等品的件数为. .解析解析: :根据频率分布直方图可知根据频率分布直方图可知, ,三等品的数量是三等品的数量是(0.012 5+0.025+0.012 5)(0.012 5+0.025+0.012 5)55400=100(400=100(件件).).答案答案:
12、 :100100考点专项突破考点专项突破 在讲练中理解知识在讲练中理解知识考点一频率分布直方图考点一频率分布直方图【例例1 1】 ( (1 1) )( (2 20 01 18 8海海南南省省八八校校联联考考 ) )某某高高校校调调查查了了4 40 00 0名名大大学学生生每每周周的的自自习习时时间间( (单单位位: :小小时时) ), ,制制成成了了如如图图所所示示的的频频率率分分布布直直方方图图, ,其其中中自自习习时时间间的的范范围围是是 1 17 7. .5 5, ,3 30 0 , ,样样本本数数据据分分组组 1 17 7. .5 5, ,2 20 0) ), , 2 20 0, ,2
13、 22 2. .5 5) ), , 2 22 2. .5 5, ,2 25 5) ), , 2 25 5, ,2 27 7. .5 5) ), ,27.5,30.27.5,30.则这则这400400名大学生中每周的自习时间不少于名大学生中每周的自习时间不少于2020小时的人数是小时的人数是( () )(A)380 (B)360 (C)340 (D)320(A)380 (B)360 (C)340 (D)320(1)(1)解析解析: :由频率分布直方图得这由频率分布直方图得这400400名大学生中每周的自习时间不少于名大学生中每周的自习时间不少于2020小时小时的频率为的频率为(0.08+0.04
14、+0.16+0.1)(0.08+0.04+0.16+0.1)2.5=0.95,2.5=0.95,所以这所以这400400名大学生中每周的自习时间不少于名大学生中每周的自习时间不少于2020小时的人数为小时的人数为4004000.95=380.0.95=380.选选A.A.(2)(2)(2018(2018朝阳区校级模拟朝阳区校级模拟) )长春市统计局对某公司月收入在长春市统计局对某公司月收入在1 0001 0004 0004 000元元内的职工进行一次统计内的职工进行一次统计, ,并根据所得数据画出样本的频率分布直方图并根据所得数据画出样本的频率分布直方图( (每个分每个分组包括左端点组包括左端
15、点, ,不包括右端点不包括右端点, ,如第一组表示职工月收入在区间如第一组表示职工月收入在区间1 000,1 500)1 000,1 500)内内, ,单位单位: :元元).).请估计该公司的职工月收入在请估计该公司的职工月收入在1 000,2 000)1 000,2 000)内的概率内的概率; ;根据频率分布直方图估计样本数据的中位数和平均数根据频率分布直方图估计样本数据的中位数和平均数. .(2)(2)解解: :由频率分布直方图得由频率分布直方图得: :职工月收入在职工月收入在1 000,2 000)1 000,2 000)内的概率为内的概率为(0.000 2+0.000 4)(0.000
16、 2+0.000 4)500500=0.1+0.2=0.3.=0.1+0.2=0.3.根据条件可知根据条件可知, ,从左至右小矩形的面积分别是从左至右小矩形的面积分别是0.1,0.2,0.25,0.25,0.15,0.05.0.1,0.2,0.25,0.25,0.15,0.05.因此因此, ,中位数的估计值为中位数的估计值为2 000+ =2 400.2 000+ =2 400.平均数的估计值为平均数的估计值为: :1 2501 2500.1+1 7500.1+1 7500.2+2 2500.2+2 2500.25+2 7500.25+2 7500.25+3 2500.25+3 2500.15
17、0.15+3 750+3 7500.05=2 400.0.05=2 400.综上可知综上可知, ,中位数和平均数的估计值都是中位数和平均数的估计值都是2 400.2 400.(1)(1)纵轴上的数据是频率除以组距纵轴上的数据是频率除以组距. .(2)(2)各组的频率之和等于各组的频率之和等于1.1.(3)(3)各组的频率等于各组的频数除以样本容量各组的频率等于各组的频数除以样本容量. .反思归纳反思归纳【跟踪训练【跟踪训练1 1】 (2018(2018天津模拟天津模拟) )某学校随机抽取部分新生调查其上学所需某学校随机抽取部分新生调查其上学所需时间时间( (单位单位: :分钟分钟),),并将所
18、得数据绘制成频率分布直方图并将所得数据绘制成频率分布直方图( (如图如图),),其中其中, ,上学所上学所需时间的范围是需时间的范围是0,100,0,100,样本数据分组为样本数据分组为:0,20),20,40),40,60),60,80),:0,20),20,40),40,60),60,80),80,100,80,100,则则(1)(1)图中的图中的x=x=; ;(2)(2)若上学所需时间不少于若上学所需时间不少于1 1小时的学生可申请在学校住宿小时的学生可申请在学校住宿, ,则该校则该校600600名新生名新生中估计中估计名学生可以申请住宿名学生可以申请住宿. .解析解析: :(1)(1)
19、由频率分布直方图知由频率分布直方图知, ,20x=1-2020x=1-20(0.025+0.006 5+0.003+0.003),(0.025+0.006 5+0.003+0.003),解得解得x=0.012 5.x=0.012 5.(2)(2)上学时间不少于上学时间不少于1 1小时的学生频率为小时的学生频率为(0.003+0.003)(0.003+0.003)20=0.12,20=0.12,因此估计有因此估计有0.120.12600=72600=72名学生可以申请住宿名学生可以申请住宿. .答案答案: :(1)0.012 5(1)0.012 5(2)72(2)72考点二茎叶图考点二茎叶图【例
20、例2 2】 (1) (1)(2018(2018长春一模长春一模) )已知某班级部分同学一次测验的成绩统计如图已知某班级部分同学一次测验的成绩统计如图, ,则其中位数和众数分别为则其中位数和众数分别为( () )(A)92,94(A)92,94(B)92,86(B)92,86(C)99,86(C)99,86(D)95,91(D)95,91解析解析: :(1)(1)由茎叶图可知由茎叶图可知, ,中位数为中位数为92,92,众数为众数为86.86.故选故选B. B. (2)(2)如图所示的茎叶图记录了甲、乙两组各如图所示的茎叶图记录了甲、乙两组各5 5名工人某日的产量数据名工人某日的产量数据( (单
21、位单位: :件件).).若这两组数据的中位数相等若这两组数据的中位数相等, ,且平均值也相等且平均值也相等, ,则则x x和和y y的值分别为的值分别为( () )(A)3,5(A)3,5 (B)5,5(B)5,5 (C)3,7(C)3,7 (D)5,7(D)5,7反思归纳反思归纳(1)(1)茎叶图保留了全部的样本数据茎叶图保留了全部的样本数据. .(2)(2)从茎叶图上可以发现样本数据的分散与集中程度从茎叶图上可以发现样本数据的分散与集中程度, ,从而对样本数据的平均从而对样本数据的平均值和方差作出定性判断值和方差作出定性判断. .【跟踪训练跟踪训练2 2】 (1) (1)(2018(201
22、8福建数学基地联考福建数学基地联考) )如图是某电视节目中七位评如图是某电视节目中七位评委为某民族舞蹈打出的分数的茎叶统计图委为某民族舞蹈打出的分数的茎叶统计图, ,去掉一个最高分和一个最低分后去掉一个最高分和一个最低分后, ,所剩数据的平均数和方差分别为所剩数据的平均数和方差分别为( () )(A)84,4.84 (A)84,4.84 (B)84,1.6(B)84,1.6(C)85,1.6 (C)85,1.6 (D)85,4(D)85,4(2)(2)为了解某校高三学生数学调研测试的情况为了解某校高三学生数学调研测试的情况, ,学校决定从甲、乙两个班中各抽学校决定从甲、乙两个班中各抽取取101
23、0名学生的数学成绩名学生的数学成绩( (满分满分150150分分) )进行深入分析进行深入分析, ,得到如图所示的茎叶图得到如图所示的茎叶图, ,茎叶茎叶图中某学生的成绩因特殊原因被污染了图中某学生的成绩因特殊原因被污染了, ,如果甲、乙两个班被抽取的学生的平均如果甲、乙两个班被抽取的学生的平均成绩相同成绩相同, ,则被污染处的数值为则被污染处的数值为( () )(A)6(A)6 (B)7 (B)7 (C)8 (C)8 (D)9(D)9考点三样本的数字特征考点三样本的数字特征(2)(2)(2018(2018福田区校级期中福田区校级期中) )为了普及环保知识为了普及环保知识, ,增强环保意识增强
24、环保意识, ,某大学随机某大学随机抽取抽取3030名学生参加环保知识测试名学生参加环保知识测试, ,得分得分( (十分制十分制) )如图所示如图所示, ,假设得分的中位数假设得分的中位数为为m me e, ,众数为众数为m m0 0, ,则则( () )(A)m(A)me e=m=m0 0(B)m(B)m0 0mme e(C)m(C)me em0.85,0.04+0.08+0.15+0.20+0.26+0.15=0.880.85,而前而前5 5组的频率之和为组的频率之和为0.04+0.08+0.15+0.20+0.26=0.730.85,0.04+0.08+0.15+0.20+0.26=0.730.85,所以所以2.5x3.2.5x3.由由0.300.30(x-2.5)=0.85-0.73,(x-2.5)=0.85-0.73,解得解得x=2.9.x=2.9.所以所以, ,估计月用水量标准为估计月用水量标准为2.92.9吨时吨时,85%,85%的居民每月的用水量不超过标准的居民每月的用水量不超过标准. .点击进入点击进入应用能力提升应用能力提升