《高中数学配套课件:第1部分 第二章 2.2 2.2.1 用样本的频率分布估计总体分布》由会员分享,可在线阅读,更多相关《高中数学配套课件:第1部分 第二章 2.2 2.2.1 用样本的频率分布估计总体分布(70页珍藏版)》请在金锄头文库上搜索。
1、2.2 用样本估计总体,理解教材新知,把握热点考向,应用创新演练,第二章 统计,知识点一,知识点二,考点一,考点二,考点三,2.2.1 用样本的频率分布估计总体分布,美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁,下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:,57,61,57,57,58,57,61,54,68,51,49,64,50, 48,65,52,56,46,54,49,51,47,55,55,54,42, 51,56,55,51,54,51,6
2、0,62,43,55,56,61,52, 69,64,46,54,48,问题1:上述44个数据中最大值与最小值的差是多少? 提示:694227 问题2:若将上述数据分成下列几组41.5,45.5),45.5,49.5),49.5,53.5)53.5,57.5),57.5,61.5)61.5,65.5),65.5,69.5)各组中数据个数是多少? 提示:各组数据的个数为2,7,8,16,5,4,2.,问题3:在直角坐标系中,能否将各组统计的数据直观地表示出来? 提示:可以,1用样本估计总体的两种情况 (1)用样本的 估计总体分布 (2)用样本的 估计总体数字特征 2绘制频率分布直方图的步骤 (1
3、)求极差:即一组数据中 的差,频率分布,数字特征,最大值与最小值,512,k,左闭右开,闭,分组,频数累计,频数,频率,合计,样本容量,1,(4)列频率分布表:一般分四列: 、 、 、 ,最后一行是 ,其中频数合计应是 ,频率合计应是 .,频率/组距,各小长方形的面积,1,3频率分布折线图和总体密度曲线 (1)频率分布折线图: 连接频率分布直方图中各小长方形 ,就得到了频率分布折线图,上端的中点,(2)总体密度曲线: 随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条 ,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.,光滑曲线,甲
4、、乙两个小组各10名学生的英语口语测试成绩(单位:分)如下: 甲组:76 90 84 86 81 87 86 82 85 83; 乙组:82 84 85 89 79 80 91 89 79 74;,问题1:从甲、乙两组得分情况能否得出甲、乙两组哪组的成绩更整齐? 提示:能甲组的成绩更整齐 问题2:上述两组数据能否用图形直观地分析? 提示:能,茎叶图的制作步骤 1将数据分为 和 两部分 2将最大茎和最小茎之间的数据按 ,写在中间位置 3将各个数据的 写在其茎右(左)侧,大小次序,排成一列,茎,叶,叶,1频率分布直方图中,各小长方形面积之和为1. 从频率分布直方图中,可清楚看到数据分布的形状 2总
5、体密度曲线一般的分布规律是呈中间高,两边低的山峰形态分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内它反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,3茎叶图主要是针对数据不多的样本,它不但可以保留原始数据,而且可以随时记录,但样本数据较多或数据位数较多时,不方便使用,例1 调查某校高一年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下: 171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 158 167
6、 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161,(1)作出频率分布表: (2)画出频率分布直方图 思路点拨 找出此组数据的最大值和最小值,确定分组的组距和组数,列出频数分布表,再由频率分布表绘制频率分布直方图,精解详析 (1)最低身高151 cm,最高身高180 cm,它们的差是18015129,即极差为29; 确定组距为4,组数为8,频率分布表如下:,(2)频率分布直方图如下,2组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情
7、况,若样本容量不超过100,按照数据的多少常分为512组,一般样本容量越大,所分组数越多,1.如图所示是一容量为100的样本的频 率分布直方图,则由图形中的数据, 样本落在15,20内的频数为 ( ) A20 B30 C40 D50,解析:样本落在15,20内的频率是15(0.040.1)0.3,则样本落在15,20内的频数为0.310030. 答案:B,2一个容量为20的样本,分组后,组距与频数如下: 10,20,2;(20,30,3;(30,40,4;(40,50,5;(50,60,4;(60,70,2.则样本在10,50上的频率为_,答案:0.7,3以下是某篮球运动员在80场比赛中的得分
8、情况: 19 19 12 10 16 12 21 20 12 23 21 18 20 14 19 20 15 22 16 8 11 10 12 21 14 16 15 12 18 12 15 21 16 10 4 15 6 21 21 22 13 19 17 37 12 12 9 16 16 22 7 25 29 12 12 16 14 41 20 17 13 14 33 27 29 19 19 17 29 10 11 28 25 14 27 16 6 23 21 15,如果将这80个数据分为8组,能否作出这组数据的频率分布表?若能,请作出频率分布直方图和频率分布折线图,解:由题意可知这80个
9、数据中最小值为4,最大值为41,其差为37,即极差为37.故根据题意可取区间3,42,将其分为8个区间,组距为5.这组数据的频率分布表如下:,频率分布直方图及频率分布折线图如图所示,例2 某良种培育基地正在培养一种小麦新品种A,将其与原有一个优良品种B进行对照实验,两种小麦各种植了25亩,所得亩产数数据(单位:千克)如下: 品种A:357,359,367,368,375,388,392,399,400,405, 412,414,415,421,423,423,427,430,430,434,443,445,445,451,454 品种B:363,371,374,383,385,386,391,
10、392,394,394, 395,397,397,400,401,401,403,406,407,410,412,415,416,422,430,(1)画出两组数据的茎叶图; (2)用茎叶图处理现有的数据,有什么优点? (3)通过观察茎叶图,对品种A与B的亩产量用其稳定性进行比较,写出统计结论 思路点拨 先根据茎叶图的绘制方法绘茎叶图再根据茎叶图判断亩产量的稳定性,精解详析 (1)茎叶图如图所示.,(2)用茎叶图处理现有的数据不但可以看出数据的分布情况,而且可以看出每组中的具体数据 (3)通过观察茎叶图,可以发现品种A 的平均亩产量约为411.1千克,品种B的平均亩产量为397.8千克由此可知
11、品种A的平均亩产量比品种B的平均亩产量高,但品种A的亩产量不够稳定,而品种B的亩产量比较集中在平均亩产量附近,一点通 绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶,4.如图是2002年至2011年某省城镇居民 百户家庭人口数的茎叶图图中左边 的数字从左到右分别表示城镇居民百 户家庭人口数的百位数字和十位数字,右边的数字表 示城镇居民百户家庭人口数的个位数字从图中可以 得到2002年至2011年该省城镇居民百户家庭人口数的 中位数为 ( ),A304 B3
12、03 C302 D306,答案:A,5为了调查甲、乙两个网站受欢迎的程度,随 机选取了14天,统计上午8001000间各自的点击量,得到如图所示的茎叶图,根据茎叶图解答下列问题:,(1)求甲网站点击量的中位数和乙网站点击量的极差; (2)求甲网站点击量在10,40间的频数和频率; (3)请你估计甲、乙两网站哪个更受欢迎?并说明理由,(3)观察茎叶图,得甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲的平均数大于乙的平均数,所以甲网站更受欢迎.,例3 为了解某校高一年级学生的体能情况,抽取部分学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方
13、图(如图),图中从左到右各小长方形的面积之比为24171593,第二小组的频数为12.,(1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110)为达标,则该校全体高一年级学生的达标率是多少? 思路点拨 (1)利用频率值等于对应小长方形面积来确定 (2)满足条件的频率之和即为达标率,一点通 1频率分布直方图的性质: (1)因为小矩形的面积组距频率/组距频率,所以各小矩形的面积表示相应各组的频率这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小 (2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数/相应的频率样本容量,2频率分布直方图反映了样
14、本在各个范围内 取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性,6某工厂对一批产品进行了抽样检测如图是根据抽 样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是 ( ),A90 B75 C60 D45,答案:A,7.已知200辆汽车通过某一段公 路时的时速的频率分布直方图 如图所示,时速在60,70)的 汽车大约有_辆,解析:由图可知,时速在60,70)的汽车的频率为0.04100.4, 时速在60,70)的汽车大约有2000.480辆 答案:80,1.几种表示样本分布方法的比较:,3用茎叶图可确定数据的中位数观察数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等,点击下图片进入“应用创新演练”,