《高中数学2.2.1用样本的频率分布估计总体分布同步学案新人教A版ppt课件》由会员分享,可在线阅读,更多相关《高中数学2.2.1用样本的频率分布估计总体分布同步学案新人教A版ppt课件(56页珍藏版)》请在金锄头文库上搜索。
1、2.2 用样本估计总体用样本估计总体2.2.1 用样本的频率分布估计总体分用样本的频率分布估计总体分布布自自 学学 导 引引1.通过实例体会分布的意义和作用通过实例体会分布的意义和作用.2.在表示样本数据的过程中在表示样本数据的过程中,学会列频率分布表学会列频率分布表,画频率分布画频率分布直方图直方图 频率折线图和茎叶图频率折线图和茎叶图.3.通过实例体会频率分布直方图通过实例体会频率分布直方图 频率分布表频率分布表 频率折线图频率折线图 茎叶图的各自特征茎叶图的各自特征,从而恰当地选择上述方法分析样本的分从而恰当地选择上述方法分析样本的分布布,从而准确地做出总体估计从而准确地做出总体估计.课
2、 前前 热 身身1.通常我们对总体作出的估计一般分成两种通常我们对总体作出的估计一般分成两种:一种是用一种是用_;另一种是用另一种是用_.2.分析数据的一种基本方法是用图将它们画出来分析数据的一种基本方法是用图将它们画出来,或者用紧凑或者用紧凑的表格改变数据的排列方式的表格改变数据的排列方式.作图可以达到两个目的作图可以达到两个目的:一是一是_;二是二是_,表格则是通表格则是通过过_,为我们提供为我们提供_的新方式的新方式.样本的本的频率分布估率分布估计总体的分布体的分布 样本的数字特征估本的数字特征估计总体的数字特征体的数字特征 从数据中提取信息从数据中提取信息 利用利用图形形传递信息信息
3、改改变数据的构成形式数据的构成形式 解解释数据数据 3.在频率分布直方图中在频率分布直方图中,纵轴表示纵轴表示_,数据落数据落在各小组内的频率用在各小组内的频率用_表示表示.各小长方形的面各小长方形的面积总和积总和_.4.连结频率分布直方图中各小长方形上端的中点连结频率分布直方图中各小长方形上端的中点,就得到频率就得到频率分布折线图分布折线图.随着随着_的增加的增加,作图时所分的作图时所分的_在增加在增加,相应的频率分布折线图就会越来越接近于一条光滑相应的频率分布折线图就会越来越接近于一条光滑曲线曲线,统计中称之为总体密度曲线统计中称之为总体密度曲线,它能够更加精细的反映出它能够更加精细的反映
4、出_.频率与率与组距的比距的比值 小小长方形的面方形的面积 等于等于 样本容量本容量 组数数 总体在各个范体在各个范围内取内取值的百分比的百分比 5.当样本数据较少时当样本数据较少时,用茎叶图表示数据的效果较好用茎叶图表示数据的效果较好.它不但它不但可以可以_,而且而且_,给数据的给数据的_和和_都带来了方便都带来了方便.保留所有信息保留所有信息可以随时记录可以随时记录记录记录表示表示名名 师 讲 解解1.频率分布表频率分布表(1)编制频率分布表的一般步骤编制频率分布表的一般步骤:求极差求极差.决定决定组数和数和组距距,组距距分分组.通常通常对组内数内数值所在区所在区间取左取左闭右开区右开区间
5、,最后一最后一组取取闭区区间;统计频数数.计算算频率率,列出列出频率分布表率分布表.(2)频率分布表在数量表示上比率分布表在数量表示上比较确切确切,但不但不够直直观形象形象,分分析数据分布的析数据分布的总体体态势不太方便不太方便.2.频率分布直方图频率分布直方图(1)作频率分布直方图的方法为作频率分布直方图的方法为:把横轴分出若干段把横轴分出若干段,每一线每一线段段对应一组组距对应一组组距,然后以此线段为底作一矩形然后以此线段为底作一矩形,它的高等于该组它的高等于该组的频率的频率/组距组距,这样得到了一系列的矩形这样得到了一系列的矩形,每个矩形的面积恰每个矩形的面积恰好好是该组上的频率是该组上
6、的频率.这些矩形就构成了频率分布直方图这些矩形就构成了频率分布直方图.(2)频率分布直方率分布直方图能能够很容易地表示大量数据很容易地表示大量数据,非常直非常直观地地表明分布的形状表明分布的形状,使我使我们能能够看到在分布表中看不清楚的数看到在分布表中看不清楚的数据模式据模式.但是从直方但是从直方图本身得不出原始数据内容本身得不出原始数据内容,也就是也就是说,把把数据表示成直方数据表示成直方图后后,原有的具体数据信息就被抹掉了原有的具体数据信息就被抹掉了.3.频率分布折线图频率分布折线图(1)如果将频率分布直方图中相邻的矩形的上底边的中点顺如果将频率分布直方图中相邻的矩形的上底边的中点顺次次连
7、接起来连接起来,就得到一条折线就得到一条折线,这条折线为样本数据的频率分布这条折线为样本数据的频率分布折线图折线图.如果将样本容量取得足够大如果将样本容量取得足够大,分组的组距足够小分组的组距足够小,则则这这条折线就趋近于一条曲线条折线就趋近于一条曲线,这条曲线称为总体分布的密度曲这条曲线称为总体分布的密度曲线线.(2)频率分布折线图的优点是它反映了数据的变化趋势频率分布折线图的优点是它反映了数据的变化趋势.4.茎叶图茎叶图(1)统计中还有一种被用来表示数据的图叫做茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指茎是指中间的一列数中间的一列数,叶是从茎的旁边生长出来的数叶是从茎的旁边生
8、长出来的数.一般情况下茎一般情况下茎按从小到大的顺序从上向下列出按从小到大的顺序从上向下列出,其茎的叶一般按从大到小其茎的叶一般按从大到小(或从小到大或从小到大)的顺序同行列出的顺序同行列出.(2)用茎叶图刻画数据有两个优点用茎叶图刻画数据有两个优点:一是所有的信息都可以从一是所有的信息都可以从这个茎叶图中得到这个茎叶图中得到;二是茎叶图便于记录和表示二是茎叶图便于记录和表示,能够展示数能够展示数据的分布情况据的分布情况.但当样本数据较多或数据位数较多时但当样本数据较多或数据位数较多时,茎叶图茎叶图就显得不太方便了就显得不太方便了.典典 例例 剖剖 析析题型一题型一 计算频率计算频率例例1:一
9、个容量为一个容量为20的样本的样本,分组后分组后,组距与频数如组距与频数如下下:(10,20,2;(20,30,3;(30,40,4;(40,50,5;(50,60,4;(60,70,2;则样本在则样本在(-,50上的频率为上的频率为( )答案答案:D变式式训练1:已知已知样本本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,12,那么那么这组数据落在数据落在8.511.5内的内的频率率为_.解析解析:样本本总数数为20个个,数据落在数据落在8.511.5内的内的样本个数本个数为8个个,故故频率率为0.4题型二题型二 频率分布直方图的绘制频率分
10、布直方图的绘制例例2:下表给出了某校下表给出了某校120名名12岁男孩的身高资料岁男孩的身高资料.(单位单位:cm)区区间界限界限 122,126122,126) )126,130126,130) )130,134130,134) )134,138134,138) )138,142138,142) )人数人数5 58 8101022223333区区间界限界限 142,146142,146) )146,150146,150) )150,154150,154) )154,158154,158) )人数人数202011116 65 5(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布
11、直方图画出频率分布直方图;(3)根据样本的频率分布图根据样本的频率分布图,估计身高小于估计身高小于134 cm的人数约占的人数约占总人数的百分比总人数的百分比.分析分析:题目要求列出样本的频率分布表和画出频率分布直方题目要求列出样本的频率分布表和画出频率分布直方图图,应注意到已知中虽未提供原始数据应注意到已知中虽未提供原始数据,但组距但组距 组数及频数组数及频数都都已给出已给出.同时题目要求将累计频率及累计频率分布图一并绘同时题目要求将累计频率及累计频率分布图一并绘出出.解解:(1)频率分布表如下频率分布表如下:区区间人数人数人数人数频率率122,126)122,126)5 5126,130)
12、126,130)8 8130,134)130,134)1010134,138)134,138)2222138,142)3333续表续表142,146)142,146)2020146,150)146,150)1111 150,154) 150,154)6 6 154,158) 154,158)5 5(2)频率分布直方图和累计频率分布如下图频率分布直方图和累计频率分布如下图:(3)由上图估计由上图估计,身高小于身高小于134 cm的学生数约占总数的的学生数约占总数的19%.误区警示区警示:在画直方在画直方图时,易出易出现把直方把直方图中的中的纵坐坐标做做频率率的的错误.变式训练变式训练2:对某电子
13、元件进行寿命追踪调查对某电子元件进行寿命追踪调查,情况如下情况如下:(1)列出列出频率分布表率分布表;(2)画出画出频率分布直方率分布直方图;(3)估估计电子元件寿命在子元件寿命在400 h以上的个数占以上的个数占总数的百分比数的百分比.寿命寿命(h)(h)100100200200200200300300300300400400400400500500500500600600个数个数20203030808040403030分析分析:由频率分布表由频率分布表,可算出电子元件寿命在可算出电子元件寿命在100 h400 h以以内或在内或在400 h以上的频率以上的频率,正确列出频率分布表是解决此类题
14、正确列出频率分布表是解决此类题目的关键目的关键.解解:(1)频率分布表如下频率分布表如下:寿命寿命(h)(h)频数数频率率10020010020020200.100.1020030020030030300.150.15300400300400 80 800.400.4040050040050040400.200.2050060050060030300.150.15合合计2002001 1(2)频率分布直方图如下图频率分布直方图如下图:题型三题型三 茎叶图茎叶图例例3:某某赛季甲乙两名季甲乙两名篮球运球运动员每每场比比赛的得分情况如下的得分情况如下:甲的得分甲的得分:12,15,24,25,31
15、,31,36,36,37,39,44,49,50;乙的得分乙的得分:8,13,14,16,23,26,28,33,38,39,51.(1)画出甲乙两名运画出甲乙两名运动员得分数据的茎叶得分数据的茎叶图;(2)根据茎叶根据茎叶图分析甲乙两运分析甲乙两运动员的水平的水平.分析分析:按照作茎叶按照作茎叶图的方法首先画出茎叶的方法首先画出茎叶图,然后分析然后分析.解解:(1)作出茎叶图如下所示作出茎叶图如下所示:(2)由上面的茎叶图可以看出由上面的茎叶图可以看出,甲运动员的得分情况是大致对甲运动员的得分情况是大致对称的称的,中位数是中位数是36;乙运动员的得分情况除一个特殊得分外乙运动员的得分情况除一
16、个特殊得分外,也也大致对称大致对称,中位数是中位数是26.因此甲运动员的发挥比较稳定因此甲运动员的发挥比较稳定,总体得总体得分情况比乙运动员好分情况比乙运动员好.规律技巧规律技巧:当数据较少时当数据较少时,用茎叶图分析问题的突出优点是用茎叶图分析问题的突出优点是:(1)保留原始信息保留原始信息.(2)随时记录随时记录.用茎叶图分析数据可以运用数用茎叶图分析数据可以运用数据据分布的对称情况分布的对称情况,集中分散情况来分析总体情况集中分散情况来分析总体情况.变式式训练3:有关部有关部门从甲乙两个城市所有的自从甲乙两个城市所有的自动售售货机中机中分分别随机抽取了随机抽取了16台台,记录下一上午各自
17、的下一上午各自的销售情况售情况:(单位位:元元)甲甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;乙乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.(1)请写出写出这两两组数据的茎叶数据的茎叶图;(2)将将这两两组数据数据进行比行比较分析分析,你能得到什么你能得到什么结论.分析分析:由茎叶由茎叶图可以直可以直观地看出一地看出一组数据集中的数据集中的趋势.解解:(1)(2)甲城市一上午的甲城市一上午的销售情况比售情况比较稳定定;乙城市一上午的乙城市一上午的销售售额较高高.题型四题型四 频率直方图的应
18、用频率直方图的应用例例4:为了解电视对生活的影响为了解电视对生活的影响,一个社会调查机构就平均每天一个社会调查机构就平均每天看电视的时间对某地居民调查了看电视的时间对某地居民调查了10000人人,并根据所得数据画并根据所得数据画出样本的频率分布直方图出样本的频率分布直方图(如图如图),为了分析该地居民平均每为了分析该地居民平均每天天看电视的时间与年龄看电视的时间与年龄 学历学历 职业等方面的关系职业等方面的关系,要从要从10000人人中再用分层抽样方法抽出中再用分层抽样方法抽出100人做进一步调查人做进一步调查,则在则在2.5,3(小小时时)时间段内应抽出的人数是时间段内应抽出的人数是( )A
19、.25 B.30C.50 D.75解析解析:抽出的抽出的100人中平均每天看人中平均每天看电视的的时间在在2.5,3(小小时)时间段内的段内的频率是率是0.50.5=0.25,所以所以这10000人中平均每人中平均每天看天看电视时间在在2.5,3(小小时)时间段内的人数段内的人数为100000.25=2500,又抽又抽样比比为 故在故在2.5,3(小小时)时间段内段内应抽出人数抽出人数为答案答案:A变式训练变式训练4:(2010石家庄二模石家庄二模)为了了解高三学生的数学成为了了解高三学生的数学成绩绩 ,抽取了某班抽取了某班60名学生名学生,将所得数据整理后将所得数据整理后,画出其频率分画出其
20、频率分布布直方图直方图,如图所示如图所示,已知从左到右各长方形高的比为已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在则该班学生数学成绩在(80,100)之间的学生人数之间的学生人数是是( )A.32 B.27C.24 D.33解析解析:由于所有矩形面由于所有矩形面积之和等于之和等于1,所以所以该班学生数学成班学生数学成绩在在(80,100)之之间的的频率是率是故故该班学生数学成班学生数学成绩在在(80,100)之之间的学生人数的学生人数为答案答案:D技技 能能 演演 练基础强化基础强化1.在用样本频率估计总体分布的过程中在用样本频率估计总体分布的过程中,下列说法中正确
21、的是下列说法中正确的是( )A.总体容量越大总体容量越大,估计越精确估计越精确B.总体容量越小总体容量越小,估计越精确估计越精确C.样本容量越大样本容量越大,估计越精确估计越精确D.样本容量越小样本容量越小,估计越精确估计越精确答案答案:C2.下列叙述中正确的是下列叙述中正确的是( )A.从频率分布表可以看出样本数据对于平均数的波动大小从频率分布表可以看出样本数据对于平均数的波动大小B.频数是指落在各个小组内的数据频数是指落在各个小组内的数据C.每小组的频数与样本容量之比是这个小组的频率每小组的频数与样本容量之比是这个小组的频率D.组数是样本平均数除以组距组数是样本平均数除以组距解析解析:由频
22、率的意义知由频率的意义知,选项选项C正确正确.答案答案:C3.频率分布直方图中频率分布直方图中,小长方形的面积等于小长方形的面积等于( )A.相应各组的频数相应各组的频数B.相应各组的频率相应各组的频率C.组数组数D.组距组距解析解析:频率分布直方率分布直方图中中,小小长方形的面方形的面积即小即小长方形的面方形的面积等于相等于相应组的的频率率.答案答案:B4.一个容量为一个容量为n的样本的样本,分成若干组分成若干组,已知某组的频数和频率已知某组的频数和频率分分别为别为40,0.125,则则n的值为的值为( )A.640 B.320C.240 D.160答案答案:B5.将容量为将容量为100的样
23、本数据的样本数据,按由小到大排列分成按由小到大排列分成8个小组个小组,如如下表所示下表所示:第第3组的的频率和累率和累积频率率为( )组号号1 12 23 34 45 56 67 78 8频数数10101313141414141515131312129 9答案答案:A6.200辆汽车通过某一段公路时的时速频率分布直方图如下辆汽车通过某一段公路时的时速频率分布直方图如下图所示图所示,则时速在则时速在50,60)的汽车大约有的汽车大约有_辆辆.60解析解析:由频率分布直方图知由频率分布直方图知,时速在时速在50,60)的汽车大约有的汽车大约有100.03200=60辆辆.7.将一批数据分成将一批数
24、据分成5组列出频率分布表组列出频率分布表,其中第其中第1组的频率是组的频率是0.1,第第4组与第组与第5组的频率之和是组的频率之和是0.3,那么第那么第2组与第组与第3组的频组的频率之和是率之和是_.解析解析:第第2组与第组与第3组频率之和为组频率之和为1-0.1-0.3=0.6.0.68.某化肥厂甲某化肥厂甲 乙两个车间包装肥料乙两个车间包装肥料,在自动包装传送带上每在自动包装传送带上每隔隔30分钟抽取一包产品分钟抽取一包产品,称其重量称其重量,分别记录如下分别记录如下:甲甲:52,51,49,48,53,48,49乙乙:60,65,40,35,25,65,60(1)这种抽样方法是哪一种抽样
25、方法这种抽样方法是哪一种抽样方法?(2)画出茎叶图画出茎叶图,并说明哪个车间的产品比较稳定并说明哪个车间的产品比较稳定.解解:(1)该抽样方法为系统抽样法该抽样方法为系统抽样法.(2)茎叶如图所示茎叶如图所示:由图可以看出甲车间的产品重量较集中由图可以看出甲车间的产品重量较集中,而而乙车间的产品重量较分散乙车间的产品重量较分散,所以甲车间的产品较稳定所以甲车间的产品较稳定.能力提升能力提升9.某个容量为某个容量为100的样本的频率分布直方图如下的样本的频率分布直方图如下,则在区间则在区间4,5)上的数据的频数为上的数据的频数为_.解析解析:由由题知知,在区在区间4,5)上的上的频率率为1(0.
26、40+0.15+0.10+0.05)=0.3.又又样本容量本容量为100,所以所以频数数为1000.3=30.答案答案:3010.(2009海南高三四校联考海南高三四校联考)下面是某中学下面是某中学2008年高考各分年高考各分数段的考生人数分布表数段的考生人数分布表:分数分数频数数频率率300,400)300,400)5 5400,500)400,500)90900.0750.075500,600)500,600)499499600,700)600,700)0.4250.425700,800)700,800)? ?800,900)800,900)8 8则分数在则分数在700,800)的人数为的
27、人数为_人人.解析解析:由于在分数段由于在分数段400,500)内的内的频数是数是90,频率是率是0.075,则该中学共有考生中学共有考生 则在分数段在分数段600,700)内内的的频数是数是12000.425=510,则分数在分数在700,800)内的内的频数数,即即人数人数为1200-(5+90+499+510+8)=88.88品味高考品味高考11.(2009山东山东)某工厂对一批产品进行了抽样检测某工厂对一批产品进行了抽样检测,下图是根下图是根据抽样检测后的产品净重据抽样检测后的产品净重(单位单位:克克)数据绘制的频率分布直数据绘制的频率分布直方方图图,其中产品净重的范围是其中产品净重的
28、范围是96,106,样本数据分组为样本数据分组为96,98),98,100),100,102),102,104),104,106.已知已知样本中样本中产品净重小于产品净重小于100克的个数是克的个数是36,则样本中净重大于或等于则样本中净重大于或等于98克并且小于克并且小于104克的产品的个数是克的产品的个数是( )A.90 B.75C.60 D.45解析解析:由由频率分布直方率分布直方图知知,产品品净重小于重小于100克的克的频率率为(0.050+0.100)2=0.300,设样本容量本容量为n,已知已知样本中本中产品品净重小于重小于100克的个数克的个数为36,则 ,n=120.又又样本本
29、中中净重大于或等于重大于或等于98克并且小于克并且小于104克的克的频率率为(0.100+0.150+0.125)2=0.3752=0.75.所求所求产品的个数品的个数为1200.75=90.答案答案:A12.(2009福建福建)某校开展某校开展“爱我海西爱我海西 爱我家乡爱我家乡”摄影比赛摄影比赛,9位位评委为参赛作品评委为参赛作品A给出的分数如茎叶图所示给出的分数如茎叶图所示.记分员在去掉一记分员在去掉一个最高分和一个最低分后个最高分和一个最低分后,算得平均分为算得平均分为91,复核员在复核时复核员在复核时,发现有一个数字发现有一个数字(茎叶图中的茎叶图中的x)无法看清无法看清,若记分员计算无误若记分员计算无误,则数字则数字x应该是应该是_.1