《数字特征和茎叶图课件.ppt》由会员分享,可在线阅读,更多相关《数字特征和茎叶图课件.ppt(33页珍藏版)》请在金锄头文库上搜索。
1、复习练习复习练习: 为了了解高一学生的为了了解高一学生的体能情况体能情况,某校抽取部分某校抽取部分学生进行一分钟跳绳次数学生进行一分钟跳绳次数测试,将所得数据整理后,测试,将所得数据整理后,画出频率分布直方图画出频率分布直方图( (如如图图) ),图中从左到右各小,图中从左到右各小长方形面积之比为长方形面积之比为2:4:17:15:9:3,第三小组,第三小组频数为频数为51.(1)(1)第三小组的频率是多第三小组的频率是多少少?样本容量是多少样本容量是多少? 90 100 110120130 140150次次数数00.0040.0080.0120.0160.0200.0240.028频率频率/
2、组距组距0.0320.0360.34 150(2)(2)若次数在若次数在110110以以上(含上(含110110次)为次)为达标,试估计该学达标,试估计该学校全体高一学生的校全体高一学生的达标率是多少?达标率是多少?90 100 110120130 140150次次数数00.0040.0080.0120.0160.0200.0240.028频率频率/组距组距0.0320.0361-0.12=0.88即达标率是即达标率是88%频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直
3、方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点,得到得到频率分布折线图频率分布折线图利用样本频分布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑那么频率分布直方图就会无限接近于一条光滑曲线曲线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上上例例的的样样本本容容量量为为100,如如果果增增至至1000,其其频频率率分分布布直直方方图图的的情情况况会会有有什什么么变变化化?假假如如增增至至1000
4、0呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间 (a, b) 内取值的百分比)。内取值的百分比)。 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的的分分布布规规律律,即即越越精精确确地地反反映映了了总总体体在在各各个个范范围围内内取取值值百分比。百分比。 总总体体密密度度曲曲线线反反映映了了总总体体
5、在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总总体分布的工具体分布的工具.总体密度曲线总体密度曲线1. 众数、中位数、平均数2.2.2 用样本的数字特征估计用样本的数字特征估计总体的数字特征总体的数字特征一一 、复习众数、中位数、平均数的概念、复习众数、中位数、平均数的概念 2、中位数中位数:将一组数据按大小依次排列,把处:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数数)叫做这组数据的中位数 1、众数众数:在一组数据中,出
6、现次数最多的数据叫:在一组数据中,出现次数最多的数据叫做这组数据的众数做这组数据的众数 众数、中位数、平均数众数、中位数、平均数都是描述一组数都是描述一组数据的集中趋势的特征数,只是描述的角度不据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛同,其中以平均数的应用最为广泛. 3、平均数、平均数: 一般地,如果一般地,如果n个数个数 ,那,那么,么, 叫做这叫做这n个数的平均数。个数的平均数。1、求下列各组数据的、求下列各组数据的众数众数(1)、1 ,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)、1 ,2,3,3,3,5,5,8,8,9,9众数是:32、求下
7、列各组数据的、求下列各组数据的中位数中位数(1)、1 ,2,3,3,3,4,6,8,8,8,9,9(2)1 ,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:4二二 、 众数、中位数、平均数与频率分布直方图众数、中位数、平均数与频率分布直方图的关系的关系 例如,在上一节抽样调查的例如,在上一节抽样调查的100位居民的位居民的月均用水量的数据中,我们得知这一组样本月均用水量的数据中,我们得知这一组样本数据的数据的 ,并画出过并画出过这组数据的频率分布直方图这组数据的频率分布直方图.众数众数 =2.3(t)中位数中位数=2.0(t)平均数平均数=2.0(t)现在,观察这组数据的频率分布
8、直方图,能现在,观察这组数据的频率分布直方图,能否得出这组数据的众数、中位数和平均数?否得出这组数据的众数、中位数和平均数?众数、中位数和平均数众数、中位数和平均数0.52.521.5143.534.5频率频率组距组距思考:小长方形面思考:小长方形面积、对应这个组的积、对应这个组的频率、这个组占的频率、这个组占的比例的关系。比例的关系。0.52.521.5143.534.5频率频率组距组距2.25 归纳总结得归纳总结得: 因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间2,2.5)的小长方形的面积最大,即这组的频率是
9、最大的,也就是说月均用水量在区间2,2.5)内的居民最多,即众数就是在区间2,2.5)内。 众数在样本数据的频率分布直方图中,众数在样本数据的频率分布直方图中,就是最高矩形的就是最高矩形的中点中点的横坐标。的横坐标。0.52.521.5143.534.5频率频率组距组距0.040.080.150.220.250.140.060.040.02提示:中位数左边的提示:中位数左边的数据个数数据个数与右边的与右边的数数据个数据个数是相等的。是相等的。0.52.521.5143.534.5频率频率组距组距0.040.080.150.220.250.140.060.040.02前四个小矩形的前四个小矩形的
10、面积和面积和=0.49后四个小矩形的后四个小矩形的面积和面积和=0.262.02 归纳总结得:归纳总结得: 在样本中,有在样本中,有50的个体小于或等于中位数,的个体小于或等于中位数,也有也有50的个体大于或等于中位数的个体大于或等于中位数,因此,在频,因此,在频率分布直方图中,中位数左边和右边的直方图的率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。在这面积应该相等,由此可以估计中位数的值。在这个频率分布直方图中,左边的直方图的面积代表个频率分布直方图中,左边的直方图的面积代表50个单位,右边的直方图也是代表个单位,右边的直方图也是代表50个单位,它个单位,它
11、们的分界线与们的分界线与x轴交点的横坐标就是中位数。轴交点的横坐标就是中位数。 中位数在样本数据的频率分布直方图中,就中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两个面积相等的分是把频率分布直方图划分左右两个面积相等的分界线与界线与x轴交点的横坐标。轴交点的横坐标。思考讨论以下问题:思考讨论以下问题:1、2.02这个中位数的估计值,与样本的中这个中位数的估计值,与样本的中位数值位数值2.0不一样,你能解释其中原因吗?不一样,你能解释其中原因吗?答:答:2.02这个中位数的估计值这个中位数的估计值,与样本的与样本的中位数值中位数值2.0不一样,这是因为样本数据的不一样,这是因
12、为样本数据的频率分布直方图,只是直观地表明分布的频率分布直方图,只是直观地表明分布的形状,但是形状,但是从直方图本身得不出原始的数从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致值往往与样本的实际中位数值不一致.0.52.521.5143.534.5频率频率组距组距0.040.080.150.220.250.140.060.040.02提示:在频率分布提示:在频率分布直方图中直方图中,各个组的各个组的平均数如何找?平均数如何找?0.52.52
13、1.5143.534.5频率频率组距组距0.040.080.150.220.250.140.060.040.02.0.751.752.252.753.253.754.251.250.25提示:与小长提示:与小长方形面积的比方形面积的比例有关吗?例有关吗?0.52.521.5143.534.5频率频率组距组距0.040.080.150.220.250.140.060.040.022.02.0.751.752.252.753.253.754.251.250.25 总结归纳得: 平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,是直方图的平衡点。,是直方图的平衡点。 先找出每个小长先找出
14、每个小长方形的方形的“重心重心”,即每小组的平均数,再,即每小组的平均数,再按比例算出直方图的平均数。按比例算出直方图的平均数。 平均数在样本数据的频率分布直方图平均数在样本数据的频率分布直方图中,等于频率分布图中每个小长方形面积中,等于频率分布图中每个小长方形面积乘以小矩形底边中点的横坐标之和。乘以小矩形底边中点的横坐标之和。三三 、三种数字特征的优缺点、三种数字特征的优缺点 1、众数体现了样本数据的最大集中点,但它、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体对其它数据信息的忽视使得无法客观地反映总体特征。特征。 2、中位数是样本数据所占频率的等分线,、中
15、位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺是优点,但它对极端值的不敏感有时也会成为缺点。点。 3、平均数与每一个样本的数据有关,与众数、平均数与每一个样本的数据有关,与众数、中位数比较起来,平均数可以反映出更多的关于中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。值的影响较大,使平均数在估计时可靠性降低。 茎叶图茎叶图 问题情境问题情境 1情境:某篮球运动员在某
16、赛季情境:某篮球运动员在某赛季各场比赛的得分情况如下:各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50 2问题:如何有条理地列出这些数问题:如何有条理地列出这些数据据, 分析该运动员的整体水平及发挥分析该运动员的整体水平及发挥的稳定程度?的稳定程度? 注注 中位数:一排数字中位数:一排数字 把他从小到大排列最中间的那个数把他从小到大排列最中间的那个数 如果这排如果这排数的个数是单数则中位数为中间那两个数的平均数数的个数是单数则中位数为中间那两个数的平均数 .众数:一排数字众数:一排数字中出现最多的数中出现最多的数 。众数不一定唯一。众数不一定
17、唯一建构数学建构数学 茎叶图茎叶图的概念:的概念:一般地:当数据是一般地:当数据是一位和两位一位和两位有效数有效数字时,用中间的数字表示十位数,即字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的上长出来的叶子,因此通常把这样的图叫做图叫做茎叶图茎叶图。茎按从小到大的顺序。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大从上向下列出,共茎的叶一般按从大到小到小( (或从小到大或从小到大)
18、)的顺序同行列出。的顺序同行列出。茎叶图的特征茎叶图的特征:()用茎叶图表示数据有两个优点:()用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;时记录,随时添加,方便记录与表示; ()茎叶图只便于表示两位(或一()茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的
19、数据虽记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录然能够记录,但是没有表示两个记录那么直观,清晰;那么直观,清晰;()茎叶图对重复出现的数据要重()茎叶图对重复出现的数据要重复记录,不能遗漏复记录,不能遗漏 例例2甲、乙两甲、乙两篮篮球运球运动员动员在上在上赛赛季季每每场场比比赛赛的得分如下,的得分如下,试试比比较这较这两位两位运运动员动员的得分水平的得分水平甲甲 1212,1515,2424,2525,3131,3131,3636,3636,3737,3939,4444,4949,5050乙乙 8,13,14,16,23,26,28,33,38,39,51解:画出两人得分
20、的茎叶图;解:画出两人得分的茎叶图;从这个茎叶图可以看出甲运动员的得分大致对称,平均从这个茎叶图可以看出甲运动员的得分大致对称,平均得分及中位数、众数都是多分;乙运动员的得分除得分及中位数、众数都是多分;乙运动员的得分除一个外,也大致对称,平均得分及中位数、众数都一个外,也大致对称,平均得分及中位数、众数都是多分,因此甲运动员发挥比较稳定,总体得分情是多分,因此甲运动员发挥比较稳定,总体得分情况比乙好况比乙好 练习:练习: 1.1.右面是甲、右面是甲、乙两名运乙两名运动员动员某某赛赛季一些季一些场场次得分的茎叶次得分的茎叶图图,据,据图图可知可知 ( )甲甲012345乙乙8247199362
21、50328754219441AA甲运动员的成绩好于乙运动员甲运动员的成绩好于乙运动员B乙运动员的成绩好于甲运动员乙运动员的成绩好于甲运动员C甲、乙两名运甲、乙两名运动员动员的成的成绩绩没有明没有明显显的差异的差异D甲运甲运动员动员的最低得分的最低得分为为0分分2 .2 . 2002-20032002-2003赛季赛季 , ,一球员在一球员在 NBA NBA 某些场次的比赛所某些场次的比赛所得篮板球数分别为得篮板球数分别为: :16 , 6 , 3 , 5 , 12 , 8 , 13 , 6 , 10 , 3 , 19 , 14 , 9 , 7 , 10 , 16 , 6 , 3 , 5 , 1
22、2 , 8 , 13 , 6 , 10 , 3 , 19 , 14 , 9 , 7 , 10 , 10 , 9 , 11 , 6 , 11 , 12 , 14 , 8 , 6 , 10 , 5 , 10 , 11 , 13 , 9 , 10 , 9 , 11 , 6 , 11 , 12 , 14 , 8 , 6 , 10 , 5 , 10 , 11 , 13 , 9 , 10 , 10 , 7 , 6 , 11 , 12 , 17 , 4 , 12 , 8 , 10 , 12 , 9 , 15 , 10 , 10 , 7 , 6 , 11 , 12 , 17 , 4 , 12 , 8 , 10
23、 , 12 , 9 , 15 , 15 , 12 , 13 , 18 , 8 , 16 , 15 , 12 , 13 , 18 , 8 , 16 , 请制作这些数据的茎叶图请制作这些数据的茎叶图 . .013 3 4 5 5 6 6 6 6 6 7 7 8 8 8 8 9 9 9 90 0 0 0 0 0 0 0 1 1 1 1 2 2 2 2 2 2 3 3 3 4 4 5 5 6 6 7 8 93.3.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图下面是甲、乙两名运动员某赛季一些场次得分的茎叶图: :甲甲乙乙014235503287542194418247199362( 1 ) ( 1 ) 甲乙两名队员的最高得分各是多少甲乙两名队员的最高得分各是多少? ?他他们的中位数和众数各是们的中位数和众数各是多少多少?( 2 ) ( 2 ) 哪名运动员的成绩好哪名运动员的成绩好一些一些? ?( 1 ) ( 1 ) 甲运动员的最高得分为甲运动员的最高得分为5151分分 , ,中位数为中位数为36,众数为,众数为44.乙运动员的最高分为乙运动员的最高分为5252分,分,中位数为中位数为25,众数为,众数为29.( 2 ) ( 2 ) 甲运动员的成绩好于乙运动员甲运动员的成绩好于乙运动员 . .