《频率分布直方图与茎叶图》由会员分享,可在线阅读,更多相关《频率分布直方图与茎叶图(17页珍藏版)》请在金锄头文库上搜索。
1、用样本的频率分布估计总体分布用样本的频率分布估计总体分布衡南五中衡南五中 谭亮谭亮用样本的频率分布估计总体分布用样本的频率分布估计总体分布一一 频率分布图和频率分布直方图频率分布图和频率分布直方图二二频率分布折线图频率分布折线图 和总体密度曲线和总体密度曲线三三三三 莖叶图莖叶图下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析第一步第一步: : 求极差求极差: ( (数据组中最大值与最小值的差距数据组中最大值与最小值的差距) ) 最大值最大值= 4.3 = 4.3 最小值最小值= 0.2 = 0.2 所以
2、极差所以极差= 4.3-0.2 = 4.1= 4.3-0.2 = 4.1第二步第二步: : 决定组距与组数决定组距与组数: : (强调取整)(强调取整) 当样本容量不超过当样本容量不超过100100时时, , 按照数据的多少按照数据的多少, , 常分成常分成512512组组. .为方便组距的选择应力求为方便组距的选择应力求”取整取整”. ”. 本题如果组距为本题如果组距为0.5(t). 0.5(t). 则则 第三步第三步: : 将数据分组:将数据分组:( ( 给出组的界限给出组的界限) ) 所以将数据分成所以将数据分成9 9组较合适组较合适. . 0, 0.5), 0.5, 1), 1, 1.
3、5),4, 4.5) 共共9组组. 第四步第四步: : 列频率分布表列频率分布表. . (包括分组、频数、频率、频率(包括分组、频数、频率、频率/组距)组距) 分组分组频数频数频率频率频率频率/组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2合计合计100组距组距=0.5=0.5 0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.6 0.5 1 1.5 2
4、2.5 3 3.5 4 4.5第第五五步步: : 画画出出频频率率分分布布直直方方图图. 频率频率/ /组距组距 月均用水量月均用水量/t/t ( (组距组距=0.5)=0.5) 0.080.160.30.440.50.30.10.080.04小长方形的面小长方形的面积积=?=?小长方形的面小长方形的面积总和积总和=?=?月均用水量最月均用水量最多的在哪个区多的在哪个区间间? ?请大家阅读第请大家阅读第6767页页, ,直方图有直方图有哪些优点和缺哪些优点和缺点点? ?频率分布直方图的特征:频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布从频率分布直方图可以清楚的看出数据分布的的总
5、体趋势总体趋势。从频率分布直方图从频率分布直方图得不出原始的数据内容得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信把数据表示成直方图后,原有的具体数据信息就被抹掉了。息就被抹掉了。思考思考:从频率分布直方图中,你能得到任意从频率分布直方图中,你能得到任意区间(区间(a,b)的频率?的频率?有什么困难?有什么困难?00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5一、频率分布折线图与概率密度曲线一、频率分布折线图与概率密度曲线频率频率/组距组距 月均用水量月均用水量/t (取组距中点取组距中点, 并连线并连线 ) 0.080.160.30
6、.440.50.30.10.080.04在样本频率分布直方图中,当样本容量增加,作图时所在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越来越分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为接近于一条光滑曲线,统计中称这条光滑曲线为总体密总体密度曲线度曲线. . 它能够精确地反映了总体在各个范围内取值的它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息百分比,它能给我们提供更加精细的信息. 总体密度曲线总体密度曲线:月均用水量月均用水量/t/t频率频率组距组距0ab月均用水量月均用水量
7、/t/t频率频率组距组距0ab1.1.对于任何一个总体,它的密度曲线是不是一定存在?它对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?的密度曲线是否可以被非常准确地画出来?思考2.2.图中阴影部分的面积表示什么?图中阴影部分的面积表示什么?1.1.实际上,尽管有些总体密度曲线是客观存在实际上,尽管有些总体密度曲线是客观存在的,但一般很难想函数图象那样准确地画出来,的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确般来说,样本容量越大,这种估计就越精
8、确 二、二、茎叶图茎叶图 当数据是两位有效数字时,用中间的数字表示十位数,即第一当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图因此通常把这样的图叫做茎叶图 例例: : 甲乙两人比赛得分记录如下:甲乙两人比赛得分记录如下:甲:甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 3913, 51, 23, 8, 26,
9、38, 16, 33, 14, 28, 39乙:乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 3949, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39用茎叶图表示两人成绩,说明哪一个成绩好用茎叶图表示两人成绩,说明哪一个成绩好甲甲乙乙0 12345 2, 55, 41, 6, 1, 6, 7, 9 4, 90 8 4, 6, 3 3, 6, 8 3, 8, 9 1 叶叶 茎茎 叶叶合作探究合作探究 :茎叶图:茎叶图 ( (一种被用来表示数据的图一种被用来表示数据的图) ) 画茎叶图要注意什么:
10、画茎叶图要注意什么:1.将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两部分两部分,在此例中在此例中,茎为十位上的数字茎为十位上的数字,叶为个位上的数字叶为个位上的数字;2.将最小茎和最大茎之间的数按大小将最小茎和最大茎之间的数按大小次序排成一列次序排成一列,写在左写在左(右右)侧侧;3.将各个数据的叶按大小次序将各个数据的叶按大小次序写在其茎右写在其茎右(左左)侧侧.茎叶0813 4 523 6 833 8 9451两个优点两个优点: 一是:没有原始数据信息的损失;一是:没有原始数据信息的损失; 二是:茎叶图中的数据可以随时记录,随二是:茎叶图中的数据可以随时记录,随时添加
11、,方便记录与表示。时添加,方便记录与表示。茎叶图的特征茎叶图的特征:三个局限:三个局限:一是:只便于表示两位有效数字的数据;一是:只便于表示两位有效数字的数据;二是:茎叶图只方便记录两组的数据;二是:茎叶图只方便记录两组的数据;三是:数据量不能太大三是:数据量不能太大频数频数茎茎叶叶2107, 81111 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,013126, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 04134, 2, 3, 0下表一组数据是某车间下表一组数据是某车间3030名工人加工零件的个数名工人加工零件的个数, , 设计一个设计一个茎叶图表示这
12、组数据茎叶图表示这组数据, ,并说明这一车间的生产情况并说明这一车间的生产情况. .134 112 117 126 128 124 122 116 113 107116 132 127 128 126 121 120 118 108 110133 130 124 116 117 123 122 120 112 112练习:练习:小结:小结: 1.不易知一个总体的分布情况时,往往从总体中不易知一个总体的分布情况时,往往从总体中抽取一个样本,用样本的频率分布去估计总体的抽取一个样本,用样本的频率分布去估计总体的频率分布,样本容量越大,估计就越精确频率分布,样本容量越大,估计就越精确. .2. 2. 目前有:频率分布表、直方图、茎叶图目前有:频率分布表、直方图、茎叶图. .3.3.当总体中的个体取值很少时,用茎叶图估计总当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。布,方法是用频率分布表或频率分布直方图。