《2212《用样本的频率分布估计总体分布(二)》课件(新》由会员分享,可在线阅读,更多相关《2212《用样本的频率分布估计总体分布(二)》课件(新(19页珍藏版)》请在金锄头文库上搜索。
1、用样本的用样本的频率分布频率分布 估计总体分布估计总体分布 (二)(二)回忆:绘制频率分布直方图有哪几个步骤呢?绘制频率分布直方图有哪几个步骤呢? 第二步第二步: 决定组距与组数决定组距与组数: (强调取整)(强调取整) 第三步第三步: 将数据分组将数据分组 ( 给出组的界限给出组的界限) 第四步第四步: 列频率分布表列频率分布表. (包括分组、频数、频率(包括分组、频数、频率、频率、频率/组组距距) 第五步第五步: 画频率分布直方图画频率分布直方图(在频率分布表的基础上绘制,横(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率坐标为样本数据尺寸,纵坐标为频率/组距组距.) 组距组
2、距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时, 按数据多少常分按数据多少常分5-12组。组。画频率分布直方图的步骤画频率分布直方图的步骤:第一步第一步: 求极差求极差: (数据组中最大值与最小值的差距数据组中最大值与最小值的差距) 自学:1、频率分布折线图。、频率分布折线图。2、总体密度曲线。、总体密度曲线。3、茎叶图如何表示?、茎叶图如何表示?4、茎叶图与频率分布表的、茎叶图与频率分布表的 关系。关系。(一)(一)频率分布折线图频率分布折线图:画好频率分布图后,我们把频率分布直方图画好频率分布图
3、后,我们把频率分布直方图中各小长方形上端连接起来,得到的图形中各小长方形上端连接起来,得到的图形. .00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5画出频率分布折线图画出频率分布折线图. . 频率频率/组距组距 月均用水量月均用水量/t (取组距中点取组距中点, 并连线并连线 ) 0.080.160.30.440.50.30.10.080.04在样本频率分布直方图中,当样本容量增加,作图时在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线
4、,统计中称这条光滑曲线为来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线总体密度曲线. . 它能够精确地反映了总体在各个范围它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息内取值的百分比,它能给我们提供更加精细的信息. 总体密度曲线总体密度曲线:月均用水量月均用水量/t/t频率频率组距组距0ab1.1.对于任何一个总体,它的密度曲线是对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以不是一定存在?它的密度曲线是否可以被非常准确地画出来?被非常准确地画出来?思考 实际上,尽管有些总体密度曲线是客实际上,尽管有些总体密度曲线是客观存在的,但一般
5、很难像函数图象那样观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。量越大,这种估计就越精确。2.图中阴影部分的面积表示什么?图中阴影部分的面积表示什么?总体密度总体密度曲线与横轴围成的面积是多少?曲线与横轴围成的面积是多少?月均用水量月均用水量/t/t频率频率组距组距0ab总体在总体在区间区间(a,b)内取值的百分比)内取值的百分比 例例: : 甲乙两人比赛得分记录如下:甲乙两人比赛得分记录如下:甲:甲:13, 51, 23, 8, 26, 38,
6、 16, 33, 14, 28, 3913, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39乙:乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 3949, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39用茎叶图表示两人成绩,说明哪一个成绩好用茎叶图表示两人成绩,说明哪一个成绩好甲甲乙乙0 12345 2, 55, 41, 6, 1, 6, 7, 9 4, 90 8 4, 6, 3 3, 6, 8 3, 8, 9 1 叶叶 茎茎 叶叶(二)(二). . 茎叶图茎叶图 (
7、(一种被用来表示数据的图一种被用来表示数据的图) ) 茎叶图茎叶图 当数据是两位有效数字时,用中间的数字表示当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图因此通常把这样的图叫做茎叶图 画茎叶图的步骤画茎叶图的步骤:1.将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两部分两部分,在此在此例中例中,茎为十位上的数字茎为
8、十位上的数字,叶为个位上的数字叶为个位上的数字;2.将最小茎和最大茎之间的数按大小次序排成一列将最小茎和最大茎之间的数按大小次序排成一列,写在左写在左(右右)侧侧;3.将各个数据的叶按大小次序将各个数据的叶按大小次序写在其茎右写在其茎右(左左)侧侧.茎叶0813 4 623 6 833 8 9451()用茎叶图表示数据有两个优点:一是从统()用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。以随时记录,随
9、时添加,方便记录与表示。()茎叶图只便于表示两位有效数字的数据,()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么数据虽然能够记录,但是没有表示两个记录那么直观,清晰。直观,清晰。茎叶图的特征茎叶图的特征:频数频数茎茎叶叶2107, 81111 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,013126, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 04134, 2, 3, 0下表一组数据是某车间下表一组数据是某车间3030名工人加工零件的个数名
10、工人加工零件的个数, , 设计设计一个茎叶图表示这组数据一个茎叶图表示这组数据, ,并说明这一车间的生产情况并说明这一车间的生产情况. .134 112 117 126 128 124 122 116 113 107116 132 127 128 126 121 120 118 108 110133 130 124 116 117 123 122 120 112 112练习:练习:茎叶图与频率分布表的关系:茎叶图与频率分布表的关系:频率分频率分布布 表表中的分中的分组组茎叶茎叶图的图的茎茎相当于频率分布频率分布表中指定表中指定区间组的区间组的频数频数茎上茎上叶的叶的数目数目相当于1.四种图表的
11、区别和联系名称名称区别区别频率分布表从数量上比较准确地反映样本的频率分布规律频率分布直方图直观的反映样本的频率分布情况频率分布折线图反映了数据的变化趋势总体密度曲线虽然客观存在,但是要准确画出难度较大,只能用样本频率分布估计,样本容量越大,估计越准确四种图表都是描述样本数据分布情况、估计四种图表都是描述样本数据分布情况、估计样本频率分布规律的。其联系如下:样本频率分布规律的。其联系如下: 相同数据的两种不同表达形式样本容量增加组数增加,组距减小频率分布表频率分布直方图频率分布折线图总体密度曲线连接各小长方形上端的中点2.几种表示样本分布方法的比较表示样本分布表示样本分布的方法的方法优点优点缺点
12、缺点频率分布表在数量表示上比较确切不够直观、形象,损失了样本的一些信息,分析数据分布的总体态势不够方便频率分布直方图能表示大量数据;直观表示数据分布情况;得不出原始数据内容,把数据表示成直方图后,原有的数据信息被抹掉了频率分布折线图反映了数据的变化趋势原有的具体数据信息被抹掉了茎叶图1.由所有样本数据构成,没有原始信息的损失。2.便于记录和表示。3.能够展示数据的分布情况只方便记录两组数据;当样本数据较多时,茎叶图就显得不太方便小结:小结: 1.在在不不了解了解一个总体的分布情况时,往往从总体中抽取一个总体的分布情况时,往往从总体中抽取一个样本,用样本的频率分布去估计总体的频率分布,一个样本,
13、用样本的频率分布去估计总体的频率分布,样本容量越大,估计就越精确样本容量越大,估计就越精确. .2.2.表示样本分布的方法表示样本分布的方法有:频率分布表、有:频率分布表、频率分布频率分布直方直方图、图、频率分布折线图、频率分布折线图、茎叶图茎叶图. .3.3.当总体中的个体取值很少时,用茎叶图估计总体的分当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。表或频率分布直方图。布置作业布置作业:P101页第一题。页第一题。