第三章统计整理

上传人:壹****1 文档编号:567659985 上传时间:2024-07-21 格式:PPT 页数:29 大小:269.50KB
返回 下载 相关 举报
第三章统计整理_第1页
第1页 / 共29页
第三章统计整理_第2页
第2页 / 共29页
第三章统计整理_第3页
第3页 / 共29页
第三章统计整理_第4页
第4页 / 共29页
第三章统计整理_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《第三章统计整理》由会员分享,可在线阅读,更多相关《第三章统计整理(29页珍藏版)》请在金锄头文库上搜索。

1、第三章 统计数据的整理与显示第一节第一节数据的预处理数据的预处理n一、数据的审核与筛选一、数据的审核与筛选n1.原始数据的审核:原始数据的审核:n(1)完整性)完整性(2)准确性)准确性n2.二手数据的审核:二手数据的审核:n(1)完整性)完整性n(2)准确性)准确性n n(3)适用性和实效性)适用性和实效性n二、数据的排序:升序、降序二、数据的排序:升序、降序第二节 品质数据的整理与显示例:一家评估机构为调查不同品牌例:一家评估机构为调查不同品牌饮料的市场占有率,对随机抽取饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员的一家超市进行了调查。调查员在某天对照在某天对照50名顾客购买饮

2、料的名顾客购买饮料的品牌进行了记录,如果一个顾客品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。下面饮料的品牌名字记录一次。下面的表的表31是记录的原始数据是记录的原始数据。顾客购买饮料的品牌名称 表3-1n旭日升旭日升露露露露旭日升旭日升可口可乐可口可乐百事可乐百事可乐可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐露露露露可口可乐可口可乐 可口可乐可口可乐旭日升旭日升可口可乐可口可乐百事可乐百事可乐露露露露旭日升旭日升旭日升旭日升百事可乐百事可乐可口可乐可口可乐旭日升旭日升旭日升旭日升可口可乐可口可乐可口可乐可口可乐旭日升旭日升露

3、露露露旭日升旭日升可口可乐可口可乐露露露露百事可乐百事可乐百事可乐百事可乐汇源果汁汇源果汁露露露露百事可乐百事可乐可口可乐可口可乐百事可乐百事可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁露露露露可口可乐可口可乐旭日升旭日升百事可乐百事可乐露露露露汇源果汁汇源果汁可口可乐可口可乐百事可乐百事可乐露露露露旭日升旭日升购买饮料的频数分布 表32饮料名称饮料名称频数频数(人次人次)可口可乐可口可乐旭日升冰茶旭日升冰茶百事可乐百事可乐露露露露汇源果汁汇源果汁其其他他15119960合合计计50品质标志品质标志品质数据的图示n条形图n圆形图条形图是用宽度相同的条形的

4、高条形图是用宽度相同的条形的高度或长短来描述已概括成频数、相对度或长短来描述已概括成频数、相对频数或百分比频数分布的品质数据。频数或百分比频数分布的品质数据。条形图可以横置或纵置,纵置时也称条形图可以横置或纵置,纵置时也称为柱形图。图为柱形图。图31是是50名顾客购买饮料名顾客购买饮料的频数分布的条形图(柱形图),图的频数分布的条形图(柱形图),图形非常直观地显示了可口可乐和旭日形非常直观地显示了可口可乐和旭日升冰茶是顾客的偏好。升冰茶是顾客的偏好。 购买饮料数据的条形图 图3-1旭日升旭日升露露露露饼图也称圆形图,是用圆形及圆饼图也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形。内扇

5、形的面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部圆形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题分所占的比例,对于研究结构性问题十分有用。绘制一个饼图,首先画一十分有用。绘制一个饼图,首先画一个圆圈,然后利用相对频数将圆圈划个圆圈,然后利用相对频数将圆圈划分成几个部分,每一部分对应一个组分成几个部分,每一部分对应一个组的相对频数。的相对频数。 购买饮料数据饼图 第三节第三节数量数据的整理与显示数量数据的整理与显示一、统计分组与变量数列的编制一、统计分组与变量数列的编制例例:某生产车间某生产车间50名工人日加工零件数如下名工人日加工零件数如下(单位单位:个个)n11

6、7122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121统计分组的关键是统计分组的关键是正确选择分组标正确选择分组标志和准确划分各组界限。志和准确划分各组界限。第一步,对统计数据进行排序n10710810811011211311411511711711711811811811912012012112212212212212312312312312412412

7、4125125125126126127127127128128129130131133133134134135137139139第二步,确定变量数列的形式按按数量标志进行分组的方法主数量标志进行分组的方法主要有两种:要有两种:一、单项式分组(即一个变量一、单项式分组(即一个变量值为一组)值为一组)二、组距式分组二、组距式分组(一)单项式分组(一)单项式分组这种方法通常只适用于离散型变量且变量值较这种方法通常只适用于离散型变量且变量值较少的情况。对例题中的数据进行分组的结果如下:少的情况。对例题中的数据进行分组的结果如下:零件数零件数频数频数零件数零件数频数频数零件数零件数频数频数1071081

8、10112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112(二)组距式分组(二)组距式分组n第一步、确定全距第一步、确定全距RR=最大值最大值-最小值最小值=139-107=32n第二步、确定组数第二步、确定组数k=1+3.322lgn=6.64n第三步、确定组距第三步、确定组距组距(组距(i)=全距(全距(R)/组数组数(k)=4.82n第四步、确定组限第四步、确定组限n第五步、计量各组单位数,并整理成表格形式第五步、计量各组单位数,并整理成表格形式

9、某车间某车间50名工人日加工零件分组表名工人日加工零件分组表表表3-3按按零件数分组零件数分组频数(人)频数(人)频率(频率(%)组中值组中值105110110115115120120125125130130135135140358141064610162820128107.5112.5117.5122.5127.5132.5137.5合计合计50100上限上限下限下限组距组距i=上限上限-下限下限ff/fx组距分组时要注意的问题组距分组时要注意的问题:一定要遵循“不重不漏不重不漏”的原则。1.“不重不重”指一项数据只能分在其中的某一组,指一项数据只能分在其中的某一组,不能在其他组中重复出现。

10、习惯上规定不能在其他组中重复出现。习惯上规定“上上限不在本组内,应归入到下一组限不在本组内,应归入到下一组”的原的原则进行处理;则进行处理;2.“不漏不漏”即所有数据都能分在其中的某一组,即所有数据都能分在其中的某一组,不能遗漏。因此,如果数据中的最大值和最小不能遗漏。因此,如果数据中的最大值和最小值与其他数据相差悬殊,可采用值与其他数据相差悬殊,可采用“*以下以下”及及“*以上以上”。例、例、87户居民户的人均拥有住宅面积数据的分布户居民户的人均拥有住宅面积数据的分布二、列表法显示统计数据二、列表法显示统计数据次数(频率)密度次数(频率)密度=次数(频率)次数(频率)/组组距距尤其适用于异距

11、分组尤其适用于异距分组累计次数(频率)的计算累计次数(频率)的计算87户居民户的人均拥有住宅面积数据的累计频率分布户居民户的人均拥有住宅面积数据的累计频率分布从变量值较大的次数为起点,从变量值较大的次数为起点,逐项累计,表示该组变量值下逐项累计,表示该组变量值下限以上累计次数或频率限以上累计次数或频率从变量值较小的次数为起点,从变量值较小的次数为起点,逐项累计,表示该组变量值上逐项累计,表示该组变量值上限限以下累计次数或频率限限以下累计次数或频率三、图示法三、图示法(一)直方图(一)直方图(Histogram)直方图是用矩形的宽度和高度来表示频直方图是用矩形的宽度和高度来表示频数分布的图形。绘

12、制直方图时,将所研数分布的图形。绘制直方图时,将所研究的变量放在横轴上,频数、相对频数究的变量放在横轴上,频数、相对频数或百分比频数放在纵轴上。每组的频数、或百分比频数放在纵轴上。每组的频数、相对频数或频率在图上就是一个长方形,相对频数或频率在图上就是一个长方形,长方形的底在横轴上,宽度是组距,长长方形的底在横轴上,宽度是组距,长方形的高就是对应的频数。方形的高就是对应的频数。 (二)折线图(二)折线图折线图也称频数多边形图(折线图也称频数多边形图(Frequencypolygon)。)。在直方图的基础上,把直方图顶在直方图的基础上,把直方图顶部的中点(即组中值)用直线连接起来,再部的中点(即

13、组中值)用直线连接起来,再把原来的直方图抹掉就是折线图。需要注意,把原来的直方图抹掉就是折线图。需要注意,折线图的两个终点要与横轴相交,具体的做折线图的两个终点要与横轴相交,具体的做法是将第一个矩形的顶部中点通过竖边中点法是将第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横后一个矩形顶部中点与其竖边中点连接到横轴。这样才会使折线图下所围成的面积与直轴。这样才会使折线图下所围成的面积与直方图的面积相等,从而使二者所表示的频数方图的面积相等,从而使二者所表示的频数分布一致。分布一致。 (三)曲线图当上

14、述变量数列的组数无限增多时,折线就近似地表现为曲线。主要分布曲线有以下几种:(1)钟型分布曲线(2)U型分布曲线(3)J型分布曲线第四节第四节统计表统计表n统计表的构成统计表的构成某车间按加工零件分组某车间按加工零件分组表表3-5按按零件数分组(件)零件数分组(件)频数(人)频数(人)频率(频率(%)组中值组中值105110110115115120120125125130130135135140358141064610162820128107.5112.5117.5122.5127.5132.5137.5合计合计50100宾词宾词主词主词指标数值指标数值横行标题横行标题纵栏标题纵栏标题总标题总

15、标题统计表的设计要求统计表的设计要求:1统计表的总标题应该简明地概括所要统计表的总标题应该简明地概括所要反映的内容,以及资料所属的空间、时间反映的内容,以及资料所属的空间、时间范围,即标题内容应符合范围,即标题内容应符合3W(When,Where,What)原则。原则。 2表中主词各行和宾词各栏的次序,一般表中主词各行和宾词各栏的次序,一般应当根据自然顺序合理编制,如时间顺序、应当根据自然顺序合理编制,如时间顺序、数量大小等。若各项目之间存在着一定客数量大小等。若各项目之间存在着一定客观联系,应根据事物之间的客观联系合理观联系,应根据事物之间的客观联系合理编排,通常总计列在各项目之后。编排,通

16、常总计列在各项目之后。3表中必须注明数字资料的计量单位。表中必须注明数字资料的计量单位。全表只有一种单位,就写在表的右上角;全表只有一种单位,就写在表的右上角;有多种计量单位,或专设计量单位一栏,有多种计量单位,或专设计量单位一栏,或在每个指标后用小字加以注明。或在每个指标后用小字加以注明。4统计表数字上下位置要对齐。相同数统计表数字上下位置要对齐。相同数字应全部写上,不能用字应全部写上,不能用“同上同上”等方法表等方法表示。无数字的空格一般用示。无数字的空格一般用“”表示,表示,以免漏填。以免漏填。5统计表的实际材料,应注明出处。资统计表的实际材料,应注明出处。资料不齐或另行推算的,应在表下

17、注明。料不齐或另行推算的,应在表下注明。第三章 统计整理思考题n1 1、统计分组的关键是什么?统计分组的关键是什么?n2 2、什么是分组标志?选择分组标志的原则是什么?什么是分组标志?选择分组标志的原则是什么?n3 3、确定组间界限时,应遵循什么原则?确定组间界限时,应遵循什么原则?n4 4、什么情况下,采用单项式分组或组距式分组?什么情况下,采用单项式分组或组距式分组?n5 5、什么情况下,采用组距分组或异距分组?什么情况下,采用组距分组或异距分组?n6 6、累计频数和累计频率的应用意义如何?累计频数和累计频率的应用意义如何?n7 7、社社会会经经济济现现象象中中常常见见的的次次数数分分布布

18、有有哪哪些些主主要要类类型型?分分布布特特征征如何?如何? 8 8、某某车车间间同同一一工工种种的的4040名名工工人人每每人人完完成成生生产产定定额额的的程程度度()如下:如下:n97 88 123 115 119 158 112 146 117 108 97 88 123 115 119 158 112 146 117 108 n105105110 107 137 120 136 125 127 142 118110 107 137 120 136 125 127 142 118n8787103103115 114 117 124 129 138 100 103 115 114 117 1

19、24 129 138 100 103 n92929595126 107 108 105 119 127 104 11126 107 108 105 119 127 104 11 要要求求:根根据据上上述述资资料料,编编制制分分配配数数列列、累累计计频频数数和和累累计计频频率率数数列,并绘制相应的分布图。列,并绘制相应的分布图。编制分配数列:属于数量标志分配数列编制分配数列:属于数量标志分配数列首先,进行排序首先,进行排序8788929597100103103104105105107107108108110112111141151151171171181191191201231241251261

20、27127129136137138142146158然后,依次确定与分组相关的数据然后,依次确定与分组相关的数据第一步、确定全距第一步、确定全距RR=最大值最大值-最小值最小值=158-87=71第二步、确定组数第二步、确定组数k=1+3.322lgn=1+3.322lg40=6.322第三步、确定组距第三步、确定组距组距(组距(i)=全距(全距(R)/组数(组数(k)=71/6.322=11.23组距应该取整,故组距应该取整,故i=10第四步、确定组限,如第四步、确定组限,如“90-100”第五步、计量各组单位数(频数和频率),并整理成表。第五步、计量各组单位数(频数和频率),并整理成表。最后,完成一个规范的统计表,注意表的各部分名称和写法。最后,完成一个规范的统计表,注意表的各部分名称和写法。按按生产定额的程度生产定额的程度分组(分组(%)频数频数(人人)频率频率(%)较小制累计较小制累计频数频数(人人)频率频率(%)809090100100110110120120130130140140以上以上2310118335.07.525.027.520.07.57.52515263437405.012.537.565.085.092.5100.0合计合计40100.0

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号