2013年初级经济基础知识 第20章 统计数据的整理与显示

上传人:子 文档编号:41673715 上传时间:2018-05-30 格式:DOC 页数:19 大小:43KB
返回 下载 相关 举报
2013年初级经济基础知识 第20章  统计数据的整理与显示_第1页
第1页 / 共19页
2013年初级经济基础知识 第20章  统计数据的整理与显示_第2页
第2页 / 共19页
2013年初级经济基础知识 第20章  统计数据的整理与显示_第3页
第3页 / 共19页
2013年初级经济基础知识 第20章  统计数据的整理与显示_第4页
第4页 / 共19页
2013年初级经济基础知识 第20章  统计数据的整理与显示_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《2013年初级经济基础知识 第20章 统计数据的整理与显示》由会员分享,可在线阅读,更多相关《2013年初级经济基础知识 第20章 统计数据的整理与显示(19页珍藏版)》请在金锄头文库上搜索。

1、20132013 年初级经济基础知识年初级经济基础知识 第第 2020 章章 统计数据的整理与显示统计数据的整理与显示第二十章 统计数据的整理与显示数据整理:统计数据搜集之后,通常包括数据的预处理、分类或分组、汇总等内容,是统计分析之前的必要步骤。数据的预处理:是数据整理的先前步骤,是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序等。一、品质数据的整理与显示数据预处理后,做分类或分组整理。对品质数据:做分类整理,对数值型数据:做分组整理。(一)分类数据的整理与显示分类数据要计算出每一类别的频数,频率或比例,比率,选择图形进行显示。1频数与频数分布频数:也称次数,是落在各类别中

2、的数据个数。频数分布:也称次数分布,是把各个类别及其相应的频数全部列出来。2分类数据频数分布表的编制方法频数分布表:将频数分布用表格的形式表现出来就是频数分布表。表 20-2(根据 20-1 进行分类整理,20-1 是原始表,记载某市 49 家企业登记注册类型和产业类型的基本情况) 。教材表 20-2 不同企业登记注册类型和产业类型的频数分布登记注册类型计数项产业类型港、澳、台商投资企业内资企业外商投资企业总计交通运输设备制造业2147食品制造业3104通信设备、计算机及电子设备制造业5218文教体育用品制造业2013医药制造业3115饮料制造业2002专用设备制造业58720总计221314

3、49列联表:上面这种由两个或两个以上变量交叉分类的频数分布表也称为列联表。交叉表:二维的列联表(两个变量交叉分类)。3比例、百分比和比率比例:是一个总体中各个部分的数量占总体数量的比重,通常用于反映总体的构成或结构。比例的计算方法:假定总体数量 N 被分成 K 个部分,每一部分的数量分别为 N1,N2,NK,则比例定义为。显然,各部分的比例之和等于 1,即。如根据教材表 20-3,内资企业的比例=13/49=0.2653。教材表 20-3 不同登记注册类型企业的频数分布登记注册类型频数比例百分比()内资企业13O.265326.53港、澳、台商投资企业22O.449044.90外商投资企业14

4、O.285728.57总计491100百分比含义和计算:或叫百分数,将比例乘以 100,将对比的基数抽象化为 100 计算出来,用表示,它表示每 100 个分母中拥有多少个分子。比例和百分比的基数:比例以 l 为基数。百分比以 l00 为基数,是一个更为标准化的数值,很多相对数都用百分比表示。当分子的数值很小而分母的数值很大时,也可以用千分数()来表示,如人口的出生率、死亡率、自然增长率等都可用千分数来表示。比率含义和计算:比率:是各不同类别的数量的比值。如表 20-3 中,港、澳、台商投资企业企业数量与外商投资企业企业数量的比率是 22:14。比率的基数:通常将分母化为 1(以 1 为基数)

5、 ,如,港、澳、台商投资企业企业数量与外商投资企业企业数量的比率是 22/14=1.57 即 1.57:1 比率可以不用 l 作为基数,用 100 或其他便于理解的数作基数。如,男女的性别比为 105:100。比率的数值:比率的数值可能大于 1(比例的数值不会大于 1) 。比率的举例:在经济和社会问题的研究中,经常使用比率。比如经济学中的积累与消费之比国内生产总值中第一、二、三产业产值之比等等。2010 年的国内生产总值与 2009 年的国内生产总值进行对比,将一个地区的国内生产总值同另一个地区国内生产总值进行对比。4分类数据的图示方法主要包括条形图和圆形图。如果两个总体或两个样本的分类相同且

6、问题可比,还可以绘制环形图。A.条形图条形图:是用宽度相同的条形的高度或长短来表示数据变动的图形。在表示定类数据的分布时,用条形图的高度或长度来表示各类别数据的频数或频率。如图 20-1 所示,专用设备制造业的企业有 20 家。条形图绘制方法:可以横置或纵置,纵置时也称为柱形图。绘制时,放在纵轴,称为条形图;放在横轴,称为柱形图。条形图形式:单式、复式等。B.圆形图圆形图(也称饼图),是用圆形及圆内扇形的面积来表示数值大小的图形。主要用于表示总体中各组成部分所占的比例。如图20-2 所示,专用设备制造业的企业占该开发区企业总数的 41%。圆形图的绘制方法:在绘制圆形图时,总体中各部分所占的百分

7、比用圆内的各个扇形面积表示,扇形中心角度是按各部分百分比占 360的相应比例确定。如专用设备制造业企业的百分比为 41,那么其扇形的中心角度就应为 36041=147.6,其余类推。(二)顺序数据的整理与显示前面介绍的分类数据的整理与显示方法,如频数、比例、百分比、比率、条形图和圆形图等,也都适用于对顺序数据的整理与显示。对于顺序数据,还可以计算累积频数和累积频率(百分比),绘制累积频数分布图。1 累积频数和累积频率(百分比)A-1.累积频数:将各类别的频数逐级累加。通过累积频数,看出某一类别(或数值)以下及某一类别(或数值)以上的频数之和。A-2.累积频数的计算方法(两种):一是向上累积:从

8、类别顺序的开始一方向类别顺序的最后一方累加频数(数值型数据则是从变量值小的一方向变量值大的一方累加频数);见表 20-5 第 4 列,三级的向上累积频数(从一级累积到三级)为330(=100+125+105) 。二是向下累积:从类别顺序的最后一方向类别顺序的开始一方累加频数(数值型数据则是从变量值大的一方向变量值小的一方累加频数)。见表 20-5 第 6 列,三级的向下累积频数(从八级累积到三级)为305(=10+25+35+50+80+105) 。表 20-5 某国有企业工人工资状况工资等级工人数(人)百分比()向上累积向下累积工人数(人)百分比()工人数(人)百分比()一级10018.91

9、0018.9530100O二级12523.622542.543081.1三级10519.833062.330557.5四级8015.141077.420037.7五级509.446086.812022.6六级356.649593.47013.2七级254.752098.1356.6八级101.9530100.0101.9合计530100.0B-1.累积频率及计算方法:累积频率也叫累积百分比,将各类别的百分比逐级累加,有向上累积和向下累积两种方法。B-2.顺序数据累积频数分布表的编制方法:见表 20-5,标志类别和频数分别占两列,另有两列分别为向上累积频数和向下累积频数,按照相应的计算方法计算。

10、* 顺序数据的图示:分类数据的图示方法也适用于顺序数据,包括条形图和圆形图和环形图。顺序数据的独特图示方法有:累积频数分布图。* 累积频数分布图:根据累积频数分布表的数据绘制累积频数分布图,如图 20-3 所示。二、数值型数据的整理与显示品质数据的整理与图示方法:如频数、比例、百分比、比率、条形图和圆形图、累积频数和累积频率(百分比)、累积频数分布图等,都适用于数值型数据的整理与显示。但数值型数据有一些特定的整理和图示方法并不适用于品质数据,如数据分组、直方图、折线图。例 20-14: 2001 年底,我国共有博物馆 1458 个,其中综合性博物馆 769 个,历史类博物馆 521 个,艺术类

11、博物馆 57 个,自然科技类博物馆 19 个,其他类型博物馆 92 个。这一构成应通过绘制(AC)来显示。A、条形图B、累积频数分布图C、圆形图D、直方图E、折线图解析:选项 AC分类数据?选项 B顺序数据?选项DE数值型数据(一)数据分组1.数据分组:根据统计研究的需要,将数据按照某种标准划分成不同的组别。数据分组的作用:分组后再计算出各组中出现的次数或频数,形成一张频数分布表。2 数据分组方法:单变量值分组,组距分组。单变量值分组:是把每个变量值作为一组,通常只适合于离散变量且变量值较少的情况。组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。通常适合于连续变量或变

12、量值较多的情况。3数据分组的具体步骤(7 步):确定分组组数对原始资料进行排序求极差确定各组组距确定组限确定各组观察值出现的频数制作频数分布表。(1)确定分组组数确定分组组数的要求(3 个):第一,划分的组数不太多也不太少。第二,组数的确定要保证组间资料的差异性与组内资料的同质性。第三,要能够充分显示客观现象本身存在的状态。统计分组组数经验公式(比较有代表性的是斯特基方法):,K 为分组组数,N 为数据个数。上例, ,分为 7 组(2)对原始资料进行排序* 上例,成绩按照从低到高排序结果如下:50 51 54 54 56 59 62 63 65 65 67 68 69 70 70 73 73

13、74 74 7476 77 79 79 80 83 85 86 86 8686 87 87 87 88 89 89 90 91 9292 92 93 93 94 94 95 96 96 97 100 102 108 110 112(3)求极差极差:最大的观察值与最小的观察值相减上例,极差=(最大的观察值-最小的观察值)=11250=62。(4)确定各组组距组距的确定办法:在实行等距分组的情况下,组距=级差/组数,组距如带有小数,取成接近于能被 5 除尽的一个数。例如, 5.4、3.8、8.7、0.4 等,可以把组距定为 5.5、5、10、O.5。上例,组距=62/789,组距可取 10。组距与

14、组数成反比关系:组数越多,组距越小,组数越少,组距越大。例:一组数据中,最大值为 75,最小值为 15,这组数据分为 4组,那么每组的组距是:解析 :组距=极差组数(最大值最小值)组数(75-15)4=15(5)确定组限组限:是组与组之间的界限,或者说是每组观察值变化的范围。组限分类:上限与下限下限和上限:一个组的最小值称为下限,最大值称为上限。例,教材表 20-6 中,成绩 50-60 组的下限是 50(最小值) ,上限是60(最大值) 。组距:每组的上限值与下限值之间的差。公式:组距=某组的上限值-该组的下限值。例,成绩 50-60 组的组距=60-50=10。组距是每组观察值的最大差。组

15、中值:上限值与下限值的平均数。组中值的计算方法:组中值=(上限值+下限值)/2 成绩 50-60 组的组中值=(50+60)/2=55。组中值的作用:(作为该组数据的代表) 。组中值的代表性如何,取决于组中观察值的变化是否呈对称分布状态。确定组限时应注意:第一,第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一点。第二,最好不要使用开口组。第三,组限值应能被 5 除尽,且一般要用整数表示。上例中,我们把第一组的下限值定为 50,那么各组的组限依次为:50、60,60、70,70、80,80、90,90、100,100、110,110、120。 (上限=下限+组距)(6)

16、确定各组观察值出现的频数凡观察值落在某一区间的,就计发生一次,最后统计各组观察值发生的总次数。组距分组统计各组频数的原则:“不重不漏”原则。“不重”:指一项观察值只能分在其中的某一组,不能在其他组重复出现;为解决“不重”的问题,统计分组时习惯上规定“上组限不在内” ,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内。上例中,70 这一数值不计算在“6070”这一组中,而计算在“7080”这一组中。“不漏”:指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。(7)制作频数分布表。如表 20-6,并填上相关的内容,以及其他需要说明的事项。表 20-6 频数分布表观察值区间组中值频数频率()506055610.9607065712.770807511

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号