统计数据的整理和显课件

上传人:hs****ma 文档编号:567340515 上传时间:2024-07-20 格式:PPT 页数:71 大小:508KB
返回 下载 相关 举报
统计数据的整理和显课件_第1页
第1页 / 共71页
统计数据的整理和显课件_第2页
第2页 / 共71页
统计数据的整理和显课件_第3页
第3页 / 共71页
统计数据的整理和显课件_第4页
第4页 / 共71页
统计数据的整理和显课件_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《统计数据的整理和显课件》由会员分享,可在线阅读,更多相关《统计数据的整理和显课件(71页珍藏版)》请在金锄头文库上搜索。

1、第第3 3章章 统计数据的整理和显示统计数据的整理和显示主要内容:主要内容:重难点:重难点:教学目的要求:教学目的要求:3.1 3.1 数据资料整理的意义与程序数据资料整理的意义与程序3.2 3.2 品质数据的整理与显示品质数据的整理与显示3.3 3.3 数值数据的整理与显示数值数据的整理与显示3.4 3.4 统计表统计表统计分组方法,统计图,表及其应用统计分组方法,统计图,表及其应用了解统计整理的概念和内容、统计分组、分配数列及统计表等概念,了解统计整理的概念和内容、统计分组、分配数列及统计表等概念,重点掌握统计分组的方法,以及统计表的应用。重点掌握统计分组的方法,以及统计表的应用。3.1

2、3.1 数据资料整理的意义与程序数据资料整理的意义与程序1 1、统计数据整理的意义、统计数据整理的意义统计数据整理是对调查资料进行科学加工,使之系统化、条理化、科学化,成为说明总体特征的综合资料统计数据整理是统计工作和研究的中间环节,起着承上启下的作用统计数据整理是积累历史资料的必要手段2 2、统计数据整理的内容与程序、统计数据整理的内容与程序内容内容第一第一,依据统计研究的目的设计整理汇总方案第二、第二、依据汇总方案,对各调查项目的资料进行汇总第三、第三、通过统计图表的形式,显示整理的结果数据资料 审核合格分组汇总分配数列 汇总后审核数据资料的积累、保管、公布不合格 再调查 统计图表显示形成

3、程序程序3 3、数据分组和频数分布、数据分组和频数分布(1)统计分组:统计分组:是指依据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把总体划分为若干个不同组的一种统计方法。(2)(2)统计分组的理解:统计分组的理解:对总体而言,是“分”;对总体单位而言是“合”对分组标志而言,是“分”,对其他标志而言是“合”(3)(3)统计分组的作用:统计分组的作用:划分社会经济现象的类型划分社会经济现象的类型类 型 1998年 1999年 2000 年2001年农 业林 业牧 业渔 业 14241.9851.37025.82422.9 14106.2886.36997.62529.0 1387

4、3.6936.57393.12712.6 14462.8938.87963.12815.0 合 计 24541.9 24519.1 24915.8 26179.7我国农林牧渔业总产值我国农林牧渔业总产值 单位:亿元单位:亿元例如:揭示社会经济现象的内部结构揭示社会经济现象的内部结构 指 标分组1978年 1985年 1995年 2001年 绝对数(亿元) 比重(%) 绝对数(亿元) 比重(%) 绝对数(亿元) 比重(%) 绝对数(亿元) 比重(%) 第一产业 1018 28.0 2542 28.4 11365 19.7 14609.9 15.2 第二产业 1745 48.2 3867 43.1

5、 28274 48.9 49069.1 51.2第三产业 861 23.8 2556 28.5 18094 31.4 32254.3 33.6 合 计 3624 100.0 8964 100.0 57734 100.0 95933.3 100.0 我国国内生产总值构成表我国国内生产总值构成表例如:例如:研究现象间的依存关系研究现象间的依存关系 社会经济现象不是孤立存在的,而是相互依存、相互制约的。研究现象之间的依存关系的最基本方法是统计分组分析法。例如,某乡某种农作物的耕作深度与收获率之间的依存关系,见下表耕地按耕作深度分组(厘米) 地块数 平均收获率(千克/亩)101212141416161

6、81820 71016125 200230270310340 (4 4)统计分组的原则统计分组的原则 穷尽原则 互斥原则(5 5)统计分组的种类统计分组的种类按分组标志的多少,分为简单分组简单分组、复合分复合分组、分组体系组、分组体系简单分组简单分组:是对研究现象按一个标志进行分组,它只能从某一个方面反映事物的分布状况和内部结构。例如:欲了解杉达学院某班学生的基本情况,可选择年龄、身高、性别、体重等标志进行简单分组。身高人数1501601316017025170180101801908 杉达学院某班学生身高构成 单位:厘米 复合分组:复合分组:用两个或两个以上标志分组,即先按一个标志分组,在此

7、基础上再按第二个标志分组,又再层叠地按第三个标志分成更小的组。例如:工业企业先按所有制标志分组,在再此基础上按规模大小标志分组,结果如下所示:工业企业国有企业集体企业私营企业混合经济企业大型企业中型企业小型企业大型企业中型企业小型企业大型企业中型企业小型企业大型企业中型企业小型企业n分组体系:分组体系:根据统计分析的要求,对同一总体进行多种不同分组而形成的一种相互联系,相互补充,从而反映总体内部关系的体系。平行分组体系复合分组体系平行分组体系:是对总体采用两个或两个以上标志分别进行简单分组。工业企业国有企业集体企业私营企业混合经济企业大型企业中型企业小型企业工业企业复合分组体系复合分组体系:是

8、对总体同时选择两个或两个以上的分组标志重叠起来进行分组工业企业国有企业集体企业私营企业混合经济企业大型企业中型企业小型企业大型企业中型企业小型企业大型企业中型企业小型企业大型企业中型企业小型企业按分组标志的性质不同,分为品质分组品质分组和数量分组数量分组 品质分组品质分组:按品质(或属性)标志进行分组。品质分组所形成的数列称为品质数列。例如:人口按性别分组,企业按所有制分组等 数量分组数量分组:按数量标志分组,数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。变量分组所形成的数列称为变量数列。例如:某班学生按身高、体重分组等按分组的作用和任务不同,分为类型分组类型分组、结构结构分

9、组分组和分析分组分析分组类型分组类型分组:把复杂的现象总体,划分为若干个不同性质的部分,就是类型分组。结构分组:结构分组:在对总体分组的基础上计算出各组对总体的比重,借此研究总体各部分的结构,即结构分组 分析分组:分析分组:为研究现象之间依存关系而进行的统计分组即分析分组简单分组与复合分组有何区别?平行分组体系与复合分组体系有区别?如果研究总体是全班学生的基本情况,试进行简单分组和复合分组?3.2 3.2 品质数据的整理与显示品质数据的整理与显示1 1、定类数据的整理与显示、定类数据的整理与显示 定类数据定类数据本身就是对事物的一种分类,因此在整理时除了列出所分的类别外,还要计算出每一类的频数

10、、频率或比重、比率,同时选择适当的图形进行显示。(1 1)频数和频数分布)频数和频数分布频数:也称次数。是落在各类别中的数据个数。把各个类别及其相应的频数全部列出来就是频数分布或次数分布。将频数分布用表格的形式表现出来就是频数分布表比例:比例是总体中各个部分的数量占总体数量的比重,通常用于放映总体的构成或结构。籍贯人数 比例(%)浙江13 19.7 上海35 53.03 江苏10 15.15福建8 12.12 某学院某班学生籍贯构成例子:例子:n条形图:条形图:是用宽度相同的条形的高度或长短来表示数据变动的图形,可以横置或纵置。(2 2)定类数据的图型显示)定类数据的图型显示n饼图:饼图:也称

11、圆形图。是用圆形及圆内扇形的面积来表示数值大小的图形。它主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。可口可乐30%旭日升冰茶22%汇源果汁12%百事可乐18%露露18%某超市出售不同品牌饮料的构成(3 3)定序数据的整理与显示)定序数据的整理与显示看法看法人数人数 比例(比例(% %)非常满意非常满意13 19.713 19.7满意满意35 53.03 35 53.03 一般一般10 15.1510 15.15不满意不满意5 7.585 7.58很不满意很不满意3 4.543 4.54 某学院某班学生对食堂服务的看法情况表某学院某班学生对食堂服务的看法情况表 可用定类数

12、据的整理与显示方法,例如:满意53.03%非常满意19.7%非常不满意4.54%不满意7.58%一般15.15%某学院某班学生对食堂服务的看法构成图p累计频数 累计频数就是将各类别的频数逐级累加起来。分向上累计和向下累计两种方法向上累计:从类别顺序的开始一方向类别顺序的最后一方累加频数(定距数据和定比数据则是从变量值小的一方向变量值大的一方累加频数)向上累计频数表明某组上限以下的各组单位数之和是多少向下累计:从类别顺序的最后一方向类别顺序的开始一方累加频数(定距数据和定比数据则是从变量值大的一方向变量值小的一方累加频数)向下累计频数表明某组下限以上的各组单位数之和是多少p累计频率或百分比累计频

13、率或百分比 就是将各类别的百分比逐级累加起来,也分为向上累计和向下累计两种。 向上累计频率向上累计频率表明某组上限以下的各组单位数之和占总体单位数比重的大小。 向下累计频率向下累计频率表明某组下限以上的各组单位数之和占总体单位数比重的大小。例如:杉达某班有65人,一次统计学考试成绩按优秀(81-100分)、良好(71-80分)、中等(61-70分)、及格(60-60分)、不及格(60分)分五档,调查结果整理如下表:档次人数百分比(%) 向上累计人数 百分比% 向下累计人数 百分比%不及格34.6234.6265100及格46.15710.776295.38中等1421.52132.315889

14、.23良好2436.94569.234467.69优秀2030.79651002030.79合计65100杉达某班统计学成绩情况分布表杉达某班统计学成绩情况分布表p定序数据的图形表示(1)累计频数分布图折线图环形图3.3 3.3 数值数据的整理与显示数值数据的整理与显示1、数值数据的分组数值数据的分组按数量型数据分组,应注意如下两个问题:分组时各组数量界限的确定必须能反映事物质的差别应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限前面讲的品质数据的整理与显示方法适合数量数据的整理,但数量型数据的某些整理和显示方法不适合品质数据分配数列,这里也叫变量数列(1 1)单变量

15、值分组)单变量值分组也称单项式分组。是指用一个变量值作为一组,并与各组分配的单位次数形成单变量值数列(单项式变量数列)例如:某车间工人按看管的机器台数分组如下某车间工人看管机器台数分组表某车间工人看管机器台数分组表 看管机器数工人数(人)比重()15033.3328053.3332013.33合计150100注意适用:注意适用:离散变量变量值变化较少的情况 将变量依次划分为若干个区间,以一个变动区间作为一个组,并与各组分配的总体单位次数形成组距式变量数列。(2 2)组距式分组)组距式分组按人均年收入分组(元)农户(户)比重()3000以下3000500050008000800010000100

16、00以上10303522310.030.035.022.03.0合计100100例如:设有100户农村居民户人均年收入如下表:注意适用:注意适用:连续变量,离散变量总体单位多且变量值变动范围较大的情形几个相关的概念:几个相关的概念: 组距:组距:上下限之间的距离。即上限下限下限、上限下限、上限:组距式分组的每一组变量值中,其最小值为下限,最大值为上限 组限:组限:相邻两组的界限 组中值:组中值:反映各组中个体变量值的一般水平。 即组中值(上限+下限)2a,a,间断组距式分组和连续组距式分组间断组距式分组和连续组距式分组间断组距式分组:是指组限不相连的组距式分组。例如:某班学生按成绩分组,可分为

17、:60分以下,6180分,8190分,91分以上连续组距式分组:组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限的组距式分组例如:见上面表的分组方式,5000既是30005000的上限又是50008000的下限坚持坚持“不重不漏原则不重不漏原则”注意:注意: 离散型变量,可间断组距式分组,也可连续组距式分组。连续型变量,只能采用连续组距式分组。“上限在不内”原则:统计工作中,通常规定各组一般只包括本组下限变量值的总体单位,而不包括本组上限变量值的总体单位。b,b,等距分组与异距分组等距分组与异距分组等距分组等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一

18、般用于标志值变动比较均匀的场合。标志值分布很不均匀的场合标志值相等的量具有不同的意义的场合标志值按一定比例发展的场合 异距分组:异距分组:是指统计分组时各组组距各不相等得分组。异距分组得适用范围:采用异距分组,各组次数的多少受到组距不同的影响,为消除异距分组所造成的影响须计算频数密度(或称次数密度)。频数密度的计算公式:对于异距分组对于异距分组C,C,开口组开口组 分组中,如果全部数据中的最大值和最小值与其他数相差悬殊,为避免出现空白组或个别极端值被漏掉,第一组和最后一组可采用“XX以下”和“XX以上”这样的开口组。开口组通常以相邻组的组距作为其组距。开口组的组限计算:开口组的组限计算: d.

19、d.频数、频数分布与频率概念频数、频数分布与频率概念频数频数:又称次数,是指一个总体按某种标志分组后,出现在各组中的单位个数。频数分布:频数分布:又称次数分布。是指在统计分组的基础上,将总体的所有单位按组归类整理,形成总体中各个单位在各组间的次数分布状况。如将频数分布用表格的形式表现出来即为频数分布表。 次数分布表现为一个数列,故又称分布分布数列数列。分布数列可以反映总体中所有单位在各组间的分布状态和分布特征。频率:频率:是指各组总体单位数占总体单位数的比重。它反映了各组频数的大小对总体所起作用的相对强度。其表达式为:fi_表示分组中第 i 组的频数 fi 表示总体单位数频率的性质:频率的性质

20、:任何频率都是界于0和1之间的一个分数各组频率之和等于1e.e.组距式分组的步骤组距式分组的步骤确定组数。确定组数。组数的确定应以能够显示数据的分布特征和规律为目的。确定组数的经验公式:n为数据总体单位数,上式结果四舍五入取整即得到组数 或组距多大,组数多少,应根据所研究的具体问题凭借经验而定,并无一个统一的规则注意:各组的组距。各组的组距。全距=所有变量值中最大值最小值组距=全距/组数根据分组整理成频数分布表。根据分组整理成频数分布表。例题:根据抽样调查,获得某市某月50户居民购买消费品支出资料如下:(单位:元)830 880 1230 1100 1180 1580 1210 1460 11

21、70 10801050 1100 1070 1370 1200 1630 1250 1360 1270 142010511180 1030 870 1150 1410 1170 1230 1260 1380 1510 1010 860 810 1130 1140 1190 1260 1350 930 142010111080 1010 1050 1250 1160 1320 1380 1316 1270 1250试对上述资料进行分组整理。解:采用等距分组。由经验公式:凭经验分为8组。以800为第一组下限,将组距定为100,经整理,得出计算结果表如下:按用户月消费品支按用户月消费品支出额分组(出

22、额分组(X)元)元频数频数(fi)向上累计频数向上累计频数频率(频率( fi / fi )向上累计频向上累计频率率800900550.100.109001000160.020.12100011008140.160.281100120011250.220.51200130011360.220.72130014007430.140.86140015004470.080.94150016002490.040.98160017001500.021合计501.00练习:练习:某养鸡厂想了解来亨鸡这种品种的鸡的下蛋情况,对100只来亨鸡每月的产蛋数收集如下表。请用适当的方法对其进行分组整理15 17 12

23、 14 13 14 12 11 14 13 16 14 14 13 17 15 14 14 16 1414 15 15 14 14 14 11 13 12 1413 14 13 15 14 13 15 14 13 1415 16 16 14 13 14 15 13 15 13 15 15 15 14 14 16 14 15 17 1316 14 16 15 13 14 14 14 14 1612 12 12 14 12 15 16 15 16 1413 14 16 15 15 15 13 13 14 1413 15 17 14 13 14 12 17 14 1556 70 72 80 73 7

24、6 81 60 81 9064 75 78 82 88 84 79 65 77 6376 78 80 89 92 83 85 86 87 6676 78 67 62 95 85 78 79 74 50 76 77 72 80 76 71 69 87 83 7873 80 83 81 78 80 90 74 68 72某班60同学的统计学考试分数收集如下,请用适当的方法对其进行分组整理2 2、数据的显示、数据的显示条形图圆形图环形图累计分布图直方图折线图(1 1)直方图)直方图 用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴

25、表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图我我一一眼眼就就看看出出来来了了,销销售售量量在在 170170 180180之之间的天数最多间的天数最多! !140140 150150210210某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图190190 200200180180160160 170170频频频频数数数数( (天天天天) )25252020151510105 53030220220 230230 24240 0注意:直方图不适用于名义级数据和顺序级数据,适用于刻度级数据,且当不重复数据的个数较多时,采

26、用组距式分组 思考:直方图与条形图有何区别?思考:直方图与条形图有何区别?条形图及其与直方图的区别条形图及其与直方图的区别条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列条形图主要用于展示分类数据,直方图则主要用于展示数量型数据(2 2)折线图)折线图折线图也称频数多边形图, 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是:第

27、一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的折线图与直方图下的面积相等!某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图频频数数( (天天) )25252020151510105 53030(3 3)曲线图(时间序列数据)曲线图(时间序列数据)例:例:例:例:已知已知1991199120002000年我国城乡居民家庭的人均收入数据如年我国城乡居民家庭的人均收入数据如表。试绘制曲线图表。试绘制曲线图19912000年城乡居民家庭人均收入年份城镇居民农村居民1

28、9911992199319941995199619971998199920001700.62026.62577.43496.24283.04838.95160.35425.15854.06280.0708.6 784.0 921.61221.01577.71926.12091.12162.02210.32254.4020004000600080001991199219931994199519961997199819992000年份收入城镇居民农村居民城乡居民家庭人均收入城乡居民家庭人均收入3 3、频数分布的类型、频数分布的类型 各种不同性质的现象的次数分布的类型大致有三种:钟型分布、U型分布和

29、J型分布钟型分布钟型分布对称分布对称分布对称分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布UU型分布型分布JJ型分布型分布正正正J J J型分布型分布型分布反反反J J J型分布型分布型分布1 1、统计表的定义和结构、统计表的定义和结构 把统计调查得来的数字资料,经过汇总整理后,得出一些系统化的统计资料,将其按一定顺序填列在一定的表格内,这个表格就是统计表。广义的统计表包括统计工作各个阶段的一切表格,如调查表、汇总表或整理表、统计分析表、时间数列表等;狭义的统计表专指统计分析表和容纳各种统计数据的表格。统计表的结构,可从表的形式和表的内容两方面来认识。结统计表的结构,可从表的形式和表的内

30、容两方面来认识。结合下图来理解合下图来理解3.4 统计表统计表 4222.004222.00 3.13 3.13 1.68 1.68 53.67 53.67 1.86 1.86 6316.81 6316.81 6279.98 6279.98 4998.00 4998.00 20002000年年资料来源:中国统计年鉴资料来源:中国统计年鉴20012001,中国统计出版社,中国统计出版社,20012001,第,第305305页。页。注:本表为城市和县城的城镇居民家庭抽样调查材料。注:本表为城市和县城的城镇居民家庭抽样调查材料。 40044.0040044.003.143.141.771.7756.

31、4356.431.771.775888.775888.775854.025854.024615.914615.91户户人人人人% %元元元元元元元元 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一就业者负担人数平均一就业者负担人数 平均每人全部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消费性支出平均每人消费性支出19991999年年单位单位项目项目1999199920002000年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料行行标标题题列列标标题题数数字字资资料料表头表头附附加加(1)从构成要素上看

32、,统计表是由总标题、横行标题、纵栏标题和数字资料四个部分组成总标题:是统计表的名称,简要说明该表的基本内容、时间和范围,置于表格上方正中。横标题:是横行的名称,一般置于表格左方纵标题:是纵栏的名称,一般置于表格上方格子内(2)从内容上看,统计表是由主词和宾词两部分组成主词:是统计表要说明的总体及组成部分,一般列在表的左边宾词:是用来说明总体数量特征的各个统计指标,一般列在表的右方项 目 工业增加值产值(亿元) 比重(%)轻工业重工业 1229419188 39.061.0合 计(主词)31482 (宾100.0 词)2002200220022002年全国工业增加值表年全国工业增加值表年全国工业

33、增加值表年全国工业增加值表编制统计表应注意的问题编制统计表应注意的问题统计表的设计的总要求:科学、实用、简练、美观(1)统计表的各种标题,特别是总标题的表述,应十分简明、确切地概括出表的基本内容,总标题还应表明资料所属的时间和地点;纵横各栏的排列要注意表述资料的逻辑系统,反映现象的内在联系。(2)表中主词各行和宾词各栏的排列,一般应按先局部后整体的原则,即先列各个项目,后列总体。 当全表只有一个计量单位时就写在表的右上方。若有多种计量单位时,横行的计量单位,可以专设“计量单位”一栏;纵栏的计量单位要与纵栏标目写在一起,用小字标写。(4 4)表中数字上下位置要对齐。遇有相同数字应照写,不能用“同上”、“同左”字样。无数字的空格,用符号“”表示;当缺乏某项资料时,用符号“”表示,以免使人误为漏项。表内还应列出合计数,便于核对和运用。 (5)统计表的表式一般是开口式,即表的左右两端不画纵线,上下基线应用粗线或双线。对于栏数较多的统计表,通常加以编号。主词栏和计量单位栏用(甲)、(乙)、(丙)等文字标明;宾词栏各栏用(1)、(2)、(3)等标明栏号。(6)必要时,统计表应加以注解,连同数字的资料来源等一般都写在表的下端。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号