实用统计 教学课件 ppt 作者 樊培茗3 第3章

上传人:E**** 文档编号:89501189 上传时间:2019-05-26 格式:PPT 页数:62 大小:1.38MB
返回 下载 相关 举报
实用统计 教学课件 ppt 作者 樊培茗3 第3章_第1页
第1页 / 共62页
实用统计 教学课件 ppt 作者 樊培茗3 第3章_第2页
第2页 / 共62页
实用统计 教学课件 ppt 作者 樊培茗3 第3章_第3页
第3页 / 共62页
实用统计 教学课件 ppt 作者 樊培茗3 第3章_第4页
第4页 / 共62页
实用统计 教学课件 ppt 作者 樊培茗3 第3章_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《实用统计 教学课件 ppt 作者 樊培茗3 第3章》由会员分享,可在线阅读,更多相关《实用统计 教学课件 ppt 作者 樊培茗3 第3章(62页珍藏版)》请在金锄头文库上搜索。

1、第三章 数据的整理与显示,能力要求: 了解数据预处理的内容和目的 掌握品质数据整理与显示方法 掌握数量数据整理与显示方法 会用Excel作出频数分布图 合理使用统计表,引入案例:今天哪支股票表现最好 股市交易中,我们注意到有许多的交易数据,比如成交量、成交额、收盘价、开盘价、最高价、涨幅我们选取了2009年2月20日的沪市A股部分股票的交易数据。我们应该如何整理这些数据,从而判断哪些股票表现活跃呢?,表 2009年2月20日沪市A股部分股票价格,引入案例:上海市企业景气调查报告 2008年,严峻的国内外经济形势对中国企业产生了明显的影响。三季度,上海市企业成本费用继续高涨,订产销数量有所减少,

2、企业资金周转不畅,盈利空间受到挤压。企业景气调查显示,三季度,上海市企业景气指数为132.4,企业家信心指数为127.7,均处于“较为景气”区间;但与二季度相比,企业家信心指数下降13.5点,企业景气指数下降16.2点。上海市2001年至2008年第三季度企业景气状况可见经整理后形成的趋势图。,图 上海市企业家信心指数、企业景气指数趋势图,第一节 数据的预处理,一、数据的审核 一般包括完整性审核、准确性审核、时效性审核。 完整性审核包括调查对象中每一个应调查的单位是否有遗漏;调查的项目或指标是否填写完整。 准确性审核主要是确定调查资料的内容是否合理;各个项目或指标之间有无重复或相互矛盾;数字计

3、算是否准确;搜集的数据是否符合实际。 时效性审核主要是确定所搜集的数据是否及时。比如统计工作在2008年展开,而所搜集的数据中包含了1990年的数据,那么我们认为这数据时效性是比较差的。,第一节 数据的预处理,二、数据的排序 可通过Excel来完成 。 【实用范例3.1】试对表3.1.1所示的数据按销售面积进行排序。,第一节 数据的预处理,表3.1.1 2008年110月东部地区商品房销售情况,第一节 数据的预处理,图3.1.1 “排序”对话框,第一节 数据的预处理,表3.1. 2 按升序排序的结果,第一节 数据的预处理,三、数据筛选 【自动筛选】命令用于简单的记录抽取;【高级筛选】用于复杂的

4、记录抽取。 (一)自动筛选 【实用范例3.2】抽取表3.1.1中上海市的销售数据及“销售面积”在15002500万平方米之间,而销售额大于1000亿元的数据。,第一节 数据的预处理,图3.1.2 筛选上海市商品房销售数据,第一节 数据的预处理,图3.1.3 筛选结果,第一节 数据的预处理,如果我们要选取“销售面积”在15002500万平方米之间,而销售额大于1000亿元的数据,图3.1.4 “销售面积”字段名下的【自定义】选项,第一节 数据的预处理,图3.1.5 “销售面积”自定义筛选条件,第一节 数据的预处理,图3.1.6 “销售额”自定义筛选条件,第一节 数据的预处理,图3.1.7 筛选结

5、果,第一节 数据的预处理,(二)高级筛选 使用高级筛选前要建立一个条件区域,同一行上的条件被认为是“且”的关系;不同行上的条件被认为是“或”的关系。,图3.1.8 筛选条件区域,第一节 数据的预处理,图3.1.9 高级筛选对话框,第二节 数据的整理与显示,一、统计分组 指根据统计目的,将统计资料按照一定的标志划分为若干个组,组内的数据具有共同的特征,组间的数据则有较明显的区别。 定类数据和定序数据是按照品质标志分组的,属于品质数据; 定距数据和定比数据是按照数量标志分组的,属于数量数据。,第二节 数据的整理与显示,表3.2.1 某班学生按总评成绩分组结果,第二节 数据的整理与显示,表32.2

6、某班学生按年龄分组结果,第二节 数据的整理与显示,二、频数分布 频数又称次数,是指分组后各组中的单位数。各组次数和总次数的比值就是频率或称比重。 数据分组的过程就是次数分配的过程,分配的结果列示出来就形成了频数分布,或称次数分布。 有时,为了统计分析的需要,我们还要计算累积频数和累积频率。,第二节 数据的整理与显示,对品质数据,向上累积是指从类别顺序的开始一方向类别的最后一方累加频数;向下累积是指从类别的最后一方向开始一方累加频数。 【实用范例3.3】试对表3.2.1中的数据进行向上累积和向下累积。,第二节 数据的整理与显示,表3.2.3 某班学生按总评成绩所作累积次数分配表,第二节 数据的整

7、理与显示,对数量数据,向上累积是指从变量值小的一方向变量值大的一方累加频数;向下累积是指从变量值大的一方向变量值小的一方累加频数。 【实用范例3.4】试对表3.2.2中的数据进行向上累积和向下累积。,第二节 数据的整理与显示,表3.2.4 某班学生按年龄所作累积次数分配表,第二节 数据的整理与显示,三、品质数据的整理与显示 (一)定类数据的整理与显示 1.定类数据的整理 整理定类数据,可以计算其次数、比例和比率。 次数是指落在各类别中的数据个数。 比例是指某一类别数据占全部数据的比值,通常反映整体的构成或者整体结构,整体比例之和为1。 比率是指不同类别数量的比值,也就是部分比部分,由于比率不是

8、总体中部分与整体之间的对比关系,因而比值可能大于1。,第二节 数据的整理与显示,【实用范例3.5】 表3.2.5 2006年城镇居民家庭平均每人全年消费性支出(单位:元),第二节 数据的整理与显示,2.定类数据的图示 常用的统计图包括了条形图、圆形图、折线图、雷达图、圆环图等,每种图形都有其优缺点 比较适合表现定类数据的图形是条形图和饼图。条形图用宽度相同的条形高度或长短来表示数据的变动,它强调的是特定时间点上的数值差异。 饼图主要用于表示部分和整体的比例关系,对于研究结构性问题十分有用。但它只能显示一个系列的数据比例关系,第二节 数据的整理与显示,【实用范例3.6】利用表3.2.5中的数据绘

9、制饼图。,图3.2.1 选择图表类型图,第二节 数据的整理与显示,图3.2.2 数据区域选项卡,第二节 数据的整理与显示,图3.2.3 系列选项卡,第二节 数据的整理与显示,图3.2.4 标题选项卡,第二节 数据的整理与显示,图3.2.5 数据标志选项卡,第二节 数据的整理与显示,图3.2.6 设置图表位置,第二节 数据的整理与显示,图3.2.7 完成的饼图,第二节 数据的整理与显示,(二)定序数据的整理与显示 1.定序数据的整理 对定序数据的整理,主要是计算其累积频数和累积频率,并编制累积频数分布表。 2.定序数据的图示 定序数据与定类数据的图示方法基本相同。常用的是圆环图。,第二节 数据的

10、整理与显示,用表3.2.1中的数据绘制圆环图,图3.2.8 完成的圆环图,第二节 数据的整理与显示,图3.2.9 完成的分离型圆环图,第二节 数据的整理与显示,五、数量数据的整理与显示 (一)数量数据的分组 1.单变量值分组 把每一个变量值作为一组,这种分组方法通常只适合于离散型变量且变量较少的情况。 如果变量数较多,就会造成组数过多而次数过少的情况,这样就失去了分组的意义。,第二节 数据的整理与显示,2.组距分组 指将全部的变量值划分为若干个不同的区间,每一变量值依据大小顺序分属不同的组。 进行组距分组时,最重要的是确定组数、组距、组限和组中值。 组数是所分的组的个数 组距是每一组的距离 组

11、限是组距两端的数值,较大值叫上组限,较小值叫下组限 组中值是上组限和下组限的简单算术平均,第二节 数据的整理与显示,表3.2.6 按年龄划分的2006年外国入境旅游人数(单位:万人次),第二节 数据的整理与显示,(1)组数的确定 一般组数确定为515组为宜。 (2)组距的确定 组距可分为等组距和不等组距,等组距是指每一组的距离都是相等的,而不等组距是指每一组的距离不全相等。 只有上组限而无下组限或只有下组限而无上组限,称为开口组 上、下组限齐全,称为闭口组,第二节 数据的整理与显示,在等距分组中,组距的计算公式是:,第二节 数据的整理与显示,(3)组限的确定 上组限不在内:即相邻两组的上、下限

12、相叠时,上组限数值不算在该组内,而计算在下一组内。 连续型变量的相邻组限也可以是间断的,此时每一组的实际上限仍是下一组的下限。 (4)计算组中值 组限确定后,组中值作为上限到下限的中值,其计算公式为:,第二节 数据的整理与显示,开口组的组中值与其相邻组的组距有关,其计算公式为:,第二节 数据的整理与显示,(二)数量数据的图示 数量数据的图示常用直方图和折线图。 直方图是用矩形的宽度和高度来表示频数分布的图形。 折线图也称频数多边形图,它是在直方图的基础上,把直方图顶部的中点用直线连接起来以后形成的图形。 Excel的直方图不是通过图表向导设置的,而是通过【工具】菜单中的【数据分析】来完成的。,

13、第二节 数据的整理与显示,直方图的绘制: 表3.2.7 某车间30名工人周加工零件数,第二节 数据的整理与显示,图3.2.10 数据分析对话框,第二节 数据的整理与显示,图3.2.11 直方图对话框,第二节 数据的整理与显示,图3.2.12 频数分布表和直方图,第二节 数据的整理与显示,图3.2.13 折线图,第三节 统计表,一、统计表的结构 基本结构包括了四部分,即表头、行标题、列标题和数字资料,必要时可以在统计表的下方加注说明。,第三节 统计表,二、统计表的设计 基本要求是一致的,即要做到简明、美观、重点突出。 设计表头时,一般应包括表号、总标题和表中数据的单位等内容,总标题的表达应力求简

14、练,能确切概括出统计表的内容即可。通常总标题中含有统计资料所属的时间、地点和数据类型。,第三节 统计表,统计表中的数字要对齐,精确度应该相同,数字部分不留空格,数字为零或可忽略不计时,应写明为“0”;当数字不存在或不应有数字时,应用符号“”表示;缺乏某项资料时,应用符号“”表示;有相同数字时,应全部重写,不能用“同上”等字样代替。此外,若统计表中只有一种计量单位时,可以把数字的计量单位写在表头部分;若有多种计量单位,则需设计量单位栏或写在列标题栏内。 设计统计表的格式时,要注意统计表常用开口式,即其左右两端不封口;表中的上下两端以粗线或双线绘制,称为上基线和下基线,中间的其他线可用细线;列标题

15、间一般用竖线隔开,而行标题通常不必用横线隔开。,实践环节,一、课堂实践案例 请根据下表绘制如条形图、柱形图、饼图和圆环图,并比较各图形的不同及数据分布的特点。 表1 2006年两地区城镇居民家庭平均每人全年购买的部分商品数量(单位:千克),实践环节,二、思考与练习 1.某校需采购的各类书写本的单价和数量见表2,根据表中的数据,完成以下操作:,实践环节,对数据按采购量进行排序。 筛选出单价是0.60元的数据。 筛选出总价在200300元的数据。 根据单价进行分类汇总,计算每一价位下品种数。 在单价汇总的基础上,再对“书名”字段进行分类汇总。,实践环节,2.表3是2008年110月住宅开发投资额,请对该数据进行适当分组,并编制次数分配表,计算出累积频数和累积频率。,实践环节,(1)对表中数据进行等距分组,并计算出组距和各组的组中值。 (2)绘制直方图,说明该数据分布的特点。,实践环节,4.请根据表5中的数据绘制柱形图和圆环图 。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号