《数据的图表展示》PPT课件.ppt

上传人:cn****1 文档编号:568642738 上传时间:2024-07-25 格式:PPT 页数:78 大小:3.02MB
返回 下载 相关 举报
《数据的图表展示》PPT课件.ppt_第1页
第1页 / 共78页
《数据的图表展示》PPT课件.ppt_第2页
第2页 / 共78页
《数据的图表展示》PPT课件.ppt_第3页
第3页 / 共78页
《数据的图表展示》PPT课件.ppt_第4页
第4页 / 共78页
《数据的图表展示》PPT课件.ppt_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《《数据的图表展示》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据的图表展示》PPT课件.ppt(78页珍藏版)》请在金锄头文库上搜索。

1、数据分析数据分析( (方法与案例方法与案例) )统计学基础统计学基础第 2 章 数据的图表展示2.1 数据的预处理数据的预处理2.2 品质数据的整理与展示品质数据的整理与展示 2.3 数值型数据的整理与展示数值型数据的整理与展示 2.4 合理使用图表合理使用图表2 - 3统计学统计学基础基础为什么要预处理为什么要预处理调查收集到的原始统计资料常常是大量的。它必须调查收集到的原始统计资料常常是大量的。它必须经过加工整理,如分类归并汇总,按时间前后或按经过加工整理,如分类归并汇总,按时间前后或按数值大小重新排列等,才容易发现数据的规律性,数值大小重新排列等,才容易发现数据的规律性,并便于做进一步的

2、统计分析。并便于做进一步的统计分析。加工整理,加工整理,加工整理,加工整理,归并汇总,归并汇总,归并汇总,归并汇总,重新排列重新排列重新排列重新排列调查得到调查得到调查得到调查得到的原始的原始的原始的原始统计资料统计资料统计资料统计资料发现数据发现数据发现数据发现数据的规律性,的规律性,的规律性,的规律性,作进一步的作进一步的作进一步的作进一步的统计分析统计分析统计分析统计分析2 - 4统计学统计学基础基础学习目标l数据预处理的内容和目的数据预处理的内容和目的l分类和顺序数据的整理与显示方法分类和顺序数据的整理与显示方法l数值型数据的整理与显示方法数值型数据的整理与显示方法l用用Excel作作

3、频数分布表和形频数分布表和形图图l合理使用图表合理使用图表20102010年年2 - 5统计学统计学基础基础统计应用把数据画图之后,要用用脑袋沃德(Abraham Wald)和许多统计学家一样,在第二次世界大战时也处理了战争与相关的问题。他发明的一些统计方法在战时被视为军事机密。以下是他提出的概念中较简单的一种沃德被咨询飞机上什么部位应该加强钢板时,开始研究从战役中返航的军机上受敌军创伤的弹孔位置。他画了飞机的轮廓,并且标识出弹孔的位置。资料累积一段时间后,几乎把机身各部位都填满了。于是沃德建议,把剩下少数几个没有弹孔的部位补强。因为这些部位被击中的飞机都没有返航20102010年年2.1 数

4、据的预处理数据的预处理 2.1.1 数据审核数据审核 2.1.2 数据排序数据排序 2.1.3 数据筛选数据筛选 2.1.4 数据透视表数据透视表第第 2 章章 数据的图表展示数据的图表展示2 - 7统计学统计学基础基础数据的预处理1.数据审核检查数据中的错误2.数据筛选找出符合条件的数据3.数据排序升序和降序寻找数据的基本特征4.数据透视按需要汇总20102010年年2.1.1 数据审核2.1 数据的预处理数据的预处理2 - 9统计学统计学基础基础数据审核原始数据(raw data)1.完整性审核应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全2.准确性审核数据是否真实反映实际情

5、况,内容是否符合实际数据是否有错误,计算是否正确等20102010年年2 - 10统计学统计学基础基础数据的审核二手数据(second hand data)1.适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定数据是否符合自己分析研究的需要2.时效性审核尽可能使用最新的数据3.确认是否有必要做进一步的加工整理20102010年年2.1.2 数据排序2.1 数据的预处理数据的预处理2 - 12统计学统计学基础基础数据排序 (data rank)1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场

6、合,排序本身就是分析的目的之一4.排序可借助于计算机完成20102010年年2 - 13统计学统计学基础基础数据排序 (方法)1.分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分2.数值型数据的排序递增排序:设一组数据为x1,x2,xn,递增排序后可表示为:x(1)x(2)x(2)x(n)20102010年年2.1.3 数据筛选2.1 数据的预处理数据的预处理2 - 15统计学统计学基础基础数据筛选(data filter)1.当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时

7、,需要对数据进行筛选2.数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除20102010年年2 - 16统计学统计学基础基础数据筛选(data filter):用用Excel进行数据筛选进行数据筛选 20102010年年8 8名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据 【例例例例2.12.1】8 8名名学学生生4 4门门课课程程的的考考试试成成绩绩数数据据。找找出出统统计计学学成成绩绩等等于于7575分分的的学学生生,英英语语成成绩绩最最高高的的前前3 3名名学学生生,4 4门门

8、课课程程成成绩绩都大于都大于7070分的学生分的学生 2.1.4 数据透视表2.1 数据的预处理数据的预处理2 - 18统计学统计学基础基础数据透视表(pivot table )1.可以从复杂的数据中提取有用的信息2.可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图3.形成一个符合需要的交叉表(列联表)4.在利用数据透视表时,数据源表中的首行必须有列标题20102010年年2 - 19统计学统计学基础基础数据透视表(pivot table )【例例2.2】在某大学随机抽取30名学生,调查他们的性别、家庭所在地、平均月生活费支出、平均每月购买衣物支出和购买衣物时所考虑的首要因素等,得

9、到的数据如表24所示。试建立一个数据透视表,在表的行变量中给出性别和购买衣物首选因素,在列变量中给出学生的家庭所在地,对平均月生活费支出和月平均购买衣物支出进行交叉汇总。20102010年年2 - 20统计学统计学基础基础数据透视表(用Excel创建数据透视表)第第1步:步:在Excel工作表中建立数据清单第第2步:步:选中数据清单中的任意单元格,并选择【数据】菜单 中的【数据透视表和数据透视图】第第3步:步:确定数据源区域第第4步:步:在【向导3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】第第5步步:在【向导布局】对话框中,依次将”分类变量“拖至 左边的“行”区域,上边的“列”区

10、域,将需要汇总的“变 量” 拖至“数据区域”第第6步:步:然后单击【确定】,自动返回【向导3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表 20102010年年 用用用用ExcelExcel创建数据透视表创建数据透视表创建数据透视表创建数据透视表第 2 章 数据的图表展示2.1 数据的预处理数据的预处理2.2 品质数据的整理与展示品质数据的整理与展示 2.3 数值型数据的整理与展示数值型数据的整理与展示 2.4 合理使用图表合理使用图表2.2 品质数据的整理与展示品质数据的整理与展示 2.2.1 分类数据的整理与图示分类数据的整理与图示 2.2.2 数值型数据的整理与图示数值型数据的

11、整理与图示第第 2 章章 数据的图表展示数据的图表展示2 - 23统计学统计学基础基础数据的整理与显示(基本问题)1.要弄清所面对的数据类型不同类型的数据,采取不同的处理方式和方法2.对分类数据和顺序数据主要是作分类整理3.对数值型数据则主要是作分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据20102010年年2.2.1 分类数据的整理与图示2.2 品品质数据的整理与展示数据的整理与展示2 - 25统计学统计学基础基础分类数据的描述统计量1.1.频数频数(frequency) :落在各类别中的数据个数2.2.比例比例(

12、proportion) :某一类别数据个数占全部数据个数的比值3.3.百分比百分比(percentage) :将对比的基数作为100而计算的比值4.4.比率比率(ratio) :不同类别数值个数的比值20102010年年2 - 26统计学统计学基础基础生成频数分布表(分类数据)1. 列出各类别20102010年年 2. 2. 计算各类别的频数3. 生成频数分布表分类分类频数频数比例比例百分比百分比比率比率ABCDE2 - 27统计学统计学基础基础生成频数分布表(定性数据)20102010年年【例例2.3】为为研研究究不不同同类类型型的的软软饮饮料料的的市市场场销销售售情情况况,一一家家市市场场

13、调调查查公公司司对对随随机机抽抽取取的的一一家家超超市市进进行行调调查查。下下面面的的表表21是是调调查查员员随随机机观观察察的的50名名顾顾客客购购买买的的饮饮料料类类型型及及购购买买者者性性别别的的记记录录。生生成成频频数数分分布布表表,观观察察饮饮料料类类型型和和消消费费者者性性别别的的分分布布状状况况,并进行描述性分析并进行描述性分析 制作频数分布表制作频数分布表制作频数分布表制作频数分布表绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品2 - 28统计学统计学基础基础分类数据的图示条形图(bar Chart)1.用宽度相同的条形的高度或长短来表示各类别数据2.各类别可放在纵轴,称为条

14、条形形图图,可以放在横轴,称为柱柱形图形图(column chart) 20102010年年2 - 29统计学统计学基础基础分类数据的图示复式条形图(bar Chart)饮料类型和顾客性别的条形图饮料类型和顾客性别的条形图 (SPSS的输出) 20102010年年2 - 30统计学统计学基础基础分类数据的图示帕累托图(pareto chart)1.按各类别数据出现的频数多少排序后绘制的柱形图 2.用于展示分类数据的分布20102010年年2 - 31统计学统计学基础基础分类数据的图示简单饼图 (pie Chart)20102010年年用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个

15、样本(或总体)中各组成部分的数据占全部数 据 的 比 例用于研究结构问题2.2.2 顺序数据的整理与图示2.2 品品质数据的整理与展示数据的整理与展示2 - 33统计学统计学基础基础顺序数据的整理(可计算的统计量)1. 累累积积频频数数(cumulative frequencies):各类别频数的逐级累加2. 累累积积频频率率(cumulative percentages):各类别频率(百分比)的逐级累加20102010年年 2 - 34统计学统计学基础基础顺序数据的频数分布表(例题分析)20102010年年【例例例例2.42.4】在在一一项项城城市市住住房房问问题题的的研研究究中中,研研究究

16、人人员员在在甲甲乙乙两两个个城城市市各各抽抽样样调调查查300300户户,其其中中的的一一个个问问题题是是:“ “您您对对您您家家庭庭目目前前的的住住房房状状况况是是否否满满意意?” ” 1 1 非非 常常 不不满满意意;2 2不不满满意意;3 3一一般般;4 4满满意;意;5 5非常满意。非常满意。 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比

17、(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510 24132225270300 8.0 44.0 75.0 90.0100.0300276168 75 30100.092562510合计合计300100.02 - 35统计学统计学基础基础顺序数据的频数分布表 (例题分析)20102010年年乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向

18、下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2199786438 7.033.026.021.312.7 21120198262300 7.0 40.0 66.0 87.3100.0300279180102 38100.0 93.0 60.0 34.0 12.7合计合计300100.02 - 36统计学统计学基础基础顺序数据的图示累计频数分布图 (例题分析)20102010年年243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a

19、)向上累积向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布2 - 37统计学统计学基础基础环形图(doughnut chart)1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环3.用于结构比较

20、研究 4.用于展示分类和顺序数据20102010年年2 - 38统计学统计学基础基础环形图 (例题分析)20102010年年8%36%31%15%7%33%26%21%13%10% 非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价2.3 数值型数据的整理与展示数值型数据的整理与展示 2.3.1 数据分组数据分组 2.3.2 数值型数据的图示数值型数据的图示第第 2 章章 数据的图表展示数据的图表展示2.3.1 数据分组2.3 数数值型数据的整理与展示型数据的整理与展示数据数据2 - 41统计学统计学基础基础数据分组20102010年年2 -

21、 42统计学统计学基础基础分组方法20102010年年等距分组等距分组异距分组异距分组单变量值分组单变量值分组组距分组组距分组2 - 43统计学统计学基础基础单变量值分组(要点)1. 将一个变量值作为一组2. 适合于离散变量3. 适合于变量值较少的情况20102010年年2 - 44统计学统计学基础基础组距分组 (要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.需要遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组20102010年年 2 - 45统计学统计学基础基础组距分组(几个概念)1. 下限下限(low limit) :一个组的最小值2. 上

22、限上限(upper limit) :一个组的最大值3. 组距组距(class width) :上限与下限之差4. 组中值组中值(class midpoint) :下限与上限之间的中点值20102010年年下限值下限值+上限值上限值2组中值组中值 =2 - 46统计学统计学基础基础频数分布表的编制(例题分析)20102010年年【例例例例2.52.5】某某电电 脑脑 公公 司司20052005年年 前前 四四个个 月月 各各 天天 的的销销售售量量数数据据( (单单位位:台台) )。试试 对对 数数 据据 进进行分组行分组2 - 47统计学统计学基础基础生成频数分布表(例题分析)1.确定组数:组

23、数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5K 15。本例中由于数据较多,可考虑分为10组 2.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距组距( 最大值最大值 - 最小值最小值) 组数组数 例如,本例最大值为237,最小值为141,组距=(237-141)109.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 3.统计出各组的频数。每个组的数据满足axb(上限值不在内(Excel的计数规则是axb) 20102010

24、年年制作频数分布制作频数分布2 - 48统计学统计学基础基础等距分组表(上下组限重叠)20102010年年2 - 49统计学统计学基础基础等距分组表(上下组限间断)20102010年年2 - 50统计学统计学基础基础等距分组表(使用开口组)20102010年年2.3.2 数值型数据的图示2.3 数数值型数据的整理与展示型数据的整理与展示数据数据Excel2 - 52统计学统计学基础基础分组数据直方图(histogram)1.用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布本质上是用矩形的面积面积来表示频数分布3.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应

25、的频数就形成了一个矩形,即直方图4.直方图下的总面积等于120102010年年2 - 53统计学统计学基础基础分组数据的图示(直方图的绘制)20102010年年140140 150150210210直方图下的面直方图下的面积之和等于积之和等于1 1某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我我一一眼眼就就看看出出来来了了,销销售售量量在在 170170 180180之之间间的的天天数数最最多多! !190190 200200180180160160 170170频频频频频频数数数数数数( (天天天天天天) )25252020

26、151510105 53030220220 230230 2402402 - 54统计学统计学基础基础分组数据直方图(直方图与条形图的区别)1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据20102010年年2 - 55统计学统计学基础基础未分组数据茎叶图(stem-and-leaf plot)1.用于显示未分组的原始数据的分布2.

27、由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留最后一位数字6. 茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据20102010年年2 - 56统计学统计学基础基础未分组数据茎叶图(例题分析)20102010年年某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图2 - 57统计学统计学基础基础未分组数据茎叶图(扩

28、展的茎叶图)20102010年年2 - 58统计学统计学基础基础未分组数据箱线图(box plot)1.用于显示未分组的原始数据的分布2.箱线图是由一组数据的最大值(maximum)、最小值(minimum)、 中 位 数 (median)、 两 个 四 分 位 数(quartiles)这5个值绘制而成的中位数是一组数据排序后处于中间位置上的变量值四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值 3.绘制方法首先找出一组数据的5个特征值,即最最大大值值、最最小小值值、中中位数位数Me和两个四分位数四分位数(下四分位数QL和上四分位数QU)连接两个四分位数画出箱子,再将两个

29、极值点与箱子相连接20102010年年2 - 59统计学统计学基础基础未分组数据箱线图(箱线图的构成)20102010年年中位数中位数中位数中位数4681012Q75%75%Q25%25%XMaxMaxXMinMinMedian/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图2 - 60统计学统计学基础基础未分组数据箱线图(例题分析)20102010年年最小值最小值最小值141141141最大值最大值最大值237237237中位数中位数中位数18218218225%25%25%四分位数四分位数四分位数170.25170.25170.2575%75%75%

30、四分位数四分位数四分位数197197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售额数据的某电脑公司销售额数据的某电脑公司销售额数据的某电脑公司销售额数据的Median/Quart./RangMedian/Quart./Rang箱线图箱线图箱线图箱线图2 - 61统计学统计学基础基础分布的形状与箱线图20102010年年不同分布的箱线图不同分布的箱线图不同分布的箱线

31、图不同分布的箱线图对称分布对称分布对称分布对称分布对称分布对称分布Bell-shaped distributionBell-shaped distributionBell-shaped distributionLeft-skewed distributionLeft-skewed distributionLeft-skewed distribution左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Right-skewed distributionRight-skewed distributionRight-skewed distribution

32、2 - 62统计学统计学基础基础未分组数据看分布多批数据箱线图 (例题分析)20102010年年【例例例例2.62.6】 从从某某大大学学经经济济管管理理专专业业二二年年级级学学生生中中随随机机抽抽取取 1111人人 , 对对 8 8门门主主要要课课程程的的考考试试成成绩绩进进行行调调查查,所所得得结结果果如如表表。试试绘绘制制各各科科考考试试成成绩绩的的批批比比较较箱箱线线图图,并并分分析析各各科科考考试试成成绩绩的分布特征的分布特征1111名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号123456789101

33、1英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础766593746870558590958187757391789751768570926881717488698465739570786690737884709363798060878167869183777690708283829284817069727875789188669480857186746879628181557870756871772 - 63统计学统计学基础基础未分组数据多批数据箱线图(例题分析Median/Quart./Range)

34、20102010年年8 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图2 - 64统计学统计学基础基础未分组数据多批数据箱线图 (SPSS绘制的箱线图)20102010年年1111名学生考试成绩的名学生考试成绩的名学生考试成绩的名学生考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图2 - 65统计学统计学基础基础箱线图K线图 (上证指数K线图)20102010年年2 - 66统计学统计学基础基础时间序列数据线图(line plot)1.表示时间序列数据趋势的图形2.时间一般绘在横轴,数据绘

35、在纵轴3.图形的长宽比例大致为10 : 73.一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断20102010年年2 - 67统计学统计学基础基础时间序列数据线图 (例题分析)20102010年年【例例例例2.72.7】我我国国1991199120032003年城乡居年城乡居民家庭的人均民家庭的人均收入数据如表。收入数据如表。试绘制线图试绘制线图¥ 1991199120032003年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年份年份城镇居民城镇居民农村居民农村居民1991199219931

36、9941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2 708.6 784.0 921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.22 - 68统计学统计学基础基础两个变量间的关系二维散点图(2D Scatterplots)1.展示两个变量之间的关系2.用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组

37、数据在坐标系中形成的个点称为散点,由坐标及其散点形成的二维数据图温度温度 / 0C降雨量降雨量/mm产量产量/kg/hm26252250840345010584500136857501411058001698750021120825020102010年年2 - 69统计学统计学基础基础两个变量间的关系散点图矩阵(2D Scatterplots)20102010年年温度温度降雨量降雨量产量产量2 - 70统计学统计学基础基础三个变量间的关系三维散点图(3D Scatterplots)20102010年年2 - 71统计学统计学基础基础多变量数据雷达图(radar chart)1.也称为蜘蛛图(s

38、pider chart)2.显示多个变量的图示方法3.在显示或对比各变量的数值总和时十分有用3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度20102010年年2 - 72统计学统计学基础基础多变量数据雷达图(雷达图的制作) 设有n组样本S1,S2, , Sn,每个样本测得P个变量X1,X2 , , XP,要绘制这P个变量的雷达图,其具体做法是20102010年年n n 先先做做一一个个圆圆,然然后后将将圆圆P P等等分分,得得到到P P个个点点,令令这这P P个个点点分分别别对对应应P P个个变变量量,在在将将这这P P个个点点与与

39、圆圆心心连连线线,得得到到P P个个幅幅射射状状的的半半径径,这这P P个个半半径径分分别别作作为为P P个个变变量量的的坐坐标标轴轴,每每个个变变量量值值的的大大小小由由半径上的点到圆心的距离表示半径上的点到圆心的距离表示n n 将将同同一一样样本本的的值值在在P P个个坐坐标标上上的的点点连连线线。这这样样,n n个样本形成的个样本形成的n n个多边形就是一个雷达图个多边形就是一个雷达图2 - 73统计学统计学基础基础多变量数据雷达图 (例题分析)20102010年年【例例例例2.92.9】20032003年年我我国国城城乡乡居居民民家家庭庭平平均均每每人人各各项项生生活活消消费费支支出出

40、构构成成数数据据如如表表。试试绘制雷达图绘制雷达图今天的今天的主食是主食是面包面包20032003年城乡居民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成(%)(%)项项 目目城镇居民城镇居民农村居民农村居民 食品食品 衣着衣着 家庭设备用品及服务家庭设备用品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育文化服务娱乐教育文化服务 居住居住 杂项商品与服务杂项商品与服务37.129.796.307.3111.0814.3510.743.30 45.595.674.205.968.3612.131

41、5.872.212.4 合理使用图表合理使用图表 2.4.1 鉴别图形优劣的准则鉴别图形优劣的准则 2.4.2 统计表的设计统计表的设计第第 2 章章 数据的图表展示数据的图表展示2 - 75统计学统计学基础基础鉴别图表优劣的准则1.一张好的图表应包括以下基本特征显示数据让读者把注意力集中在图表的内容上,而不是制作图表的程序上避免歪曲强调数据之间的比较服务于一个明确的目的有对图表的统计描述和文字说明2.5种鉴别图表优劣的准则:一张好的图表应当精心设计、有助于洞察问题的实质使复杂的观点得到简明、确切、高效的阐述能在最短的时间内以最少的笔墨给读者提供最大量的信息是多维的表述数据的真实情况20102

42、010年年2 - 76统计学统计学基础基础统计表的结构20102010年年2002200220032003年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位2002年年 2003年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一名就业者负担人数平均一名就业者负担人数 平均每人全部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消费性支出平均每人消费性支出户户人人人人%元元元元元元元元453173.041.5851.971.928177.40

43、7702.806029.88480283.011.5852.491.919061.228472.206510.94资料来源:资料来源:中国统计年鉴中国统计年鉴20042004,中国统计出版社,中国统计出版社,20042004,第,第359359页。页。注:本表为城市和县城的城镇居民家庭抽样调查资料。注:本表为城市和县城的城镇居民家庭抽样调查资料。 行行行行标标标标题题题题列列列列标标标标题题题题数数数数字字字字资资资资料料料料表头表头表头表头附附附附加加加加2 - 77统计学统计学基础基础统计表的设计1.合理安排统计表的结构2.总标题内容应满足3W 要求3.数据计量单位相同时,可放在表的右上角

44、标明,不同时应放在每个变量后或单列出一列标明4.表中的上下两条横线一般用粗线,其他线用细线5.通常情况下,统计表的左右两边不封口6.表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一7.对于没有数字的表格单元,一般用“”表示8.必要时可在表的下方加上注释20102010年年2 - 78统计学统计学基础基础本章小结1.1.数据预处理的内容和目的数据预处理的内容和目的2.2.分类和顺序数据的整理与显示方法分类和顺序数据的整理与显示方法3.3.数值型数据的整理与显示方法数值型数据的整理与显示方法4.4.合理使用图表合理使用图表5.5.用用Excel作作频数分布表和图形频数分布表和图形20102010年年

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号