数据可视化快速入门教程

上传人:cl****1 文档编号:512040521 上传时间:2024-02-07 格式:DOC 页数:9 大小:193.51KB
返回 下载 相关 举报
数据可视化快速入门教程_第1页
第1页 / 共9页
数据可视化快速入门教程_第2页
第2页 / 共9页
数据可视化快速入门教程_第3页
第3页 / 共9页
数据可视化快速入门教程_第4页
第4页 / 共9页
数据可视化快速入门教程_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数据可视化快速入门教程》由会员分享,可在线阅读,更多相关《数据可视化快速入门教程(9页珍藏版)》请在金锄头文库上搜索。

1、16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站HO光环大数携AURA B T G DATA数据可视化可以帮助我们更好地去传递信息。本篇要点:1. 数据可视化是什么2. 数据可视化的一般流程3. 常见的数据种类4. 通过可视化你想表达什么信息5. 选择具体的可视化形式6. 图表设计原则7. 常用的可视化工具01|数据可视化是什么数据可视化 主要旨在借助于图形化手段,清晰有效地传达与沟通信息(来源于百度百科)。也就是说可视化的存在是为了帮助我们更好地去传递信息。02|数据可视化的一般流程首先我们需要对我们现有的数据进行分析,得出自己的结论,明确要表达的信息和主 题(即你通过图表要说

2、明什么问题)。然后根据这个目的在现有的或你知道的图表信息库中 选择能够满足你目标的图表。最后开始动手制作图表,并对图表进行美化、检查,直至最 后图表完成。这里我们容易犯的一个错误是:先设想要达到的可视化效果,然后在去寻找相应的数 据。这样经常会造成:现有的数据不能够做出事先设想的可视化效果,或者是想要制作理想的图表需要获取更多的数据。”这样的误区。03|常见的数据种类为了更好的进行可视化,我们将数据分为分类数据、时序数据、空间数据、多元变量 数据四大类。1、分类数据分类数据是指针反映事物类别的数据。如:用户的设备可以分为Iphone用户和andorid用户两种;支付方式可以分为支付宝、微信、现

3、金支付三种等。诸如此类的分类所 得到的数据被称为分类数据。2、时序数据时序数据也称时间序列数据,是指同一统一指标按时间顺序记录的数据列。如:每个月的新增用户数量、某公司近十年每年的GMV等。诸如此类按时间顺序来记录的指标对应的数据成为时序数据。3、空间数据空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数 据,它可以用来描述来自现实世界的目标,它具有定位、定性、时间和空间关系等特性。想拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站HO光环大数携AURA B T G DATA空间数据是一种用点、线、面以及

4、实体等基本空间数据结构来表示人们赖以生存的自然世 界的数据。4、多变量数据数据通常以表格形式的出现,表格中有多个列,每一列代表一个变量,将这份数据就称为多变量数据,多变量常用来研究变量之间的相关性。即用来找出影响某一指标的因素 有哪些。04|通过可视化你想表达什么信息表达某个什么结论(平台上的用户中哪个地区的用户较多、数据分析领域最具有权威 的人物是谁、2016年的GMV环比去年是增加类还是降低了)。阐述某种现象(学生成绩好坏可能与家庭背景是否具有一定的相关性、应届生收入和毕业院校是否有一定的相关性 )。05|选择具体的可视化形式明确了我们要借助图表传递什么信息以后我们就可以着手选择合适的图表

5、了,这里我们借助于数据之美作者提出的观点,不是列举什么柱状图、折线图等具体的图表,而 是介绍一些组成这些图表的零部件。比如说柱状图就是有长度和直角坐标系组成的。我们 只需要选择所需的零部件进行组合即可。接下来具体看一下这些零部件。基于数据的零部件有:视觉暗示、坐标系、标尺、背景信息以及前面四种形式的任意 组合。1、视觉暗示是指通过查看图表就可以与潜意识中的意识进行联系从而得出图表表达的意识。常用的视觉暗示主要有:位置 (位置高低卜长度(长短)、角度(大小)、方向(方向上升还是下降 卜 形状(不同形状代表不同分类)、面积(面积大小卜体积(体积大小卜饱和度(色调的强度,就 是颜色的深浅)、色调(不

6、同颜色)。想拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站HG光环大数擔島 U R A B r G D * T A想拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站H想拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站H2、坐标系这里的坐标系和我们之前数学中学到的坐标系是相同的,只不过坐标轴的意义可能稍 有不同。常见的坐标系种类有:直角坐标系、极坐标系和地理坐标系。I卫rT.亠dIh 111 JI想

7、拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站H想拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站H大家对直角坐标系、极坐标系比较熟悉,这里说一下地理坐标系。地理坐标系是使用三维球面来定义地球表面位置,以实现通过经纬度对地球表面点位 引用的坐标系。但是我们在进行数据可视化的时候一般用投影的方法把其从三维数据转化 成二维的平面图形。想拿高薪,选对行业很重要!学 大数据,工资高,前景好!官方网站HO-.16年老品牌,上市IT培训机构学大数据,就选光环大数据AURA

8、II r a D A T AWorld Population 2010)可现抵的二地地丈地国3、标尺前面说到的三种坐标系只是定义了展示数据的维度和方向,而标尺的作用是用来衡量 不同方向和维度上的大小,其实和我们熟悉的刻度挺像。4、背景信息此处的背景和我们在语文中学习到的背景是一个概念,是为了说明数据的相关信息(who、what、when、where、why),使数据更加清晰,便于读者更好的理解。5、组合组件组合组件就是根据目标用途将上面四种信息进行组合,就是我们最后要呈现的图表样 式,具体如何组合视你的目标而定。想拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机

9、构学大数据,就选光环大数据官方网站HG光环大数携4 U It * B G D A T AI r 卅址 *Jf- 疋 耳 重 K Kt Att-ii-乂直角蚩挥鬲与芦向抑a合臣施覽怖為弓紀置的堂含 Ann -fliffn 耐首 MTS 耐It环JEJW颐尸1*科4t地理坐粽泉峪荻色力也旬蜃叭组合円 H H *讀w 冃M硏1“*1更埼鱼忏申口卜一叵:纬墟&KTrffi JtHdiiMi叵杞=戎色口益合06|图表设计原则想拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站HO光环大数携AURA B T G DATA图表设计原则其实也可以

10、看作是图表美化的一部分,因为我们之所以遵循设计原则就 是为了让图表更好看一点。关于图表的设计我们可以分为三部分,分别为整体的排版布 局、色彩搭配和字体。1、排版布局排版布局里面我们又可以分为两个。(1) 最大化数据墨水比是指在墨水数量一定的情况下最大化数据墨水所占的比例。先来了解一下什么是数据 墨水,什么是非数据墨水比。数据墨水是指为了呈现数据所用的墨水,在图表中主要是指柱状图的那些柱子,折线 图的那根线之类的。而非数据墨水就是除了这些数据以外的元素所用的墨水,在图表中主 要指网格线、坐标轴、填充背景等元素。这个原则就是告诉我们在设计的时候尽可能多的重点突出数据元素而淡化非数据元 素。(2)

11、CRAP 原则是指对比(Contrast)、重复(Repetition)、对齐(Alignment)、亲密性(Proximity)这四 大基本原则。对比(Co ntrast)对比的基本思想是, 要避免页面上的元素太过相似。如果元素(字体、颜色、大小、线宽、 形状、 空间等)不相同, 那就干脆让它们截然不同。要让页面引人注目,对比通常是最重要的一个因素,正是它能使读者首先看这个页面。重复(Repetitio n)让设计中的视觉要素在整个作品中重复出现。可以重复颜色、形状、材质、空间关系、 线宽、 字体、大小和图片,等等。 这样一来,既能增加条理性,还可以加强统一性。对齐(Alig nment)任

12、何东西都不能在页面上随意安放。每个元素都应当与页面上的另一个元素有某种视觉联系。这样能建立一种清晰、精巧而且清爽的外观。亲密性(Proximity)想拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站HO光环大数携AURA B t 0 D A T A彼此相关的项应当靠近,归组在一起。如果多个项相互之间存在很近的亲密性,它们就会成为一个视觉单元,而不是多个孤立的元素。这有助于组织信息,减少混乱,为读者提供清晰的结构。2、配色在配色里面也主要有两种方案。(1) 第一种就是模仿,去找一些看起来比较专业好看的图表配色,然后把该配色方案拷贝

13、过来供自己所用。这里可能会用到RGB获取的工具,可以利用 windows自带的画图工具进行获取,详情点击:https:/ji ngya 色调,然后依据这一种去匹配其他的颜色。(我现在就是用的这种)(2) 第二种相比第一种就比较难点,需要自己去学一些基础的色彩理论。这个对于非专 业的可能有点难度。3、字体字体分为有衬线和无衬线两种。,A ALOGO DESIGN LOGO DESIGNlArir Himftarm SefH MLS衬线体无衬线体中文常见的衬线和非衬线的两种字体分别是宋体和黑体,而英文对应的是TimesNew Roman 和 Arial 。想拿高薪,选对行业很重要!学 大数据,工资高,前景好!16年老品牌,上市IT培训机构学大数据,就选光环大数据官方网站HG光环大数擔AURA B r G D * T A衬钱是指笔風起姐材结审处的装饰其作用是强化笔画的特征.从而便得阅读更为窖易Times Neu Roiian123456英文12456中文无钳线Arial123456英文黑体122456中文在图表中我们一般使用无衬线字体,而为了方便我们一般默认使用Arial字体,8-10磅大小。07|常用的可视化工具1、Mi

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号