大数据可视化培训课件ppt(共 42张)

上传人:简****9 文档编号:105293097 上传时间:2019-10-11 格式:PPT 页数:43 大小:8.25MB
返回 下载 相关 举报
大数据可视化培训课件ppt(共 42张)_第1页
第1页 / 共43页
大数据可视化培训课件ppt(共 42张)_第2页
第2页 / 共43页
大数据可视化培训课件ppt(共 42张)_第3页
第3页 / 共43页
大数据可视化培训课件ppt(共 42张)_第4页
第4页 / 共43页
大数据可视化培训课件ppt(共 42张)_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《大数据可视化培训课件ppt(共 42张)》由会员分享,可在线阅读,更多相关《大数据可视化培训课件ppt(共 42张)(43页珍藏版)》请在金锄头文库上搜索。

1、,全国高校标准教材云计算姊妹篇,剖析大数据核心技术和实战应用,大数据,刘鹏 主编 张燕 张重生 张志立 副主编,BIG DATA,刘 鹏,全国高校标准教材云计算姊妹篇,剖析大数据核心技术和实战应用,of,41,3,7.1数据可视化基础,第七章 大数据可视化,of,41,4,大数据可视化核心问题 随着互联网技术的发展,尤其是移动互联技术的发展,网络空间的数据量呈现出爆炸式增长。如何从这些数据中快速获取自己想要的信息,并以一种直观、形象的方式展现出来?这就是大数据可视化要解决的核心问题。 数据可视化解释 数据可视化,最早可追溯到20世纪50年代,它是一门关于数据视觉表现形式的科学技术研究。数据可视

2、化是一个处于不断演变之中的概念,其边界在不断地扩大,主要指的是技术上较为高级的技术方法,而这些技术方法允许利用图形图像处理、计算机视觉及用户界面,通过表达、建模,以及对立体、表面、属性及动画的显示,对数据加以可视化解释。 本章重点讲解 与立体建模之类的特殊技术方法相比,数据可视化所涵盖的技术方法要广泛得多。本章将重点对大数据可视化的基础知识、基本概念及大数据可视化的常用工具进行详细讲解。,7.1数据可视化基础,第七章 大数据可视化,可视化的 基本特征,易懂性,必然性,片面性,专业性,数据可视化的片面性特征要求可视化模式不能替代数据本身,只能作为数据表达的一种特定形式,专业化特征是人们从可视化模

3、型中提取专业知识的环节,它是数据可视化应用的最后流程,可视化可以使得碎片化的数据转换为具有特定结构的知识,从而为决策支持提供帮助,大数据所产生的数据量必然要求人们对数据进行归纳总结,对数据的结构和形式进行转换处理,of,41,5,7.1.1可视化的基本特征,7.1数据可视化基础,第七章 大数据可视化,7.1.2可视化的目标和作用,数据可视化的作用主要包括数据表达、数据操作和数据分析3个方面,它是以可视化技术支持计算机辅助数据认识的3个基本阶段。,数据表达,数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据。常见的形式如文本、图表、图像、二维图形、三维模型、网

4、络图、树结构、符号和电子地图等。,数据操作,数据操作是以计算机提供的界面、接口、协议等条件为基础完成人与数据的交互需求,数据操作需要友好的人机交互技术、标准化的接口和协议支持来完成对多数据集合或者分布式的操作。,数据分析,数据可视化可以有效地表达数据的各类特征,帮助人们推理和分析数据背后的客观规律,进而获得相关知识,提高人们认识数据的能力和利用数据的水平。,of,41,6,7.1数据可视化基础,第七章 大数据可视化,7.1.3数据可视化流程,数据获取,主动式是以明确的数据需求为目的,如卫星影像、测绘工程等;被动式是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务、网络论坛等。,数据

5、处理,数据处理是指对原始的数据进行质量分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性。,1,2,可视化模式,可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。,可视化应用,可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。,3,4,of,41,7,全国高校标准教材云计算姊妹篇,剖析大数据核心技术和实战应用,of,41,8,7.2大数据可视化方法,第七章 大数据可视化,7.2.1文本可视化,标签云,of,

6、41,9,如图所示是一种称为标签云(Word Clouds或Tag Clouds)的典型的文本可视化技术。它将关键词根据词频或其他规则进行排序,按照一定规律进行布局排列,用大小、颜色、字体等图形属性对关键词进行可视化。一般用字号大小代表该关键词的重要性,该技术多用于快速识别网络媒体的主题热度。,7.2大数据可视化方法,第七章 大数据可视化,7.2.1动态文本时序信息可视化,of,41,10,7.2大数据可视化方法,第七章 大数据可视化,7.2.2网络图可视化,(1)Nodal研究人员及其组织机构社会网络图,(2)基于节点连接的图和树可视化方法,of,41,11,7.2大数据可视化方法,第七章

7、大数据可视化,7.2.2网络图可视化,of,41,12,(3)基于空间填充的树可视化,(4)基于边捆绑的大规模密集图可视化,7.2大数据可视化方法,第七章 大数据可视化,7.2.3时空数据可视化,流式地图,结合了捆绑技术的流式地图,结合了密度图技术的流式地图,of,41,13,7.2大数据可视化方法,第七章 大数据可视化,7.2.3时空数据可视化,时空立方体,融合散点图与密度图技术的时空立方体,融合堆积图技术的时空立方体,of,41,14,7.2大数据可视化方法,第七章 大数据可视化,7.2.4多维数据可视化,of,41,15,1、散点图( Scatter Plot) 散点图(Scatter

8、Plot)是最为常用的多维可视化方法。二维散点图将多个维度中的两个维度属性值集合映射至两条轴,在二维轴确定的平面内通过图形标记的不同视觉元素来反映其他维度属性值。,二维散点图能够展示的维度十分有限,研究者将其扩展到三维空间,通过可旋转的Scatter Plot方块(dice)扩展了可映射维度的数目,如图所示。散点图适合对有限数目的较为重要的维度进行可视化,通常不适于需要对所有维度同时进行展示的情况。,7.2大数据可视化方法,第七章 大数据可视化,7.2.4多维数据可视化,of,41,16,7.2大数据可视化方法,第七章 大数据可视化,7.2.4多维数据可视化,平行坐标是研究和应用最为广泛的一种

9、多维可视化技术,将维度与坐标轴建立映射,在多个平行轴之间以直线或曲线映射表示多维信息。,平行坐标多维可视化技术,集成了散点图和柱状图的平行坐标工具,平行坐标图聚簇可视化,of,41,17,全国高校标准教材云计算姊妹篇,剖析大数据核心技术和实战应用,of,41,18,7.3大数据可视化软件与工具,第七章 大数据可视化,7.3.1Excel,利用Excel的可视化规则实现数据的可视化展示,Excel图表样式,利用Excel图表中的折线图制作的“工资”和“年龄”数据展示,Excel是Microsoft Office的组件之一,是由Microsoft为Windows和Apple Macintosh操作

10、系统的计算机编写和运行的一款表格计算软件。Excel 是微软办公套装软件的一个重要组成部分,它可以进行各种数据的处理、统计分析、数据可视化显示及辅助决策操作,广泛地应用于管理、统计、财经、金融等众多领域。,of,41,19,7.3大数据可视化软件与工具,第七章 大数据可视化,7.3.2Processing,Processing在数据可视化领域有着广泛的应用,可制作信息图形、信息可视化、科学可视化和统计图形等。下面通过一个简单实例来认识一下如何利用Processing实现数据的可视化展示。,美国各州GDP增长率(数据随机生成),of,41,20,7.3大数据可视化软件与工具,第七章 大数据可视化

11、,7.3.2Processing,第一步,声明(初始化)变量,代码如下: PImage mapImage; Table locationTable; Table nameTable; int rowCount; Table dataTable; float dataMin = MAX_FLOAT; float dataMax = MIN_FLOAT;,of,41,21,7.3大数据可视化软件与工具,第七章 大数据可视化,7.3.2Processing,第二步,初始化画布,加载(生成)数据,代码如下: void setup() size(640, 400); mapImage = loadIma

12、ge(“map.png“); /加载地图 locationTable = new Table(“locations.tsv“);/加载位置信息 nameTable = new Table(“names.tsv“);/加载名称信息 rowCount = locationTable.getRowCount(); dataTable = new Table(“random.tsv“);/加载随机数据 for (int row = 0; row dataMax) dataMax = value; if (value dataMin) dataMin = value; PFont font = load

13、Font(“Univers-Bold-12.vlw“); textFont(font); smooth(); noStroke(); ,of,41,22,7.3大数据可视化软件与工具,第七章 大数据可视化,7.3.2Processing,第三步,调用绘制函数绘制图形,代码如下: void draw() background(255); image(mapImage, 0, 0); for (int row = 0; row = 0) radius = map(value, 0, dataMax, 1.5, 15); fill(#333366); / blue else radius = map

14、(value, 0, dataMin, 1.5, 15); fill(#ec5166); / red ellipseMode(RADIUS); ellipse(x, y, radius, radius); if (dist(x, y, mouseX, mouseY) radius+2) fill(0); textAlign(CENTER); String name = nameTable.getString(abbrev, 1); text(name + “ “ + value, x, y-radius-4); ,7.3大数据可视化软件与工具,第七章 大数据可视化,7.3.3NodeXL,No

15、deXL 不仅具备常见的分析功能,如计算中心性、Page Rank值、网络连通度、聚类系数等,还能对暂时性网络进行处理。在布局方面,NodeXL主要采用力导引布局方式。 NodeXL 的一大特色是可视化交互能力强,具有图像移动、变焦和动态查询等交互功能。其另一特色是可直接与互联网相连,用户可通过插件或直接导入E-mail或微博网页中的数据。,准备 数据,步骤,生成 顶点,生成 网络图,of,41,24,7.3大数据可视化软件与工具,第七章 大数据可视化,of,41,25,1、准备数据,从开始菜单中打开一个NodeXL的模板,在“Edges”工作表中输入准备好的数据,如图所示。每条边包含两个Vertex及其相关的属性(Color、Width、Label等)。,NodeXL主要研究人员及其所在研究组织,在“Edge”工作表中输入边的信息,7.3大数据可视化软件与工具,第七章 大数据可视化,of,41,26,2、生成顶点,在“Edge”工作表中录入边的信息后,打开“Graph Metrics”对话框,勾选所有可选项

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号