大数据时代的可视化与协同创新

上传人:艾力 文档编号:36441377 上传时间:2018-03-29 格式:PDF 页数:7 大小:2.36MB
返回 下载 相关 举报
大数据时代的可视化与协同创新_第1页
第1页 / 共7页
大数据时代的可视化与协同创新_第2页
第2页 / 共7页
大数据时代的可视化与协同创新_第3页
第3页 / 共7页
大数据时代的可视化与协同创新_第4页
第4页 / 共7页
大数据时代的可视化与协同创新_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《大数据时代的可视化与协同创新》由会员分享,可在线阅读,更多相关《大数据时代的可视化与协同创新(7页珍藏版)》请在金锄头文库上搜索。

1、中国美术学院学报月刊21大数据时代的可视化与协同创新屈华民大数据时代的来临我们毫无疑问已经处在一个大数据的时代。各行各业都在快速 产生和积累数据。广泛认为大数据具有四个特点,也就是大数据的 四个V:数据量Volume惊人,前所未有;这些数据产生的速度Ve- locity极快;而数据的品种Variety非常多,包括文本、图像、视 频、传感器等多种数据种类;并且,这些数据里面包含潜在的价值 Value。关于数据对人类历史的影响可以从下面三段引言中看出。“我怀疑二百年后的后人书写我们这段历史时,他们会发现我们 所处时代人类思考方式发生了重大的变化,那就是我们比以往的任 何时代在更多的事情上变得更加理

2、性,我们更多以数据为依据分析 思考问题。”( 哈佛前校长 Lawrence Summers)“得益于计算机技术和海量数据库的发展,个人在真实世界的活 动得到了前所未有的记录社会科学将脱下准科学的外衣, 在21世纪全面迈进科学的殿堂。”(雅虎首席科学家沃茨)“大数据的影响,就像四个世纪前人类发明的显微镜一样而大 数据,将成为我们下一个观察人类自身社会行为的显微镜。”(麻省理工MIT教授Erik Brynjolfsson)从数据,到海量数据,再到大数据,对人类的做事和思维方式都 有很大的影响。在大数据时代:生活、工作与思维的大变革1一 书中,笔者将其归结为三个特点:(1)更多:不是随机样本,而是

3、所有的数据;(2)更杂:不是精确性,而是混杂性;(3)更好: 不是因果关系,而是相关关系。对大数据的研究涉及计算机、数 学、生物学等多个领域。大数据尤其是对数据存储、数据挖掘等提 出了重大挑战。而数据的可视化也将在大数据时代扮演一个重要的 角色。设计正是数据可视化中非常重要的一环,需要计算机科学家 和设计师紧密合作,协同攻关。本文讨论什么是数据可视化,数据 可视化和平面设计的关系,并用多个案例来示例说明数据可视化系 统是如何设计的。可视化在大数据时代的作用在美国奥巴马政府的大数据计划中,专门有一个项目:“向一 个研究培训小组发放200万美元的奖金,用于支持一项大学生培训计 划,教授他们如何利用

4、图形和可视化工具解析复杂数据。”数据可 视化的重要性由此可见一斑。 在大数据2一书中,在讨论商务智1 英维克托迈尔舍-恩伯格Vikitor Mayer-Schnberger、肯尼思库克耶Kenneth Cuki-er著,盛扬燕、周涛译,大数据时代:生活、工作与思维的大变革,浙江人民出版社,2012年。2 涂子沛著,大数据:正在到来的数据革命, 以及它如何改变政府、商业与我们的生活,广西师范大学出版社,2013年。Journal of the National Academy of Art22能时,专门提到数据可视化的“化蝶”作用:数据可视化把美学的元素带进了商务智能。一幅好的数据图像 不仅能有

5、效地传达数据背后的知识和思想,而且华美精致,如一只 只振动翅膀的彩蝶,刺激视觉神经,调动美学意识,留下栩栩如生 的印象。数据可视化的这种“导航”作用也极大地推动了商务智能的大 众化。通过把复杂的数据转化为直观的图形,并呈现给最普通的用 户,商务智能已经不再是少部分高级分析人员的专利,而是贴近大 众生活,浅显易懂,人皆可用的工具和手段。对大数据的分析不外乎两种类型:使用机器(尤其是计算机), 利用复杂精妙的算法进行自动分析,或者是让人利用他们的领域知 识进行交互式的分析。如果人成为数据分析的重要一环,那么有必 要为人提供直观易懂的界面,来帮助人了解数据里面隐藏的信息。 这种界面往往就是数据可视化

6、系统。什么是可视化? 可视化,简要地讲,就是把数据转换为图形图像的方式,帮助 人们理解大量的和复杂的数据。可视化有三个主要的分支:科学可 视化、信息可视化、可视分析。科学可视化,主要研究如何可视化 科学研究中产生的大量数据,比如流体动力学模拟产生的数据,医 学图像如CT/MRI数据,向量场和张量场等。这些数据本身往往包含 在真实世界中存在的几何结构。信息可视化主要研究的是抽象数据 如文本、图像、网络、股票、社交媒体等。这些数据本身并没有看 得见摸得着的几何结构。人们只是把它们转换为图形图像的方式便 于理解。最近兴起的可视分析更多地集成了数据挖掘等自动算法, 加重了系统中的分析含量。可视化的目的

7、可以概括为记录信息,分 析推理,证实假设,交流思想。3很多时候,可视分析和数据挖掘的最终目标是一致的,即理解数据。但数据挖掘更偏重于研究各种自动算法来充分利用计算机的 强大计算能力,而可视化则更偏重于设计交互的图形展示,以便利 用人的强大的视觉处理能力和领域知识。我个人认为,可视化和数 据挖掘之间的关系就像风景照片里面山与水的关系。就像一个好的 风景往往同时包含山和水,一个好的大数据解决方案必然同时拥有 强大的数据挖掘能力和充满灵气的可视化展示。 可视化中的美学元素1.可视化的“信达雅” 可视化也可以看作是一种翻译,即将数据(语言)翻译成图形 图像(语言)。大家知道,翻译的最高标准是“信达雅”

8、。严复提3 陈为、张嵩、鲁爱东著,数据可视化的基本原理与方法,科学出版社,2013年。中国美术学院学报月刊23出:“翻译作品内容忠实于原文谓信,文辞畅达谓达,有文采 谓雅。”同理, 可视化系统也要做到“信达雅”,力求忠实、 有效和优美。信:从数据转化到可视表示时不歪曲,不误导,不遗漏。 也就是说,可视化系统要忠实地反映数据里面包含的信息。达:可视化的表现方式自然有效,清楚易用,容易上手, 帮助用户达成目标。也就是说,可视化系统要有效地帮助用户 找到有用的信息。雅:系统要充满美感,给用户优雅的体验。也就是说,系 统一定要优美。2.可视化中美的含义可视化的主要目的是展示数据中隐藏的知识。另一方面,

9、 可视化呈现也需要美观。在可视化之美4这本书里,提到什 么是漂亮的可视化。漂亮的可视化有下面这些标准: (1)美感:美感很难形容,但你看到了,你就会知道。 (2)新颖:普通的图形表示很难让人兴奋,它们已经变成了陈 词滥调。漂亮的可视化,往往有新奇的元素,能让人兴奋。 (3)简单有效:没有太多华而不实的元素。能有效地表达出数据 里的故事。简单有效Simple and effective就是所谓的科技的优雅。书中也提到:“可视化中的美学概念远远不止是漂亮的图 片。当然,使用舒心是一项重要且一直被低估的因素但 是,正如史蒂夫乔布斯的一句名言:设计不在于产品的外观 和感觉,而是它如何工作。一个真正的审

10、美可视化,除了必 须美丽外,而且必须能够表达现有的潜在隐含特征,并能够激 励用户、读者去探索更丰富多彩的世界。”这些都是很有见地 的看法。可视化和设计的关系可视化系统的设计经常需要遵循一些原则。这些原则有些 是从别的领域(如人机交互)借鉴过来的,有些则是大量实践 的过程中总结出来的。其中设计领域中的很多原则都可以在可 视化系统的开发中得到应用。事实上,很多可视化系统本身 就是直接受到平面设计作品,尤其是信息图Infographics的启 发。在可视化领域,有一类研究就是如何自动生成信息图Info- graphics。下面试举一例。图1显示的是设计师兰德尔芒罗Randall Munroe手绘的

11、星球大战电影的故事线Storyline。5里面显示了星球大 战电影中的主要角色和一些角色共同出现的场景。水平轴显 示的是时间。每一个线条代表一个演员。如果两个或多个演员 共同出现在一个场景中,那么这些线条就会画得很靠近,并且 一起穿过一个代表该场景的色块。这个信息图无疑非常直观而4 朱莉斯蒂尔Julie Steele等编,祝洪凯、李妹芳译,数据可视化之美,机械工业出版社,2011年。5 R. Munroe. Xkcd #657: “Movie narrative charts”, http:/ , December 2009.Journal of the National Academy of

12、 Art24图1 设计师R. Munroe设计的星球大战电影的故事线且包含了大量的信息。但因为原图是设计师手绘的,如果换了一个 电影,又得重新绘制,比较费时。而且一般用户也不能很方便地用 这样的可视化来探索他们自己喜欢的电影。所以可视化领域就有研 究者开发了一个可视化系统,6可以自动生成这样的图。图2显示的是 该可视化系统生成的星球大战的故事线。将两个图进行比对, 可以看出,虽然自动生成的图艺术性可能稍差一些,但完全可以传 达手绘图中同样的信息。这样的系统可以很方便地表现别的电影的 故事线。相对于手工绘制的故事线,该可视化系统具有很好的扩展 性,可以根据数据快速自动生成各种电影、电视或是小说的

13、故事 线,而且支持用户交互,并且可以很容易加载别的信息。 基于隐喻的可视化设计可视化系统开发中最关键的一环是如何根据数据和应用来设计美 观有效的视觉呈现。除了上文提到的信息图,隐喻也被广泛用来设计 可视化呈现。下面介绍香港科技大学可视化小组的三个工作。这些工 作广泛使用隐喻Metaphor来帮助人们理解可视化中图的含意。 案例一:基于钟表隐喻的交通轨迹数据可视化图3显示的是一个出租车轨迹数据的可视化系统。7目前很多城市 的出租车都安装了GPS系统。这些GPS系统可以提供车辆在不同时 刻的位置。装有GPS系统的出租车就像移动的传感器一样,可以提 供一个城市动态的交通状况和人群的移动特征。其中一个

14、有意思的 问题是如何做路径推荐。从一个地方到另一个地方经常有多个路径 可选。如何根据交通状况给用户推荐一个省时不堵车的路径无疑具 有很大的实用价值。一个解决方案是根据历史数据,从出租车司机 在某个时间段从A地到B地所走的路径中选取一个用时最短的路径推 荐给用户。因为出租车司机是最了解城市交通状况的群体,他们的6 Yuzuru Tanahashi, Kwan-Liu Ma: “Design Consi-derations for Optimizing Storyline Visualizations”. IEEE Trans. Vis. Comput. Graph. 18(12): 2012,

15、pp. 2679-2688.7 He Liu, Yuan Gao, Lu Lu, Siyuan Liu, Huamin Qu, Lionel M. Ni: “Visual analysis of route diversity“. IEEE VAST 2011, pp. 171-180.图2 可视化系统自动生成的星球大战电影的故事线中国美术学院学报月刊25最佳选择往往好过目前机器自动计算选择出来的路径。在我们的可 视化系统中,我们希望能表现在每个时间段,选择某个路径的车辆 的数目,以及这些车辆的平均速度等。这样用户就能直观地判断哪 个路径在什么时间段比较好。为了表现时间,我们采用了一种基于 钟

16、表的隐喻。一天的24小时就像在钟表上一样分布在一个圆环上。 每一个时间点上车辆的多少用柱状图的高低来表示。而每个柱状图 中不同颜色则代表车辆行驶速度的不同。而颜色的设计也采用了红 绿灯的隐喻。因为红色让大家想到红灯,所以对应于慢速行驶的车 辆;而绿色则让大家想到绿灯,对应于高速行驶的车辆。从图中非 常明显地能看出来早上9点到10点,车辆非常多,而且很多车的行驶 速度很慢,而下午4点则车辆稀少而且速度比较快。 案例二:基于向日葵隐喻的信息传播的可视化图4显示的是如何呈现信息在社交媒体,尤其是Twitter推特(或 微博)上的传播。8信息在社交网络上的传播有三个关键因素:被传 播的信息本身,传播信息的人,以及信息传播的过程及影响。为了 表现这三个因素,我们基于向日葵的隐喻设计了一个可视化系统。 向日葵的花盘边缘是舌状花,而花盘内侧则是管状花。管状花成熟 后变成种子。这些种子可以被风、

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号