基于网络大数据分析的可视化技术

上传人:A*** 文档编号:49053337 上传时间:2018-07-23 格式:PDF 页数:2 大小:676.67KB
返回 下载 相关 举报
基于网络大数据分析的可视化技术_第1页
第1页 / 共2页
基于网络大数据分析的可视化技术_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于网络大数据分析的可视化技术》由会员分享,可在线阅读,更多相关《基于网络大数据分析的可视化技术(2页珍藏版)》请在金锄头文库上搜索。

1、2017 年第 23 期信息与电脑 China Computer visualization; multidimensional data; hierarchical data; time series data1 大数据可视化技术分析大数据可视分析是指在大数据的背景下进行数据挖掘、建立模型,同时,利用支持信息可视化的用户界面运用人机交互方式与技术对数据进行可视化映射,有效融合计算机的计算能力和图形图像的表达能力,提高数据使用者对于大规模复杂数据集的认知力和洞察力。1.1 多维信息可视化传统的高维数据可视化算法,以 Inselberg 提出的平行坐标技术1为代表。将高维数据转换在二维或三维的空

2、间中进行标示,算法复杂、耗时长、适用性较差。在近几年的研究中,陈谊等提出将数据聚类后的平行坐标可视化2,其主要思想是用 K-means 算法对原始大数据进行聚类处理,重新分配类区间的宽度,对不同的类区间按其权重大小来排序作图。相比于传统的平行坐标可视化技术,基于类区间的平行坐标可视化技术能有效降低数据线段的杂乱程度,使得数据线段的分布清晰明了,便于用户查看数 据趋势。1.2 层次信息可视化层次信息是很常见的结构信息之一,例如系谱图、计算机文件系统、组织结构图等。层次信息可视化最为常见的形式就是 Johnson 提出的树图布局算法3,但是,在大数据层次信息中,这种表示方式会因为横向的每层节点数和

3、纵向的树深层数扩展比例失调、分支拥挤等问题导致层次结构的表示模糊。基金项目:本课题得到大学生科学研究与创业行动计划项目资助。 作者简介:黄今慧(1966-),女,湖南长沙人,硕士研究生,副教授。研究方向:数据分析、数据挖掘。 通讯作者:翁彬月(1996-),女,贵州贵阳人,本科。研究方向:大数据可视化。E-mail:。 1 5 8 2017 年第 23 期信息与电脑 China Computer&Communication数据库技术杨如意等人于 2014 年提出大众标注层次可视化算法,依赖全局上下文定位信息位置,快速直观地显示当前位置的层次结构,提高空间利用率。但这种算法有明显的缺点,即不能满

4、足跨层级、多继承的数据要求。陈谊等人于 2016 年提出一种树图中的多维坐标 MCT(Multi-Coordinate in Treemap) 技 术。 采 用 Squarified 和Strip 布局算法的树图表示层次结构,将树图节点的 4 条边定义成 4 条属性轴,计算属性值,将其映射于属性轴上,首尾顺次相连,进行曲线拟合。这样层次信息就能分区域进行可视化表达,避免了树形结构的比例失调问题,将层次信息清晰呈现给用户。1.3 时序信息可视化在信息可视化领域中,时序信息可视化始终是一个难点。因为时间信息对于数据的其他属性信息而言,具有不可改变的顺序性。2000 年 Susan Havre 等人

5、提出 ThemeRiver模型,以河流为模型表达随着时间改变数据发生变化的可视化算法。这种算法的优点是能够显示不同的时序信息的演化过程,缺点则为不能在图中直观表现时序信息的具体数值和相关属性。2007 年 Johansson 等 人 提 出 Temporal Density Parallel Coordinates(TDPC)算法和 Depth Cue Parallel Coordinates(DCPC)算法,通过转换函数得到绘图颜色,在平行坐标系上绘制多边形来代替折线表示数据根据时间的变化,可以观察到数据发生变化时的时刻位置,但这种算法存在着数据遮挡问题。2015 年董重和魏迎梅提出多变元时

6、序数据可视化方法,通过时间维分段、视觉聚类和颜色绘制三个步骤,对时序数据进行可视化处理,可以观察到数据信息的趋势变化和突变时刻,数据遮挡问题得到缓解。2 大数据可视化面临的问题和挑战2.1 海量高维数据集可视化从上文可知,在大数据背景下,大量复杂的高维数据无论是在数据分析还是在数据可视化方面都面临巨大的挑战,并且无可避免地会出现界面显示混乱不清、数据曲线严重重叠的现象。因此,优化高维数据可视化的布局等都是研究此类问题的方向。2.2 多源异构数据可视化大数据时代数据来源广、种类多,且多来自于异构环境。所以,在对多源异构的数据进行分析时,即使获得了数据源,也无法保证数据的完整性和准确性。导致分析这

7、类数据是可视化技术的一大难点,可以通过研究不同类型的数据接口进行可视化分析来解决。2.3 实时数据分析可视化越来越多的实时数据在互动论坛、企业系统、穿戴设备等地方产生,且产生速度快、密度高。在合理快速分析这些数据后,实现实时数据可视化成为时下的技术难点,也是时序数据可视化与实际运用相结合面临的严峻挑战。2.4 预测分析目前,随着行为分析相关产业的发展,大数据预测模型的需求在与日俱增,但支持预测分析的系统却寥寥无几。由此可见,先进的、准确的、可定制的可视化预测分析系统是未来的发展趋势。2.5 可扩展性当下大数据的规模呈现爆炸式的增长趋势,数据量无限增加,以至于普通计算机的处理能力难以跟上数据的新

8、增速度。 同时, 设备显示屏幕范围有限, 而需要表达的数据量无限,在这样极端的数据规模条件下,可视化技术的优点在不断减弱。提高可视化技术的扩展性成为解决问题的关键。如何缩小数据规模,如何提高人机交互技术,如何结合大规模并行处理方法和超级计算机,这些问题都将是未来大数据发展中最为核心的挑战。3 结 语 在可视化的过程中,数据可以变得更具可塑性、可行性,最终更加人性化。在可视化的呈现中,海量数据集中或者汇总展示,让信息使用者可以快速聚焦在数据的关键点。本文针对数据信息的特征,将多维信息可视化、层次信息可视化和时序信息可视化这三类可视化技术的常用算法和近 5 年新提出的研究算法进行了详细的比较。同时

9、,指出面临的困难与挑战,归纳出 5 点,强调数据预测和可视化技术的扩展性将是未来大数据可视化发展面临的重大挑战。在接下来的工作中,应在云平台上结合相关产业数据,围绕可视化分析技术的实践与运用,进行深入的大数据可视化研究与探索。参考文献1Inselberg A. The plane with parallel coordinatesJ. The Visual Computer, 1985,1(2):69-91. 2 陈谊 , 李潇潇 , 蔡进峰 , 等 . 基于类区间的多维数据可视化方法 J. 系统仿真学报 ,2013,25(10):2418-2423.3Johnson B, Shneiderman B. Tree-maps: a space-filling approach to the visualization of hierarchical information structuresJ. 1991:284-291. 1 5 9

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 期刊/会议论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号