数据可视化报告.doc

上传人:壹****1 文档编号:431509653 上传时间:2023-09-25 格式:DOC 页数:17 大小:4.15MB
返回 下载 相关 举报
数据可视化报告.doc_第1页
第1页 / 共17页
数据可视化报告.doc_第2页
第2页 / 共17页
数据可视化报告.doc_第3页
第3页 / 共17页
数据可视化报告.doc_第4页
第4页 / 共17页
数据可视化报告.doc_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《数据可视化报告.doc》由会员分享,可在线阅读,更多相关《数据可视化报告.doc(17页珍藏版)》请在金锄头文库上搜索。

1、2018年 6 月 7 日目录一、题目4二、数据4三、可视化工具(哪一种,选择原因)4四、可视化方案或可视化实现过程41、导入数据并进行规范化42、数据连接与整理43、将地理信息与地图进行结合54、设置相关参数55、可视化方案5五、可视化结果51、交战阵营可视化62、人口统计可视化83、死亡人数可视化94、时间顺序可视化115、人口损失情况可视化13六、体会15一、 题目在的可视化课程结束的同时中,本人也开始了数据可视化的大作业的工作。大作业是对前面学过的数据可视化技术的一个总结、回顾和实践。在开始设计前,本人回顾以前所学的内容,明确了本次作业设计所要用到的技术点,成功完成了可视化期末大作业。

2、大作业要求从网络上下载一组数据(自行获取),选择一种可视化工具(Excel、Tableau、Matlab、Echarts等),设计一种可视化方案实现该数据的可视化,并做适当的数据分析(或挖掘)。二、 数据本次实验中,我设计的是关于第二次世界大战的数据可视化。原数据为两张表,分别存储了各个国家的人口牺牲情况与各个国家相互之间的战争具体时间、阵营、以及事件。其中国家数据来源于维基百科中World War II casualties词条下的表格,具体网址为:https:/en.wikipedia.org/wiki/World_War_II_casualties#cite_note-187。而关于时间

3、、阵营与事件的数据来源于维基百科的World War II词条下方的信息,具体网址为:https:/en.wikipedia.org/wiki/World_War_II。两张表之间都以excel形式存在,在导入Tableau数据库的时候,建立两表的关系并对表进行说明。本人在建立过程前引入了一些编号变量,可以进行无视。下面是部分数据截图,具体数据见随文档上交的excel文件。三、 可视化工具(哪一种,选择原因)在这次的作业中本人选择的可视化工具为Tableau,选择该工具主要有以下原因:1、快速创建交互式绘图。使用Tableau的拖拽式界面,可以在几分钟内创建许多漂亮的可视化。这个界面可以操作无

4、穷尽的变化,可以轻松解决项目。 2、交互式仪表盘。得到结果后可以简单的与结果进行交互,得到更加直观的结果。3、实时的连接,在对原数据进行修改后,简单的刷新数据库就可以对全部的可视化结果进行修改。4、提供多种的可视化方法,不仅限于Excel的简单图,Tableau可以容易的与地图进行连接,构建更加直观的图像。也可以直接选择不同的可视化方法,观察其中的优劣。 5、Tableau简单易学,可以快速掌握,简单的得出还算漂亮的图像。四、 可视化方案或可视化实现过程1、 导入数据并进行规范化选择导入excel文件,然后整理文件的格式,让系统可以正常识别。2、 数据连接与整理把excel表中的表和详细描述进

5、行连接,然后清除掉多余或者无用的项,整理后的数据见下图:图4-1:交战情况表图4-2:国家状况表3、 将地理信息与地图进行结合把地理信息同具体的地图进行结合,在地图上解释原来数据中的地理信息。4、 设置相关参数设置相关的参数,通过参数来确认相关的阈值,以及形成数据桶,更好的进行分类操作。5、 可视化方案1)对交战国战前、战时、战后的情况进行可视化,使用颜色区别阵营。2)对交战国的人口与人口死亡率进行可视化,同时用不同的颜色标识死亡率大小。3)对交战国具体的死亡人数进行可视化,用颜色深浅标识人数多寡。4)对交战国总人口死亡情况进行可视化,设置阈值识别牺牲多寡,同时使用不同颜色标示不同阵营与状态的

6、牺牲人数。5)对交战国具体事件与开战事件进行可视化,要求可以清楚的分辨开战时间的长短与具体事件的先后。6)对以上可视化内容,要求可以突出显示每一个交战国的具体情况。也可以根据阵营或其他分类方法进行突出显示。五、 可视化结果1、 交战阵营可视化使用了地图的模式,把每一个国家与对应的版图进行连接,其中比较麻烦的是有部分国家政治环境发生了一些变化,导致国家的消失(如苏联、英联邦和南斯拉夫)因此要使用其他的方法重现。下面是本人的阵营图界面:下面是具体的操作演示与分析:战前,1939年前的世界秩序,可以看到,一战中利益受损国从一战中走出,开始积极向周围小国开战,各大利益集团利益开始冲突。在欧洲,爆发了意

7、识形态冲突,一战中失去了领土的战败国积极的对外扩张,法西斯注意在战败国中间传播。十月革命后成立的苏联也积极对外进行意思形态的输出,同时希望夺取原来属于沙皇俄国的遗产。西班牙意识形态斗争异常剧烈,从而爆发了内战。非洲,意大利积极对外扩张,希望一雪二十年前惨败与埃塞俄比亚的耻辱,而亚洲大部分利益都掌握在欧洲国家手中,对此不满的日本企图夺取东亚的利益,一场大战一触即发。战时,1939年到1943年的世界秩序,可以看到,轴心国势力达到顶峰,世界笼罩在黑暗之中,同时中立的美洲国家加入了世界大战。欧洲大陆几乎被法西斯占据,只有苏联仍然坚持,西班牙内战中右翼政府上台,欧洲形势到了最危急的时候。然而苏联力挽狂

8、澜,在1943年完成了攻守互换。日本在东亚如入无人之境,横扫东南亚的英美荷殖民地,剑锋直至印度。然而日本低估了美国的工业能力,最后丧失了制海权。于此同时中国也加入了同盟国,正式加入了第二次世界大战。战后,1945年以后的世界秩序,可以看到轴心国势力完全磨平,剩余两大阵营瓜分了轴心的势力范围,并且在东亚开始了新一轮的意识形态竞争。同时因为战争导致欧洲国家力量减弱,各个殖民地独立行动也轰轰烈烈的展开了。欧洲战场,苏联力挽狂澜,意大利忽然反水,美英诺曼底登陆。轴心国势力别瓜分。正如丘吉尔所说,一道横跨欧洲的铁幕拉开了。但由于牺牲过与巨大,欧洲没有发生继续的战争。亚洲,日本投降,远东的利益又一次别掌握

9、,然而由于宗主国实力的减弱,轰轰烈烈的民族解放运动在南亚开始了。而东亚则成了苏联与美国博弈的舞台,意识形态的战争在这里再次开战。2、 人口统计可视化在这个部分设置两个数据桶,把人口总数放入人口数据桶,死亡率放入死亡率数据桶,然后用大小标识国家人口多少,用颜色深浅标识死亡率高低,具体结果如下所示:下面是本人的操作与分析可以看到,下图中战争中别占领的国家,人口伤亡率普遍高于没有被占领的国家。尤其是德国东线战场上的国家,人口死亡率相当惊人。如下图所示,人口死亡率低于10%的国家明显标注出来,其中主要包括美洲国家、西线战场的国家、英国殖民地以及人口基数较大的国家。下图是人口死亡率高于10%的国家。主要

10、包括苏联成员国,东线战场国家以及德国本身。结合上面的分析,可以得到,海上交战的国家人口死亡率较低,亚洲的人口大国人口因为人口基数较大死亡率次低,而欧洲战场上主要陆上交战国,如德国、俄罗斯、波兰,人口死亡率极高。3、 死亡人数可视化在该界面中主要标识了不同国家的具体死亡人口数目,使用颜色深浅来标识数据的大小情况。具体情况见下面的分析操作:下面是按照士兵战死数目,可以看到欧洲西线战场上双方死伤惨重,接下来就是远东的亚洲战场上,中国与日本这两个人口大国之间也是士兵牺牲数量较多的国家。下面是按照军事行动导致平民死亡的人数,可以看到大部分都是领土别入侵的国家与人口基数较大的国家。不过要注意的是轴心国的数

11、据普遍偏小。下面是按照疾病与饥荒导致平民死亡的数据,可以看到排名靠前的都是人口基数大的国家或者欠发达国家。下面是士兵失踪数目,其中俄罗斯数据包括全部苏联失踪人数。失踪人员可能是临阵脱逃或者关如集中营死亡。这个数据真的有点玄乎,俄罗斯作为苏联一员军事行动中死亡的士兵约6百万,然而全苏联失踪人数竟然达到1千4百万。各国都是失踪人数大于牺牲士兵数,这真的很怪。下面是全体人口的死亡数,其中我把失踪人数也算入了死亡人数,按照大众的说法是不应该计入失踪人数的,但我还是加上了失踪人数,因为都过去那么多年了,失踪人员假如生还也应该死了,他们的人生因为战争而改变,到最后都生死不明,于是我加上了他们。从上述数据可

12、以看出不同国家的具体人口牺牲数目使用颜色深浅可以让数据更加直观。同时这个数据也是很有问题的,轴心国平民中因为饥荒或者军事行动死亡的人数为零或很少,而且士兵失踪数目也过于巨大;这都是原本数据的不可信点。可以发现,法国、意大利人口基数大早早投降,因此死亡人口低。而苏联,波兰、中国德国等国家人口死亡率极高。因此,人口基数越大、战争持续时间越长、被入侵本土的国家人口死亡率就高。4、 时间顺序可视化这里可以通过时间来对二战中的大事件进行梳理,可以突出表达有关国家的具体事件。在事件部分采用了地图散点图,而持续时间用了树状图的平铺图。下面是具体的页面:如下图所示,可以高亮的显示具体国家的情况。下面就高亮了全

13、部有关于轴心国方日本的时间情况:此时,只要再高亮同盟国方的具体情况,就可以看见具体的两国之间的情况了,鼠标放到点上会显示具体情况。还可以拖动右上角的时间条对时间进行梳理。下面是关于这方面的分析:上面是轴心国主要国家:德、日、意三国的各自作战情况图,可以看到,二战中的轴心国交战主要依据地缘政治,德国负责欧洲,意大利负责北非,日本负责亚太地区。详细情况可拖动时间表显示,具体情况可以在工作表中操作。5、 人口损失情况可视化按照可视化方案,设计了这一份人口损失情况的可视化。其中包括各国的具体情况与世界情况的对照,可以突出显示具体的国家,下图中高亮了中国的信息:具体界面如下图所示,左边是柱状图显示的死亡

14、率图与死亡人口总数图,其中超过阈值(12%的人口死亡率与1百万的人口死亡数)的标记为红色。右边是全世界不同国家的具体情况,用不同的颜色表明了不同的阵营。下面是具体情况的分析报告与演示,先展示全部轴心国死亡人数的情况,可以看到,左边的人口除德国以外没有其他国家,再看右边,人口死亡数与人口死亡率中考前的两个深灰色原点是德国和日本,而平民死亡人数都没有高亮的圆圈。再展示全部同盟国死亡人数的情况,可以看到,左边的人口中标红的为中国、印度与美国。再看右边,人口死亡数与人口死亡率中普遍较低,而平民死亡人数除最高的中国之外没有其他较高的数据点。最后是苏维埃联邦和其他别占领的国家,他们在二战中付出了巨大的牺牲

15、,其中平民死亡与人口死亡率都是排在前列。1945年8月5日,战争结束。这场战争中交战方都付出了巨大的代价,特别是苏联、同盟国主要国家、德国以及被轴心国占领的国家;也给世界带来了巨大的灾难,希望人类引以为戒,战争不再发生。以上就是全部我的全部相关分析。 六、 体会在本次的期末作业中,我根据网上收集的二战数据,完成了关于二战情况的可视化作业,虽然较为简单,同时并不完善,但是我也在实践中收获了很多,得到了以下体会:在搞大作业的时候,我才开始学习tableau,由于对于这一款软件的不了解,没有使用有关算法进行数据挖掘,只是简单的把数据可视化了而已。在实战中,主要参考了给的模板例子,同时查阅网上的资料,在试验中掌握技术,最终得到了成果。同时我也了解了数据一致化的重要性,从晚上得到的数据千奇百怪,总是有种种问题。在本次作业中主要遇到的数据不一致问题有国家名称的不统一,事件城市名称多值,以及人数栏中出现字符串等,都要进行修改,因此数据的一致性是相当重要的。最后体会最深的还是认识到自己能力与软件的能力。本来本人希望

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 人力资源管理师

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号