大数据分析报告过程中各个步骤中使用地工具

上传人:M****1 文档编号:498151473 上传时间:2023-02-13 格式:DOC 页数:13 大小:209KB
返回 下载 相关 举报
大数据分析报告过程中各个步骤中使用地工具_第1页
第1页 / 共13页
大数据分析报告过程中各个步骤中使用地工具_第2页
第2页 / 共13页
大数据分析报告过程中各个步骤中使用地工具_第3页
第3页 / 共13页
大数据分析报告过程中各个步骤中使用地工具_第4页
第4页 / 共13页
大数据分析报告过程中各个步骤中使用地工具_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《大数据分析报告过程中各个步骤中使用地工具》由会员分享,可在线阅读,更多相关《大数据分析报告过程中各个步骤中使用地工具(13页珍藏版)》请在金锄头文库上搜索。

1、数据分析过程中各个步骤使用的工具数据分析也好,统计分析也好,数据挖掘 也好、商业智能也好,都需要在学习的时候掌 握各种分析手段和技能, 特别是要掌握分析软件工具! 学习数据分析,一般是先学软件开始, 再去应用,再学会理论和原理! 没有软件的方法就不去学了,因为学了也不能做, 除非你自己会编程序。下图是一个顶级的分析工具场,cry st訓角卩口卄5必先利DB2君dTAaiEAUIM M ir a ISQLServgp;甲骨共砌企业级斓分析工具场工欲善其事PPT Swiff ColorWheel Yed Flex XcelsrusUCINFTBu rinass I ntalligancANet D

2、rawEnterprise Miner Clementine依次从X和Y轴看:第一维度:数据存储层 数据报表层 数据分析层 数据展现层第二维度:用户级 部门级 企业级 BI级我结合上图和其他资料统计了我们可能用到的软件信息。具体的软件效果还 需要进一步研究分析和实践。1第一步:设计方案可以考虑的软件工具:mind ma nager。Mind manager(思维导图又叫心智图),是表达发射性思维的有效的图形思维工具,它简单却又极其有效,是一种革命性的思维工具。 思维导图运用图文并重的技巧,把各级主题的关系用相互隶属与相关的层级图表现出来,把主题关键词与图像、颜色等建立记忆。思维导图充分运用左右

3、脑的机能,利用记忆、阅读、思维的规律,协助人们在科学与艺术、逻辑 与想象之间平衡发展,从而开启人类大脑的无限潜能。思维导图因此具有人类思维的强大功思维导图是一种将放射性思考具体化的方法。我们知道放射性思考是人类大脑的自然思考方式,每一种进入大脑的资料,不论是感觉、记忆或是想法 一一包括文字、数字、符码、 香气、食物、线条、颜色、意象、节奏、音符等,都可以成为一个思考中心,并由此中心向外发散出成千上万的关节点,每一个关节点代表与中心主题的一个连结,而每一个连结又可以成为另一个中心主题,再向外发散出成千上万的关节点,呈现出放射性立体结构,而这些关节的连结可以视为您的记忆,也就是您的个人数据库。Ws

4、i 产- |-pu iIWrHMiAw2第二步:数据采集可以考虑的工具软件: word、excel、access、oracle、mysql。2.1 Word、Excel 和 Access 等有关ofice软件的容,我们就不介绍了。2.2 Oracle Database又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环 境。它是一种高效率、可靠性好的适应高吞吐量的数据库解决方案 。介绍:hai

5、ke haidu /picti ire/1685727 /1685727/0/f31fhe096h63f6241h74d9268544ehf81a4ca3ee html?fr =lemma&ct=si ngle#aid=0&pic=f31fbe096b63f6241b74d9268544ebf81a4ca3ee2.3 MySQL(发音为my ess cue el,不是my sequel)是一种开放源代码的关系型数据库管理系统(RDBMS),MySQL数据库系统使用最常用的数据库管理语言-结构化查询语言(SQL)进行数据库管理。这个也不做过多介绍。3第三步:数据处理可以考虑的工具软件:Epida

6、ta、excel、 SPSS、ETL3.1 EpiData 工具是一个既可以用于创建数据结构文档,也可以用于数据定量分析一组应用工具的集合。EpiData协会于1999年在丹麦成立。EpiData采用Pascal开发。在允许的情况下, 尽可能地使用开放标准(如HTML )。介绍:baike.baidu./li nk?url=9z2e0tvF9yh7a59W-0sYFNf8sZzjpqL4u11Glxxj4J1HBMtSI8eSJMSTeUZxEMcMIMGo8L nZQCforWxTqwPPda下载地址:bbs.pi nggu.org/thread-386685-1-1.html3.2 Exc

7、el 工具有关Office软件的信息不做介绍3.3 SPSS工具(Statistical Product and Service Solutions ), 统计产品与服务解决方案 软件。最初软 件全称为 社会科学统计软件包 ”(SolutionsStatistical Package for the Social Sciences ), 但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为 统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关

8、服务的总称 SPSS,有 Windows和Mac OS X等版本。百度百科介绍:baike.baidu./link?url=Sx6UNQj33qC5igpst8Lz2PZI494sD0FAG8fcCYgrVy0 jlSPvvBFmrHEngsfG5ou233d9aAxvgrrlw-NqSiZoa下载地址:.ddooo./softdow n/10039.htm备注:安装需要注册码3.4 ETL模式是英文 Extract-Tra nsform-Load 的缩写,用来描述将数据从来源端经过抽取(extract )、转换(transform )、加载(load )至目的端的过程。 ETL 一词较常用在

9、数据 仓库,但其对象并不限于 数据仓库。ETL是构建数据仓库的重要一环,用户从 数据源抽取出所需的数据,经过 数据清洗,最 终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。目前,ETL 工具的典型代表有:lnformatica Datastage、OWB、微软 DTS、Beeload、Kettle 开源的工具有 eclipse的etl插件。cloveretl.数据集成:快速实现ETL百度百科介绍:baike.baidu./li nk?url=EVI1pZdi9ZtCwa7yCH2LOM87LqVCE6XJVp68rJeB87vOh nvm6XXe_rywObzP m2QflItlw

10、nSDrX5eUpsW8h-Ja0ISIdXVuoMN0P n5d1iCtTu相关软件下载:FineBI 工具 222228.htm4第四步:数据分析可以考虑的工具软件:SPSS、SAS、Matlab、Eviews、Stata、Excel、Weka、RapidMiner4.1 SPSS是一个综合类数据分析处理软件,前面介绍了,我们在这一部分就不再介绍。4.2 SAS(全称STATISTICAL ANALYSIS SYSTEM ,简称SAS )是全球最大的 软件公司 之一,是由美国NORTH CAROLINA 州立大学1966年开发的统计分析软件。百度百科介绍:baike.baidu./li n

11、k?url=JNRrNyC3ZhBPJXAL0HtQ2DGFBQP8RYeKWR81b6EtpF9PPuPPyC2AiRgRT2t cnqej3AFYNATem8OdaP-Cp5TDS 7cXwJMxjc oNSocHgru下载地址:bbs.pi nggu.org/thread-2114285-1-1.html备注:安装需要虚拟光盘、sid等信息。也可以购买sid。4.3 Matlab每个人都很了解,我就不做太多介绍了。4.4 Eviews是Econo metrics Views 的缩写,直译为计量经济学观察,通常称为计量经济学软件包。它的本意是对社会经济关系与经济活动的数量规律,采用计量经济

12、学方法与技术进行观察”。另外Eviews也是美国QMS公司研制的在 Windows下专门从事数据分析、 回归分 析和预测的工具。使用Eviews可以迅速地从数据中寻找出统计关系,并用得到的关系 去预测数据的未来值。Eviews的应用围包括:科学实验数据分析与评估、金融分析、宏观经济预测、仿真、销售预测和成本分析等。介绍:baike.baidu./li nk?url=vLJW8XexwC-_vZ-7sL4zNWZQcCvN4oWRe neCHa7mopZtK4VAvbdF2hUjNwbYlg ngbqTQdcm7ApSfoTwTR4Ct_下载地址:bbs.p in ggu.org/thread-

13、752891-1-1.html4.5 Stata是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。Stata其统计分析能力远远超过了SPSS,在许多方面也超过了SAS !由于Stata在分析时是将数据全部读入存,在计算全部完成后才和磁盘交换数据,因此计算速度极快(一般来说,SAS的运算速度要比 SPSS至少快一个数量级,而Stata的某些模块和执行同样 功能的SAS模块比,其速度又比SAS快将近一个数量级! )Stata也是采用命令行方式来操作,但使用上远比SAS简单。其生存数据分析、纵向数据(重复

14、测量数据)分析等模块的功能甚至超过了SAS。用Stata绘制的统计图形相当精美,很有特色。介绍:baike.baidu./link?url=QUuwD6l50 QADWtvXkXQI5IBf2qvSOvny590h8oxrlF2ar6-axuye6pEOfCpL lifMCaz7LcrnFAfwzsNbOyna下载:bbs.pi nggu.org/thread-714027-1-1.html4.6 weka全名是怀卡托 智能分析 环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品-Cle

15、mentine )的,基于JAVA环境下开源的机器学习(machine learning )以及数据挖掘(data minining )软件。它和它的源代码可在其官方下载。有趣的是,该软件的缩写WEKA也是NewZealand独有的一种鸟名,而Weka的主要开发者同时恰好来自New Zealand的theUni versity of Waikato 。介绍:baike.baidu./li nk?url=AR80v-BY2MUNu2j_JXqwBKDD6Df-hK7_LThpf_4vqUFYY5AlsOL47EwpChPhZi6tzJr8ilP8UQcablDhUj-MPK下载:.xpgod./soft/17508.html4.7 RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 活动策划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号