BI应用“抓”数据源头-数据源头

上传人:人*** 文档编号:507690390 上传时间:2023-01-25 格式:DOCX 页数:4 大小:17.44KB
返回 下载 相关 举报
BI应用“抓”数据源头-数据源头_第1页
第1页 / 共4页
BI应用“抓”数据源头-数据源头_第2页
第2页 / 共4页
BI应用“抓”数据源头-数据源头_第3页
第3页 / 共4页
BI应用“抓”数据源头-数据源头_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《BI应用“抓”数据源头-数据源头》由会员分享,可在线阅读,更多相关《BI应用“抓”数据源头-数据源头(4页珍藏版)》请在金锄头文库上搜索。

1、应用“抓”数据源头:数据源头 2021年下半年,美国一家第三方调查企业曾经对全球部分存放用户和IT管理人员进行了一次问卷调查,内容包含IT人员在未来一段时间里可能在哪些领域进行投资。调查结果显示,虚拟磁带库是被大家所谈论最多的步骤,从评分来看,VTL取得了100分,名列榜首。该调查企业预计,虚拟磁带库市场在2021年将以40的年增加率成长。大多数存放用户全部知道,VTL能够处理不一样存放介质之间复杂的数据转换和管理问题,给企业现有的备份环境带来愈加快速和可靠的数据恢复,使存放管理的成本显著降低。面对市场上高速增加的需求,近一两年来,市场上出现了越来越多的虚拟磁带库产品,而且不一样厂家的产品全部

2、含有各自不一样的特点和技术优势。2021年2月16日,Network Appliance企业公布了其虚拟磁带库领域的新产品系列,包含两款NearStore虚拟磁带库系统,即NearStore VTL处理方案家族的单头NearStore VTL600和双头NearStore VTL1200。NearStore VTL系统是NetApp企业在去年5月份收购了Alacritus企业以后整合而成的最新产品线,据NetApp企业技术总监岑广海介绍,新的虚拟磁带库系统含有以下几大技术革新: 动态负载均衡 通常的方法是预先分配好磁盘空间,当备份时就会将数据固定地备份到某一磁带空间上,这么就使得要求位置的磁带

3、空间会变成“热门”磁盘,而这部分磁盘就存在性能问题。而此次NearStore VTL首次在存放系统中采取自我调整技术,在数据负载发生改变时不间断地自动将备份流分配给可用性最高的磁盘,使整个数据流的分布不会在一些磁盘上形成瓶颈,变成一个动态性能,显著地提升了备份性能。磁盘连续写操作实现了大模块连续磁盘传输。 磁带空间计算 通常的虚拟磁带压缩技术采取的方法是直接将数据进行压缩,然后再输出并压缩存放到物理磁带上,不过在通常情况下,因为VTL和物理磁带的压缩算法不一样,所以在数据转移过程中就会产生误差,这么现有可能浪费磁带空间,同时也给以后的数据追踪带来麻烦。NearStore VTL系统采取了一个新

4、奇的称为“Introduces Tape Smart Sizing”的功效,这种计算功效能够在数据进入VTL时,对全部数据进行动态实时采样,计算出以后VTL输出到物理磁带上时所需的实际空间,经过准确计算,数据在实际物理硬件压缩时在空间介质上将不会产生任何消耗浪费。据估量,这种磁带优化功效将使企业用户在存放介质上最少能够节约50的存放空间。 快速数据恢复 NearStore VTL利用联机磁盘的快速性和可靠性,极大地提升了恢复性能,消除了磁带库存在的机械延迟问题,经过磁带直通模式,使备份应用程序能够立刻访问数据,从而加紧了从物理磁带恢复的速度。在安全方面,NearStore VTL使用含有RAI

5、D保护功效的磁盘存放技术来防媒体犯错,使用Journaled对象存放区以自描述的模式将数据写入磁盘,即使出现最严重的系统错误以往提及信息管理或是数据管理时,通常是数据库、数据仓库提供商会提供更多的概念,而更偏重提供前端BI分析工具的BO涉足该领域,则预示着BI厂商逐步走向“全能”。近日,Business Objects企业宣告了其EPM和EIM战略,其中EIM是专门针对BI应用中的数据整合、数据源质量确保和总控数据管理的一个完整框架。图 EIM数据管理拓扑图实时数据整合在数据整合阶段,BO除了提供对应的ETL工具之外,还提供EII工具Data Federator。数据整合,顾名思义就是未来自不

6、一样数据源的数据整合在一起,以一个完整的视图提供给更为上层的BI进行分析。传统的数据整合是经过ETL工具将数据抽取、加载到数据仓库,从而将不一样数据源的数据全部聚集到数据仓库中,从物理位置看,全部这些数据也全部是放在一起的。而BO所提出的EII能够实时地从不一样数据源抽取数据,从而实现实时BI分析。实际上,它提供的是虚拟的通道,数据本身还是放在原来的数据源中。实时、快速是EII最大的特点,之前利用数据仓库的数据整合方法,最快也是天天晚上加载当日数据,第二天能够使用的最新数据是前一天的。其次,数据仓库的容量总是有限的,不是全部表格全部能够或是有必须存放在其中,当需要的表格在数据仓库中找不到时,E

7、II恰恰能实时抽取需要的数据。和其它部分厂商相比,BO之前的产品线更偏重前端BI分析工具的提供,而此次BO推出EIM战略,无疑拓展了它在后端数据整合阶段的实力,使自己逐步成为全方面的BI处理方案供给商。为数据质量“筑”防火墙实时数据整合因为经历的步骤少,其中并没有专门确保数据质量的步骤,所以BO在数据整合之上提出了数据质量防火墙的概念,为的是确保整合以后数据的质量能够达成一定的要求,从而增强企业做出决议所需信息的可信度。BO企业亚太区产品和处理方案市场经理Ian Parker在接收记者采访时表示,“数据整合不可避免地会暴露数据质量方面的问题”。BI应用是对数据进行整合、统计和分析,从而得出对业

8、务有价值的分析结果。数据对BI来说是最初的源头,假如数据的质量无法确保,BI就成了无源之水。在传统的以数据仓库为基础的BI项目中,确保数据质量的工作通常是由ETCL工具负担,但现在的ETCL工具大多集中在数据的抽取、转换和加载方面的功效,对数据质量的确保还有所欠缺。和此同时,市场上确保数据质量的工具也比较少,Firstlogic应该算是数据质量处理方案和服务提供商中的佼佼者,可提供数据评定和度量、数据整理、匹配和合并、连续监测等能力,而BO企业近日将其收购,这就使得Firstlogic成为其EIM战略中的主要步骤。xx点评:当然,实时的EII工具并不能替换数据仓库,它是数据仓库更为有效的补充。数据仓库在数据整合方面的能力很强,它和实时的EII数据整合分别适合不一样的应用类型,而不论是对实时数据整合,还是对数据仓库数据整合来说,数据质量全部很主要。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号