大数据分析存储解决方案

上传人:鲁** 文档编号:568031287 上传时间:2024-07-23 格式:PPT 页数:39 大小:6.86MB
返回 下载 相关 举报
大数据分析存储解决方案_第1页
第1页 / 共39页
大数据分析存储解决方案_第2页
第2页 / 共39页
大数据分析存储解决方案_第3页
第3页 / 共39页
大数据分析存储解决方案_第4页
第4页 / 共39页
大数据分析存储解决方案_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《大数据分析存储解决方案》由会员分享,可在线阅读,更多相关《大数据分析存储解决方案(39页珍藏版)》请在金锄头文库上搜索。

1、Page 1从企业数据向大数据的扩展TraditionalApproachStructured,analytical,logicalSystemsofRecordNewApproachCreative,holisticthought,intuitionSystemsOfEngagementMultimediaSystemsofInsightEnterpriseIntegrationandContextAccumulationStructuredRepeatableLinearUnstructuredExploratoryDynamicDataWarehouseWebLogsSocialData

2、TextData:emailsSensordata:imagesRFIDInternalAppDataTransactionDataMainframeDataOLTPSystemDataHadoopandStreamsTraditionalSourcesNewSourcesERPdata具备洞悉能力的系统SystemsofInsightPage 2对新式基础架构的需求对新式基础架构的需求对新式基础架构的需求对新式基础架构的需求在可靠和安全可靠和安全的环境中处理关键业务应用存取和处理存取和处理海量数据包括结构化和非结构化数据速度及时响应随时可能出现的商业机会,这就需要灵活、实时性的基础架构The

3、 dynamics of SoR and SoE:通过负载及资源部署的优化,来增强灵活性和效益通过采用包括基于开放标准的技术等新技术来改善IT economicsSystemofRecord( (SoR) )SystemsofEngagement( (SoE) )对的决策的决策对的地方的地方对的的时间点点BigData&AnalyticsPage 3大数据分析的新型架构解决方案大数据分析的新型架构解决方案大数据分析的新型架构解决方案大数据分析的新型架构解决方案IBMBigData&AnalyticsInfrastructureData Zone Application Zone Page 44

4、SmartMeteringGridOperations电网管理电网管理FieldService外勤现场服务外勤现场服务ResourcePlanning资源规划资源规划CustomerService/CustomerOperations实现真正的有效的法规遵从及时发现能源损耗问题、以及偷电和欺诈行为提高客户满意度电量使用预测更为精确电网运维优化减少停电次数和时间案例案例案例案例: :SmartMeteringSmartMetering智慧电力计费智慧电力计费智慧电力计费智慧电力计费 大数据分析应用可以带来大数据分析应用可以带来大数据分析应用可以带来大数据分析应用可以带来真正的业务价值真正的业务价

5、值真正的业务价值真正的业务价值法法规遵从遵从Page 5案例案例案例案例:用大数据分析来加强用大数据分析来加强用大数据分析来加强用大数据分析来加强 SmartMeteringSmartMetering数据分析的高可用性,以确保随时了解用户喜好跨应用的TB级的数据需求 通用虚拟化存储平台实时收集、存储并分析数据,最快可达 50,000 data points/sec历史用电状态数据的复杂查询处理数据在加载到数据仓库前的清洗、验证,这些数据可能来自很多的用户、收费系统或断电保护系统关系掌控构建和维护电网的唯一试图对整个企业的结构化和非结构化数据t做全局导览Navigation,从中发现Discov

6、er价值分析用户用电情况,侦测偷电、改表等行为预测哪些用户适合于哪些分时时段电价或需求/响应服务分时时段电价的实时定价 或 提供及时的需求/响应服务Page 6IBMBigData&AnalyticsReferenceArchitectureBig Data Platform CapabilitiesInformation IngestReal-time AnalyticsWarehouse & Data MartsAnalytic AppliancesAll Data SourcesAdvanced Analytics/New InsightsNew/Enhanced Application

7、sCognitive认知知Learn Dynamically?Prescriptive规范范Best Outcomes?Predictive预测What Could Happen?Descriptive描述描述What Has Happened?ExplorationandDiscoveryWhat Do You Have?Streaming DataText DataApplications DataTime SeriesGeo SpatialRelationalSocial NetworkVideo & ImageAutomated ProcessCase ManagementAnalyt

8、ic ApplicationsWatsonCloud ServicesISV SolutionsAlertsPage 7NewInfrastructureLeveragesDataTypesDatainMotionDataatRestDatainManyFormsInformationIngestionandOperationalInformationDecisionManagementBIandPredictiveAnalyticsNavigationandDiscoveryIntelligenceAnalysis Raw Data Structured Data Text Analytic

9、s Data Mining Entity Analytics Machine LearningLandingArea,AnalyticsZoneandArchiveVideo/AudioNetwork/SensorEntity AnalyticsPredictiveReal-timeAnalyticsExploration,IntegratedWarehouse,andMartZonesDiscoveryDeep ReflectionOperationalPredictive Stream Processing Data Integration Master Data StreamsInfor

10、mation Governance, Security and Business Continuity BigInsightsStreamsWarehouse Copyright IBM Corporation 2014Page 9InfoSphereBigInsightsHadoop-based 低延迟分析,针对多样化的、海量静态数据Data-At-RestNetezzaHighCapacityAppliance基于结构化数据的可查询归档Netezza1000基于结构化数据的BI+定制化分析 DataSmartAnalyticsSystem基于结构化数据的运营分析InformixTimese

11、riesTime-structured analyticsInfoSphereWarehouse基于结构化数据的大容量数据分析InfoSphereStreams低延迟流数据分析Velocity, Variety & VolumeData-In-MotionMPP Data WarehouseStream ComputingInformation IntegrationHadoopInfoSphereInformationServer海量数据集成和转化ApacheHadoop:跨服务器集群的大数据集分布式处理开放系统框架,采用的是一种简单化编程模型IBMBigDataPlatform大数据平台大

12、数据平台Page 10What: 一种开源软件,将数据计算分布到整个集群的常见商用服务器和存储上Why: 传统的计算架构是一种沿纵向扩展模式,通过更快的SAN、大容量内存和多级缓存将数据加载到CPU上,成本比较高。What: Hadoop 把大数据集合拆分区划为小数据集合,再把小数据集合分发到多台普通服务器上,是一种横向扩展模式。Why: Scalable, Flexible, Cost Effective, Fault TolerentComponents: Map Reduce, HDFSWhatisHadoop?Page 11NameNode (Metadata store)NodesH

13、DFS ClusterOperating SystemNodesElastic Storage -SNC ClusterKernel LevelIBMValueforHadoop!HDFS 把数据分散存储在多个存储节点Node上HDFS 设计时就假设存储节点有失效的可能,所以HDFS会把一份数据复制3份以上,分散存储在多个节点上,从而实现系统整体上的可靠性HDFS文件系统是由服务器节点集群组成的,每台服务器依照HDFS的特有block协议支持网络化block 数据HDFS Name Node 有发生单点故障的危险IBM 在改善文件系统的性能同时消除了单点故障 Elastic Storage -

14、SNC (available as beta code)Hadoop说明明,MapReduce,HDFSPage 12HadoopStackHadoopStackWhat does it look like?Page 13典型典型Hadoop存存储的的PainPoints在选择HDFS的组件(如软件、服务器、网络和存储等)时很难选对在从测试环境迁移到生产环境时,需要做的调优和调整工作太繁复了长期持续不断的运维保障过于繁重,比如老要更换失效组件(尤其是硬盘),这使得保证期望的SLA非常难CPU 和存储去耦o本来用户的CPU和内存已经满足计算需求,但为了存储容量需要安装更多的硬盘不得不买更多的、不

15、必要的CPU和内存Storage options available have clear gapso本地存储的利用率低 (25%),每次需要扩容的时候就要添加更多的服务器,而一旦硬盘失效后需要重建,服务器越多,失效的几率越高,性能也就越差Page 14IBMStorageforHadoopIBMStorageforHadoop传统的 Hadoop 集群使用的是服务器内置硬盘存储。如果用作测试或科学研究还好,可作为业务运行的存储就要采用企业存储Hadoop 集群要负责数据保护和复制l重建(就是copy)失效的数据集到不同节点上 严重影响CPU性能,无法实现企业级的RASlReplicate d

16、ata 问题同上l扩展的时候同时增加处理器/网络/存储,无法做到物尽其用( no way to separate these 3 even if excess capacity existing in one (e.g. Needed more storage but had to add Compute and Network))使用外部存储可以将存储负载和Hadoop计算节点分离,同时还获得了企业存储的好处。lSell the value of XIV, V7000, SVC, etc.用户一般会随Hadoop File System部署;采用Elastic Storage 可以有很多好处

17、Page 15数据加速数据加速lExperience the instant results that come from IBM FlashSystemlDrive as much as 45X faster analytics results on certain workloads数据负载的多样性和灵活性数据负载的多样性和灵活性lXIV delivers predictable performance that scales linearly without hotspots delivering insights from analytics faster with tuning-fr

18、ee data distributionlScale-out, parallel processing of Elastic Storage software and integration with FlashSystem dramatically accelerates performance of Analytics clusters lVirtual Storage Center with SVC automatically optimizes data warehouse performance and cost across Flash and DiskMainframeDataE

19、nvironmentslIntegration with DB2 & specialty analytics “engines” leveraging DS8870 delivers 4x reduction in batch times with new High Performance Flash EnclosureslHigh speed encryption on every drive type secures data数据保护和保留数据保护和保留 lLTFS EE w/ tape provides reduced TCO by up to 90% over disk for lon

20、g term retention of data at rest with a large open format tape repositorylReduce the amount of data to be stored by up to 25times with ProtecTIER de-duplication 12x更快更快IBM FlashSystem increased SPLUNK & SAS application efficiency to perform business analytics20x改善改善 in actionable supply chain analyt

21、ics, 4xreduction in batch times, virtualization for plug & play6x时间节省省“GPFS allows us to move the metadata from the disk to the FlashSystem online. Once we did that, the backups were reduced down to about an hour.” 2hrsbecomes2minutes失效切换时间大幅缩短MappingCharacteristicstoIBMStorageProductsPage 16Storage

22、Infrastructure需求需求适用于所有的5种应用场景 OptimizedMulti-TemperatureWarehouse优化的多化的多级存存储库oAll FlashFlashSystemoHybridDS8000 EasyTierXIV + SSD CachingStorwize EasyTierFlashSystem Solution (VSC + FlashSystem)oPureSystemsPureFlex (XIV or Storwize w/EasyTier)PureData for Transactions (Storwize)PureData for Analyti

23、cs (Netezza)Page 17Midrange & EntryTier 0 AccelerationSmarter StorageSmarter StorageIntegrated SystemsIntegrated SystemsEnterpriseOfferingsXIVzEnterprise Solutions for Analytics with DS8000PureData System forOperational Analytics with StorwizePureFlex Systemwith StorwizeDS8000Smart Analytics Systems

24、 with DS3xxxOpen & ExtensibleOpen & ExtensibleStorwizefamilyFlashSystemfamilyIBMSmarterStorage的的设计就是支持大数据分析就是支持大数据分析高效和高效和优化数据基化数据基础架构架构Page 18IBMFlashSystemIBMFlashSystem:为大数据分析应用设计的,让应用和数据实现:为大数据分析应用设计的,让应用和数据实现:为大数据分析应用设计的,让应用和数据实现:为大数据分析应用设计的,让应用和数据实现极速极速极速极速IBMFlashSystem的的极速性能极速性能让实时业务决策成为可能让实

25、时业务决策成为可能适合于模块化数据存储结构的适合于模块化数据存储结构的Hadoop系统。某些或所有数据可系统。某些或所有数据可以保存到以保存到Flash闪存上,其他可以保存到闪存上,其他可以保存到XIVPage 19IBMXIV:OptimizeddataworkloaddiversityforBigData&AnalyticsIBMXIV:OptimizeddataworkloaddiversityforBigData&AnalyticsIBMXIV的的高性能高性能无须人工干预配置,且适用于各无须人工干预配置,且适用于各种各样的存储负载种各样的存储负载IBMXIV的的效率效率高的异乎寻常,而

26、且简单性业内最高,内高的异乎寻常,而且简单性业内最高,内置友好界面置友好界面IBMXIV的的弹性弹性是企业级的,完全保证了数据的可用性和是企业级的,完全保证了数据的可用性和业务连续性业务连续性Page 20XIV:XIV:XIV:XIV:为为为为AnalyticsAnalyticsAnalyticsAnalytics而生而生而生而生 无与无与伦伦比的比的性能性能性能性能可扩展的网格存储架构任意时间支持任意读写负载板上的闪存Flash 无与无与伦伦比的比的可靠性可靠性可靠性可靠性精致的数据分布无双的磁盘重建时间企业级的可用性 无与无与伦伦比的比的简简易性易性易性易性简单的规划、供给和灵活性上线后

27、零维护零调优“XIV最吸引我们的地方就是其超强的性能 we正是由于XIV为我们的精细复杂的分析应用提供了一致的高性能, 使得我们能够为我们的用户带来更多的价值。”Page 21SASSAS 和和和和 XIVXIV网格架构网格架构网格架构网格架构 完美的结合完美的结合完美的结合完美的结合大规模并行计算 保持持续地最佳性能Balanced Performance性能均衡性能均衡 常年零调整Unprecedented Scalability史无前例的史无前例的扩展性展性 配合添加SAS节点和XIV模块即可Page 22IBMSVC:Optimizeddataworkloadflexibilityfo

28、rBigData&AnalyticsIBMSVC:OptimizeddataworkloadflexibilityforBigData&AnalyticsIBMSVC通过如下功能在通过如下功能在IBM大数据产品线上增加了大数据产品线上增加了灵灵活性活性:完整和数据虚拟化和数据移动性完整和数据虚拟化和数据移动性高级集群和复制高级集群和复制多路镜像,多路镜像,readpreferredoptionRealTimeCompression实时压缩实时压缩EasyTierHotExtentcachingStorwize V7000/UIBM SVCPage 23设计原则设计原则Real-Time Com

29、pression实时压缩是设计来做:l作用于 ActivePrimaryDataActivePrimaryDatal专用的压缩平台Platform handles ALL heavy lifting associated with compressionl不会影响性能We modify a compressed file in-place efficientlyl不会改变用户应用Users nor admins need to change anythingl处理流程不变压缩是在线完成,不是事后压缩l业界标准压缩算法所采用的压缩算法已经使用了几十年Storwize V7000/UIBM SVC

30、Page 24流处理计算 & IBM Flash SystemsPage 25Data:Data:是拥有还是保存是拥有还是保存是拥有还是保存是拥有还是保存?或是是分析和开始行动或是是分析和开始行动或是是分析和开始行动或是是分析和开始行动! !Data inData atPage 26InfoSphereStreams:InfoSphereStreams:大数据流分析大数据流分析大数据流分析大数据流分析为分析动态数据而建l多并发输入数据流l大规模可扩展Massive scalability分析和处理的数据多样化lStructured, unstructured, video, audiolAdv

31、anced analytic operators自适应实时分析lWith Data WarehouseslWith Hadoop SystemsPage 27Current fact finding当前数据查询分许流动中的数据在数据落盘前低延迟模式, push model数据驱动真正的数据分析Historical fact finding历史数据查询查找和分析存储在磁盘上的数据信息批处理模式, pull model查询驱动: submits queries to static data TraditionalComputingStreamComputing流数据计算代表着计算模式的变迁流数据计

32、算代表着计算模式的变迁流数据计算代表着计算模式的变迁流数据计算代表着计算模式的变迁Real-timeAnalyticsPage 28RealTimeAnalyticsRealTimeAnalytics实时分析实时分析实时分析实时分析想象一下你如何用防火栓喝水想象一下你如何用防火栓喝水想象一下你如何用防火栓喝水想象一下你如何用防火栓喝水来自多个多样输入源的大量数据直接处理和过滤数据,而不必存储仅保存有价值的数据仅关联对数据最感兴趣的用户随着数据信息的产生采取行动Page 29AdaptiveAnalyticsAdaptiveAnalytics自适应分析自适应分析自适应分析自适应分析DatainM

33、otionandDataatRestDatainMotionandDataatRest的集成的集成的集成的集成1.DataIngest数据集成,数据挖掘,机器学习, 统计建模实时和历史数据洞察力的可视化3.AdaptiveAnalyticsModel数据收取,在线分析准备,模式校验Data2.Bootstrap/EnrichControl flowInfoSphereBigInsights,Database&WarehouseInfoSphereStreamsPage 30AdaptiveReal-TimeAnalyticsAdaptiveReal-TimeAnalytics自适应实时分析自适

34、应实时分析自适应实时分析自适应实时分析来自多个多样输入源的大量数据过去、现在和未来全方位综合性视图l实时分析,低延时结果lFull context for deep analysis深度分析的完整的上下文跨data in motion and data at rest的常用数据分析自适应-随机而变l当发现非预期行为时,自适应l当识别出新数据意义时深度分析之l开始没有意识到的数据意义,随后才可能意识到l自适应在开始没有意识到的,随后可以找出数据模式Page 31StockmarketImpact of weather on securities pricesAnalyze market data

35、 at ultra-low latenciesMomentum CalculatorFraudpreventionDetecting multi-party fraudReal time fraud preventione-ScienceSpace weather predictionDetection of transient eventsSynchrotron atomic researchGenomic ResearchTransportationIntelligent traffic managementAutomotive TelematicsEnergy&UtilitiesTran

36、sactive controlPhasor Monitoring UnitDown hole sensor monitoringNaturalSystemsWildfire managementWater managementOtherManufacturingText AnalysisERP for CommoditiesReal-time multimodal surveillanceSituational awarenessCyber security detectionLawEnforcement,Defense&CyberSecurityHealth&LifeSciencesICU

37、monitoringEpidemic early warning systemRemote healthcare monitoringTelephonyCDR processingSocial analysisChurn predictionGeomapping如何使用如何使用如何使用如何使用InfoSphereStreams?InfoSphereStreams?Page 32加快数据流入分析系统的速度加快数据流入分析系统的速度加快数据流入分析系统的速度加快数据流入分析系统的速度向交易方向加速。一个高效和灵活的基一个高效和灵活的基础架构架构显然可以加快然可以加快流速,并平衡不同数流速,并平衡不

38、同数据分析的需求据分析的需求CoresSCMStorageNetworkCoresSCMStorageNetworkCoresSCMStorageNetworkCoresSCMStorageNetwork+预测分析分析数据数据仓库文本分析文本分析Hadoop WorkloadsHadoop Workloads优化化敏感性分析敏感性分析加快流速加快流速价值时间“触触发事件事件”数据完数据完备交易交易Insight预见获取数据获取数据时间时间分析数据分析数据时间时间行动时间行动时间Page 33大数据分析的新式基础架构解决方案大数据分析的新式基础架构解决方案大数据分析的新式基础架构解决方案大数据分

39、析的新式基础架构解决方案IBMBigData&AnalyticsInfrastructureData Zone Application Zone Page 34Experience real-time analytical insights with up to 50x better performance than enterprise disk systems using IBM FlashCore technologyPreserve and protect infrastructure continuity while scaling to over 2 petabyte of eff

40、ective all-flash capacity under a single integrate interfaceDeliver agility and data economics with 4x greater capacity in less rack space than competitive all-flash productsSynchronized and Complimentary to Overarching Storage Messaging - Accelerate time to insights through data without borders. IB

41、M innovation frees data with agile and simple to use storage solutions delivering superior data economics IBMFlashSystemCoreLaunchMessagingDrive a complete paradigm shift in Enterprise Storage with the all new IBM FlashSystem FamilyPage 35IBMFlashSystemFamilyIBMFlashSystemFamily2015Theme2015ThemeTim

42、e to insight. Time to value. Time to market.IBM FlashSystem, its about time.Flash Realized!Page 36IBMFlashSystemV9000IBMFlashSystemV9000FoundationalPillarsFoundationalPillarsIBM FlashCore Technology is the DNA of the FlashSystem FamilyPage 37Introducing the New IBM FlashSystem Family OfferingsIBM Fl

43、ashSystem 900Extreme Performance: Delivers 100 microsecond response times Macro Efficiency: Lowest latency offering with 40% greater capacity at a lower cost per capacityEnterprise Reliability: IBM enhanced Micron MLC flash technology with Flash Wear GuaranteePowered by IBM FlashCore TechnologyIBM F

44、lashSystem V9000Scalable Performance: Grow capacity and performance with up to 2.2PB scaling capabilityEnduring Economics: Next generation flash media with lower cost per capacity Agile Integration: Fully integrated system management to simplify management and improve workforce productivity under a

45、single name spacePage 38FlashSystem900FlashSystem900FlashSystem900FlashSystem900Introducing IBM FlashSystem 900, the next generation in our lowest latency offering IBM MicroLatency with up to 1.1 million IOPS40% greater capacity at a 10% lower cost per capacityIBM FlashCore technology, our secret sa

46、uce Technical collaboration with Micron Technology, our flash chip supplierIBM enhanced flash technologyMLC NAND flash offering with Flash Wear Guarantee VAAI UNMAP and VASA support with IBMSIS for improved cloud storage performance and efficiencyMinimumlatencyWrite90 sRead155 s MaximumIOPS4KBRead (

47、100%, random)1,100,00Read/write (70%/30%, random)800,000Write (100%, random)600,000Maximumbandwidth256KBRead (100%, sequential)10 GB/s Write (100%, sequential)4.5 GB/s Performanceat-a-glanceIBMMicroLatencymoduletype1.2TB2.9TB5.7TBModulesquantity46 8 10 12 6 8 10 12 6810 12RAID5capacity(TB)2.44.87.29

48、.6 1211.6 17.423.229.022.834.245.657.0RawCapacity(TB)7.110.714.217.821.426.335.143.952.752.770.387.9105.5Page 39IBMintroducesafullyintegrated,fullymanaged,fullfunctionall-flashstoragesystemFlashSystemV9000FlashSystemV9000FlashSystemV9000FlashSystemV9000Scalable all-flash architecture with full set o

49、f advanced data featuresPerforms at up to 2.5M IOPS with IBM MicroLatency, scalable to 19.2 GB/s Scales to 456 TB usable and up to 2.28 PB effective capacity in only 34UUp to 57 TB usable and up to 285 TB effective capacity in only 6UNew licensing structure to simplify ordering and planning for External Data Virtualization, Flash Copy, Metro Mirror, and Real-time CompressionScalablePerformanceAgileIntegrationEnduringEconomicsPoweredbyFlashCoreTechnology

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > 金融/商业/投资

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号