《数据资产管理(PPT35页)》由会员分享,可在线阅读,更多相关《数据资产管理(PPT35页)(37页珍藏版)》请在金锄头文库上搜索。
1、工欲善其事,必先利其器数据资产云图白皮书2尽管“数据是资产”概念已经广为人知,但“如何管理数据资产”仍然缺少成熟理论以及工具手段数据资产管理是企业或组织采取的各种管理活动,用以保证数据资产的安全完整,合理配置和有效利用,从而提高带来的经济效益,保障和促进各项事业发展。该领域是大数据时代企业布局竞争的核心,也是目前市场空白。什么是数据资产?存在什么问题?数据源不规范,导致无效数据加工处理缓慢,导致低效决策加工流程混乱,人力物力浪费评估手段缺失,数据资产价值大打折扣分配不透明,数据资产错配定义不统一错误判断分布杂乱,数据资产闲置数据不开放,企业数据合作受限数据库报表文件接口权限视图治理无力应用低效
2、运营缺失数据资产是企业及组织拥有或控制,能带来未来经济利益的数据资源。3 数据资产管理包括哪些核心内容?让企业数据更加准确、一致、完整、安全,降低IT成本。数据数据资产治理治理使得企业数据的使用过程更为人性、快捷、智能,从而提升管理决策水平。数据数据资产应用用支持企业数据资产的分发、开放、交易等数据嫁接的实现,从而促进数据资产的价值实现。数据数据资产运运营4数据资产规范及治理能力数据资产运营、开放、应用能力数据资产管理体系核心在于有效解决对数据资产进行管理的实践性问题,既帮助企业合理评估、规范和治理企业信息资产,又可以挖掘和发挥数据资产价值并促进持续增值,并符合大数据的跨行业合作趋势资产质量更
3、加可靠创新合作更加便捷运营手段更加丰富数据资产应用有效处置租赁、报损、转换全面评估资产分布、活性、配置合理性、使用策略使能创新交易、数据开放数据资产运营协同工作数据资产数据规范 管控体系 元模型数据 情景规则 人员组织数据处理 全局洞察 采集加工 快速可视化 运维管控第三方应用加载标准化数据接口、平滑迁移、快速定制快速开发部署效率、质量形式丰富易用数据产品、报表有机融合5数据资产管理平台,涵盖了采集、加工、使用、评估、优化、下线等数据资产的全生命周期管理,并基于全面数据治理能力,进一步提供专业化的数据资产“管家”服务,包括资产规划、运营管理、开放管理,以及面向企业客户和个人客户的不同类型数据资
4、产应用,从而为大数据时代的数据资产管理和增值发展提供全面支持。数据资产治理数据资产开放管理数据资产运营管理数据资产规划管理数据资产应用应用软件应用软件浏览器浏览器终端终端/app电话呼叫电话呼叫微信微信短信短信Email内部数据传统数据库新型数据库文档资料数据加工运维管理安全管理质量管理数据体系规划数据标准化管理价值评估增值策略资产活性分析资产配置优化数据采集开发者社区数据交互中心数据资产合作平台数据可视化平台企业客户应用个人客户应用金融-风险识别医疗-传染源定位征信管理个人数据宝库小数据聚合政府-舆情管理注: 数据资产应用内容需要根据具体业务场景定制。6特定行业的大型企业(如电信、金融、航空
5、、制造等)各行业的大中型企业中小企业以及个人客户产品部署+定制化开发产品部署+云化服务SaaS/App管理数据资产掘金经济价值注: 云化服务和SaaS、App等形式目前仍处于规划阶段。7能够合理评估、规范和管理企业信息资产,在有效IT投资和降低管理成本的同时,挖掘和发挥数据资产价值并增值。企业管理者IT建设部门业务运营人员数据运营人员能够规范数据处理过程、保障数据资产质量、提升IT系统建设效率、快速支撑业务部门运营需要,从而激发创新、体现价值。能够快速、高效的提供体验良好的数据展现手段,通过确保了数据资产质量,从而有助于做出更加准确的业务举措。支持多种数据使用模式,并提供更为丰富、安全的数据运
6、营管理手段,有助于企业间进行更广泛的数据合作并由此创造价值。8传统数据管理方式元数据数据稽核管理制度外部性管理,依赖管理力度和执行自律,成难毁易。挑战1挑战2挑战3从范围来看,从形式来看,从内涵来看,非结构化数据、内外部数据混搭、云化处理等都会冲击传统管理模式数据加工的复杂度和速度要求越来越高,也对传统管理效率提出挑战数据的交换、转让、租赁、交易等各种创新模式,也要求新的管理手段资产验证数据整合交易保障9良好界面体验完善规范标准智能化过程控制凝聚了10年以上电信级数据管理规范和实践经验,形成了一整套管理办法和信息体系全Web界面的在线操作提供了丰富的可视化组件,能够很好地帮助信息展现、问题定位
7、和决策支持能够根据数据资产实际使用过程进行智能化分析,并动态调整管理过程中的规则参数;支持第三方应用集成一站式管理:面向业务人员提供快速取数、自助分析、门户定制等功能;面向技术人员提供可视化运维、自动化处理等工具;面向管理人员提供各种评估告警以及决策支持手段;数据治理企业级大数据中心数据处理及可视化框架使能数据开放支持多租户管理、数据开放平台、数据合作加工模式等数据交互模式,并能够很好地保证数据使用过程中的隐私安全;10网络通信平台主机系统软件主机存储备份OS1.网络通信层2.主机存储层数据存储层db2oraclehadoop3.数据层 平台资产规划资产应用4.应用支撑层资产评估资产运营数据采
8、集数据加工数据管理运维监控业务应用系统应用系统15.应用系统层应用系统5应用系统2应用系统3应用系统4应用系统6分析门户、网站6.信息发布层信息安全体系项目实施方法论支持标准化体系支持gp定位于应用支撑层,在数据治理基础上,实现资产规划、加工、评估、运营等功能11数据资产规划数据架构管理数据标准化维度表标准化指标标准化数据资产质量数据资产加工数据流程设计数据模型设计数据处理开发数据应用开发数据测试上线数据运维运行监控告警管理数据评估数据优化存储优化下线管理质量规则管理质量规则检查质量问题管理元数据管理元数据采集元数据分类元数据稽核数据关系分析字段关系分析元数据服务数据资产安全安全策略管理安全漏
9、洞检查权限申请分配安全审计数据处理类 | 数据交换类 | 文件操作类 | 数据查询类 | 数据安全类 | 数据检查类 (函数适配器)Engine for db2db2Engine for oracleOracleEngine for hadoopHadoopEngine for GBASEMPP功能层统一API层生产平台数据地图运营层数据资产应用数据资产评估数据资产运营指标墙自助分析多维报表运营诊断资产构成分析资产使用评估资产活性分析资产分布评估多租户接入管理数据开放平台BI应用商店数据分发中心1213元数据库元数据库元数据管理开发管理运维监控管理统一日志、通信、控制中心生产运行环境质量管理上
10、线元数据采集1234元数据查询元数据分析元数据维护元数据采集开发过程管理需求开发管理项目开发管理。数据生命周期管理应用生命周期管理进程启停临时任务管理数据质量采集数据稽核评估问题管理质量报告运维管理同步开发任务以元模型驱动,连接数据管理,开发、运维和生产运行,形成一体化管理14建立标准体系1数据标准是数据资产管理的基础,需要对管理对象,管理要求、管理手段、管理流程等进行规范,从而成为海尔相关系统和部门统一遵循的标准。具备管控手段3针对数据生命周期各个阶段的不同特性,提供各种监控、管理工具,将可能出现的系统运行出错或数据异常变化进行修正或告警,以避免出现更大的损失形成信息地图2建立全集团的IT的
11、信息地图,通过自动化的多源头元数据采集,自动分析汇总,形成完整的企业数据地图,使用户能够从全局视角审查企业整体数据状况。实现影响分析4实现数据来源的追溯,能够方便内部管理、审计或外部监管的需求追溯业务指标、报表的数据来源和加工过程, 即能方便的找到想要的数据以及这个数据与其他数据的传递关系和业务逻辑关系。促进数据协同5实现跨平台的元数据管理,具备数据管控统一功能平台,增强应用的协同管理能力,能够展示出数据之间的关系,从而促进不同阶段的数据形成协同关系,以及闭环加工流程,确保数据可靠性。持续质量改进6数据质量体系需要通过实践和规划的相互促进,不断完善改进,为此,需要确保确保数据架构合理,条理清晰
12、,过程可控,知识积累传承,并通过监控和审计不断促进质量水平的持续提升。建立起可管可信的数据资产治理体系15DMP可持续的技术架构体系组织架构与标准规范数据质量智能化数据标准化规范化数据关系脉络化通过对数据、应用、系统综合管理,构建标准化、流程化、自动化、一体化的数据管理体系确保数据架构合理,条理清晰,过程可控,知识积累传承。16数据标准化制定数据架构管理主数据管理指标数据管理代码标准化管理规则稽核评估提供了完整全面数据治理与管控功能体系,可以帮助企业实现数据资源的条理化、脉络化,成为数据资产化管理的重要基础数据采集数据加工数据分发数据共享敏感数据管理质量规则管理问题定位分析影响范围分析问题知识
13、库质量标准定位数据标准化管理专业数据管理高效数据处理持续质量改进可视化开发管理需求分析变更分析知识积累自助分析数据可视化快速响应17接口系统提供完整细致的血缘分析,对问题的节点进行回溯,分析其处理路径上可能存在的问题以及相关影响范围应用处理程序数据表全面追溯的数据影响分析,一切尽在掌握18一站式统一运维监控为运维部门提供了一个中央管理点,使得运维人员可以紧密有效地对系统上发生的事件进行控制,为分布式环境创建一个“任务控制”中心。对收集到报警信息及时触发各种动作,可通过邮件、短信、语音等方式提醒运维人员对日常监控数据的分析,也可以帮助运维人员分析出系统中存在的性能瓶颈,以便采取适当的解决措施对系
14、统进行优化或扩展。19需求设计开发调试测试部署、升级文档生成需求设计开发测试上线n接口开发n程序开发n指标开发n展示开发n数据流程设计n数据模型设计n规则设计n展示设计n测试方案n测试执行n测试报告n测试跟踪n需求受理n需求分析n上线审核n上线执行n上线跟踪表格组件可视化设置表格组件可视化设置全过程的开发管理,提升执行效率,确保数据质量通过数据管理来提升开发效率,而加强开发管控反过来也促进了数据质量有效提升20报表组件调度类图表组件地图组件流程类邮件触发UI组件社区组件分析导航组件图形组件短信触发规则组件安全服务组件提供方便灵活的组合方式,并能和数据组件进行绑定以组件的形式保证应用在其内部的事
15、务控制动作过滤组件计算组件指标警告清洗组件封装了特定业务逻辑,有明确的输入和输出,保证业务规则的实现脑图分析路径分析预测分析用户身份信息日志审计安全集成负责BI Store 应用使用日志的记录,以及与经营分析系统安全模块交互进行客户端使用权限控制提供数据获取能力,对获取的数据需要提供明确的数据指标、指标口径、数据范围、数据时效性等丰富的组件库快速帮助实现数据资产应用21可视化的拖拽式开发类Excel的报表设计过程无失真导入无失真导入Excel文件文件体验良好、可靠高效的设计开发过程22丰富美观、实用大方的数据可视化能力23根据多年的经验积累,总结了从数据到资产的评估体系,可以帮助企业全方位的诊
16、断发现问题,并提供相应的策略来企业提高数据的健康度24通过标准化数据服务,搭建企业的应用开放平台,促进应用的百花齐放运行资源的稳定性应用上线下线管理应用共享管理信息安全管理统一数据访问接口统一应用运行机制封装好的sdk API进行开发信息推送API支持展示组件支持订阅中心数据处理开发;数据高速访问提供数据安全控制数据沙箱提供32类数据开放运行基础平台数据标准化服务基于Api二次开发统一运行环境,主机,数据库等打通与各系统的接口。统一数据中心统一的开发工具提供可二次开发的SDK包应用发布评估管理运行监控下线管理应用类型包括报表,信息推送,手机经分,手机客户端等企业应用商店25数据分析师ETL开发
17、工程师模型架构师运营程序员数据化运营商业决策产品设计理解业务文档化业务和需求BI产品设计PD业务分析师/数据PD合作伙伴合作伙伴数据产品PD购买决策行业分析营销支撑分析、挖掘用户需求数据产品设计培训,咨询,解决方案架构师技术框架设计平台与工具的实现数据产品开发团队商业智能团队数据开发团队内部用户外部用户基础开发&开发架构使用、建设建设服务能力开放,打造数据资产工厂能力开放,打造数据资产工厂26基于SQL解析实现透明数据安全访问的控制业务指标的异常自动发现算法数据库数据冗余的发现和消除算法基于TopN的多维数据诊断算法多数据库数据分发同步技术基于元数据流程图形可视化技术数据库的智能检索技术数据仓
18、库元数据管理技术DACP专有技术2专有技术1专有技术3专有技术4专有技术5专有技术6专有技术7专有技术8Non-disclosure Confidential Document. Unauthorized Copy Prohibited. Copyright 2014. All rights reserved. 273类 发展方向8项 技术专利9年 产品积累支持第三方应用集成覆盖数据资产全生命周期丰富易用的可视化管理与生产有机结合多元化运营手段有效数据资产规划评估n 产品概述n 架构功能n 部署实施n 应用案例n 联系我们2829针对已建有信息系统的企业,系统提供开放、开源的接口,可以和原有系
19、统无缝对接,不影响原有系统的使用只要硬件环境满足基础要求,即可新建一套数据置产管理的系统支持主流的数据库软件,如Oracle、SQL Server、DB2、MySql等只需500G,普通的PC硬盘即可满足要求支持开源的Tomcat,也支持专业性较高的Weblogic和Websphere数据库存储WEB服务器普通PC机即可,安装Linux操作系统运行平台部署时对平台要求低新建系统集成升级模式灵活快速安装部署学习方便建设周期短30配置说明推荐配置 主机PC Server *2 或小型机尽量采用独立的环境,单台性能建议不小于30万TPCC(具备配置视数据量的大小调整),作为数据资产云图(DACP)在
20、正式环境的核心,必须保证双击热备和7*24小时不间断运行 存储运行环境500G,数据存储5T 10T存储系统运行配置信息,日志中心,质量稽核,作业计划调度等(具体配置视数据量大小调整) 操作系统Unix、Linux、Aix、Solaris、Windows Server WEB服务器Weblogic、Tomcat数据库Oracle、DB2、Mysql、SQL Server、Teredata支持各种主流关系型数据库n 产品概述n 架构功能n 部署实施n 应用案例n 联系我们3132类别类别末端原因末端原因人员缺少对现有系统学习手段离职或变动数据源数据自相矛盾复杂规则设有被充分理解变更带来质量问题开
21、发过程时间太紧张业务规则理解错误需求理解不准确缺少测试标准和方法质量管理质量监控规则不好把握系统构架设计中缺少质量考虑质量监控带来过多性能开销优化构架质量控制1234全过程开发管理全过程质量管理元数据管理引入DACP平台质量管理开发过程数据源人员质量持续改进人员培训周期由3个月缩短至5天元数据覆盖度从30%上升至98%问题查证率提高50%节约人力资源成本30%客户现状:1、BI系统经过12年以上建设,超过10万张数据表、1600个以上应用,容量超过100T2、存在多厂家合作开发,数据质量管理主要依靠管理制度和事后稽核客户现状:1、客户计划采取Hadoop+DB2 混搭式结构实现经分域系统重构、
22、优化。2、2040个接口、功能模块,1058个模块,2700多个指标,2306个数据表重构,180个一经上报,参与团队多、周期长。效率提升跨平台,跨系统数据抽取分发。数据处理效率提升30%可视化的开发平台,建设周期缩短20%高效、灵活的报表展现工具,二次开发效率提升40%能力增强计算速度提升120%,存储能力提升5倍,为过渡到企业级大数据中心奠定基础成本降低整体性能差不多的情况下,采用DACP投资降低20%左右;DACP投入使用还释放了仓库的高端存储25T;释放了仓库额外50%的计算能力;同时通过新平台将传统仓库的详单数据的存储周期从60天提升到210天。34客户现状:1、业务部门需要开展营销
23、活动或进行业务分析,则以工单形式要求IT部门临时统计或取数。2、IT部门投入8个人负责对口,每个月完成临时统计300次以上,处理数据稽核90次以上。35指标名称指标名称维度维度说明说明移动新增客户数地市-营业厅,渠道实时联通新增客户数地市5秒电信新增客户数地市5秒业务办理量地市,业务类型,渠道类型实时计费时长地市,长途类型,漫游类型实时流量业务类型,终端类型实时通信用户数地市8秒实时刷新展示。由后台数据驱动的。只要数据有变化,直接更新到前端界面客户现状:1、3000千万在网用户,1300万竞争对手用户,希望做到实时比对2、当前数据获取和加工展现周期为1天,对于业务人员来说,只看到前一天数据演讲完毕,谢谢观看!