第5章:基于数据仓库的决策支持系统ppt课件

上传人:我*** 文档编号:148616268 上传时间:2020-10-21 格式:PPT 页数:54 大小:241KB
返回 下载 相关 举报
第5章:基于数据仓库的决策支持系统ppt课件_第1页
第1页 / 共54页
第5章:基于数据仓库的决策支持系统ppt课件_第2页
第2页 / 共54页
第5章:基于数据仓库的决策支持系统ppt课件_第3页
第3页 / 共54页
第5章:基于数据仓库的决策支持系统ppt课件_第4页
第4页 / 共54页
第5章:基于数据仓库的决策支持系统ppt课件_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《第5章:基于数据仓库的决策支持系统ppt课件》由会员分享,可在线阅读,更多相关《第5章:基于数据仓库的决策支持系统ppt课件(54页珍藏版)》请在金锄头文库上搜索。

1、1,第5章,基于数据仓库的决策支持系统 (2),2,第(2)部分,5.2 联机分析处理 5.3 数据仓库的决策支持,3,5.2 联机分析处理,5.2.1 基本概念 5.2.2 OLAP数据组织 5.2.3 OLAP的决策支持:多维数据分析 5.2.4 OLAP的应用实例,4,联机分析处理(On Line Analytical Processing,OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。 在数据仓库系统中,联机分析处理是重要的数据分析工具。 OLAP的基本思想是从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。,5.2.1 基本概念,5,OLAP是

2、在OLTP的基础上发展起来的。 OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。 OLAP是以数据仓库为基础的数据分析处理。它有两个特点: 一是在线性(On Line),由客户机/服务器这种体系结构来完成的; 二是多维分析,这也是OLAP的核心所在。,1、OLAP的定义,联机分析处理是共享多维信息的快速分析。 它体现了四个特征: (1)快速性:用户对OLAP的快速反应能力有很高的要求 (2)可分析性:OLAP系统应能处理任何逻辑分析和统计分析。 (3)多维性:系统必须提供对数据分析的多维视图和分析 (4)信息性:OLAP系统应能及时获得信息,

3、并且管理大容量的信息。,7,1993年,E.F.Codd提出OLAP的12条准则,其主要的准则有:多维数据分析;客户/服务器结构;多用户支持;一致的报表性能等。,2、OLAP准则,8,1.多维概念视图,企业的数据空间本身就是多维的。因此OLAP的概念模型也应是多维的。 用户可以对多维数据模型进行切片、切块、旋转坐标或进行多维的联合(概括和聚集)分析。,9,4.稳定的报表性能,报表操作不应随维数增加而削弱,即 当数据维数和数据的综合层次增加时,提 供的报表能力和响应速度不应该有明显的 降低。,10,5客户/服务器体系结构,OLAP是建立在客户/ 服务器体系结构上的。 要求多维数据库服务器能够被不

4、同的应用和工具所访问。,11,8多用户支持 当多个用户要在同一分析模式上并行工作,需要这些功能的支持。 11灵活的报表生成 报表必须充分反映数据分析模型的多维特征,并可按用户需要的方式来显示它。,OLAP是针对特定问题的联机数据访问和分析。 (1)变量 :变量是数据的实际意义,即描述数据“是什么”。 (2)维:维是人们观察数据的特定角度。如产品维、顾客维、时间维等。 (3)维的层次:数据的细节不同程度为维的层次。如日、月、季、年是时间维的层次。 (4)维成员:维的一个取值称为该维的一个维成员。如“某年某月某日”是时间维的一个成员。,3、OLAP的基本概念,(5)多维数组:一个多维数组可以表示为

5、: (维1,维2,维n,变量) 一个5维的结构,即 (产品,地区,时间,销售渠道,销售额) (6)数据单元(单元格): 多维数组的取值称为数据单元。 如:5维数据单元 (牙膏,上海,1998年12月,批发,销售额为100000)。,(1)OLTP OLTP是低层人员利用计算机网络对数据库中的数据进行查询、增、删、改等操作,以完成事务处理工作。 OLTP利用数据库快速地处理具体业务。OLTP应用要求多个查询并行。,4、OLAP与OLTP的关系与比较,(2)OLAP OLAP是高层人员对数据仓库进行信息分析处理。 存取大量的数据 包含聚集的数据 按层次对比不同时间周期的聚集数据 以不同的方式来表现

6、数据 要包含数据元素之间的复杂的计算 能够快速的响应用户的查询,(3)OLAP与OLTP对比(对比表),17,5.2.2 OLAP的数据组织,MOLAP和ROLAP是OLAP的两种具体形式: ROLAP是基于关系数据库存储方式建立的OLAP。 多维数据映射成平面型的关系表。采用星型模型。,18,MOLAP是基于多维数据库存储方式建立的OLAP;表现为“超立方”结构,类似于多维数组的结构。 在分析中,需要“旋转”数据立方体以及“切片” 、“切块”等操作。,MOLAP和ROLAP的对比表,20,例如,以“产品、城市、时间”三维数据,如图,5.2.3 OLAP的决策支持: OLAP多维数据分析,21

7、,1、切片和切块,对三维数据,通过“切片” ,分别从城市和产品等不同的角度观察销售情况:,22,2、钻 取,钻取:例如,2005年各部门销售收入表如下:,部门销售数据表,23,对时间维进行下钻到季度操作,获得新表如下:,24,3.旋转,通过旋转可以得到不同视角的数据。旋转操作相当于平面数据将坐标轴旋转。 或是把页面显示中的一个维和页面外的维进行交换(令其成为新的行或列中的一个),25,旋 转,26,旋转前的数据,实例,27,旋转后的数据,28,旋转后再切片,29,2、广义OLAP功能,1、基本代理操作 “代理”是一些智能性代理,当系统处于某种特殊状态时提醒分析员。 (1)示警报告 定义一些条件

8、,一但条件满足,系统会提醒分析员去做分析。如每日报告完成或月定货完成等通知分析员作分析。 (2)异常报告 当超出边界条件时提醒分析员。如销售情况已超出预定义阈值的上限或下限时提醒分析员。,30,2、计算能力 计算引擎用于特定需求的计算或某种复杂计算。 3、模型计算 增加模型,如增加系统优化、统计分析、趋势分析等模型,以提高决策分析能力。,31,假设有一个5维数据模型,5个维分别为:商店,方案,部门,时间,销售。 1三维表查询 在指定“商店=ALL,方案=现有”情况的三维表(行为部门,列为时间和销售量),5.2.4、OLAP的应用实例,指定商店、方案后的三维表,2、向下钻取 对汽车部门向下钻取出

9、具体项目的销售情况和利润增长情况。,3、切片表 切片(Slice)操作是除去一些列或行不显示,4、旋转表 这次旋转操作得到2009年的交叉表方案为:现有、计划、 差量、差量%。,36,5.3.1 查询与报表 5.3.2 多维分析与原因分析 5.3.3 預测未来 5.3.4 实时决策 5.3.5 自动决策,5.3 数据仓库的决策支持,37,5.3.1 查询与报表,查询和报表是数据仓库的最基本、使用的最多的决策支持方式。 通过查询和报表使决策者了解“目前发生了什么”。,38,查询服务,(1)查询定义。能够容易地将商业需求转换成适当的查询语句。 (2)查询简化。让用户能够简单地查看数据的结构和属性。

10、 (3)导航。用户能够使用元数据在数据仓库中浏览数据。 (4)结果显示。能够以各种方法显示查询结果。 (5)对聚集的查询。能够将查询重新定义到聚集表格上,以加快检索速度。,39,2、报表,(1)预格式化报表。用户能够容易选择他们需要的报表。 (2)参数驱动的预定义报表。用户必须有能力来设置它们自己的参数,用预定义格式创建报表。 (3)简单的报表开发。用户能够利用报表语言撰写工具来开发他们自己的报表。 (4)多数据操作选项。用户通过交换行和列变量来实现结果的旋转,在结果中增加小计和最后的总计,以及改变结果的排列顺序等操作。 (5)多种展现方式选项。提供多种类型的选项,包括图表、表格、柱形格式、字

11、体、风格、大小和地图等。,40,5.3.2 多维分析与原因分析,多维分析与原因分析能让决策者了解“为什么会发生”。 1、多维分析 获得在各种不同维度下的实际商业活动值(如销售量等),特别是他们的变化值和差值,达到辅助决策效果。 2、原因分析 查找问题出现的原因是一项很重要的决策支持任务,一般通过多维数据分析的钻取操作来完成。,41,例如,某公司从分析报表中得知最近几个月来整个企业的利润在急速下滑,通过人机交互找出该企业利润下滑的原因。具体步骤如下: (1)查询整个公司最近3个月来各个月份的销售额和利润,通过检索数据仓库中的数据显示销售额正常,但利润下降。 (2)通过多维数据的切块,查询全世界各

12、个区域每个月的销售额和利润,显示欧洲地区销售额下降,利润急剧下降,其它地区正常。,42,(3)通过对多维数据的钻取,查询欧洲各国销售额和利润。显示一些国家利润率上升,一些国家持平,欧盟国家利润率急剧下降。 (4)通过对多维数据的钻取,查询欧盟国家中的直接和间接成本。得到欧盟国家的直接成本没有问题,但间接成本提高了。 (5)通过钻取查看详细数据,查询间接成本的详细情况。得出企业征收了额外附加税,使利润下降。 通过以上的原因分析,得到企业利润下滑的真正原因是欧盟国家征收了额外附加税造成。,43,5.3.3預测未来,预测未来使决策者了解“将要发生什么”。 从历史数据中找出变化规律,将可以用来预测未来

13、。 需要用到一些预测模型。最常用的预测方法是采用回归模型。预测时,代入预测的时间到回归方程中去就能得到预测值。 一般的预测模型有:多元回归模型、三次平滑预测模型,生长曲线预测模型等。,44,5.3.4 实时决策,数据仓库的第4种决策支持是企业需要准确了解“正在发生什么”,从而需要建立动态数据仓库(实时数据库),用于支持战术型决策,即实时决策。有效地解决当前的实际问题。 第1到第3种决策支持的数据仓库都以支持企业内部战略性决策为重点,帮助企业制定发展战略。 第4种决策支持侧重在战术性决策支持。 动态数据仓库能够逐项产品、逐个店铺、逐秒地作出最佳决策支持。,45,5.3.5 自动决策,数据仓库的第

14、5种决策支持是由事件触发,利用动态数据库自动决策,达到“希望发生什么”。 例如,电子货架标签技术结合动态数据仓库,可以帮助企业按照自己的意愿,实现复杂的价格管理自动化; 对于库存过大的季节性货物,这项技术会自动实施复杂的降价策略,以便以最低的损耗售出最多的存货。,46,5.4.3 数据仓库应用实例,NCR公司成功地开发了很多实际数据仓库系统,在此介绍一例典型的数据仓库系统。 实例:金融业数据仓库解决方案 数据仓库是金融银行机构实现客户关系管理(Customer Relationship Management)的核心技术,也是金融银行业竞争优势的来源,主要的应用业务部门为信用卡部、信贷部、市场部

15、和零售业务部等,应用领域是以客户为中心的的分销渠道管理、客户利润分析、客户关系优化、风险评估和管理。,47,银行只有通过以客户为中心(Customer Centric)的数据仓库决策支持系统,才能使用科学的方法实现个性化服务。 数据仓库系统存放每一位客户同银行往来的详细的历史交易明细数据,对客户有统一的视图。 能帮助银行业务用户以科学的手段快速地分析、模拟和预测客户的个性化需求,进而设计符合客户需求的产品或服务。 通过客户喜好的渠道完成交易,是增强商业银行竞争能力最有效的手段。,48,什么是个性化服务呢?可以从客户和银行的观点来看。 客户认为个性化服务是:银行知道我(Who)在什么时间(Whe

16、n)、需要什么产品或服务(What)、以我可以接受的价格(How Much)、经由我喜好的分销渠道(Where),对我提供销售。,49,银行的定义是:以有竞争性的产品或服务(What)、在适当的时间(When)、通过适当的分销渠道(Where)、对信用好风险低的客户(Who)、以合理的价格(How Much)和利润(Profitable)完成销售。 两者都是在精打细算的前提下,以达成各自的需求和目标。,50,1、分销渠道的分析和管理,银行通过分析知道客户、渠道、产品或服务三者之间的关系; 了解客户的购买行为; 客户或渠道对业务收入的贡献; 哪些客户比较喜好经由什么渠道在何时和银行打交道; 目前的分销渠道的服务能力如何; 需要增加哪些分销渠道才能达到预期的服务水平。,51,2、利润评价模型,建立所有客户的每一个帐号的利润评价模型,以便了解每一位客户对银行的总利润贡献度。 银行可以依客户的利润贡献度安排合适的分销渠道提供服务和销售,知道哪些有利润

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号