第 4 章数据仓库的决策支持数据仓库的决策支持 4.1数据仓库的用户数据仓库的用户 4.2数据仓库的决策支持与决策支持系统数据仓库的决策支持与决策支持系统4.3 数据仓库应用实例数据仓库应用实例4.1数据仓库的用户数据仓库的用户 4.1.1 信息查询者信息查询者4.1.2 知识探索者知识探索者数据仓库的用户:信息查询者和知识探索者数据仓库的用户:信息查询者和知识探索者n信息查询者是使用数据仓库的大量用户信息查询者是使用数据仓库的大量用户信息查询者以一种可预测的、重发性的方式使信息查询者以一种可预测的、重发性的方式使用数据仓库平台用数据仓库平台信息查询者通常查看概括数据或聚集数,查看信息查询者通常查看概括数据或聚集数,查看相同的商业维度(如产品、客户、时间)和指相同的商业维度(如产品、客户、时间)和指标(如收入和成本)随时间的发展趋势标(如收入和成本)随时间的发展趋势n知识探索者完全不同于信息查询者,他们有一知识探索者完全不同于信息查询者,他们有一个完全不可预测的、非重复性的数据使用模式个完全不可预测的、非重复性的数据使用模式知识探索者的任务是寻找公司数据内隐含的知识探索者的任务是寻找公司数据内隐含的价值并且根据过去事件努力预测未来决策的结价值并且根据过去事件努力预测未来决策的结果。
果知识探索者是典型的数据挖掘者知识探索者是典型的数据挖掘者64.1.1 信息查询者信息查询者信息查询者使用数据仓库能发现目前存在的问题信息查询者使用数据仓库能发现目前存在的问题创建数据阵列创建数据阵列 将相关的数据(每月的数据)放在同一个物理位将相关的数据(每月的数据)放在同一个物理位置上预连接表格预连接表格 对于两个或多个表格共享一个公用链,对于两个或多个表格共享一个公用链,可以将多可以将多个表格合并到一个物理表格中这样做可以个表格合并到一个物理表格中这样做可以很大程度的提高数据访问效率很大程度的提高数据访问效率7预聚集数据预聚集数据以每天为基础存储数据在一周结束时,以每周为以每天为基础存储数据在一周结束时,以每周为基础存储数据(即累加每天的数据)月末时,基础存储数据(即累加每天的数据)月末时,则以每月为基础存储数据则以每月为基础存储数据聚类数据聚类数据聚类将数据放置在同一地点,这样可以提高对聚类聚类将数据放置在同一地点,这样可以提高对聚类数据的查询数据的查询84.1.2知识探索者知识探索者发现的问题并找出原因发现的问题并找出原因创建一个单独的探索仓库,不影响数据仓库的常创建一个单独的探索仓库,不影响数据仓库的常规用户。
同时采用规用户同时采用“标识技术标识技术”进行数据压缩,进行数据压缩,提高数据分析速度提高数据分析速度使用一些使用一些模型模型帮助决策分析,例如客户分段、欺帮助决策分析,例如客户分段、欺诈监测、信用分险、客户生存期、渠道响应、诈监测、信用分险、客户生存期、渠道响应、推销响应等模型推销响应等模型通过模型的计算来得出一些有价值的商业知识通过模型的计算来得出一些有价值的商业知识9采用数据挖掘工具来获取商业知识采用数据挖掘工具来获取商业知识例如,得到如下一些知识:例如,得到如下一些知识:n哪些商品一起销售好?哪些商品一起销售好?n哪些商业事务处理可能带有欺诈性?哪些商业事务处理可能带有欺诈性?n高价值客户的共同点是什么?高价值客户的共同点是什么?获取的知识为企业领导者提供决策支持,达到获取的知识为企业领导者提供决策支持,达到保留客户,减少欺诈,提高公司利润具有重保留客户,减少欺诈,提高公司利润具有重要作用4.2 4.2 数据仓的决策支持与决策支持系统数据仓的决策支持与决策支持系统4.2.1 查询与报表查询与报表4.2.2 多维分析与原因分析多维分析与原因分析4.2.3 预测未来预测未来4.2.4 实时决策实时决策4.2.5 自动决策自动决策4.2.6 决策支持系统决策支持系统数据仓库是一种能够提供重要战略信息,并获得数据仓库是一种能够提供重要战略信息,并获得竞争优势的新技术,从而得到迅速的发展。
竞争优势的新技术,从而得到迅速的发展具体的战略信息有:具体的战略信息有:n给出销售量最好的产品名单给出销售量最好的产品名单n找出出现问题的地区(切片)找出出现问题的地区(切片)n追踪查找出现问题原因(向下钻取)追踪查找出现问题原因(向下钻取)n对比其他的数据(横向钻取)对比其他的数据(横向钻取)n显示最大的利润显示最大的利润n当一个地区的销售低于目标值时,提出警告信息当一个地区的销售低于目标值时,提出警告信息n建立数据仓库的目的不只是为了存储更多的数建立数据仓库的目的不只是为了存储更多的数据,而是要对这些数据进行处理并转换成商业据,而是要对这些数据进行处理并转换成商业信息和知识,利用这些信息和知识来支持企业信息和知识,利用这些信息和知识来支持企业进行正确的商业行动,并最终获得效益进行正确的商业行动,并最终获得效益n数据仓库的功能是在恰当的时间,把准确的信数据仓库的功能是在恰当的时间,把准确的信息传递给决策者,使他能作出正确的商业决策息传递给决策者,使他能作出正确的商业决策4.2.1 查询与报表查询与报表1.查询查询(1)能向用户提供查询的初始化,公式表示和结果显)能向用户提供查询的初始化,公式表示和结果显示等功能。
示等功能2)由元数据来引导查询过程)由元数据来引导查询过程(3)用户能够轻松地浏览数据结构)用户能够轻松地浏览数据结构(4)信息是用户自己主动索取的,而不是数据仓库强)信息是用户自己主动索取的,而不是数据仓库强加给他们的加给他们的(5)查询环境必须要灵活地适应不同类型的用户)查询环境必须要灵活地适应不同类型的用户2.报表报表(1)预格式化报表预格式化报表2)参数驱动的预定义报表参数驱动的预定义报表3)简单的报表开发简单的报表开发4)公布和订阅公布和订阅5)传递选项传递选项6)多数据操作选项多数据操作选项7)多种展现方式选项多种展现方式选项4.2.2 多维分析与原因分析多维分析与原因分析1、多维分析、多维分析通过多维分析将获得在各种不同维度下的实际商通过多维分析将获得在各种不同维度下的实际商业活动值(如销售量等),特别是他们的变化业活动值(如销售量等),特别是他们的变化值和差值,达到辅助决策效果值和差值,达到辅助决策效果例如通过多维分析得到如下信息:例如通过多维分析得到如下信息:n今年以来,公司的哪些产品量是最有利润的?今年以来,公司的哪些产品量是最有利润的?n最有利润的产品是不是和去年一样的?最有利润的产品是不是和去年一样的?2、原因分析、原因分析查找问题出现的原因是一项很重要的决策查找问题出现的原因是一项很重要的决策支持任务,一般通过多维数据分析的支持任务,一般通过多维数据分析的“向下钻取向下钻取”操作来完成。
操作来完成某公司从分析报表中得知最近几个月来整某公司从分析报表中得知最近几个月来整个企业的利润在急速下滑,通过人机交个企业的利润在急速下滑,通过人机交互找出该企业利润下滑的原因互找出该企业利润下滑的原因1)查询整个公司最近)查询整个公司最近3个月来各个月份的销售额和利润,个月来各个月份的销售额和利润,显示销售额正常,但利润下降显示销售额正常,但利润下降2)查询全世界各个区域每个月的销售额和利润,显示欧洲)查询全世界各个区域每个月的销售额和利润,显示欧洲地区销售额下降,利润急剧下降地区销售额下降,利润急剧下降3)查询欧洲各国销售额和利润显示一些国家利润率上升,)查询欧洲各国销售额和利润显示一些国家利润率上升,一些国家持平,欧盟国家利润率急剧下降一些国家持平,欧盟国家利润率急剧下降4)查询欧盟国家中的直接和间接成本得到直接成本没有)查询欧盟国家中的直接和间接成本得到直接成本没有问题,但间接成本提高了问题,但间接成本提高了5)查询间接成本的详细情况得出企业征收了额外附加税,)查询间接成本的详细情况得出企业征收了额外附加税,使利润下降使利润下降通过原因分析,得到企业利润下滑的真正原因是欧盟国家征通过原因分析,得到企业利润下滑的真正原因是欧盟国家征收了额外附加税造成。
收了额外附加税造成4.2.3 预测未来预测未来预测未来使决策者了解预测未来使决策者了解“将要发生什么将要发生什么”数据仓库中存放了大量的历史数据,数据仓库中存放了大量的历史数据,从历史数据从历史数据中找出变化规律,将可以用来预测未来中找出变化规律,将可以用来预测未来在进行预测的时候需要用到一些行预测的时候需要用到一些预测模型预测模型最常用的预测方法是采用回归模型,包括线性回归或的预测方法是采用回归模型,包括线性回归或非线性回归非线性回归采用聚类模型或分类模型也能达到一定的预测效采用聚类模型或分类模型也能达到一定的预测效果4.2.4 实时决策实时决策n企业需要准确了解企业需要准确了解“正在发生什么正在发生什么”,从而需,从而需要建立要建立动态数据仓库(实时数据库动态数据仓库(实时数据库),用于支),用于支持战术型决策,即实时决策持战术型决策,即实时决策n战术性决策支持的重点则在企业外部,支持的战术性决策支持的重点则在企业外部,支持的是执行公司战略的员工第四种侧重在战术性是执行公司战略的员工第四种侧重在战术性决策支持决策支持以货运为例以货运为例n 卡车上的货物常常需要把某些货物从一辆车转移到卡车上的货物常常需要把某些货物从一辆车转移到另一辆车上,以便最终送抵各自的目的地。
另一辆车上,以便最终送抵各自的目的地n当某些卡车晚点时,就要做出艰难的决定:是让后继当某些卡车晚点时,就要做出艰难的决定:是让后继的运输车等待迟到的货物,还是让其按时出发的运输车等待迟到的货物,还是让其按时出发n如果后继车辆按时出发而未等待迟到的包裹,那么迟如果后继车辆按时出发而未等待迟到的包裹,那么迟到包裹的服务等级就会大打折扣到包裹的服务等级就会大打折扣n反过来说,等待迟到的包裹则将损害在后继的运输车反过来说,等待迟到的包裹则将损害在后继的运输车上的其他待运包裹的服务等级上的其他待运包裹的服务等级n运输车究竟等待多长时间,取决于需卸装到该车辆的运输车究竟等待多长时间,取决于需卸装到该车辆的所有延迟所有延迟货物的服务等级货物的服务等级和已经装载到该车辆的货物和已经装载到该车辆的货物的服务等级的服务等级4.2.5 自动决策自动决策n利用动态数据库自动决策,达到利用动态数据库自动决策,达到“希望发生什希望发生什么么”为了寻求决策的有效性和连续性,企业为了寻求决策的有效性和连续性,企业就会趋向于采取自动决策就会趋向于采取自动决策n动态数据仓库可以为整个企业提供战略决策支动态数据仓库可以为整个企业提供战略决策支持,也可提供战术决策支持。
确切地说,动态持,也可提供战术决策支持确切地说,动态数据仓库同时支持这两种方式数据仓库同时支持这两种方式n随着技术的进步,越来越多的决策由事件触发,随着技术的进步,越来越多的决策由事件触发,自动发生自动发生4.2.6 决策支持系统决策支持系统n数据仓库整合了企业的各种信息来源,能确保一致与数据仓库整合了企业的各种信息来源,能确保一致与正确详细的数据它是一个庞大的数据资源要将数正确详细的数据它是一个庞大的数据资源要将数据转换成商业智能,就需要利用数据仓库来建立决策据转换成商业智能,就需要利用数据仓库来建立决策支持系统支持系统n基于数据仓库的决策支持系统是针对实际问题,基于数据仓库的决策支持系统是针对实际问题,利用利用分析工具或者编制程序,采用一种或多种组合的决策分析工具或者编制程序,采用一种或多种组合的决策支持能力,对数据仓库中的数据进行多维分析,支持能力,对数据仓库中的数据进行多维分析,从而从而掌握企业的经营现状,找出现状的原因,并预测未来掌握企业的经营现状,找出现状的原因。