商务智能(第5版)课件第4章 在线分析处理

上传人:小萌新****ao 文档编号:367856566 上传时间:2023-11-15 格式:PPTX 页数:34 大小:1.16MB
返回 下载 相关 举报
商务智能(第5版)课件第4章 在线分析处理_第1页
第1页 / 共34页
商务智能(第5版)课件第4章 在线分析处理_第2页
第2页 / 共34页
商务智能(第5版)课件第4章 在线分析处理_第3页
第3页 / 共34页
商务智能(第5版)课件第4章 在线分析处理_第4页
第4页 / 共34页
商务智能(第5版)课件第4章 在线分析处理_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《商务智能(第5版)课件第4章 在线分析处理》由会员分享,可在线阅读,更多相关《商务智能(第5版)课件第4章 在线分析处理(34页珍藏版)》请在金锄头文库上搜索。

1、在线分析处理OLAP概要(1)1970年,关系数据库之父 EFCodd提出了关系模型,促进了在线事务处理(On-Line Transaction Processing,OLTP)的发展。在线事务处理通常是一个或一组记录的查询和修改,用于处理短暂的交易事务,例如银行账目更新、实时库存变化、顾客的订单与发货情况的更新以及病人健康状况的更新等。传统的系统对数据的分析和展现基本是基于二维信息的,当针对不同需求编写相应的二维报表时,会导致报表堆砌和大量的数据冗余。然而在日常决策中,决策者不能仅仅局限于粗略的数据查阅,更要注重精细的数据分析。他们往往需要从多个角度分析问题,以便发现多个变量之间的关系。例如

2、某体育用品销售公司1 月份在哪个国家的什么地区头盔销售处于领先地位?这与销售的多个方面,如产品、销售、数量、地区和时间等有关。这些观察数据的角度称为维。在多维数据上的分析称为在线分析处理(OLAP),也称为多维分析。在线分析处理进行每一次查询都要数千次甚至数万次地对数据进行扫描。传统的 OLTP 很难满足这样复杂的查询。在线分析处理OLAP概要(2)1993年,EFCodd提出了多维数据库和在线分析处理(OLAP)的概念。通常,报表反映了业务状况,告诉管理者发生了什么事情。而要明白为什么发生就需要借助OLAP,例如公司营销业绩让人不满意,什么地方的营销不好?哪些产品的营销出现了问题?OLAP

3、也称为例外分析。OLAP 用于支持复杂的多维分析操作,并最终以一种直观易懂的方式把查询结果返回给分析人员,OLAP 侧重于对中高层管理人员的决策支持。本章主要介绍 OLAP 相关概念、OLAP 与 OLTP 的比较、多维数据操作、OLAP 操作语言、OLAP 工具介绍以及综合实例等内容。OLAP 简介 基本概念(1)变量变量:变量是数据度量的指标,是数据的实际意义。图中的数据“560”本身并没有意义,但如果描述2007年第一季度大中华区 LCD 的销售量是560 万台,则数据560就有了实际意义,代表了产品销售量的度量。年、季度和月份是描述时间的三个层次,10万是变量销售额的值。通常也把变量称

4、为度量。维维:维是与业务主题相关的一组属性,单个属性或属性集合可以构成一维。例如计算机配件销售随着时间推移而产生的变化,这是从时间的角度对产品的销售进行观察。如果把一个主题的多种属性定义为多个维,那么用户就能够从多个角度组合分析销售情况。如图所示,可以从时间维、产品维(CPU、主板、LCD、硬盘、显卡和内存)和地区维(大中华区、北美区、拉丁美洲)分析销售量。OLAP 简介 基本概念(2)维的层次维的层次:一个维往往可以具有多个层次,例如时间维分为年、季度、月和日等层次,地区维可以分为国家、地区、省、市等层次。这里的层次表示数据细化程度,对应概念分层。后面提到的上钻操作就是由低层概念映射到较高层

5、概念。概念分层除了根据概念的全序和偏序关系确定外,还可以通过对数据进行离散化或分组来实现。维的成员维的成员:维是多层次的,不同层次的取值构成一个维成员,例如,某年某季度、某季度某月等都可以是时间维的成员。OLAP 简介 基本概念多维数组多维数组:多维数组用维和度量的组合表示一个多维数组,可以表示为(维1,维2,维n,度量),例如(月份,地区,产品,销售额)组成一个多维数组。数据单元(单元格)数据单元(单元格):多维数组的取值。当多维数组中每个维都有确定的取值时,就唯一确定一个变量的值。数据单元可以表示为(维1成员,维2成员,维n 成员,度量值),例如(2007年第一季度,大中华区,LCD,56

6、0万台)表示一个数据单元:2007 年第一季度大中华区 LCD产品销售560万台。OLAP 简介 基本概念事实事实:事实是不同维度在某一取值下的度量,例如 上述2007年第一季度 LCD 在大中华区的销售额是560万台就表示在时间、产品和地区三个维度上企业销售事实的度量,同时包含时间维度的两个层次:年和季度。有关销售的多维分析视图如图所示。OLAP 简介 OLAP的定义OLAP是由 EFCodd提出,目前已出现了很多在线分析处理的定义:OLAP是一种共享多维信息的快速分析技术;OLAP利用多维数据库技术使用户可以从不同角度观察数据;OLAP用于支持复杂的分析操作,侧重对管理人员的决策支持,可以

7、满足分析人员快速、灵活地进行大数据量的复杂查询的要求,并且以一种直观易懂的形式呈现查询结果,辅助决策;OLAP是针对特定问题的在线数据访问和分析;OLAP是通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理人员对数据进行深人观察。上面定义从各个角度对在线分析处理给予了不同的解释,OLAP 委员会(OLAP Council)则给出了较为正式和严格的定义:在线分析处理是使管理人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的并真实反映业务维特性的信息进行快速、一致和交互的存取,从而获得对数据更深人的理解。OLAP 简介 OLAP的特点OLAP 的多维性、层次、

8、维度计算以及结构与视图的分离等特点。快速、可分析、共享和多维等。OLTP与OLAP的区别在线事务处理是事件驱动、面向应用的,其主要特点是性能要求高,用户数量大。在线分析处理则支持复杂的分析,侧重于为管理人员提供决策支持,并以直观的形式呈现结果。在线事务处理与在线分析处理的主要区别如表所示。OLAP操作在线分析处理比较常用的操作包括切片(slice)与切块(dice)、上钻(drill-up)与下钻(drill-down)以及旋转(rotate)等。在线分析处理还能对多维数据进行深加工。在线分析处理的这些操作使用户从多个视角观察数据,并以图形、报表等多种形式表示,从而获取隐藏在数据中的信息。OL

9、AP操作实例 多维数据OLAP操作实例 切片与切块切片和切片和切块切块:选定多维数组的1维成员做数据分割的操作称为该维上的一个切片。在服装消费实例分析中,对“性别、年龄、月收人”三维立方体选取年龄段进行切片,可得到2630岁年龄段不同月收入人群中男女消费者的购买信息。OLAP操作 切片与切块常把多维数组中选定一个三维子集的操作视为切块。图所示为多维数组(a)选取年龄段2130岁进行切块,可得到此年龄段不同月收人下男女消费者的购买情况(性别,2130岁,月收人,购买百分比)。类似地,多维数组(b)和多维数组(c)均对应多维立方体的切块。OLAP操作 切片与切块当某维只取一个维成员时,便得到一个切

10、片,而切块则是某一维取值范围下的多个切片的叠合。通过对立方体的切片或切块分割,可以从不同视角得到各种数据,包括各个年龄段下女性顾客在不同月收人下的服装购买情况,或者是中档收入下不同年龄段的购买情况。切片与切块的作用是对数据进行过滤,使用户专注于局部信息。OLAP操作 钻取钻取包括上钻、下钻等操作。钻取能够帮助用户获得更多的细节性数据。例如,管理者要了解计划完成情况,可以打开相关的报表查看利润数据。通过与计划值比较,正常的数据显示为绿色,否则显示为红色。红色的数值意味着企业的运营出现了问题,可以进一步查看这些数据的细节,逐层分析问题的所在和原因。图中显示某零售企业销售分析的下钻功能界面。OLAP

11、操作 钻取上钻上钻:上钻又称上卷 roll-up,上钻操作是指通过一个维的概念分层向上攀升或者通过维归约在数据立方体上进行数据汇总。例如,在服装购买顾客调查中,可以按月收人分段汇总数据,把较低、中档与较高归约为有收人,便可以得到沿月收人维上钻的数据汇总;也可以按年龄分段汇总数据,把16岁以下与1620岁归约为青少年,2125岁、2630岁与 3135岁归约为青年,3640岁与40岁以上归约为中老年,从而得到沿年龄段维上钻的数据汇总视图。OLAP操作 钻取下钻下钻:下钻是上钻的逆操作。通过对某一汇总数据进行维层次的细分。下钻使用户对数据能够获得更深人的了解,更容易发现问题的本质,从而做出正确的决

12、策。钻取使用户不会被海量的数据搞得晕头转向:上钻使用户可以站在更高层次观察数据,下钻则可以细化到用户所关心的详细数据。钻取的深度与维所划分的层次相对应,根据用户关心的数据粒度来合理划分。OLAP操作 旋转旋转旋转又称为转轴(pivot),它通过旋转变换一个报告或页面显示的维方向,在表格中重新安排维的放置,如行列互换。这种对立方体的重定位可以得到不同视角的信息。OLAP操作 其他OLAP操作除以上常用的多维操作外,还有其他多维操作:钻过(钻过(drill-across):钻过操作涉及多个事实表的查询并把结果合并为单个数据集。一个典型的例子就是预测数据与当前数据的结合。通常预测数据与当前数据存在于

13、不同的表中,当用户比较预测销售与当前销售时,需要跨多个事实表查询。钻透(钻透(drill-through):钻透使用SQL,查询到数据立方体的底层,一直到后端的关系表。OLAP操作 案例web文档的 OLAP 分析 读者一般从多个方面查询 web文档:文档的作者、主题、标题、日期、大小、作者单位和出版社等,对应 web文档立方的维。可以对文档立方进行各种多维分析,如切片、切块、旋转以及钻取等操作,从多个角度分析文档。例如,从中可以得到中国哪所大学在过去几年的视频会议领域发表了最多的论文。OLAP操作 实例一个数据立方体,以客户、需求日期和雇员维度,运费为度量。OLAP的分类 按照处理方式分类按

14、照处理方式分类是指OLAP 按照数据处理的地点可以分为服务器端在线分析处理(Server-side OLAP 或 Server OLAP)和客户端在线分析处理(Client-side OLAP 或 Client OLAP)。Server OLAP:绝大多数 OLAP 系统都属于此类,Server OLAP 在服务器端的数据库上建立多维数据立方体,由服务器端提供多维分析,并把最终结果呈现给客户端。Client OLAP:与服务器端在线分析处理相反,Client OLAP 把相关立方体数据下载到本地,由本地为用户提供多维分析,从而保证在出现网络故障时仍然能正常工作。这类 OLAP 产品往往轻便、简

15、洁。例如,Cognos(IBM)的 Powerplay 产品提供了简洁部署且具有交互性的 PowerPlay Web Explorer界面,其他代表产品还有Brio Designer等。OLAP的分类 按照存储方式分类OLAP 按照存储器的多维数据存储方式可以分为:(1)关系在线分析处理(Relational OLAP,ROLAP)(2)多维在线分析处理(Multi-dimensional OLAP,MOLAP)(3)混合在线分析处理(Hybrid OLAP,HOLAP)OLAP的分类 按照存储方式分类ROLAP:ROLAP 使用关系数据库管理系统(RDBMS)或扩充关系数据库管理系统(XRD

16、BMS)存储和管理数据仓库,以关系表存储多维数据,有较强的可伸缩性。其中维数据存储在维表,而事实数据和维ID 则存储在事实表,维表和事实表通过主键和外键关联。此外,ROLAP 通过一些软件工具实现,物理层仍用关系数据库的存储结构,因此称为虚拟 OLAP(virtual OLAP)。MOLAP:MOLAP支持数据的多维视图,采用多维数组存储数据,它把维映射到多维数组的下标或下标的范围,而事实数据则存储在数组单元中,从而实现了多维视图到数组的映射,形成了立方体(cube)结构。但随着维数的增加,大容量的数据可能使立方体稀疏化,此时需要借助稀疏矩阵压缩技术来处理。由于 MOLAP 是从物理层实现,采用了多维数组的存储结构,故又称为物理 OLAP(physical OLAP)。OLAP的分类 按照存储方式分类HOLAP:HOLAP 有机结合了 ROLAP 和 MOLAP 技术。许多商务智能提供商,如 Speedware和 Microsoft等公司在其产品中都应用了 HOLAP。在 MOLAP 立方体中存储高级别的聚集,在 ROLAP 中存储低级别的聚集,使得 HOLAP同时具有ROLAP的可伸

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号