第二部分之二课件

上传人:我*** 文档编号:138996794 上传时间:2020-07-19 格式:PPT 页数:38 大小:1,001.50KB
返回 下载 相关 举报
第二部分之二课件_第1页
第1页 / 共38页
第二部分之二课件_第2页
第2页 / 共38页
第二部分之二课件_第3页
第3页 / 共38页
第二部分之二课件_第4页
第4页 / 共38页
第二部分之二课件_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《第二部分之二课件》由会员分享,可在线阅读,更多相关《第二部分之二课件(38页珍藏版)》请在金锄头文库上搜索。

1、第3章联机分析处理(OLAP),引例:为什么需要联机分析,在市场经济的激烈竞争中,信息对于企业的生存和发展起着至关重要的作用。企业对信息的需求是多方面的,为了避免企业中各部门或各用户间的冲突和简化用户的数据视图,一种称作“抽取程序”的方法被广泛地应用。 比如,市场部人员通常只关心企业的销售、市场策划方面的信息,而不注重企业的研发、生产等其他环节。因此,将销售、市场策划方面的信息抽取出来单独建立部门级的数据库很有必要,这样可以提高数据的访问效率。,在部门级数据的基础上可能还要被继续执行抽取程序,以建立个人级的数据库。比如,专门负责制作公司财务报表的数据人员,常常需要从财务部门的数据库系统中抽取数

2、据。又如,部门经理可能经常抽取常用的数据到本地,有针对性的建立个人级数据库就显得尤为重要。 随着数据的逐层抽取,很可能最终导致系统内的数据间形成了错综复杂的网状结构,如图所示,人们形象地称为“蜘蛛网”。一个大型的公司每天进行上万次的数据抽取很普遍。这种演变不是人为制造的,而是自然演变的结果。企业的规模越大,“蜘蛛网”问题就越严重。,网上的任意两个节点的数据可能归根结底是从一个原始库中抽取出来的,但其数据没有统一的时间基准,因而错综复杂的抽取与访问将产生很多问题,主要有以下几个方面。,数据分析的结果缺乏可靠性 展示了某企业的市场部和计划部对项目I是否具有市场前景的分析过程和结果。市场部认为“项目

3、I的市场前景很好”,而计划部却得到截然相反的结果-“项目I没有市场前景”。作为企业的最终决策者,将如何根据这样的结论进行决策呢? 为什么分析同一个企业数据库中的数据,却得到截然相反的结论呢? 首先,两部门可能抽取数据的内容不同。比如,市场部抽取的是项目I在大客户中的应用情况,而计划部抽取的是项目I在普通客户中的应用情况。,其次,可能两部门抽取数据的时间不同。如市场部在星期日晚上提取分析所需的数据,而计划部在星期三下午就抽取了数据。有任何理由相信对某一天抽取的数据样本进行分析与对另一天抽取的数据样本进行的分析可能相同吗?当然不能!企业内的数据总是在变的。 再次,引用外部信息的不同。分析项目的发展

4、趋势常常需要引入企业外部的信息,比如报刊信息、国家的政策等。市场部门引用的外部信息来源可能与计划部门不同,而外部信息自然是仁者见仁,智者见智,这也可能是导致最终分析结果不同的原因。 最后,分析程序的差异。市场部门使用的分析程序可能与计划部门不同,分析的内容和指标也可能不同。,教学目标,掌握联机分析处理的基本概念 掌握多维分析方法。,教学要求,本章内容,数据立方 OLAP的基本概念 OLAP与多维分析 OLAP的分类,数据立方,数据立方是从数据仓库中提取的全部或部分表构成的多维数据集合。,多维数据模型,理解数据立方,不同的商业视角为维度建立一个商业数据分析用的立方体,这些维的属性是立方体的坐标轴

5、。 大多数情况下,数据立方是以三维以上的方式组成的,理解数据立方,数据立方中多个维度的值是商务需求中需要观察的目标,这个目标的值一般叫度量值。 度量值来源于构成商务观察目标的事实表中。例如事实表中有全部产品的销售度量,那么,可以用立方体上的某一个点度量某产品在某一时间和某一城市的销售情况。,理解数据立方,如果保持立方体的某些坐标 轴的值不变而改变另外某一 个轴,便可以看到度量在不 同维上的变化情况。,设计方法:自下而上的方法,观看视频:数据仓库与olap,设计方法:自上而下的方法,直接建cube,即可以直接创建多维数据集,创建维度和量度,这个过程在OLAP过程中都能完成,如果前端展示有新的需求

6、或与设计不一致的需求,则可以直接修改多维数据集中的数据模型,而数据仓库可以自动的依据cube生成。,OLAP概念,OLAP是一种通过多维结构访问来自商业的数据源并对数据进行聚合和组织的整理过程。,OLAP的基本概念,OLAP的发展背景 联机事务处理(OLTP,On-line Transaction Processing)应用积累了大量数据 如何从这些海量业务数据中提取对企业决策分析有用的信息成为企业决策管理人员所面临的重要难题。 数据仓库技术的发展 以支持决策管理分析为主要目的应用迅速崛起 联机分析处理的概念最早由关系数据库之父E.F. Codd于1993年提出的,OLTP与OLAP的比较,联

7、机分析处理是数据仓库系统的一种应用,联机分析处理直接仿照用户的多角度思考模式,预先为用户组建多维的数据模型 例如对销售数据的分析,时间周期是一个维度,产品类别、分销渠道、地理分布、客户群类也分别是一个维度。 一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析,具有极大的分析灵活性。,OLAP的基本概念,在线分析处理或连机分析处理(OLAP,On-line Analytical Processing)是共享多维信息、针对特定问题的联机数据访问和分析的快速软件技术。 使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的

8、、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互的存取,从而获得对数据更深入了解的一类软件技术。,OLAP与数据挖掘之间的关系,OLAP分析的过程是一个演绎推理的过程,就是从一般性的前提出发,通过推导即“演绎”,得出具体陈述或个别结论的过程。 数据挖掘是一个归纳的过程,是指从个别性的前提出发,通过感官的观察和经验的推理,得出一个具有或然性的一般结论的过程. 它们两者之间具有一定的互补性。演绎与归纳是互补的而不是对立的关系:演绎推理告诉我们,当一个前提确定时我们如何能够有效地从中引出何种结论;而归纳推理则告诉我们,在给定的经验性证据基础上,怎样的结论才是可能的。尽管归纳推

9、理所给予的只是一种或然性的结论,但并不意味着这种推理是无价值的。事实上,假如没有在感官观察和经验概括基础上形成一般性结论的归纳推理过程,科学将成为不可能 。,OLAP的基本分析操作切片,定义:在多维数组的某一维上选定一维成员的动作称为切片,即在多维数组(维l,维2,维n,变量)中选一维,如维i,并取其一维成员(设为“维成员Vi”),所得的多维数组的子集(维1,维成员Vi,维n,变量)称为在维i上的一个切片。,OLAP的基本分析操作切片,(地区,产品,销售量)切片,切片,OLAP的基本分析操作切块,定义:在多维数组的某一维上选定某一区间的维成员的动作称为切块,即限制多维数组的某一维的取值区间 如

10、多维数组中(地区、产品、时间,销售量),OLAP的基本分析操作旋转,旋转即改变一个报告或页面显示的维方向。例如: 旋转可能包含交换行和列 或是把某一个行维移到列维中去,OLAP的基本分析操作旋转,OLAP的基本分析操作钻取,钻取是改变维的层次,变换分析的粒度。它包括上卷(roll up)和下钻(drill down)。 上卷是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数; 下钻则相反,它从汇总数据深入到细节数据进行观察或增加新维。 例如销售数据,可以按月聚集(上卷)销售数据。反过来,给定时间为划分成月份的数据表示,可能希望将月销售总和分解(下钻)成日销售总和,当然,这要求基本销售数据的时间粒度是按天的。,钻取,总结,OLAP作为数据仓库的一种应用工具。OLAP的操作必须依赖存在于数据仓库与OLAP之间的数据集市。 由于OLAP需要对数据集市进行多维度的观察分析,因此数据集市可以采用立方体、超立方体的多维结构。 根据多维结构存储模式的不同,可将OLAP分成基于多维数据库的MOLAP和基于关系数据库的ROLAP两大类型。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号