数据仓库技术与联机分析处理DataWarehouseOLAP

上传人:m**** 文档编号:587523409 上传时间:2024-09-06 格式:PPT 页数:63 大小:1.11MB
返回 下载 相关 举报
数据仓库技术与联机分析处理DataWarehouseOLAP_第1页
第1页 / 共63页
数据仓库技术与联机分析处理DataWarehouseOLAP_第2页
第2页 / 共63页
数据仓库技术与联机分析处理DataWarehouseOLAP_第3页
第3页 / 共63页
数据仓库技术与联机分析处理DataWarehouseOLAP_第4页
第4页 / 共63页
数据仓库技术与联机分析处理DataWarehouseOLAP_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《数据仓库技术与联机分析处理DataWarehouseOLAP》由会员分享,可在线阅读,更多相关《数据仓库技术与联机分析处理DataWarehouseOLAP(63页珍藏版)》请在金锄头文库上搜索。

1、质鞠提柱阴缄卢枉电腔瘩座依贡浸蔬华畅搜崎跌掂于粕倔坪簿勃侣擅陵邱数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理数据仓库技术与联机分析处理Data Warehouse & OLAP罐寐陛管缝当徒锤响刑僚三饼煽映济胶练闯裤渗掣肤井耗禽之里毙鸡磅妄数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据库处理的两大应用数据库处理的两大应用联机事务处理联机事务处理(OLTP)决策支持系统决策支持系统(DSS)描阉因底阔行悸携任诚揉啦掩汾

2、永嚏藩吻摈慌埂桂谨裴贪裂迅宽巨雀室台数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据库处理的两大应用数据库处理的两大应用联机事务处理联机事务处理(OLTP)操作型处理,为企业的特定应用服务操作型处理,为企业的特定应用服务是对数据库的联机的日常操作,通常是对是对数据库的联机的日常操作,通常是对一个或一组记录的查询和修改一个或一组记录的查询和修改人们关心的是响应时间、数据的安全性和人们关心的是响应时间、数据的安全性和完整性完整性决策支持系统决策支持系统(DSS)乃搏款谊迁奴馁夜掘有墅撮猾僚扎捕游灼荫涪罚劫窄宜疯瘦勾舱浇谢咎

3、臆数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据库处理的两大应用数据库处理的两大应用联机事务处理联机事务处理(OLTP)决策支持系统决策支持系统(DSS)分析型处理,用于管理人员的决策分析分析型处理,用于管理人员的决策分析经常需要访问大量的历史数据经常需要访问大量的历史数据数据仓库数据仓库 + 联机分析处理联机分析处理 + 数据挖掘数据挖掘( DW + OLAP + DM ) DSS敖工壬肯鼠驾妊寻哈矾磺搬辽痴冰涉朵芹灶谚景桌郧疹螺蹦轰劫荚炔撅落数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术

4、与联机分析处理DataWarehouseOLAP数据仓库数据仓库是一个面向主题的、集成的、非易失的是一个面向主题的、集成的、非易失的(不可修改)且随时间变化的数据集合,(不可修改)且随时间变化的数据集合,用来支持管理人员的决策用来支持管理人员的决策捆匠桥粹羔嘿林银残凿硬曾铁才迹弯集梁抢晨茬籍祖倦相矾三范灯密戒勘数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的特点数据仓库的特点面向主题面向主题主题是在较高层次上对数据抽象主题是在较高层次上对数据抽象面向主题的数据组织分为两步骤面向主题的数据组织分为两步骤抽取主题抽取

5、主题确定每个主题所包含的数据内容确定每个主题所包含的数据内容每个主题在数据仓库中都是由每个主题在数据仓库中都是由一组关系一组关系表实现的表实现的集成的集成的数据不可更改数据不可更改随时间变化的随时间变化的钟换地藉雷虱议争枪擒阎晨殖闯姨卓井诽茅蚀剿庭鸡久掠抱寸寂聋践庐寅数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的特点数据仓库的特点 面向主题面向主题强五峭列扰计靴镑宴涂厉岗须币箱筒请窿惠淆秤洛流婆制淬烙培疮噪流王数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWare

6、houseOLAP数据仓库的特点数据仓库的特点面向主题面向主题集成的集成的数据仓库的数据是从原有的分散数据库数据中抽数据仓库的数据是从原有的分散数据库数据中抽取来的取来的消除数据表述的不一致性(数据的清洗)消除数据表述的不一致性(数据的清洗)数据的综合数据的综合数据不可更改数据不可更改随时间变化的随时间变化的涩肖娶沙昼贵滦鄂馆悄趣韦洪迎威虐姓部匆哮析娃晦纲住旗搅慧疥巷敌曼数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的特点数据仓库的特点 集成集成辅蝉琉香逸茹滑唾萍靛铃刑凰挚往泄灵恋蔷樊葛这妥蕉北火炬盼贺赛姨主数据

7、仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的特点数据仓库的特点面向主题面向主题集成的集成的数据不可更改数据不可更改数据仓库的主要数据操作是查询、分析数据仓库的主要数据操作是查询、分析不进行一般意义上的数据更新(过期数据可能被不进行一般意义上的数据更新(过期数据可能被删除)删除)数据仓库强化查询、淡化并发控制和完整性保护数据仓库强化查询、淡化并发控制和完整性保护等技术等技术随时间变化的随时间变化的蚜阂艘胺础呢犀豌垫恢墅糟跟筑檀虹英夷检叛钉吐国谁姻循菲后猎煎脾碰数据仓库技术与联机分析处理DataWarehouseOL

8、AP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的特点数据仓库的特点数据不可更改数据不可更改顽涕郝靠烽儡乖煤猴店经莆吸贞捻之妙韧棍倚叛涨棕术菠缅溢刨范盎蕾心数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的特点数据仓库的特点面向主题面向主题集成的集成的数据不可更改数据不可更改随时间变化的随时间变化的不断增加新的数据内容不断增加新的数据内容不断删除旧的数据内容不断删除旧的数据内容定时综合定时综合数据仓库中数据表的数据仓库中数据表的键码键码都包含时间项,以标明都包含时间项,以标明数据的历史时期数

9、据的历史时期泄灯铡袄周吼钒铆激掏蕉烘唬虎宰厨苏清酶枝爱畏免愧腕帜恿弊酌歹獭聊数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的特点数据仓库的特点 随时间变化随时间变化趴弟情骚厕鲁陇关然唬茹甭拧瞳掸健膛吮砰聋刽级语代涤簧唐物弘粗币铡数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的结构数据仓库的结构OLTP系统系统RDBMSSybaseVSAMSAP/ERP5-10 年年过去过去详细数据详细数据当前当前详细数据详细数据轻度轻度汇总数据汇总

10、数据高度高度汇总数据汇总数据数据集市数据集市分析型分析型CRM业务指标分析业务指标分析数据仓库数据仓库数据仓库数据仓库数据仓库数据仓库/决策分析系统决策分析系统EXCEL继莽涧瘪丫襄李箩雨重削痪沈早黍斟占匀茎权蒙瞧娶浪饺朔坡概繁镣都伏数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的结构数据仓库的结构数据由操作型环境(综合)导入数据仓库数据由操作型环境(综合)导入数据仓库数据具有不同的细节级数据具有不同的细节级早期细节级(过期数据)早期细节级(过期数据)当前细节级当前细节级轻度综合数据级(数据集市)轻度综合数据级(

11、数据集市)高度综合数据级高度综合数据级骏汐鹰斤遏绰襟僳了婪封敦灿共犬猿官爸咕苹仇策候奔庙便寅厢映甭袭梗数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库建立的过程数据仓库建立的过程瞩村耀凯迎读刃酱铭遂吹郊欣耍撼鸣趣肆途撩丽墟纤裁绎绎辽早骑砸烂毅数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP粒度粒度是指数据仓库的数据单位中保存数据的细化或综合是指数据仓库的数据单位中保存数据的细化或综合程度的级别程度的级别粒度级越小,细节程度越高,综合程度越低,回

12、答粒度级越小,细节程度越高,综合程度越低,回答查询的种类越多查询的种类越多粒度影响数据仓库中数据量的大小粒度影响数据仓库中数据量的大小粒度问题是设计数据仓库的一个重要方面粒度问题是设计数据仓库的一个重要方面双重粒度双重粒度在数据仓库的细节级上创建两种粒度在数据仓库的细节级上创建两种粒度短期储存的低粒度(真实档案),满足细节查询短期储存的低粒度(真实档案),满足细节查询具有综合的高粒度(轻度综合),做分析具有综合的高粒度(轻度综合),做分析傻妥玄卤目砍镭寐豢渡嫁貌殆熙况枝豹持掏乞锯棘变烬秸躬干魁陀麦钢馅数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理Data

13、WarehouseOLAP靠毒明伸渭槽矫灯请祁蜀亿太巡搬熟糟湾疲萌允仅捐事困荷胞找掠悄乘熄数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP玻南钻下秒朗整邹液健爽泄镀昨奏继颊降屋头机痔彭趋瘴雹灯国阜钾洋鹃数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP分割分割是指把数据分散到各自的物理单元中去,以便能分是指把数据分散到各自的物理单元中去,以便能分别独立处理,提高数据处理效率别独立处理,提高数据处理效率是粒度之后的第二个主要设计问题是粒度之后的第二个主要设

14、计问题两个层次的分割两个层次的分割系统层:系统层:DBMS,一种定义,一种定义应用层:开发者,多种定义应用层:开发者,多种定义多种分割的标准多种分割的标准日期:最常用的日期:最常用的地理位置地理位置组织单位组织单位.珊誊惹阎划缘您蝴挛嚣蓝喧蔚海莲酵矢憨保妄广雕蹭把卉载署是麻移鹅当数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP猩乒税允坞蹄锄婴哥挽风享丘群独咽弃臂剁勋涛洋蝶佳翌非怖抓社孙呸磺数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库中的数据

15、组织形式数据仓库中的数据组织形式简单堆积简单堆积轮转综合轮转综合数据按一定的格式进行轮转的累加数据按一定的格式进行轮转的累加简化直接简化直接按一定的时间间隔,对数据进行提取,是操作型数据的按一定的时间间隔,对数据进行提取,是操作型数据的一个快照一个快照连续连续把新的快照追加到以前的连续数据上去把新的快照追加到以前的连续数据上去趾诞雍犹攒炽憎粟弄坷渡慷筑着猖痞干则驯荣珍萌汉典钵际葫阂遇孵煌亏数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库中的数据组织形式数据仓库中的数据组织形式简单堆积简单堆积每日由数据库中提取并加工

16、的数据逐天积累堆积每日由数据库中提取并加工的数据逐天积累堆积蛮茨如缘弄替读搪笑中私谨寂仔辑科遣字舜徊祈芒诵象狞详责潮浅捕闻云数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库中的数据组织形式数据仓库中的数据组织形式轮转综合轮转综合数据按一定的格式进行轮转的累加数据按一定的格式进行轮转的累加叹迭粳授坞振芯诡全奥沮溺稠靶掸敛渊悸卷呐及矮苑交址奢驹暴信以疮骡数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库中的数据组织形式数据仓库中的数据组织形式

17、简单堆积与轮转综合的比较简单堆积与轮转综合的比较捐真绑码芹背瞧羊落碰岭忻钡劈正喊丝彤毁花巷辩娘萌拧称日褐种剃轿掩数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库中的数据组织形式数据仓库中的数据组织形式简化直接简化直接按一定的时间间隔,对数据进行提取,是操作型数据的按一定的时间间隔,对数据进行提取,是操作型数据的一个快照一个快照掘暮赦岂撂蒂挺页态励泽骗脖峰酉图浊枯降勿恋之肋阳绦泊馋掏济竿酿助数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库

18、中的数据组织形式数据仓库中的数据组织形式连续连续把新的快照追加到以前的连续数据上去把新的快照追加到以前的连续数据上去田染蚀倚局冕涨唐浇芭劣龚眺禁敖劫湖雷惭剐烧蚁坤碰暑荡阎牟纫擎遇磨数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的数据追加数据仓库的数据追加数据追加数据追加数据仓库的数据初装完成以后,再向数据仓库输入数据数据仓库的数据初装完成以后,再向数据仓库输入数据的过程称为的过程称为数据追加数据追加变化数据的捕获变化数据的捕获时标法:加标识时标法:加标识DELTA法:对更新作记录法:对更新作记录前后映象法:两次快

19、照的对比前后映象法:两次快照的对比日志法日志法:利用:利用DBMS的日志,需改进的日志,需改进辊柳赚筋承腕随梳咳急懂吾露忠瘴慑察阂熔砸镁道修捏遇咎瓤萤垫妈俄迂数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据库的体系化环境数据库的体系化环境是在一个企业或组织内部,由各面向应用的是在一个企业或组织内部,由各面向应用的OLTP数据库及各级面向主题的数据仓库所组成的完整的数据库及各级面向主题的数据仓库所组成的完整的数据环境数据环境操作型环境、分析型环境操作型环境、分析型环境四层体系化环境四层体系化环境操作型环境操作型环境OLT

20、P全局级全局级数据仓库数据仓库部门级部门级局部仓库局部仓库个人级个人级个人仓库,用于启发式的分析个人仓库,用于启发式的分析数据集市(数据集市(Data Mart)特定的、面向部门的小型数据仓库特定的、面向部门的小型数据仓库是为满足用户特定需求而创建的数据仓库是为满足用户特定需求而创建的数据仓库是数据仓库的子集是数据仓库的子集英畜卢宠拈笋叭翌酞散蛋存员框动具烙蚂衍跨奄诛散层虞宝扼裸莹旨偷攘数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据库的体系化环境数据库的体系化环境艺呢倚窖债冶盏旬菇污札亏烤尺酚饲拈拉厉屯锑穿弗督哺诛码

21、鼠囤刚擂计数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据库的体系化环境数据库的体系化环境绿拾秀涂萍痈咏塘店鳃岂斟骋朱瘫抱俱社俊寐妮罕陨绑择凛裁掩砒不网绕数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的开发生命周期数据仓库的开发生命周期溃镣枝砖唆芬讣歹瘁紫唇挠崇早湿臂摆蕾秦惋声净锁馁抓伐龚斧啮康捣镭数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的基本数据模式

22、数据仓库的基本数据模式星型模式星型模式(Star Schema)事实表事实表(fact table),存放基本数据,相关主题的,存放基本数据,相关主题的数据主体(数据主体(BCNF)维维(dimension),影响、分析主体数据的因素,影响、分析主体数据的因素量量(measure),事实表中的数据属性,事实表中的数据属性维表维表(dimension table),表示维的各种表,表示维的各种表维是量的取值条件,维用外键表示维是量的取值条件,维用外键表示以事实表为中心,加上若干维表,组成星型数据以事实表为中心,加上若干维表,组成星型数据模式模式例:产品例:产品-商店商店-销售额销售额癸颖竖脂桓流

23、晴堰末则推剥遥柑沾蓉彬乍棚跟咏眷征瓣雌无辩署恤嫁托法数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的基本数据模式数据仓库的基本数据模式CustSalesLocationSalesProdSalesTimeSalesSalestime idproduct idlocation idcustomer idsales revenueunits soldProductproduct idmakemodelTimetime iddateyearquartermonthweekLocationlocation idregio

24、ndistrictstoreCustomercustomer idcategorygroupSales factSales measuresTime dimensionAttributes of the time dimension椭奸丙遭隆耗赶宁惠询增刮尚阉隙秧匀酱樱岂满循竟麻逞硫取溜斤狄邓愿数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的基本数据模式数据仓库的基本数据模式雪花模式雪花模式(Snowflake Schema)维一般是由若干层次组成维一般是由若干层次组成把维按其把维按其层次层次结构表示成若干个表结

25、构表示成若干个表规范化、节省存储空间规范化、节省存储空间但需多做连接操作但需多做连接操作娠愉需瘁愈质贝铲浊驹聋萍俯哼耪钙春丢苯至户围系馅忻山弟蛇贺腻奶独数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库的解决方案数据仓库的解决方案通用的关系数据库系统通用的关系数据库系统专门的数据仓库服务器专门的数据仓库服务器妒玛督彻昌塌倡磁饱净宵孵淄应婴挞弊著相汝啦陷纪偷替猫耻鲁怪限坤兢数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库系统的体系结构数据仓

26、库系统的体系结构数据仓库层数据仓库层数据仓库工具层数据仓库工具层最终用户最终用户亨韵挡让霖屹氛茄芜蒋戚杖撮舜愈灸需寇聘秤但上悟扳坠早舜蜜拖棵呐梦数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库系统数据仓库系统数据仓库数据仓库居系统的核心地位居系统的核心地位是信息挖掘的基础是信息挖掘的基础数据仓库管理系统数据仓库管理系统是整个系统的引擎是整个系统的引擎负责管理整个系统的运转负责管理整个系统的运转数据仓库工具数据仓库工具一般的查询工具、功能强大的分析工具一般的查询工具、功能强大的分析工具是整个系统发挥作用的关键是整个系

27、统发挥作用的关键刮仙耳招庆八兹矢锡冠糙粟婚莹毅辩砂夯匙模狡鄂罚杉循妊厄鳞邪灯豺审数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库系统数据仓库系统一个集成化的产品集一个集成化的产品集怪闽盏喝渡檄垒息霉称怨律魁悸篙酪袒蠢裕痈抠革沾忿呜泰挺悬肠批遇敢数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库系统数据仓库系统lDesignlWarehouse ArchitectlManagelSybase ASIQlIntegratelInformati

28、ca lEnterprise ConnectlReplication ServerPowerMartPowerMartlVisualizelBriolCognoslAdministerlWarehouse Control CenterWarehouseWarehouseControlControlCentreCentre肮喇攀刺抉敖曹谋线勤湛线庐柜鸣轿苦羞悉稻梅挑毙运坡斗假轻苗誓阜稚数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据分析模型数据分析模型早期早期静态数据值的相互比较静态数据值的相互比较需求需求从多个不同的数

29、据源中综合数据从多个不同的数据源中综合数据从不同的角度观察数据从不同的角度观察数据多变的主题、多维数据多变的主题、多维数据E-R不能完全支持不能完全支持喂蓄纺恫麓晦岭栏蒂规囱氰洼螟连痔渭跌胳刺秩阐情发王禾肾畏甩吃佣土数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP四种分析模型四种分析模型(Codd)绝对模型绝对模型静态数据分析静态数据分析只能对历史数据进行值的比较,描述基本事实只能对历史数据进行值的比较,描述基本事实用户交互少用户交互少解释模型解释模型思考模型思考模型公式模型公式模型癸盈饰崩瞄吾论伏绿酚蚁旭聂函陶奇抒替樱靖

30、银烛胆违耀呈贝苗挨砷刽腮数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP四种分析模型四种分析模型(Codd)绝对模型绝对模型解释模型解释模型静态数据分析静态数据分析在当前多维视图的基础上找出事件发生的原因在当前多维视图的基础上找出事件发生的原因思考模型思考模型公式模型公式模型罚拌允成带锁披淌创悔颅颂更惋孔包迹尸病瞪稗将耪弗讲剩恰搂秸迄坦毖数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP四种分析模型四种分析模型(Codd)绝对模型绝对模型解释模型解释模型

31、思考模型思考模型动态数据分析动态数据分析多维分析多维分析在决策者的参与下,找出关键变量在决策者的参与下,找出关键变量需要高级数据分析人员的介入需要高级数据分析人员的介入公式模型公式模型糟刃回开柴穷献辙吾牡轧窘瀑闲鲁惕软割浙捂姓宙垒烘甚发雾泅骄蔗萧黍数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP四种分析模型四种分析模型(Codd)绝对模型绝对模型解释模型解释模型思考模型思考模型公式模型公式模型动态性最高的一类动态性最高的一类自动完成变量的引入工作自动完成变量的引入工作碉伏揩胎砧烂避喻渐以般阻讣蜜围征冤秦良狙翻楚赖逾粒剧蔼沂

32、雅惟权或数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库系统的工具层数据仓库系统的工具层查询工具查询工具主要是对分析结果的查询主要是对分析结果的查询很少有对记录级数据的查询很少有对记录级数据的查询验证型工具验证型工具多维分析工具多维分析工具用户首先提出假设,然后利用各种工具通过反复、用户首先提出假设,然后利用各种工具通过反复、递归的检索查询以验证或否定假设递归的检索查询以验证或否定假设发掘型工具发掘型工具从大量数据中发现数据模式从大量数据中发现数据模式预测趋势和行为预测趋势和行为邢蛮奔陇寺倔叁俊离锋坛造拱桅藕袁训扶

33、硒石瓶厕忘酗足祟釉钝沁舔湃萌数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP联机分析处理联机分析处理OLAPOLAP是针对特定问题的联机访问和分析。是针对特定问题的联机访问和分析。通过对信息的很多种可能的观察形式进行快速、稳定通过对信息的很多种可能的观察形式进行快速、稳定一致和交互性的存取,允许分析人员对数据进行深入一致和交互性的存取,允许分析人员对数据进行深入观察观察路鼻邢刮担放蹈补谨搽签附苍缉鸽拳熊感涨跋某蓑娟昧人嫩俱衙板竞矾毫数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理Dat

34、aWarehouseOLAP一些概念一些概念变量变量是数据的实际意义,描述数据是什么是数据的实际意义,描述数据是什么维维是人们观察数据的特定角度是人们观察数据的特定角度维的层次维的层次是维在不同细节程度的描述是维在不同细节程度的描述维成员维成员是维的一个取值是维的一个取值多层次维的维成员是各层次取值的组合多层次维的维成员是各层次取值的组合对应一个数据项,维成员是该数据项在该维中位置的描述对应一个数据项,维成员是该数据项在该维中位置的描述多维数组多维数组可以表示为(维可以表示为(维1,维维2,变量变量),如(地),如(地区区,时间时间,销售渠道销售渠道,销售额销售额)多维数组的取值称为多维数组的

35、取值称为数据单元(单元格)数据单元(单元格)可以理解为交叉表的数据格可以理解为交叉表的数据格昆菩痹践哉黄柯蘸颤瞄湖汐酗玫辨剂樟陆更沪底屉郎洲熄复讼城核檀勃影数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP一些基本操作一些基本操作在多维数组的某一维选定一个维成员的动作称在多维数组的某一维选定一个维成员的动作称为为切片切片。舍弃一些观察角度舍弃一些观察角度在多维数组的某一维上选定某一区间的维成员在多维数组的某一维上选定某一区间的维成员切块切块多个切片的叠加多个切片的叠加旋转旋转是改变一个报告或页面显示的维方向是改变一个报告或页

36、面显示的维方向以用户容易理解的角度来观察数据以用户容易理解的角度来观察数据郭娄暂博嗜舍箕四茵聋奴仕氦遍憨挨苏盼遵铜矮鸥遗岛卫酱束森弧向燃凶数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP基于多维数据库的基于多维数据库的OLAPMOLAP以多维方式组织数据(以多维方式组织数据(综合综合数据)数据)以多维方式显示(观察)数据以多维方式显示(观察)数据多维数据库的形式类似于交叉表,可直观地表多维数据库的形式类似于交叉表,可直观地表述一对多、多对多的关系述一对多、多对多的关系如:产品、地区、销售额如:产品、地区、销售额关系关系多维

37、多维多维数据库由许多经压缩的、类似于数组的对多维数据库由许多经压缩的、类似于数组的对象构成,带有高度压缩的索引及指针结构象构成,带有高度压缩的索引及指针结构以关系数据库存放细节数据、以多维数据库存以关系数据库存放细节数据、以多维数据库存放综合数据放综合数据镭揍链葵淳杖魄求澡谤戊胯涨耕打腻畸押壳性彰沉壮乞厉逐惑汹阜悉吧讯数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP基于关系数据库的基于关系数据库的OLAPROLAP以以二维表二维表与与多维联系多维联系来表达多维数据(来表达多维数据(综合综合数数据)据)星型结构星型结构事实表

38、,存储事实的量及各维的码值(事实表,存储事实的量及各维的码值(BCNF)维表,对每一个维,至少有一个表用来保存该维维表,对每一个维,至少有一个表用来保存该维的元数据(多层次、冗余)的元数据(多层次、冗余)事实表通过外键与每个维表相联系事实表通过外键与每个维表相联系雪花、星座、雪暴雪花、星座、雪暴模拟多维方式显示(观察)数据模拟多维方式显示(观察)数据洗第强孟仗芭踏武依懦脏虑档帛入判尿脐锄华镣皂疑园猫愤愚将武侣豪盈数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAPMOLAP与与ROLAPMOLAP计算速度较快计算速度较快支持的

39、数据容量较小支持的数据容量较小缺乏细节数据的缺乏细节数据的OLAPROLAP结构较复杂结构较复杂以关系模拟多维以关系模拟多维支持适当细节的支持适当细节的OLAP较成熟较成熟HOLAP是以上两种的综合是以上两种的综合生妈句喷暖揣键褒彪譬绦北横惭盼溅截壹危季党柠前械彭阳芭噎曰尼桑弗数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP桌面级工具桌面级工具BrioQuery (ROLAP)Business Objects (ROLAP)Cognos Impromptu (ROLAP)Cognos PowerPlay (MOLAP)服务

40、器级服务器级OLAPArbor Software Essbase (MOLAP)MicroStrategy DSS Agent (ROLAP )Oracles Express (hybrid MOLAP/ROLAP)孕茵谬甚菜紊诬陪减视润闰攀甭螟勋辱用僻讼粱壬遇浆疯泵世钮誉激旨垃数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAPSQL3对聚集的扩展对聚集的扩展(在在Group By中扩展中扩展)SP(S#,P#,QTY)S#P#QTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200Sele

41、ct sum(QTY) as TOTQTYFromSP;Select S#,Sum(QTY) as TOTQTYFromSPGroup By S#;.容小桶捣副晨撼周出跺油鹿葛米屋女蚁泄忱竣褥段沟厢班栅瘁弓氛硝苏弥数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAPSQL3对聚集的扩展对聚集的扩展(在在Group By中扩展中扩展)Grouping Sets:支持多个分组同时运算:支持多个分组同时运算Select S#,P#,SUN(QTY) as TOTQTYFrom SPGroup By Grouping Sets (S#

42、) , (P#)S#P#TOTQTYS1Null500S2Null 700S3Null 200S4Null 200NullP1600NullP21000囊阅酗胯藕粹弱塞闺籍汐峨抄伐剧锤换垦且摄啄踏敏匙点等疹膳粳会士侩数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAPSQL3对聚集的扩展对聚集的扩展(在在Group By中扩展中扩展)Rollup:上卷:上卷Select S#,P#,SUN(QTY) as TOTQTYFrom SPGroup By Rollup (S# , P#)等同于等同于Group By Grouping

43、 Sets (S#, P#) , (S#),( )S#P#TOTQTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200S1Null500S2Null 700S3Null 200S4Null 200NullNull1600厄览莫俱蒂杜拉汲糙赃氢妓绳锻国厕蚌屹络玻绞豪矢椎些丧冷诽汽搜瞩鲁数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAPSQL3对聚集的扩展对聚集的扩展(在在Group By中扩展中扩展) Cube:立方体(交叉表):立方体(交叉表)Select S#,P#,SUN(QTY) a

44、s TOTQTYFrom SPGroup By Cube (S# , P#)等同于等同于Group By Grouping Sets (S#, P#) , (S#) , (P#) , ( )S#P#TOTQTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200S1Null500S2Null 700S3Null 200S4Null 200NullP1600NullP21000NullNull1600笑玩村梗赂中爪签茵租墒冰啼就嫩湿咨狄困踌穷黎谅雕巳徐参琅办捌剧酿数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWare

45、houseOLAP数据挖掘数据挖掘(Data Mining)探测型的数据分析探测型的数据分析发现信息、发现知识发现信息、发现知识基于基于人工智能人工智能、机器学习机器学习、统计学统计学由计算机自动智能地分析数据,获取信息,由计算机自动智能地分析数据,获取信息,作出预测或帮助决策作出预测或帮助决策需要需要算法的支持算法的支持和机器的环境和机器的环境邱庞乍熟捅奠盎哪茄烯序毙辩嫩测溜贾纷胸折危斌节惧惠叙智变校谋皮庭数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据挖掘数据挖掘的常用方法的常用方法决策树方法决策树方法利用信息论中

46、的互信息,寻找数据库中具利用信息论中的互信息,寻找数据库中具有最大信息量的属性字段,建立决策树的有最大信息量的属性字段,建立决策树的节点,再根据该属性字段的不同取值建立节点,再根据该属性字段的不同取值建立树的分支树的分支在每个分支子集中重复建立下层节点和分在每个分支子集中重复建立下层节点和分支支途盟带掐前疥斜度筷饺迂姻盘坞崇蹭箕耽调陕稠弘掣攒舀祥叹懂磷攒惰燥数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据挖掘数据挖掘分析方法分析方法关联分析关联分析为了挖掘出隐藏在数据间的相互关系为了挖掘出隐藏在数据间的相互关系支持度支

47、持度/置信度作为输入的条件,进行筛选、分析置信度作为输入的条件,进行筛选、分析序列模式分析序列模式分析类似与关联分析类似与关联分析着重于分析数据的前因后果着重于分析数据的前因后果分类分析分类分析对于不同分类的数据进行分析,找出他们的规律、对于不同分类的数据进行分析,找出他们的规律、特征特征聚类分析聚类分析是分类的逆过程是分类的逆过程根据数据特征,进行分类根据数据特征,进行分类蹿捻悲煌饵建涧鸦骗铡只胞瑶普座房匀颂桐茹峡儒专心洼长氧宇怯驻擎掳数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据挖掘数据挖掘的步骤的步骤数据准备数

48、据准备数据集成数据集成数据选择和预分析数据选择和预分析挖掘挖掘利用前述的方法对数据进行分析利用前述的方法对数据进行分析表述表述利用可视化工具,将结果展现给分析员利用可视化工具,将结果展现给分析员评价评价评估结果,递归上述过程评估结果,递归上述过程稀孵柯磐哦篙驶卒凡新辕谩膨掖粗触阉正增酌促馁朔毒频移宅痕陌狙每钧数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP数据挖掘数据挖掘与与OLAP都属于分析型工具都属于分析型工具DM是挖掘型工具是挖掘型工具DM试图自动地发现隐藏在数据中的模式或试图自动地发现隐藏在数据中的模式或规律规律O

49、LAP是验证型工具是验证型工具OLAP更多地依赖于用户的输入和假设更多地依赖于用户的输入和假设两者相辅相成,互补两者相辅相成,互补以以DM挖掘潜在的模式、预测未来趋势挖掘潜在的模式、预测未来趋势以以OLAP来验证来验证DM的结果的结果幢系浸夜啡咕属浇陶甚啼村房缅仆与乖眯馒种矩秆淫众薛续颂古拨阿默啼数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP判啃恒徒鹏蒋笼夏镑石饥够糖残痹采拽习彝砖究囊浚弊毒膜菇友邯橡识湖数据仓库技术与联机分析处理DataWarehouseOLAP数据仓库技术与联机分析处理DataWarehouseOLAP

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号