第2章数据仓库开发模型

上传人:M****1 文档编号:567405814 上传时间:2024-07-20 格式:PPT 页数:47 大小:433KB
返回 下载 相关 举报
第2章数据仓库开发模型_第1页
第1页 / 共47页
第2章数据仓库开发模型_第2页
第2页 / 共47页
第2章数据仓库开发模型_第3页
第3页 / 共47页
第2章数据仓库开发模型_第4页
第4页 / 共47页
第2章数据仓库开发模型_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《第2章数据仓库开发模型》由会员分享,可在线阅读,更多相关《第2章数据仓库开发模型(47页珍藏版)》请在金锄头文库上搜索。

1、卸赠塌伺拘厢凤获怂磷绰近瘪琼窿国兹枯呐襄挟秉聚息变娇败了愈语掘致第2章数据仓库开发模型第2章数据仓库开发模型 第2章数据仓库开发模型在在创创建建数数据据仓仓库库之之时时,需需要要使使用用各各种种数数据据模模型型对对数数据据仓仓库库进进行行描描述述。数数据据仓仓库库的的开开发发人人员员依依据据这这些些数数据据模模型型,才才能能开开发发出出一一个个满满足足用用户户需需求求的的数数据据仓仓库库。使使开开发发人人员员能能够够将将注注意意力力集集中中在在数数据据仓仓库库开开发发的的主主要要部部分分。模模型型有有更更好好的的适适应应性性,更更易易于于修修改改。当当用用户户的的需需求求改改变时,仅对模型做出

2、相应的变化就能反映这个改变。变时,仅对模型做出相应的变化就能反映这个改变。 喧犬毗栽黍泽烷昔朽鼻健旧粉趟逆盛芭念阴停瘴脖苞擅懦询茵踌潜嘱凰宾第2章数据仓库开发模型第2章数据仓库开发模型数据仓库开发模型2.1数据仓库开发模型数据仓库开发模型2.2数据仓库概念模型数据仓库概念模型2.3数据仓库逻辑模型数据仓库逻辑模型2.4数据仓库的物理模型数据仓库的物理模型2.5数据仓库的元数据模型数据仓库的元数据模型2.6数据仓库的粒度和聚集模型数据仓库的粒度和聚集模型练练习习铬颐壶兵眨民殖练卓跃孕蛋讳灌诊屯廉肢澈促饿葛痉雅武争佩颁吴秤寺转第2章数据仓库开发模型第2章数据仓库开发模型2.1 数据仓库开发模型模模

3、型型是是对对现现实实世世界界进进行行抽抽象象的的工工具具。在在信信息息管管理理中中需需要要将将现现实实世世界界的的事事物物及及其其有有关关特特征征转转换换为为信信息息世世界界的的数数据据才才能能对对信信息息进进行行处处理理与与管管理理,这这就就需需要要依依靠靠数数据据模模型型作作为为这这种种转转换换的的桥梁。这种转换一般需要经历桥梁。这种转换一般需要经历:l从现实到概念模型,从现实到概念模型,l从概念模型到逻辑模型,从概念模型到逻辑模型,l从逻辑模型到物理模型从逻辑模型到物理模型虎理咕躲咕谍患夕茵缘造珍蹈脚分造袁坡肖渡频潭牵镣裕署灵废斥她骤倪第2章数据仓库开发模型第2章数据仓库开发模型现实世界

4、现实世界概念世界概念世界逻辑世界逻辑世界计算机世界计算机世界信用信用特性特性属性属性列(字段、数据列(字段、数据项)项)张三张三个体个体实体实体记录记录客户客户整体整体同质总体同质总体表文件表文件客户与产品客户与产品整体间联系整体间联系异质总体异质总体数据库数据库苛帛退癸宋梳炽氮畜帽鸳警鸳含景蚂踏讯只退项耳囱磕谱珐焕卫昨惯冬靡第2章数据仓库开发模型第2章数据仓库开发模型数据仓库的设计就是在概念模型、逻辑模型和物理模型的依次转换过程中实现的。作为数据仓库的灵魂元数据模型元数据模型则自始至终伴随着数据仓库的开发、实施与使用。数据粒度和聚集模型也在数据仓库的创建中发挥着指导的作用,指导着数据仓库的具

5、体实现。现实世界概念模型逻辑模型物理模型数据仓库元数据模型数据粒度和聚集模型别枝姻涤丹卡匀鼻缩脐琢哪幌氦抱秽杰院趴霓凛指锗勒语坠沏呸劫夏诗莽第2章数据仓库开发模型第2章数据仓库开发模型2.2 数据仓库概念模型 2.2.1 概念数据模型财务部门销售收入账应收账应付账成本账销售部门销售计划销售合同销售统计人事部门员工业绩记录员工技能情况员工薪酬表企业数据模型销售部门人事部门财务部门图2.3 企业数据模型武图描伊况搅篮邻斥洞场摧彻争骗捉扼枚窄铂州愚静攻栋畸旨足醛范绪瞎第2章数据仓库开发模型第2章数据仓库开发模型数据仓库可以采用数据仓库可以采用ER图作为概念设计框架,但是图作为概念设计框架,但是与具体

6、的业务处理系统设计还是有所区别。与具体的业务处理系统设计还是有所区别。l数据仓库的数据模型中不包含操作型的数据,数据仓数据仓库的数据模型中不包含操作型的数据,数据仓库的数据模型只包含用户所感兴趣的库的数据模型只包含用户所感兴趣的分析数据、描述分析数据、描述数据和细节数据数据和细节数据。l数据仓库的数据模型扩充了关键字结构,增加了时间数据仓库的数据模型扩充了关键字结构,增加了时间属性作为关键字的一部分属性作为关键字的一部分l数据仓库的数据模型中还增加了一些由基本数据所导数据仓库的数据模型中还增加了一些由基本数据所导出的衍生数据,这些导出的衍生数据主要用于对企业出的衍生数据,这些导出的衍生数据主要

7、用于对企业的管理决策进行分析的管理决策进行分析裕酚洗竖桑故此祸棒吓绚掘隅锐疹鸡掩涂奏蝴美进舱莎匣各灯硫世嗓穷办第2章数据仓库开发模型第2章数据仓库开发模型指指标标实实体体(事事实实实体)实体)指标实体指标实体名名维度实维度实体名体名详细类别详细类别实体名实体名维度实体维度实体详详细细类类别别实实体体(引用实体)(引用实体)为表述数据仓库所需的分析数据、描述数据和细节数据,为表述数据仓库所需的分析数据、描述数据和细节数据,反映时间属性,表现数据导出关系。将原反映时间属性,表现数据导出关系。将原ERD的实体分解为的实体分解为“事实实体、维实体和详细类别实体事实实体、维实体和详细类别实体。5个基本特

8、征滩切帖跃软孕淌欣赐厕绕允敷兽卜窟家阁脂溜觉豢镊兜啪垣温肪寒碱缓号第2章数据仓库开发模型第2章数据仓库开发模型2.2.2 规范的数据模型第第一一范范式式、第第二二范范式式、第第三三范范式式数数据据仓仓库库的的反反规范化处理规范化处理数据仓库的数据数据仓库的数据普通数据库系统的数据普通数据库系统的数据长期的框架长期的框架静态静态数据通常是汇总的数据通常是汇总的特殊查询访问特殊查询访问定期更新定期更新数据驱动数据驱动短期的框架短期的框架快速变化快速变化记录级的访问记录级的访问标准查询访问标准查询访问实时更新实时更新事件驱动事件驱动炼凡锅峻倍间池蘸淌垫己喳锦阮汹农肾雍忘渍主秤餐膏弗瘩笛舶降依接非第2

9、章数据仓库开发模型第2章数据仓库开发模型2.2.3 星型模型 星星型型模模型型是是最最常常用用的的数数据据仓仓库库设设计计结结构构的的实实现现模模式式。使使数数据据仓仓库库形形成成了了一一个个集集成成系系统统,为为用用户户提提供供分分析析服服务务对象。对象。 事实表维 度表维 度表维 度表维 度表维 度表核心是事实表,围绕事实表的是维度表。通过事实表将各种不同的维度表连接起来,各个维度表都连接到中央事实表。说膊踢喷劣掀访则束辱尼窄彦昭催喝瓦绎坤仔牧磊袜做件势陨浴基近獭申第2章数据仓库开发模型第2章数据仓库开发模型例例1某公司销售数据的星型模型某公司销售数据的星型模型time_keydayday

10、_of_the_weekmonthquarteryeartime 维表location_keystreetcitystate_or_provincecountrylocation 维表Sales 事实表 time_key item_key branch_key location_key units_sold dollars_sold avg_sales度量item_keyitem_namebrandtypesupplier_typeitem 维表branch_keybranch_namebranch_typebranch 维表概念分层猴替赁骄输嘻济壬仓箱述樟苞椭名均粪桃驭悄浚式姨涤酵详扯搪悦拖

11、澡锈第2章数据仓库开发模型第2章数据仓库开发模型例例2超市营销数据仓库日期商品促销客户门市商品营销斤陷失宁着杰观糜写耿坟寅桌仍缉论符郑讼液株线缨椿映殊澎溺诛式蔓琐第2章数据仓库开发模型第2章数据仓库开发模型超市营销主题日期关键字门市关键字商品关键字促销关键字商品销售编号商品销售量商品销售额商品成本商品销售利润日期维日 期 关键字商品维商 品 关键字门市维门 市 关键字促销维促 销 关键字客户维客 户 关 键字珍梁侍铱晋财谐馋沽尸狸称恋柴阎玄丑捅娠热搅咀同珠舞搏辉寞趣咽俐瞄第2章数据仓库开发模型第2章数据仓库开发模型日期日期维度度销售事售事实日期关日期关键字字日期关日期关键字字星期星期商品关商品

12、关键字字日日历日期日期编号号门市关市关键字字日日历周周编号号促促销关关键字字日日历月月编号号客客户关关键字字纪元日元日编号号公司纪元公司纪元POS事事务编号号纪元周元周编号号销售量售量纪元月元月编号号销售售额财政月日政月日编号号成本成本额年度日年度日历周数周数利利润金金额年度日年度日历月数月数日日历年月年月(YYYY-MM)日日历季度季度日日历年季度年季度日日历半年度半年度2012年2月22郸槛麦浩谈夕裂煽夯厂勉淘咀瀑氨袄易玲校剪眠郡问瞳肯番陨喝借鹏洁吭第2章数据仓库开发模型第2章数据仓库开发模型2.2.4 雪花模型雪雪花花模模型型是是对对星星型型模模型型的的扩扩展展,每每一一个个维维度度都都

13、可可以以向向外外连连接接到到多多个详细类别表。个详细类别表。雪花模型对星型模型的维度表进一步标准化,对星型模型中的维度表进行了规范化处理。 事实表维度表维度表维度表维度表维度表详 细类 别表详 细类 别表好室魔螺蜘汞豢腊妄脯膀募勿铺塔醒疼矫八练泞令风旺挪瑰涎吻颐梧宁助第2章数据仓库开发模型第2章数据仓库开发模型例:销售数据雪花模型例:销售数据雪花模型time_keydayday_of_the_weekmonthquarteryeartimelocation_keystreetcity_keylocationSales Fact Table time_key item_key branch_ke

14、y location_key units_sold dollars_sold avg_salesMeasuresitem_keyitem_namebrandtypesupplier_keyitembranch_keybranch_namebranch_typebranchsupplier_keysupplier_typesuppliercity_keycitystate_or_provincecountrycity故葛阐亩植穷监哮沂秆尊郎饥溅蒙祈火锌刽鄙柞跺咽脆鬃濒麦屏瓣钮忍斡第2章数据仓库开发模型第2章数据仓库开发模型补充:事实星座模型补充:事实星座模型事实星座(事实星座(Factconst

15、ellations):复杂应用可能复杂应用可能需要多个事实表共享维表需要多个事实表共享维表,这种模式可以看作星这种模式可以看作星型模式的汇集,因此称为星系模式(型模式的汇集,因此称为星系模式(galaxyschema),或者事实星座(),或者事实星座(factconstellation)设磐姨帖篱扭外球赃瞅苦角凰凰君幸岗敞榆醒鸳免窖瓤愤碟眶蝶喇啡豆热第2章数据仓库开发模型第2章数据仓库开发模型time_keydayday_of_the_weekmonthquarteryeartimelocation_keystreetcityprovince_or_statecountrylocationSa

16、les Fact Tabletime_key item_key branch_key location_key units_sold dollars_sold avg_salesMeasuresitem_keyitem_namebrandtypesupplier_typeitembranch_keybranch_namebranch_typebranchShipping Fact Tabletime_key item_key shipper_key from_location to_location dollars_cost units_shippedshipper_keyshipper_na

17、melocation_keyshipper_typeshipper帧勋切只抑挚份碴邀衡疡稻颅疏屡睫搂土诵外损稠疹伍称浅蚌譬乙商汛烟第2章数据仓库开发模型第2章数据仓库开发模型2.3 数据仓库逻辑模型 信息反馈贵宾卡账号 姓名 客户类型 初 次 交 易时间账号 省 市 县 街道 邮政编码账号 现金交易额 信用交易额账号 商品编号 时间 交易量账号 最大信用额 最近信用发 生时间账号 记录人 反馈类型 反馈时间账号 服务种类 时间 服务费用颜色信用交易客户编号交易记录信用状况商品交易服务交易签字现金交易 账号 交易额 信用额 信用时间 诲赁驻都披渠泪储蹿障唯坛养妮碎陀蚕盘花治兵凤躁装烘契菜烦案啸叛

18、情第2章数据仓库开发模型第2章数据仓库开发模型2.3.1 事实表模型设计1.事实表(1)客户事实表)客户事实表客户基本情况表(账号Integer9,姓名Character12,出生地Character20,初次交易时间Date,)。2事实表中的事实特性事实表中的事实特性 事实表中一般包含两部分,一是由主键和外键所组成的键部分键部分,另一是用户希望在数据仓库中所了解的数值指标数值指标。 派生事实主要有两种,一是可以用同一事实表中其他事实计算得到,还有一类派生事实是非加法性事实。 功征递踏适嘛芋户湛窥革沦剂楼忽盅饺邱咬臂耙冠桌辑宙创递破强汝愤捂第2章数据仓库开发模型第2章数据仓库开发模型2.3.1

19、 事实表模型设计3.设计原则设计原则通过调查确定所有可能的事实,派生事实通过调查确定所有可能的事实,派生事实按功能排序,删除重复事实按功能排序,删除重复事实基于不同准则但是有相同性质的派生事实基于不同准则但是有相同性质的派生事实确认计算派生事实的基本事实包含在模型中确认计算派生事实的基本事实包含在模型中事实表尽可能小!事实表尽可能小!附椰愉忱拐剥慰哭爵甩携烧棉茂夜椅败擒洲勇挤炙灾接叠代抨失示煞郭命第2章数据仓库开发模型第2章数据仓库开发模型2.3.2 维模型设计客户主题维度表模型时间维度表(年Date,月Date,日Date)。地点维度表(省Character20,市Character20,县

20、Character20,街道Character20)。鸣猛蝗阁荤蔗邱鳃笨秤墟库页阂粮谅涡触茵言亩耘舔绣锑婉堑甄旗醛碘粒第2章数据仓库开发模型第2章数据仓库开发模型2.4 数据仓库的物理模型2.4.1数据仓库物理模型的存储结构数据仓库物理模型的存储结构确定数据的存储结构确定数据的存储结构 并行存储结构RAID(Redundant Array of Inexpensive Disk,廉价冗余磁盘阵列)。 RAIDRAID1级。RAID2级。RAID3级。RAID4级。RAID5级。 贾冤驼吵糜爸小座坑虚淖显泼忙圭李萧伯斟桩窃骏访照奄藤愚佩夏琶菠皱第2章数据仓库开发模型第2章数据仓库开发模型2.4.

21、2 数据仓库物理模型的索引构建位图索引位图索引 女性索引女性索引客客户性性别客客户所在地所在地上海市索引上海市索引北京市索引北京市索引0男男北京市北京市011女女江江苏省省001女女北京市北京市010男男山山东省省001女女北京市北京市010男男上海市上海市100男男江江苏省省001女女上海市上海市101女女北京市北京市010男男浙江省浙江省001女女广广东省省00党硒诊厕胚氟稿讲柳管膘债玖街奋秤禽轧取绳痞驳轮纽绷窄锌死痕谱梦瞒第2章数据仓库开发模型第2章数据仓库开发模型2.4.2 数据仓库物理模型的索引构建上海市上海市索引索引OR北京市北京市索引索引=地区地区索引索引AND女性女性索引索引=

22、最后最后索引索引0110000010011110000001111101000000010111011110000000010寝菊辛巧级滁湾穗屑篷所秃兆忘隶摩犬伸更贯蜗炎瑰且臻纬仲篙冤确融追第2章数据仓库开发模型第2章数据仓库开发模型2.4.2 数据仓库物理模型的索引构建2广义索引的构建广义索引的构建3连接索引连接索引连接索引Aagelevel_idtime_idyear_idmonth_idgeo_idprov_idcity_idcounty_idprodu_idagelevel_id time_idgeo_idprodu_idamou_moneagelevel_id time_idyear

23、_idmonth_idgeo_idprov_idcity_idcounty_idprodu_idamou_moneagelevel_id time_idgeo_idprodu_id全连接结果time_idgeo_id连接索引B挞举呆丘别吵疮钡状边痪储札蝇尽朝淖叶君昆辐东芒盆才古瓶啄粤双八盲第2章数据仓库开发模型第2章数据仓库开发模型2.4.3 数据仓库物理模型的优化问题1.合合并并表表:几几个个表表的的记记录录分分散散存存放放在在几几个个物物理理块块中中时时,多多个个表表的的存取和连接操作的代价会很大。存取和连接操作的代价会很大。 2.建建立立数数据据序序列列:按按照照某某一一固固定定的的顺顺

24、序序访访问问并并处处理理一一组组数数据据记记录录。将数据按照处理顺序存放到连续的物理块中,形成数据序列。将数据按照处理顺序存放到连续的物理块中,形成数据序列。 3.引引入入冗冗余余:一一些些表表的的某某些些属属性性可可能能在在许许多多地地方方都都要要用用到到,将将这这些属性复制到多个主题中,可以减少处理时存取表的个数。些属性复制到多个主题中,可以减少处理时存取表的个数。 4.表表的的物物理理分分割割:每每个个主主题题中中的的各各个个属属性性存存取取频频率率是是不不同同的的。将将一一张张表表按按各各属属性性被被存存取取的的频频率率分分成成两两个个或或多多个个表表,将将具具有有相相似似访访问频率的

25、数据组织在一起。问频率的数据组织在一起。 5.生生成成派派出出数数据据:在在原原始始数数据据的的基基础础上上进进行行总总结结或或计计算算,生生成成派派出出数数据据,可可以以在在应应用用中中直直接接使使用用这这些些派派出出数数据据,减减少少I/O次次数数,免免去去计计算算或或汇汇总总步步骤骤,在在更更高高级级别别上上建建立立了了公公用用数数据据源源,避避免免了了不同用户重复计算可能产生的偏差。不同用户重复计算可能产生的偏差。 晰擞混摇淆昧二啮芦阐吾潜撬迹冀叉莲皆件鹿欧秦衍滚验属垦酣疽震妙讼第2章数据仓库开发模型第2章数据仓库开发模型2.5 数据仓库的元数据模型元数据元数据静态元数据静态元数据名称

26、名称描述描述格式格式数据类型数据类型关系关系生成生成时时间间来源来源索引索引类别类别域域业务业务规规则则2.5.1元数据的类型与组成元数据的类型与组成元数据元数据动态元数据动态元数据入库时间入库时间更新周更新周期期数据质数据质量量统计信统计信息息状态状态处理处理存储存储位置位置存储大小存储大小引用引用处处真豫墅翘熟烈逮禁钙酚砂谨迅冯槽武农诗滩柜烦棺崇茁伏嫂砂验魁盖想溃第2章数据仓库开发模型第2章数据仓库开发模型元元数数据据描描述述了了数数据据的的结结构构、内内容容、键键、索索引引等等项项内内容容。在在数数据据仓仓库库中中,元元数数据据定定义义了了数数据据仓仓库库中中的的许许多多对对象象表表、列

27、列、查查询询、商商业业规规则则或或是是数数据据仓仓库库内内部部的的数数据据转转移移。元元数数据据是是数数据据仓仓库的重要构件,是数据仓库的指示图(库的重要构件,是数据仓库的指示图(roadmap)。)。 1.数据仓库的元数据重要性数据仓库的元数据重要性为数据仓库服务与为数据仓库服务与DSS分析员及高层决策人员服务提供便利分析员及高层决策人员服务提供便利 解决操作型环境和数据仓库的复杂关系解决操作型环境和数据仓库的复杂关系 数据仓库中数据的管理数据仓库中数据的管理 2.元数据在数据仓库开发期间的使用元数据在数据仓库开发期间的使用确认数据质量确认数据质量 、同步化和刷新同步化和刷新 、映射映射3.

28、元数据在数据源抽取中的作用元数据在数据源抽取中的作用资资源源领领域域的的确确定定 、跟跟踪踪历历史史数数据据结结构构变变化化的的过过程程 、属属性性到到属属性性的映射的映射 、属性转换属性转换 4.元数据在数据求精与重构工程上的作用元数据在数据求精与重构工程上的作用数据的分割数据的分割 、概括与聚集概括与聚集 、预算与推导预算与推导 、转换与再映像转换与再映像 2.5.2 元数据在数据仓库中的作用变注降梗道剿臻血红醛纵衬贵替纂财洗拍吸秉腾战衅眼氮谍肪泵少翁难本第2章数据仓库开发模型第2章数据仓库开发模型2.5.3 元数据的收集1.数据源的元数据 2.数据模型的元数据数据模型的元数据3.数据源与

29、数据仓库映射的元数据数据源与数据仓库映射的元数据4.数据仓库应用的元数据数据仓库应用的元数据葫输柑浇诬灸完起暴囚拴竿恫捅分麓擒斌同泪巷刚锗绅摈燎债缺滩皮摊床第2章数据仓库开发模型第2章数据仓库开发模型2.6 数据仓库的粒度和聚集模型粒度可定义成数据仓库中数据细节的最低层次,如事务层次。这种数据层次是高度细节化的,这样就能使用户按所需的任何层次进行汇总。根据粒度的划分标准可以将数据划分为:详细数据、轻度总结、高度总结三级或更多级粒度。粒度的具体划分将直接影响到数据仓库中的数据量以及查询质量。 粒度级别粒度级别综合性综合性数据细节数据细节低(如事务)低(如事务)高(如汇总)高(如汇总)低低高高非常

30、高非常高中等到低中等到低栋烯袜傣缩瘩疫盼鹏祷郸簧膀对泼舟亭筷佑绰醒亭辫鸡狮妙邦豹用丑闹娇第2章数据仓库开发模型第2章数据仓库开发模型2.6.1 数据粒度的划分第一步,是估算数据仓库中将来要使用的数据行数和所需的直接存取存储设备数。 每一个表的存储空间,应该是每一个表的数据存储空间和索引存储空间之和。一年数据一年数据五年数据五年数据数据量(行数)数据量(行数)粒度划分策略粒度划分策略数据量(行数)数据量(行数)粒度划分策略粒度划分策略10,000,0001,000,000100,00010,000双重粒度并仔细设计双重粒度并仔细设计双重粒度双重粒度仔细设计仔细设计不考虑不考虑20,000,000

31、10,000,0001,000,000100,000双重粒度并仔细设计双重粒度并仔细设计双重粒度双重粒度仔细设计仔细设计不考虑不考虑韵达虹取祥萝礁抗篇游耶泅缀友露迅肚丛晌硝挛备厩宪猪角黍灵拥腰药耪第2章数据仓库开发模型第2章数据仓库开发模型2.6.2 确定粒度的级别考虑因素:要接受的分析类型、可接受的数据最低粒度和能存储的数据量。粒度的层次定义越高,就越不能在该仓库中进行更细致的分析。 在同一模式中使用多重粒度。 如果存储资源有一定的限制,就只能采用较高粒度的数据粒度划分策略。 粒度的确定实质上是业务决策分析、硬件、软件和数据仓库使用方法的一个折衷。 数据粒度划分策略一定要保证数据的粒度确实能

32、够满足用户的决策分析需要,这是数据粒度划分策略中最重要的一个准则。 盏瞒叼骚件澳戳胖墓呸由墙掷是身才瘴江烛沫饭赤咬收屎仑鹏氏砂朱返列第2章数据仓库开发模型第2章数据仓库开发模型2.6.3 数据仓库的聚集模型确定聚集数据主要是为了使用户获得更好的查询性能 聚集模型设计时应该注意将聚集数据存储在其事实表中,并与其底层数据相区别。 设计聚集模型时,首先需要考虑用户的使用要求。其次要考虑数据仓库的粒度模型和数据的统计分布情况。 数据仓库的聚集模型的设计与数据仓库的粒度模型紧密相关 建立聚集模型时还需要考虑作为聚集属性的数量因素 折鳞扒绒吻螺锦留施兔咎薛酗秒糟拯胸投丧殴身循溃垫抬旦搂段夏斜燥挺第2章数据

33、仓库开发模型第2章数据仓库开发模型2.6.4 聚集模型的处理聚集事实表已经独立存在并且可以与基本事实表一同保存 通过将当前加载数据添加到系统中的累积“桶”中 将数据的聚集与数据仓库的加载过程组合为同一处理过程 在将数据仓库数据加载以后,再进行聚集处理 每次在加载数据仓库数据时,都需要对各种聚集进行计算和增加,及时保持聚集与基本数据的同步性 孟戌洞痕莆逃摄呻绥拆起溺粮凉姑巾查束钙蒲醒琵沮舀廷冒析密拽鉴牺坎第2章数据仓库开发模型第2章数据仓库开发模型2.6.5 聚集模型的管理要根据使用情况删除不经常使用的聚集 需要减少层次过于接近的聚集生成 注意将聚集独立存储在自己的事实表中 钓民蹭羌氛饱佳款棵诺

34、影悲唬宅齿挽德阉怠埃莱壮沂酵讼排掳箭揖疲咸冈第2章数据仓库开发模型第2章数据仓库开发模型数据仓库示例数据仓库示例SQL开发套件介绍开发套件介绍数据仓库建立数据仓库建立-AdventureWorksDW示例数据仓示例数据仓库介绍库介绍数据转换工具数据转换工具ETL介绍介绍多维数据模型建立多维数据模型建立桃赚顽算熬椭烦慎晋膀鄂址仔宗陛疵牺湍浅衅计盏报铀抒约遮许奇党韦嗣第2章数据仓库开发模型第2章数据仓库开发模型SQL开发套件介绍开发套件介绍MicrosoftSQLServerManagementStudio数据仓库的物理实现数据仓库的物理实现SQLBusinessIntelligenceDevelopmentStudio数据的预处理、转换数据的预处理、转换ETL项目项目多维数据集的建立、多维数据集的建立、OLAP操作和数据挖掘操作和数据挖掘AnalysisService项目项目SQL2005或或2008开发版。开发版。放谐鹿江第崎真个梢捉皖怜辐旭操晒特拜横啄块稻菠绎姆鸥猜让辙耙峦吃第2章数据仓库开发模型第2章数据仓库开发模型AdventureWorksDW示例数据仓库介绍示例数据仓库介绍http:/

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号