《数据仓库与ETL的实现过程PPT精品文档》由会员分享,可在线阅读,更多相关《数据仓库与ETL的实现过程PPT精品文档(14页珍藏版)》请在金锄头文库上搜索。
1、数据仓库与ETL的实现过程1.设计数据仓库CubeCube多维多维数据集数据集数据仓库数据仓库源系统源系统客户端客户端设计数据仓库设计数据仓库 导入数据仓库导入数据仓库建设建设Cubes Cubes 查询数据查询数据1 13 34 4查询工具查询工具报表报表分析分析数据挖掘数据挖掘2 22.数据仓库的星型结构Employee_DimEmployee_DimEmployeeKeyEmployeeID.EmployeeKeyEmployeeKeyTime_DimTime_DimTimeKeyTheDate.TimeKeyTimeKeyProduct_DimProduct_DimProductKey
2、ProductIDProduceNameProductBrandProductCategory.ProductKeyProductKeyCustomer_DimCustomer_DimCustomerKeyCustomerID.CustomerKeyCustomerKeyShipper_DimShipper_DimShipperKeyShipperID.ShipperKeyShipperKeySales_FactSales_FactTimeKeyEmployeeKeyProductKeyCustomerKeyShipperKeyUnitsPrice.TimeKeyTimeKeyCustomer
3、KeyCustomerKeyShipperKeyShipperKeyProductKeyProductKeyEmployeeKeyEmployeeKey多个外键多个外键事实事实维度键维度键3.维度与事实一个数据仓库包括了 多个中央事实表 Fact Table多个维度外键和多个可以分析的指标多个维度表 Dimension Tables可以分析的角度4.ETL过程数据从数据源向目标数据仓库抽取(Extract)、转换(Transform)、装载(Load)的过程5.ETL过程构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中
4、去。6.抽取:将数据从各种原始的业务系统中读取出来。 转换:按照预先设计好的规则将抽取得数据进行转换、清洗,以及处理一些冗余、歧义的数据,使本来异构的数据格式能统一起来。 装载:将转换完的数据导入到数据仓库中。 7.ETL举例FNameLNameUnitPriceQtyBarrAdam.552ChaiSean1.13EmpKeyName1Barr.Adam2Chai.SeanNameUnitPriceQtyBarr.Adam.552Chai.Sean1.13NameTotalSalesBarr.Adam1.1Chai.Sean3.3EmpKeyTotalSales11.123.3导入合并计算查
5、找8.案例背景保健品销售部门,各分部门将销售情况记录在各自的表中,记录方式也是不一样的要求计算出各种产品各个员工07年的销售情况9. 店面 网售 PosDWSQLsheet1sheet2sheet310.Pos部门销售情况部门销售情况EmployeeNameGroupNameTime ProductName ProductStyle ProductClass Quantity InformationSource SaleAddress DimProductProductKeyProductNameProductStyleProductClass店面店面销售情况销售情况EmployeeNameG
6、roupNameTime ProductName ProductStyle ProductClass Quantity CustomerEvaluation CustomerSources网售网售销售情况销售情况EmployeeNameGroupNameTime ProductName ProductStyle ProductClass Quantity ProductNameProductStyleProductClassProductNameProductClassProductStyleProductNameProductClassProductClassProductNameProdu
7、ctStyleProductStyleDimEmpEmployKeyEmployeeNameGroupNameDeptNameGroupeNameEmployeeNameGroupeNameGroupNameEmployeeNameEmployeeNameGroupeNameEmployeeName维度表的抽取维度表的抽取源表源表源表源表源表源表维度表维度表11.店面店面销售情况销售情况EmployeeNameGroupNameTime ProductName ProductStyle ProductClass Quantity DimProductProductKeyProductNameProductStyleProductClassFactSalesProductKeyProductNameProductStyleProductClassProductNameProductClassProductStyleProductNameProductClassProductStyleProductKeyProductKey事实表的抽取事实表的抽取源表源表维度表维度表事实表事实表12.DEMO13.谢谢!谢谢!14.