数据仓库与数据挖掘

上传人:m**** 文档编号:468930671 上传时间:2023-03-26 格式:DOCX 页数:9 大小:240.74KB
返回 下载 相关 举报
数据仓库与数据挖掘_第1页
第1页 / 共9页
数据仓库与数据挖掘_第2页
第2页 / 共9页
数据仓库与数据挖掘_第3页
第3页 / 共9页
数据仓库与数据挖掘_第4页
第4页 / 共9页
数据仓库与数据挖掘_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数据仓库与数据挖掘》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘(9页珍藏版)》请在金锄头文库上搜索。

1、衡水学院经济学与管理学系实验报告专业:班级:姓名:学号:课程名称数据仓库与数据挖掘实验项目实验二成绩实验小组小组成员实验日期实验地点实验目的:1.在Analysis Services项目中定义数据源、数据源视图、维度、 属性、属性关系、层次结构和多维数据集。2.查看多维数据集和维度数据。实验设备计算机实验软件:Microsoft SQLServer2012、Microsoft SQL Server 2012 Analysis Services、AdvertureWorksDW2012实验内容一、定义数据源视图1. 新建项目(或打开已有的项目)与前几次实验相同,需要创建Analysis Serv

2、ices多维和数据挖掘项目。2. 定义数据源与前面实验方法相同,使用AdventureWorksDW2012数据库作为数据源。3. 定义数据源视图数据源提供与数据库的简单连接,但更多高级功能,如添加关系、创建计算和设 置逻辑键等还需要使用数据源视图来完成。为了对多维数据集进行这些操作,这 步定义数据源视图。在解决方案资源管理器中,鼠标右键单击“数据源视图”, 在弹出米单中选择 新建数据源视图,选择AdventureWorksDW2012作为数据 源,并且在“选择表和视图”页的“可用对象”列表中,选择 Dimcustomer, Dimdate , DimGeography, Dimproduct

3、, FactInternetSal es这5个表(如图1),然后将它们添加到“包含的对象”列表中。单击“下一 步”、“完成”,生成 Adventure Works DW2012OLAP 数据源视图。4. 让用户界面更友好通过更改数据源视图中对象的Friendly Name属性的值,用户界面会更加友好, 在数据源视图设计器“关系图”窗格中,鼠标右键单击Fact Internet Sales 表,在弹出的快捷菜单中选择“属性”命令然后将弹出的对话框中的Friendly Name 属性改为“网络销售”。同理,把 Dimcustomer, DimGeography, Dimproduct, DimDa

4、te,的 FriendlyName 属性 分别改为“客户”,“地区”,“产品”,“时间”。按照以上的步骤,设置好 维度表和事实表之间的关系后,数据源视图将会如图2所示。1 hrwi.-iqn琳ILb 果1d:-ri3 庭livZ-hlgiT-tm .iry * 尊 h-wiv 4) A1 PsfllUilka HJPKlCdlCH- IM ft FwwrwirVit 5 亮j PmLF1HB4- HIM W1 PHifrdibnE上卜 man 岛JriKltidJ-H-FiU+i b- 整IJlMlJibuA-4-lut;ZtX-MwIE.LT i J fajA hlhilfalbj.ii J

5、 Fu-TbhrMrlEd.iE-#.FftF*R二、定义和部署多维数据集1.定义维度可以使用多维数据集向导,通过单个步骤定义一个多维数据集及其维度。也可以 先定义一个或多个维度,然后使用多维数据集向导定义一个使用这些维度的多维 数据集。如果要设计一个复杂的解决方案,通常是先定义维度。(定义【时间维度】)在“解决方案资源管理器”中,用鼠标右键单击“维度” 文件夹,然后单击【新建维度】,将显示维度向导。u津号|点 Sip nilt qrtQNH罟I H询” tiis t -v?F! I* Kl-riiH ftl nHKUjzJLimAfl w也士里心UiWtiiIEWJ 十#NH f-NLI-I

6、KMilK RHTr!rmnWtLV|i、上一*磨|下一iji 点击【下一步】,在随后的“指定源信息”页上,选择 Adventure Works DW 2012OLAP 数据源视图;在“主表”列表中,选择“日 期”表,勾选属性,并修改属性类型-财5T= #也-五* rn-lXUfa,=B*tH Ml, laiB UfluruQ 土 ImK BaQ rUaUdi Ew 日 r UgJ I I BUM Un rriuk Swhs-mT-| MtfJ J2生成多维数据集这一步在上面创建的数据源视图的基础上生成多维数据集,方法如下:(a) 在“解决方案资源管理器”中用鼠标右键单击“多维数据集”文件夹对

7、象, 在弹出的快捷菜单中选择【新建多维数据集】命令。(b) 在弹出的“多维数据集向导”欢迎界面中单击【下一步】按钮进入“选择创 建方法”窗口,选择“使用现有表”,继续点击【下一步】,按图5选择度量值 组的表单击【下一步】按钮,在选择【现有维度】页上,选择已有的维度一时间维度, 然后单击【下一步】,在【选择新维度】页上,选择要创建的新维度。为此,请 确认已选中“客户”、和“产品”复选框,再单击【下一步】完成。(c) 完成向导后,可以查看建立的多维数据集结构,如图7所示,为多维数据集 的数据源视图,与前面的数据源视图相比较,这里的视图表达的是多维数据集的 表间关系,而且用黄色标记了事实表,蓝色标记

8、了维度表。3.向维度添加属性前面已经定义了维度,维度中的属性可以通过下面方法添加。(a) 向“客户”维度中添加属性在解决方案资源管理器的“维度”节点中双击“客户”维度,此时就打开了 “客户”维度的维度设 计器。如图8。在“数据源视图”窗格中,将Customer表的以下各列拖到“属性”窗格中:BirthDate, MaritalStatus,Gender,EmailAddress,YearlyIncome,Totalchildren, NumberChildrenAtHome, EnglishEducation, EnglishOccupation, HouseOwnerFlag, Number

9、CarsOwned, Phone, DateFirstPurchase, CommuteDistance。将“数据源视图”窗格内Geography表中的以下各列拖到“属性”窗格中:City,StateProvinceName, EnglishCountryRegionName, PostalCode。(b) 向产品”维度中添加属性将“数据源视图”窗格内Product表中的以下各列拖到“属性”窗格中:StandardCost, Color, SafetyStockLevel, ReorderPoint, ListPrice, Size, SizeRange, Weight, DaysToManu

10、facture, ProductLine, DealerPrice, Class, Style, ModelName, StartDate,4、部署多维数据集这一步将把创建好的多维数据集部署到Analysis Services数据库中,如图所示,在多维数据 集上单击鼠标右键,在弹出的快捷菜单中选择【进程】命令,在是否生成和部署项目”的对 话框中选择是”选项。待部署结束,系统将会弹出处理多维数据集”对话框,单击【运行】 按钮,程序将会对多维数据集进行处理,处理完毕后,在处理进度”对话框中单击【关闭】 按钮结束处理过程。如果以上操作都顺利进行,则此多维数据集已经顺利地部署到了 Analysis S

11、ervices 数据库。ServkZH J*tlU 细 顷 1的忡(c)切换到EXCEL,用透视表浏览数据对于多维数据集,“浏览器”选项卡提供了两种用于浏览数据的方法。你可以使用内置MDX查询设计器生成从多维数据库返回平展行集的查询,或者可以使用Excel快捷方式。当从SQL Server Data Tools内启动Excel时,Excel将打开,并且在工作表中已有数据透视表以及 与模型工作区数据库的预定义连接。Excel通常会提供更好的浏览体验,因为可以交互方式浏览多维数据集数据,并且使用水平 轴和垂直轴来分析数据中的关系。操作如图 H J1切片切片是0LAP进行基本多维分析操作的一种方式。

12、切片之后,呈现出来的数据为多维数据集 中数据的一个子集。具体来讲,切片就是在某个或者某些维上选择一个属性成员,在某两个 维上取一定区间的属性成负或者全部属性成员。将维度“客户”中的English Country Region Name拖拽至“行标签”。将维度“产品”中的Product Line拖拽至“列标签”,将维度“ Order Date”中的“OrderDate. Calendar Year”拖拽至“报表筛选”,并且指定一个时间,如2012年。最 后将Measures. Sales Amount拖拽至“数值”。如果不小心误拖,反向拖回即可撤销操作。呈现结果如图2切块切块是在立方体的三个维上

13、取一定区间的属性成员或者全部属性成员。切块可以看成是由多 个切片重叠形成。例如,依然使用上例,在时间维度上的取值如果设定为一个区间而非单一 的属性成员时,如2012年一2014年,所得结果就是一个数据切块。如图3钻取钻取包括上钻和下钻两种操作。从高级数据到明细级数据视图称为下钻,从明细级数据视图 到高级数据视图称为上钻。数据库的设计以及数据库的粒度级别将决定上钻或者下钻的能 力。比如,在时间维上,“年”表示聚集的最高级别,“日”表示聚集的最低级别,用户可 能从一个较高的聚集级别来分析数据,然后下钻到较低级别以从多个角度分析。在浏览器中,将“年,,“半年,,“季度,,“月”,“日,所代表的字段拖

14、动到“将行字段拖至此处”, 任意选择字段放在作为列字段和筛选字段。单击加减号,用户可以很方便地实现向上或者向 下钻取。4旋转旋转即是改变一个报告或者页面显示的维方向。通过旋转可以得到不同视角的数据。如交换 数据立方体的横轴和纵轴,也就是说,在浏览器中,在列字段,行字段,筛选字段中进行交 换,请自己动手试试,观察数据呈现的方式的变化。练习:通过把字段按照层次结构依次展开,你可以从不同角度和深度观察数据。现在,请找 到产品型号(model name)为mountain-200的产品在2011年的订货状况(order date), 该产品是每个季度都有销售吗?三修改度量值、属性和层次结构在前面的步骤

15、,我们已经在项目中建立好了一个简单的Cube。在实际情况中,往往Cube的 建立不是一次性的,而是会随着用户的需求发生各种改变,现在我们就来对Cube进行相关 的更改。1修改度量值的显示格式切到多维数据集设计器的“多维数据结构”选项卡,在“度量值”窗格中展开“网络销售 /internet sales”度量值组,用鼠标右键单击“Order Quantity”选项,在弹出的快捷菜单中选 择【属性】命令。弹出度量值的属性窗口,在FormatString列表中,键入“#,#”,如图所 示,类比以上步骤,请把 Unit Price, Total Product Cost,Sales Amount, Tax Amt的 FormatString 选择为 Currency。类比以上步骤,再请把 Unit Price Discount Pct 的 FormatString 改为 Percent。Pre*# Mwyjre

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号