数据挖掘与商务智能课程实验

上传人:壹****1 文档编号:431768421 上传时间:2022-10-31 格式:DOC 页数:39 大小:1.60MB
返回 下载 相关 举报
数据挖掘与商务智能课程实验_第1页
第1页 / 共39页
数据挖掘与商务智能课程实验_第2页
第2页 / 共39页
数据挖掘与商务智能课程实验_第3页
第3页 / 共39页
数据挖掘与商务智能课程实验_第4页
第4页 / 共39页
数据挖掘与商务智能课程实验_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《数据挖掘与商务智能课程实验》由会员分享,可在线阅读,更多相关《数据挖掘与商务智能课程实验(39页珍藏版)》请在金锄头文库上搜索。

1、数据挖掘与商务智能课程实验指导实验一 数据仓库的构建一、实验目的及要求(一)实验目的1理解数据库与数据仓库之间的区别与联系;2掌握典型的关系型数据库及其数据仓库系统的工作原理以及应用方法;3掌握数据仓库建立的基本方法及其相关工具的使用。(二)实验要求利用实验室和指导教师提供的实验软件,认真完成规定的实验项目,真实地记录实验中遇到的各种问题和解决的方法与过程,并绘出模拟实验案例的数据仓库模型。实验完成后,应根据实验情况写出实验报告。二、实验设备及软件基于MS SQL Server 2005 服务系统以及Analysis Services系统。三、实验内容以SQL Server 2005为系统平台

2、,设计、建立数据库,并以此为基础创建数据仓库。四、 实验步骤创建 Microsoft SQL Server 2005 Analysis Services (SSAS) 项目后,通常通过定义此项目将要使用的一个或多个数据源来开始使用此项目。定义数据源时,将定义要用于连接此数据源的连接字符串信息。 在以下任务中,把 AdventureWorksDW 示例数据库定义为 Analysis Services Tutorial 项目的数据源。为了实现本教程教学目的,此数据库位于您的本地计算机上,而源数据库通常驻留在一台或多台远程计算机中。 定义新的数据源1. 在解决方案资源管理器中,右键单击“数据源”,然

3、后单击“新建数据源”。将打开数据源向导。2. 在“欢迎使用数据源向导”页上,单击“下一步”。 将显示“选择如何定义连接”页。在该页上,可以基于新连接、现有连接或以前定义的数据源对象来定义数据源。以前定义的数据源对象是当前项目中或当前解决方案的其他项目中的现有数据源定义。在本教程中,将基于新连接定义新数据源。3. 在“选择如何定义连接”页上,单击“新建”。 将显示“连接管理器”对话框。在此对话框中,可定义数据源的连接属性。连接管理器是将在运行时使用的连接的逻辑表示形式。例如,连接管理器包括一个在设计时设置的连接字符串属性;在运行时,将通过使用连接字符串属性中的值创建一个物理连接。4. 在“提供程

4、序”列表中,确保已选中“本机 OLE DBMicrosoft OLE DB Provider for SQL Server”。Analysis Services 还支持“提供程序”列表中显示的其他访问接口。5. 在“服务器名称”文本框中,键入 localhost。要连接到本地计算机上的命名实例,请键入 localhost。将项目部署到 Analysis Services 的特殊实例时,Analysis Services 引擎将连接到 Microsoft SQL Server 的默认实例(位于 Analysis Services 实例所在的计算机上)的 Adventure Works DW 数据

5、库。如果在定义数据源时指定特定的计算机名或 IP 地址,则项目或部署的应用程序将与指定计算机而不是本地计算机建立连接。通过 Analysis Services 部署向导,可以在部署时指定源数据的实际服务器名。6. 确保已选中“使用 Windows 身份验证”。在“选择或输入数据库名称”列表中,选择 AdventureWorksDW。 下图显示了包含到目前为止已定义设置的“连接管理器”。7. 单击“确定”,然后单击“下一步”。将显示“模拟信息”页。在该向导的此页上,可以定义 Analysis Services 用于连接数据源的安全凭据。在本教程中,您将选择 Analysis Services 服

6、务帐户,因为该帐户具有访问 Adventure Works DW 数据库所需的权限。8. 选择“使用服务帐户”,然后单击“下一步”。 下图显示了随后出现的“完成向导”页。9. 在“完成向导”页上,单击“完成”以创建名为 Adventure Works DW 的新数据源。 下图显示了解决方案资源管理器的“数据源”文件夹中的新数据源。定义多维数据集及其属性1. 在解决方案资源管理器中,右键单击“多维数据集”,然后单击“新建多维数据集”。2. 在“欢迎使用多维数据集向导”页上,单击“下一步”。 3. 在“选择生成方法”页上,确认已选中“使用数据源生成多维数据集”选项和“自动生成”选项,然后单击“下一

7、步”。 4. 在“选择数据源视图”页上,确认已选中 Adventure Works DW 数据源视图,然后单击“下一步”。5. 该向导扫描在数据源对象中定义的数据库中的表,以标识事实数据表和维度表。事实数据表包含相关的度量值,如售出的部件数等。维度表包含有关这些度量值的信息,如售出产品、售出该产品的月份等。 6. 在向导标识完事实数据表和维度表后,请在“检测事实数据表和维度表”页上单击“下一步”。7. 在“标识事实数据表和维度表页上,将显示该向导所标识的事实数据表和维度表。 对于 Analysis Services Tutorial 项目,该向导标识四个维度表和一个事实数据表。为该事实数据表定

8、义了一个度量值组。 每个维度表必须链接到多维数据集中的一个事实数据表。维度表具有下列关系类型之一: 与事实数据表的直接主键-外键关系。这称为“星型架构”。通过某个其他表与事实数据表的间接主键-外键关系。这称为“雪花型架构”。 在“标识事实数据表和维度表”页上,还可以指定时间维度表,然后将时间属性与指定维度表中的列相关联。时间属性与指定时间维度表中的列相关联是基于时间的多维表达式 (MDX) 计算(如 YTD 和 ParallelPeriod)所必需的,而且时间智能向导将使用这一关联定义与时间相关的计算成员。 下图显示了该向导的“标识事实数据表和维度表”页,其中为 Analysis Servic

9、es Tutorial 项目选择了事实数据表和维度表。8. 在“标识事实数据表和维度表”页的“时间维度表”列表中,选择 Time,然后单击“下一步”。9. 在“选择时间段”页上,将时间属性名称映射到以指定为“时间”维度的维度为基础的维度表中的相应列。根据以下列表映射这些属性: 将 Year 属性映射到 CalendarYear 列。 将 Half Year 属性映射到 CalendarSemester 列。 将 Quarter 属性映射到 CalendarQuarter 列。 将 Month 属性映射到 EnglishMonthName 列。 将 Date 属性映射到 FullDateAlte

10、rnateKey 列。下图演示了该向导中的这些列映射。10. 单击“下一步”按钮进入向导的下一页。 随即会出现“选择度量值”页,其中显示了该向导所选择的度量值。该向导选择它标识为事实数据表的表中的各数值数据类型列作为度量值。在本课中,只定义了一个度量值组。但在第 4 课中,您将使用多个度量值组。11. 在“选择度量值”页上,查看在“Internet 销售”度量值组中选择的度量值,然后清除下列度量值的复选框: 促销关键字 货币关键字 销售区域关键字 修订号该向导选择事实数据表中未链接到维度的所有数值列作为度量值。但这四列不是实际的度量值。前三列是将事实数据表与未在此多维数据集的初始版本中使用的维

11、度表链接起来的键值。下图显示了“选择度量值”页上已清除的复选框和其余选定维度。12. 单击“下一步”。由于您前面已在该向导选择了“自动生成”选项,因此该向导将扫描层次结构。 该向导对定义为维度表的表中的各列记录进行采样,以确定列之间是否存在层次结构关系。层次结构关系是多对一关系,例如“市/县”和“省/市/自治区”之间的关系。13. 在该向导完成对维度的扫描和对层次结构的检测后,请在“检测层次结构”页上单击“下一步”。 14. 在“查看新建维度”页上,通过展开树控件显示该向导检测到的三个维度的层次结构和属性,查看其中每个维度的维度层次结构。 下图显示了“查看新建维度”页上的这三个维度。15. 依

12、次展开“产品” 维度和“属性”,然后清除 Large Photo 复选框。单击“下一步”。Large Photo 列在本教程项目的多维数据集中不是很有用,并且由于它可能会占用大量空间,因此最好将其从多维数据集中删除。16. 在“完成向导”页上,将多维数据集的名称更改为 Analysis Services Tutorial。在该页上,也可以查看多维数据集的度量值组、度量值、维度、层次结构和属性。17. 单击“完成”按钮以完成向导。 在解决方案资源管理器的 Analysis Services Tutorial 项目中,Analysis Services Tutorial 多维数据集显示在“多维数据

13、集”文件夹中,而三个数据库维度则显示在“维度”文件夹中。此外,多维数据集设计器在开发环境的中央显示 Analysis Services Tutorial 多维数据集。请注意,在 Business Intelligence Development Studio 的其他选项卡上也已打开数据源视图设计器。18. 在多维数据集设计器的工具栏上,将缩放级别更改为 50,以便轻松查看多维数据集中的维度表和事实数据表。19. 下图显示了该设计器中的维度表和事实数据表。请注意,事实数据表是黄色的,维度表是蓝色的。下图显示了该设计器中的维度表和事实数据表。请注意,事实数据表是黄色的,维度表是蓝色的。 20. 在

14、“文件”菜单上,或者在 BI Development Studio 的工具栏上,单击“全部保存”。这将保存到目前为止您在 Analysis Services Tutorial 项目中所做的更改,您可以根据需要在此处停止教程,以后再继续。实验二 多维数据组织与分析(OLAP)一、实验目的及要求(一)实验目的1理解维(表)、成员、层次(粒度)等基本概念及其之间的关系;2理解多维数据集创建的基本原理与流程;3理解并掌握OLAP分析的基本过程与方法;(二)实验要求利用实验室指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模

15、型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。二、实验设备及软件安装 SQL Server 2005 服务系统、Analysis Services系统。三、实验内容1运用Analysis Server工具进行维度、度量值以及多维数据集的创建(模拟案例)。2使用维度浏览器进行多维数据的查询、编辑操作。3对多维数据集进行切片、切块、旋转、钻取操作。四、实验步骤在多维数据集设计器中检查多维数据集和维度的属性1. 在多维数据集设计器中,在“多维数据集结构”选项卡的“度量值”窗格中,展开“Internet 销售”度量值组。 此时将显示为“Internet 销售”度量值组定义的度量值。可以将这些度量值拖到所需的顺序中,以此更改这些度量值的顺序。度量值的顺序将影响某些客户端应用程序对这些度量值进行排序的方式。度量值组被命名为 Internet Sales,这是因为基础事实数据表在数据源视图中的友好名称为 InternetSales。请注意,大写字母“S”前自动添加了一个空格,以增加该名称的用户友好特性。度量值组及其包含的每个度量值都有属性,在“属性”窗口中可以编辑这些属性。 下图显示了多维数据集设计器的“度量值”窗格中的度量值组和度量值。2. 在多维数据集设计器中,在“多维数据集

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号