数据仓库与数据挖掘复习

上传人:油条 文档编号:33239055 上传时间:2018-02-14 格式:DOCX 页数:2 大小:30.33KB
返回 下载 相关 举报
数据仓库与数据挖掘复习_第1页
第1页 / 共2页
数据仓库与数据挖掘复习_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据仓库与数据挖掘复习》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘复习(2页珍藏版)》请在金锄头文库上搜索。

1、复习资料一名词解释 1数据仓库: 数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。 为企业提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制。2螺旋式周期性开发方法: 针对未来航空电子系统面临的挑战和航空电子系统设计的特点,提出了基于原型仿真的航空电子系统螺旋式开发方法3数据仓库元数据:在数据仓库中,元数据是描述数据仓库数据的结构和建立方法的数据。4 数据挖掘:是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析

2、处理、情报检索、机器学习、专家系统和模式识别等方法来实现目标。5数据集市:一种更小、更集中的数据仓库。原始数据从数据仓库流入不同的部门以支持这些部门的定制化使用。这些部门级的数据库就称为数据集市。迎合了专业用户群体的特殊需求。二、简答题 1为什么不能依靠传统的业务处理系统进行决策分析?传统业务系统数据量少,不能用来做出正确的预测,是针对日常事务处理而设计的,因此不能支持短时间内大量数据的分析和计算;传统业务系统数据杂乱,可能存在大量的坏数据以及异常数据,会影响决策分析的正确性。如果在传统业务系统中进行决策分析,那么必然会影响到系统的使用 2数据粒度,数据粒度划分策略数据仓库中数据的细化和综合程

3、度。划分为:详细数据、轻度总结、高度总结三级。原则:细化程度越高,粒度越小;细化程度越低,粒度越大。3数据仓库的体系结构数据源、数据存储和管理、OLAP 服务器以及前端工具与应用四个部分4MOLAP 和 ROLAP 在 OLAP 的数据存储特点 MOLAP 基本数据和聚合数据存放于多维数据集中,ROLAP 基本数据和聚合数据均存放在 RDBMS 之中5请列出常见的现代数据挖掘技术 知识发现技术、规则型挖掘技术、神经网络型挖掘技术、遗传算法型挖掘技术、粗糙型挖掘技术、决策树型挖掘技术、三、简述关联规则挖掘算法 Apriori 的算法思想并说明如何利用 Apriori 性质生成频繁项集。首先遍历目

4、标数据库一次,记录每个项目或属性的出现次数,即计算每个项目的支持度,收集所有支持度不低于用户最小支持度的项目构成频繁 1-项集 L1,然后链接 L1 中所有的元素形成候选 2 项集 C2,再次遍历事务数据库 ,计算 C2 中每个候选 2-项集的支持度,收集所有支持度不低于用户最小支持度的项目构成频繁 2-项集 L2,再链接 L2 形成 C3,遍历数据库得L3,反复执行以上过程,直到没有候选项集为止。设定最小支持度 s 和最小置信度 c。使用候选项集。首先产生出候选的项的集合,即候选项集,若候选项集的支持度大于或等于最小支持度,则该候选项集为频繁项集。四、简述数据仓库中需要的元数据,这些元数据在

5、不同的阶段应该发挥的作用 技术元数据和业务元数据。作用:1、描述哪些数据在数据仓库中;2、定义要进入数据仓库中的数据和从数据仓库中产生的数据;3、记录根据业务事件发生而随之进行的数据抽取工作时间安排;4、记录并检测系统数据一致性的要求和执行情况;5、衡量数据质量。五、通过以下给出的“出版社销售图书 Pubs”数据库模型,设计一个“图书销售分析”的多维数据集模型,并详细描述如何利用 SQL Server2008 的相关组件建立该多维数据集的过程。 数据分析需求:建立出版社维度、作者维度、图书维度、书店维度、时间维度对图书销售业绩进行统计(多维数据集模型按事实表和维度表之间的星型、雪花型或星型雪花混合型的结构设计)答:1、打开 SQL;2、附加备份的数据库文件并做出优化;3、修改数据库属性;4、建立数据仓库所需的数据库 bb(导出) ; 5、创建新的分析服务项目;6、新建数据源(本地服务器输入“.” )7、建立多维数据集;8、处理多维数据集,得出模型六、在超市中的商品价格都是大于等于零的,超市的总经理只关心如何利用送一件免费商品而带来 1000 元以上的总销售量。讨论如何挖掘这种商业模式。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号