数据仓库和数据挖掘试题答案

上传人:枫** 文档编号:456936210 上传时间:2023-03-06 格式:DOCX 页数:9 大小:86.19KB
返回 下载 相关 举报
数据仓库和数据挖掘试题答案_第1页
第1页 / 共9页
数据仓库和数据挖掘试题答案_第2页
第2页 / 共9页
数据仓库和数据挖掘试题答案_第3页
第3页 / 共9页
数据仓库和数据挖掘试题答案_第4页
第4页 / 共9页
数据仓库和数据挖掘试题答案_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数据仓库和数据挖掘试题答案》由会员分享,可在线阅读,更多相关《数据仓库和数据挖掘试题答案(9页珍藏版)》请在金锄头文库上搜索。

1、数据仓库与数据挖掘I.选择题,为每个问题选择最合适的答案(10X2%=20%)1. 数据仓库上的业务处理称作_B_。A. 联机事务处理B. 联机分析处理C. 联机输入处理D. 联机查询处理2. 在自然演化体系结构中,关于导致数据缺乏可信性的原因的说法哪个不正确? DA. 数据无时基B. 抽取程序的算法有差异C. 抽取的层次不同D. 缺乏集成性3. 下面哪项关于OLTP与OLAP访问特点的说法是不正确的。AA. OLTP和OLAP对于响应时间的要求都高B. OLTP访问频率高,OLAP访问频率低C. OLAP访问大量的历史,执行大量统计操作D. OLTP数据处理具有并发性4. 下面关于数据仓库中

2、数据的说法错误的是?A. 数据越详细,粒度越小,层次级别就越高。B. 在估计直接存储设备数时,如数据超过1000万行必须强制采取双重粒度级。C. 数据仓库大部分分析是针对被压缩的、存取效率高的轻度级数据进行的。D. 数据分割便于数据的重构、重组和恢复,以提高创建索引和顺序扫描的效率。5. 下面关于数据仓库的数据存储方式的说法哪个是不正确的? FE. 虚拟存储方式中,数据仓库的数据仍然在源数据中。F. 星型模式下的维表规范化的,而雪花模式下的不需要规范化G. 在查询效率方面,星型模式效率更高H. 在事实星座模式中有多个事实表,且它们共享相同的维表6. 下面关于星型模型的说法哪个是不正确的?I.

3、有一个包含大量数据的事实表J. 有一组小的附属表,称为维表,每维一个。K. 事实表的每个字段都是事实度量字段L. 事实中每条元组都含有指向各个维表的外键和一些相应的度量数据。7. 下面关于数据仓库的数据追加的说法哪个是不正确的? CA. 时标法需要为记录数据增加一个时间标志。B. 前后映像文件方法需要扫描整个数据库,占用较多资源,对性能有较大影响C. DELTA不需要扫描整个数据库,效率较高,应用普遍D. 日志文件法也不需要扫描整个数据库,是固有机制。8. 假设收入属性的最小与最大分别是10000和90000,现在想把当前值30000映射到区间0,1,若采用最大一最小数据 规范方法,计算结果是

4、多少? BA. 0.25B. 0.375C. 0.125D. 0.59. 下面关于维的概念哪个是不正确的?CA. 维是人们观察数据的特定角度。B. 维的层次性是由观察数据细致程度不同造成的。C. “某年某月某日”是时间维的层次。D. “月、季、年”是时间维的层次。10. 数据仓库开发应用周期可分为三个阶段,下列哪项不是其中某个阶段? C? BA. 规划分析阶段B. 体系结构设计阶段C. 设计实施阶段D. 使用维护阶段11. 简答题(4X5%=20%)1.在现实世界的数据中,元组在某些属性上缺少值是常有的,描述处理该问题的方法?(至少给出5种不同的方法) 空缺的数据会影响数据挖掘的质量,所以应该

5、处理忽略该元组人工填写空缺值使用一个全局常量填空使用属性的平均值填充空缺值使用与给定元组属同一类的所有样本的平均值使用最可能的值填充空缺值2. 简述数据仓库的四个基本特征?面向主题,集成的,非易失的,随时间改变的3. 简述轮转综合数据存储的过程?简单逐日堆积数据的一种变种。数据用与前面相同的处理方法从操作型环境输入到数据仓库环境中,只是在轮转综合文件中的数据才被输入到不同的 结构形式中。4. 简述数据库数据与数据仓库数据的异同?原始数据,操作型数据面向应用详细的在存取瞬间是准确的为日常工作服务,可更新重复运行处理需求事先可知生命周期符合SDLC对性能要求高一个时刻存取一个单元事务处理驱动更新控

6、制主要涉及所有权高可用性整体管理非冗余性静态结构;可变的内容一次处理数据量小设计题15X12%= 60%)假定大耦数据仓库包含4个维student学生、 course导出数据由浇数据面向主题综合的,或提炼的代表过去的数据为管理者服务.不更新启发式运行处理需求事先不知道完全不同的生命周期对性能要求宽松一个时刻存取一个集合杂析处理驱动无更新控制问题松弛的可用性以子集管理时常有冗余,结构灵活一次处理数据量大支持管理需求课程、semes溥学期、nstruit祥教师,2个度量count和II.1、avg_grade。在最低的概念层(例如对于给定的学生、课程、学期和教师组合),度量avg_grade存放学

7、生的实际成 绩。在较高概念层,avg_grade存放给定组合的平均成绩。a)为数据仓库画出雪花模式图8%b)由基本立方体学生、课程、学期、教师开始,列出大学每个学生的“计算机导论”课程的平均成绩,应当使用哪些OLAP操作(如由学期上卷到年)? 4%上卷到年,切块(学期、课程)、切片2、假定数据仓库包含4个维date时间,spectator观众,location地区和game节目,2个度量count和charge。其中,charge 是观众在给定的日期观看节目的付费。观众可以是学生、成年人或老人,每类观众有不同的收费标准。a) 画出该数据仓库的星形模式图8%b) 由基本立方体date,spect

8、ator,location,game开始,为列出2011年观众在GM-Place的总付费,应当执行哪些OLAP 操作? 4%3.4假定BigUniversity的数据仓库包含如下4个维:student(student_name, area_id, major, status, university), course(course_name, department),semester(semester, year)和1 nstructor(dept, rank); 2个度量:count和avg_gradeo在最低概念层,度量avg_grade存放学生的实际课程成绩。在较高概念层,avg_grad

9、e存放给定组合的平均成绩。(a)为该数据仓库画出雪花形模式图。(b)由基本方体student, course, semester, instructor开始,为列出BigUniversity每个学生的CS课程的平均成绩,应当使用哪些特殊的O LAP操作。解答:a)为该数据仓库画出雪花形模式图。雪花模式如图所示。coiuuseLuiivstudent维表事实表维表b)由基本方体student, course, semester, instructor开始,为列出BigUniversity每个学生的CS课程的平均成绩, 应当使用哪些特殊的O LAP操作。这些特殊的联机分析处理(OLAP)操作有:i

10、. 沿课程(course)维从course_id上卷到departmentoii. 沿学生(student)维从student_id“上卷”到universityoiii. 取department=CS和university=Big University”,沿课程(course)维和学生(student)维切片。iv. 沿学生(student)维从university下钻Ustudent_name。3.5假定数据仓库包含4个维:date, spectator, location和game;和2个度量:count和charge,其中charge是观 众在给定的日期观看节目的付费。观众可以是学生、

11、成年人或老年人,每类观众有不同的收费标准。(e) 画出该数据仓库的星形模式图。(f) 由基本方体date, spectator, location, game开始,为列出2004年学生观众在GM_Place的总付费,应当执行 那些O LAP操作?解答:(a)画出该数据仓库的星形模式图。dmdimetisLO! tablescliinfusloQ tabl-曲 e_iddate_idspectatoridJ/dayspectator idspectator namemonthgameidquarter10C3tion_idph-oneyFnrCOlUltaddress/charge/hcGfic

12、udiin&udQu tableidlocation iianiegame_idfphuDELwH酊e:Hdes-cnptioncityproduoerpi-a vincecountry(b)由基本方体date, spectator, location, game开始,为列出2004年学生观众在GM_Place的总付费,应当执行 那些O LAP操作?沿日期(date)轴从date_id上卷到year。 沿节目(game)轴从game_id上卷到all。 沿地点(location)轴从 location_id 上卷到 location_name。 沿观众(spectator)轴从 spectat

13、or_id 上卷到 status。 用 status_=status,location=GM_Place,和year=2004。Y寻号明妍他”所噂皿,渺褊eW:&x 冷3 仁哗羊钏耕蛎N却i*4嗣午滩,;窈况舸传柄驻:毕弘Q法Tm牛汉3) R 尊罗虹成5.很游八网*)% 时滞赢户,魏苏籍了 5 f I瞬明旧q浦供】,NK 砰七件, , 胪gB宥玖“* Y 。点有痴卜林明.匕 nwg 八纤该 :; 粉以炒州小W 七 1今补 政A泌乙加客/I窝唯早卒豉丸也W琢,心眼淄心聂勺),易巳)。)&.七.二:,G母4八弓孕J新游$瘤.饱心政舞页辱,和始险、巾,G争襁妙笋认混曲wr泅m*k欢*。3为标何黄(用心二住-滂队4列?岛棉,阳脱当-Sgj 功以件)f亨牛

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号