《数据挖掘》练习题(第6章)

上传人:飞****9 文档编号:127606519 上传时间:2020-04-04 格式:DOC 页数:3 大小:94KB
返回 下载 相关 举报
《数据挖掘》练习题(第6章)_第1页
第1页 / 共3页
《数据挖掘》练习题(第6章)_第2页
第2页 / 共3页
《数据挖掘》练习题(第6章)_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《《数据挖掘》练习题(第6章)》由会员分享,可在线阅读,更多相关《《数据挖掘》练习题(第6章)(3页珍藏版)》请在金锄头文库上搜索。

1、一、填空题1、关联规则挖掘的目的是 。2、在下列事务数据集中TID项集1面包,牛奶2面包,尿布,啤酒,鸡蛋3牛奶,尿布,啤酒,可乐4面包,牛奶,尿布,啤酒5面包,牛奶,尿布,可乐项集啤酒,尿布,牛奶的支持数为 ,支持度为 。3、在第2题的事务数据集中,如果将最小支持数定为3,则数据集中的频繁项集有 。4、在第2题的事务数据集中,规则牛奶,尿布啤酒的支持度为 ,置信度为 。5、满足最小支持度和最小信任度的关联规则称为 。6、给定一个事务数据库,关联规则挖掘间题就是通过用户指定的 和 来寻找强关联规则的过程。7、关联规则挖掘问题可以划分成 和 两个子问题。8、可以降低产生频繁项集的计算复杂度两种方

2、法为: 和 。9、候选集产生的方法有: 、 和 。10、Apriori算法有两个致命的性能瓶颈。它们分别是:(1) (2) 二、多项选择题1、设有项目集是的一个子集,则下列结论中成立的是( )A、如果如果频繁项目集,则也是频繁项目集;B、如果如果频繁项目集,则也是频繁项目集;C、如果如果非频繁项目集,则也是非频繁项目集;C、如果如果非频繁项目集,则也是非频繁项目集;E、如果如果频繁项目集,则可能是频繁项目集也可能是非频繁项目集。 2、设3-项集是频繁项目集,则下列1-项集和2-项集中,( )是频繁项目集。A、B、C、D、E、 3、设事务数据库具有项集,已知不是强关联规则时,则下列关联规则中,(

3、 )一定不是强关联规则。A、B、C、D、E、4、设事务数据库具有项集,已知不是强关联规则时,则下列关联规则中,( )一定不是强关联规则。A、B、C、D、E、 5、假设关联规则具有低可置信度,则在关联规则生成算法中,规则( )应该被丢弃(剪枝)。A、 B、C、 D、 E、三、问答题1、进行关联分析时,需要处理的两个关键问题是什么?2、将下列事务数据库的用二元形式表示TID项集1面包,牛奶2面包,尿布,啤酒,鸡蛋3牛奶,尿布,啤酒,可乐4面包,牛奶,尿布,啤酒5面包,牛奶,尿布,可乐四、求解题1、设有如下事务数据库:TIDItemset1A,B,C,D2B,C,D3A,B,C,E4B,D,E5A,

4、B,C,D(1)设minsupport=40%,利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。2、考虑下表中购物篮事务数据集。顾客ID购买项1a,d,e1a,b,c,e2a,b,d,e2a,c,d,e3b,c,e3b,d,e4c,d4a,b,c5a,d,e5a,b,e(1)设minsupport=40%,利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。3、考虑下表中显示的购物篮事务。事务ID购买项1牛奶,啤酒,尿布2面包,黄油,牛奶3牛奶,尿布,饼干4面包,黄油,饼干5啤酒,饼干,尿布6牛奶,尿布,面包,黄油7面包,黄油,尿布8啤酒,尿布9牛奶,尿布,面包,黄油10啤酒,饼干(1)设minsupport=40%,利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号