数据挖掘作业(第5章)

上传人:碎****木 文档编号:220861143 上传时间:2021-12-09 格式:DOCX 页数:2 大小:20.01KB
返回 下载 相关 举报
数据挖掘作业(第5章)_第1页
第1页 / 共2页
数据挖掘作业(第5章)_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据挖掘作业(第5章)》由会员分享,可在线阅读,更多相关《数据挖掘作业(第5章)(2页珍藏版)》请在金锄头文库上搜索。

1、第 5 章关联分析5.1 列举关联规章在不同领域中应用的实例。5.2 给出如下几种类型的关联规章的例子,并说明它们是否是有价值的。(a) 高支持度和高置信度的规章; (b)高支持度和低置信度的规章; (c)低支持度和低置信度的规章; (d)低支持度和高置信度的规章。5.3 数据集如表 5-14 所示:表 5-14 习题 5.3 数据集Customer IDTransaction IDItems Bought10001a, d, e10024a, b, c, e20012a, b, d, e20031a, c, d, e30015b, c, e30022b, d, e40029c, d40040

2、a, b, c50033a, d, e50038a, b, e(a) 把每一个事务作为一个购物篮,计算项集e, b, d和b, d, e的支持度。(b) 利用(a)中结果计算关联规章b, de 和 eb, d的置信度。置信度是一个对称的度量吗?(c) 把每一个用户购置的全部商品作为一个购物篮,计算项集e, b, d和b, d, e的支持度。(d) 利用(b)中结果计算关联规章b, de 和 eb, d的置信度。置信度是一个对称的度量吗?5.4 关联规章是否满足传递性和对称性的性质?举例说明。5.5 Apriori 算法使用先验性质剪枝,试争辩如下类似的性质(a) 证明频繁项集的全部非空子集也是

3、频繁的(b) 证明项集s 的任何非空子集s的支持度不小于s 的支持度(c) 给定频繁项集l 和它的子集s,证明规章“s(l s)”的置信度不高于 s(l s)的置信度,其中 s是 s 的子集(d) Apriori 算法的一个变形是承受划分方法将数据集D 中的事务分为n 个不相交的子数据集。证明D 中的任何一个频繁项集至少在D 的某一个子数据集中是频繁的。5.6 考虑如下的频繁 3-项集:1, 2, 3,1, 2, 4,1, 2, 5,1, 3, 4,1, 3, 5,2, 3, 4,2, 3, 5,3, 4, 5。(a)依据Apriori 算法的候选项集生成方法,写出利用频繁3-项集生成的全部候

4、选 4-项集。(b)写出经过剪枝后的全部候选 4-项集5.7 一个数据库有 5 个事务,如表 5-15 所示。设min_sup=60%,min_conf = 80%。表 5-15 习题 5.7 数据集事务 IDT100购置的商品M, O, N, K, E, YT200 T300 T400T500D, O, N, K, E, YM, A, K, EM, U, C, K, YC, O, O, K, I ,E(a) 分别用Apriori 算法和FP-growth 算法找出全部频繁项集。比较两种挖掘方法的效率。(b) 比较穷举法和Apriori 算法生成的候选项集的数量。(c) 利用(1)所找出的频繁

5、项集,生成全部的强关联规章和对应的支持度和置信度。5.8 购物篮分析只针对全部属性为二元布尔类型的数据集。假设数据集中的某个属性为连续型变量时,说明如何利用离散化的方法将连续属性转换为二元布尔属性。比较不同的离散方法对购物篮分析的影响。5.9 分别说明利用支持度、置信度和提升度评价关联规章的优缺点。5.10 表 5-16 所示的相依表汇总了超级市场的事务数据。其中hot dogs 指包含热狗的事务, hot dogs 指不包含热狗的事务。hamburgers 指包含汉堡的事务, hamburgers 指不包含汉堡的事务。表 5-16 习题 5.10 相依表hot dogshot dogsSro

6、wHamburgers2,0005002,500hamburgers1,0001,5002,500Scol3,0002,0005,000假设挖掘出的关联规章是“hot dogs hamburgers”。给定最小支持度阈值 25%和最小置信度阈值 50%,这个关联规章是强规章吗?计算关联规章“hot dogs hamburgers”的提升度,能够说明什么问题?购置热狗和购置汉堡是独立的吗?假设不是,两者间存在哪种相关关系?5.11 对于表 5-17 所示序列数据集,设最小支持度计数为2,请找出全部的频繁模式。表 5-17 习题 5.11 数据集Sequence ID 1234Sequence ID

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号