不确定性数据流 聚类 滑动窗口 混合属性 概率频度直方图 网格概率密度

上传人:油条 文档编号:20328188 上传时间:2017-11-21 格式:DOC 页数:4 大小:33KB
返回 下载 相关 举报
不确定性数据流 聚类 滑动窗口 混合属性 概率频度直方图 网格概率密度_第1页
第1页 / 共4页
不确定性数据流 聚类 滑动窗口 混合属性 概率频度直方图 网格概率密度_第2页
第2页 / 共4页
不确定性数据流 聚类 滑动窗口 混合属性 概率频度直方图 网格概率密度_第3页
第3页 / 共4页
不确定性数据流 聚类 滑动窗口 混合属性 概率频度直方图 网格概率密度_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《不确定性数据流 聚类 滑动窗口 混合属性 概率频度直方图 网格概率密度》由会员分享,可在线阅读,更多相关《不确定性数据流 聚类 滑动窗口 混合属性 概率频度直方图 网格概率密度(4页珍藏版)》请在金锄头文库上搜索。

1、 不确定性数据流论文:基于元组聚类特征的不确定性数据流聚类算法研究【中文摘要】对国内外数据流聚类的研究情况分析可知,已有的数据流聚类算法存在如下问题:不能聚类具有不确定性的混合属性数据流;在聚类过程中不能对不确定性数据流中近期的数据进行详细的分析;在聚类过程中不能得到任意形状的聚类。针对这些问题,本课题将研究重点放在基于元组聚类特征的不确定性数据流聚类算法的研究上,解决这些问题对研究基于位置服务的应用、电子商务等领域具有重要的意义。首先,为了能对具有不确定性的混合属性数据流进行聚类,提出了一种具有不确定性的混合属性数据流聚类算法 HU-Clustering。该算法使用概率频度直方图来统计标称属

2、性部分的信息,定义了混合属性不确定性聚类特征以便能描述混合属性不确定性数据流的分布特征。并采用基于两轮选择的聚类过程来提高聚类质量。其次,为了能对近期的数据进行分析,提出了一种基于滑动窗口的不确定性数据流聚类算法 SWCUStreams。该算法采用两阶段的聚类框架。在在线部分,定义了不确定性时间聚类特征来描述元组的不确定性信息,提出不确定性聚类特征指数直方图存储近期数据的分布特征。在离线部分,基于不确定性聚类特征指数直方图的统计信息,采用 UK-means 算法来生成最终的聚类结果。.【英文摘要】By analyzing the algorithms for clustering data s

3、treams of foreign and domestic, the existing methods have the following problems. The existing algorithms for clustering uncertain data streams can not cluster the heterogeneous data streams with uncertainty. Besides, in uncertain data streams, the recent data can not be analyzed in detail in the cl

4、ustering process. Furthermore, most algorithms can not obtain the clustering results with arbitrary shape. For these problems, this paper mainly facus on the resea.【关键词】不确定性数据流 聚类 滑动窗口 混合属性 概率频度直方图 网格概率密度【英文关键词】Uncertain data stream clustering sliding window heterogeneous attributes probability freq

5、uency histogram grid probability density【索购全文】联系 Q1:138113721 Q2:139938848【目录】基于元组聚类特征的不确定性数据流聚类算法研究 摘要 5-6 Abstract 6-7 第 1 章 绪论 10-18 1.1 不确定性数据流挖掘技术 10-12 1.1.1 不确定性数据流挖掘研究背景及意义 11 1.1.2 不确定性数据流挖掘的任务 11-12 1.2 不确定性数据流挖掘的研究现状 12-15 1.2.1 国内外研究现状 13-15 1.2.2 存在的问题 15 1.3 课题研究 内容 15-16 1.4 本文的结构内容安排

6、 16-18 第 2 章 不确定性的混合属性数据流聚类算法 18-27 2.1引言 18-19 2.2 问题定义 19-22 2.2.1 混合属性元组不确定性 20 2.2.2 混合属性不确定性聚类特征 20-22 2.2.3 具有不确定性的混合属性相似度度量 22 2.3 HU-Clustering 算法 22-25 2.3.1 算法描述 23-25 2.3.2 算法分析 25 2.5 本章小结 25-27 第 3 章 基于滑动窗口模型的不确定性数据流聚类算法 27-36 3.1 引言 27-28 3.2 问题定义 28-32 3.2.1 属性级元组不确定性 29 3.2.2 不确定性时间聚

7、类特征 29-31 3.2.3 不确定性元组相似度度量标准 31-32 3.3 SWCUStreams 算法 32-34 3.3.1 算法描述 32-33 3.3.2 算法分析 33-34 3.4 本章小结 34-36 第 4 章 基于网格概率密度的不确定性数据流聚 类算法 36-44 4.1 引言 36-37 4.2 问题定义 37-40 4.2.1 网格概率密度 37-38 4.2.2 不确定性网格聚类特征 38-39 4.2.3 网格相似度 39-40 4.3 GD-CUStreams 算法 40-43 4.3.1 算法描述 40-42 4.3.2 算法分析 42-43 4.4 本章小结

8、 43-44 第 5 章 算法实现及实验分析 44-57 5.1 实验环境 44-45 5.2 HU-Clustering 算法实验 45-49 5.2.1 HU-Clustering 算法的实验参数设置 45 5.2.2 HU-Clustering 算法的聚类质量评价 45-47 5.2.3 HU-Clustering 算法的执行效率评价 47-49 5.3 SWCUStreams 算法实验 49-52 5.3.1 SWCUStreams 算法实验参数设置 49 5.3.2 SWCUStreams 算法的聚类质量评价 49-51 5.3.3 SWCUStreams 算法聚类运行时间 51-52 5.4 GD-CUStreams 算法实验 52-55 5.4.1 GD-CUStreams 算法实验参数设置 52 5.4.2 GD-CUStreams 算法的聚类质量评价 52-54 5.4.3 元组不确定性对 GD-CUStreams 算法执行效率的影响 54-55 5.5 本章小结 55-57 结论 57-59 参考文献 59-65 攻读硕士学位期间承担的科研任务与主要成果 65-66 致谢 66-67 作者简介 67

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号