数据挖掘的研究的新进展

上传人:206****923 文档编号:51993548 上传时间:2018-08-17 格式:PPT 页数:18 大小:98KB
返回 下载 相关 举报
数据挖掘的研究的新进展_第1页
第1页 / 共18页
数据挖掘的研究的新进展_第2页
第2页 / 共18页
数据挖掘的研究的新进展_第3页
第3页 / 共18页
数据挖掘的研究的新进展_第4页
第4页 / 共18页
数据挖掘的研究的新进展_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《数据挖掘的研究的新进展》由会员分享,可在线阅读,更多相关《数据挖掘的研究的新进展(18页珍藏版)》请在金锄头文库上搜索。

1、数据挖掘研究的新进展复旦大学计算机与信息技术系 汪卫数据挖掘研究n数据挖掘研究的基础 机器学习 统计分析 数据库n数据挖掘技术的产生 大规模的数据 数据分析的需要当前数据挖掘研究的主要方向n数据挖掘研究的发展方向 新的应用领域nWEB访问分析n入侵检测n生物信息学n 新的工作形式n流数据分析n隐私保护n 新的数据类型n文本数据n图数据nXML数据n 数据挖掘的进一步深入生物数据挖掘n应用领域 生物序列数据分析 基因芯片分析n主要难点 数据规模大 数据的模糊性生物数据挖掘-序列分析n主要问题 从大规模的基因序列中提取相关模式n基因序列的特征 序列长 每个单元不同的取值少n研究内容 基因序列中频繁

2、模式的发现n重复序列的发现 基因序列的聚类 基因序列的高效组织方法生物数据挖掘-基因芯片分析n主要问题 从大量的芯片数据中提取相关模式n芯片数据的特征 序列短、序列数量长 有时采用的是局部信息n研究内容 基因表达数据的聚类 基因表达数据的分类流数据分析n应用领域 数据监控 超大规模数据处理n主要特点 数据只能扫描一遍 最多只有o(lgn)的空间可用来存储临时数 据n主要难点 无法形成一个精确的整体状态 现有的挖掘算法需要重新研究流数据分析n研究内容 分类n构造一个分类器,不断修正n构造多个分类器,通过投票的方法进行预 测 聚类n针对流过信息建立数据摘要的方法n动态调整现有分类 对新增类的判断方

3、法和对老类的合并流数据分析n研究内容 关联规则挖掘n频繁模式的更新n精确度分析 变化监测n变化发生时刻的确定n数据变化模式 高速流的处理方法n数据采样n并行处理面向隐私保护的数据挖掘n主要背景 防止通过挖掘结果对原始细节数据进行反 推理 主要应用于医疗数据的管理n主要研究内容 敏感数据的标示 挖掘结果的裁减n通过规则的推导预测生成的细节数据n对挖掘结果进行裁减 裁减的效率研究面向隐私保护的数据挖掘n主要研究内容 数据的转换n挖掘前对数据进行转换 基于一定的模式对数据进行变化 添加一些错误数据n基于变化后的数据进行数据挖掘n将结果进行恢复 数据挖掘流程的再造n在多个结点之间进行数据的传递n每个结点只了解局部的信息和部分全局信息n单个结点无法推出其它节点的信息图数据挖掘n主要应用领域 生物信息学 社会网络 分子结构 WEB网页分析 n主要困难 结构复杂 子图同构的匹配计算复杂性高图数据挖掘n研究内容 频繁子图挖掘 图索引结构 具有某些特征的子图模式挖掘n直径要求n连通性 挖掘的应用n图数据的管理技术数据挖掘研究所面临的问题n数据挖掘研究已经开展了10年n今后的路:推进数据挖掘技术的广泛应用 企业界已经开始关注数据挖掘技术n研究部门应该做什么? 同现有应用领域相结合n金融业n生物信息学n信息检索 自身技术的研究n易用性n可用性 新的应用领域n谢谢!本文观看结束!谢 谢欣 赏!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号