网络信息重组与知识挖掘

上传人:aa****6 文档编号:54573213 上传时间:2018-09-15 格式:PPT 页数:25 大小:1.87MB
返回 下载 相关 举报
网络信息重组与知识挖掘_第1页
第1页 / 共25页
网络信息重组与知识挖掘_第2页
第2页 / 共25页
网络信息重组与知识挖掘_第3页
第3页 / 共25页
网络信息重组与知识挖掘_第4页
第4页 / 共25页
网络信息重组与知识挖掘_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《网络信息重组与知识挖掘》由会员分享,可在线阅读,更多相关《网络信息重组与知识挖掘(25页珍藏版)》请在金锄头文库上搜索。

1、,网络信息重组 与知识挖掘,主要内容,网络信息重组,网络知识挖掘,黄如花 理想的网络信息组织模式应该以用户为中心,遵循实用性和易用性原则,综合运用自然语言和人工语言(分类语言、主题语言),充分利用新兴技术和人类经验的积累,朝着更符合用户需要的方向发展。,信息重组,所谓信息重组,是在根据对源信息所含知识内容进行分析解构的基础上,运用一定的科学方法将源信息或解构所得信素进行重新组合,从而得到新的信息产品,实现信息增值的过程。,信息重组的含义,信息重组的分类,时间跨度大,时间跨度小,空间跨度大,空间跨度小,信息重组的途径,指引库 也称为导航库,是指所建立的信息库,从物理上讲并不存储各种实际的信息资源

2、,它存放的是有关主题的数据库或服务器的地址等信息,可指引用户到特定的地址获取所需的信息。,虚拟图书馆 虚拟图书馆是一种网络信息利用工具。它针对某一学科或领域的研究者的需要,将互联网上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL,进行系统地收集、核实并加以组织,以网站、网页或数据库形式提供给用户浏览或者检索。,网络知识挖掘,网络知识挖掘 挖掘是指从大量的万维网文档集合中发现蕴涵的、未知的、有潜在应用价值的、非平凡的模式。它所处理的对象包括:静态网页(文字、多媒体信息等)、Web数据库、Web页面的内部结构、Web结构、用户使用

3、记录等信息。通过对这些信息的挖掘,可以得到仅通过文字检索所不能得到的信息。,网络知识挖掘的分类,内容挖掘,Web内容挖掘(Web Content Mining,Web CM)是指对Web上大量文档集合的“内容”进行总结、分类、聚类、关联分析以及利用万维网文档进行趋势预测等,是从Web文档内容或其描述中抽取知识的过程。可分为内容挖掘和多媒体挖掘两部分。,结构挖掘,Web结构挖掘(Web Structure Mining,Web SM)主要是从Web组织结构和链接关系中推导信息、知识。挖掘页面的结构和Web结构,可以用来指导对页面进行分类和聚类,找到权威页面、中心页面,从而提高检索的性能:同时还可

4、以用来指导网页采集工作,提高采集效率。可分为文档间挖掘和内容结构挖掘。,用户使用记录挖掘,Web用户使用记录挖掘(Web Usage Mining,Web UM) 主要是想从用户的访问日志中抽取感兴趣的模式。分析这些日志数据可以帮助理解用户的行为,从而改进站点的结构或为用户提供个性化的服务。这方面的研究主要有两个方向:一般的用户访问模式跟踪(General Access Pattern Tracking)和个性化的使用记录跟踪(Customized Usage Tracking)。,Web日志分析流程,信息推送技术,信息推送技术(Push技术),即个性化信息服务,是网络信息组织和检索一个非常重要的发展模式。从技术上看,Push技术是一个基于Internet/Intranet网络环境的高度专业化、智能化的网络专题信息服务系统。基于Push技术的系统不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,经过筛选、分类、排序后,按照每个用户的特定需求,主动推送给用户。,谢谢大家!,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号