基于本体的信息检索

上传人:mg****85 文档编号:36609113 上传时间:2018-03-31 格式:DOC 页数:7 大小:129.50KB
返回 下载 相关 举报
基于本体的信息检索_第1页
第1页 / 共7页
基于本体的信息检索_第2页
第2页 / 共7页
基于本体的信息检索_第3页
第3页 / 共7页
基于本体的信息检索_第4页
第4页 / 共7页
基于本体的信息检索_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《基于本体的信息检索》由会员分享,可在线阅读,更多相关《基于本体的信息检索(7页珍藏版)》请在金锄头文库上搜索。

1、基于本体的信息检索基于本体的信息检索吴素坤吴素坤(东华大学图书馆(东华大学图书馆 上海图书馆)上海图书馆)摘要:近年来,本体论(摘要:近年来,本体论(ontologyontology)成为信息领域一个新的研究热点,国内外大量文献进行了本体在)成为信息领域一个新的研究热点,国内外大量文献进行了本体在信息检索上的应用研究。本文通过国内外基于本体的信息检索的相关文献分析,试图描绘本体论可能或已信息检索上的应用研究。本文通过国内外基于本体的信息检索的相关文献分析,试图描绘本体论可能或已经带给信息检索模式的改变。经带给信息检索模式的改变。1. 引言引言随着信息时代的到来以及互联网的迅速普及和应用,每天都

2、会产生出大量的、具有反复利用价值的信息。面对信息海洋,如何最快地查全查准所需要的信息成为我们共同关心的问题。目前的信息检索,不论是网络检索还是在特定数据库内检索,其搜索机制往往是基于关键词或主题内容的检索。传统信息检索模型可示意如下图:图图1 1 传统的信息检索模型传统的信息检索模型11从图1上可以看出,传统的信息检索是基于关键字的检索技术,需要用户将要寻找的事件以关键词的形式较准确地描述出来,并最终以检索表达式的形式提交给查询系统。由于字义本身与其概念的延伸不在同一级上,造成利用传统信息检索所寻找的信息可能仅仅是字面本身的信息,但往往人们想要的是这个信息的概念及相关的成分,而不仅仅是字面所表

3、达的信息。换言之,传统信息检索只是关注词的模式匹配,而没有能够关注与处理词的语义概念本身及其相关关系。理想的智能信息检索系统的目标是:提供友好的用户检索交互界面;基于自然语言或实例的查询;依据用户浏览和检索的习惯信息,熟悉用户的兴趣爱好,建立一定的用户描述,主动向用户提供相关的信息;针对用户查询请求自动向用户提供相关文档页面,不需用户重复发现知识;综合利用个性化检索和集中浏览的优势;检索速度快,能够快速地返回查询结果;高检索率(多)和高检索精度(准) 。因此已有的信息检索系统与理想的智能信息检索系统相比,存在着很多不足。这就需要在现有信息检索系统的理论和技术的基础上,设计并实现符合特定领域需要

4、的智能信息检索系统和该系统的体系架构,从而实现分布式异构信息的预处理和远程信息的自动获取。有学者提出,基于本体的信息检索模式是一种最有前途的检索方法。2.2. 知识本体的定义及其在信息检索中的应用知识本体的定义及其在信息检索中的应用2.12.1 知识本体的定义知识本体的定义近十年来,本体的研究日趋成熟。在各种文献中,尽管与本体相关的概念和术语的用法并不完全一致,但是事实的使用约定已经出现。以下仅列出本体的几种比较有代表性的定义2。(1) 本体是对于“概念化”(conceptualization)的某一部分的明确的总结或表达。 (2) 本体在不同的场合分别指“概念化”或“本体理论”(ontolo

5、gical theory)。 (3) 本体是用于描述或表达某一领域知识的一组概念或术语。它可以用来组织知识库较高层次的知识抽象,也可以用来描述特定领域的知识。 (4) 本体属于人工智能领域中的内容理论(content theories) ,它研究特定领域知识的对象分类、对象属性和对象间的关系,它为领域知识的描述提供术语。 从以上定义我们可以知道,本体通过对于概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系和描述语言。2.22.2 知识本体在信息检索中的应用知识本体在信息检索中的应用基于本体的信息检索可以实现用户与本体所体现的概念和关系在检索过程中的相互作用。目前,基于本体的信息

6、检索还处于原型和方法论的研究阶段。还有很多与基于本体的信息检索相关的技术问题有待解决。本体在信息检索中的利用有多种途径,一种可能的途径是作为用户输入检索词界面3,然后利用本体,作为检索策略的扩充。但是,结果是这种方法仍旧依赖自然语言的加工,并未给用户以更大的检索灵活性。另一种本体应用途径是在用户界面中揭示本体的技术结构,比如 OntoBroker 检索界面4,但是,这种应用途径对信息检索人员提出了很高的要求,防碍了非专家用户的使用。下图描述了典型的基于本体的信息检索模型。图图2 2基于本体的信息检索模型基于本体的信息检索模型55图 2 描绘了共享本体是如何改变在信息检索过程中检索表达式以及文献

7、的展现。另外,检索表达式的制定过程中可以获得一个或者多个本体的支持,这些本体都是在开始检索之前用户根据所需信息所属的领域选择的。另外文献的展现应包括其一些逻辑概念的描述,使文献本身成为本体结构中的集成的一个部分,那么具体的文献通过本体概念的描述管理使其在完整的本体结构找到自己的位置,这样,信息检索过程中的匹配过程就可以归结为一种探察(exploration)过程,这种过程可以根据检索提问的形式和逻辑解释不同,有多种不同的实现方式。3.3. 国内外基于本体的信息检索研究国内外基于本体的信息检索研究近来,国内外关于基于本体的信息检索方面的研究日益增多,以下作简要介绍。Ontobroker4是用来处

8、理 HTML、XML 和 RDF 格式的信息源和信息源语义描述的系统,提供信息检索、查询和维护支持服务。核心是用形式化本体描述背景知识,并明确化Web 文档的语义,以便综合利用本体论的表达能力和推理机制。OntoSeek5是基于内容从在线黄页和产品目录中进行检索的系统,把本体用作有语义信息的领域词汇表,将本体驱动的内容匹配机制与一个表示形式化系统相结合,试图将本体论和大词典库相互集成,以便提供一个可以用领域内任意词汇进行交互式语义查询的系统询的系统。P. Varga 等6描述了一种用于从各种信息源检索到的信息的存储和呈现的总的构架和原型应用。其语言背景为匈牙利语,适用领域为金融知识领域。所提出

9、的构架受多种挑战因素制约,如知识的精细领域、非结构化文本信息的内容挖掘、其它语言问题的解决等。其中在应用过程中最关键的问题是合适的领域本体的开发,因为要构建一个结构与人类描述世界的方式完全一致的本体还只是在理论上能够实现。图 3 为所提出的信息检索系统的构架。图图3 3 文献检索系统的构架文献检索系统的构架王 进等7(2004 年第 3 期 中文信息学报)提出了一种新的基于语义的跨语言信息检索模型 Onto-CLIR,该模型在传统信息检索技术的基础上,利用本体来刻画不同语言中对应的领域知识,以解决从查询语言到检索语言之间转换过程中出现的语义损失和曲解等问题,从而保证在检索过程中能够有效地遵循用

10、户的查询意图,获得预期的检索信息。万捷等8针对信息检索中关键词所包含的语义内容,提出基于内容的信息检索原型系统,利用本体论对检索需求进行语义扩充,并用文档分析器对检索文档进行过滤,因此增加了检索结果的准确性,更加符合用户的查询需求,但在自由文档分析中术语提取过程的效率偏低。徐振宁等9提出并实现了一个以特定领域的概念化模型领域本体作为统一语义模型的关系数据库网上发布与集成系统 DIDSBS。该系统从领域本体出发,提出并实现了形式化本体和 DTD(Document Type Definition,文档类型定义) ,DTD 和关系视图的转换算法,实现了 XML 文档和数据库视图在语义和结构上的对应关

11、系。武成岗等10提出了一种利用多智能主体和本体论(ontology)理论设计的信息检索服务器。它集成了界面主体、预处理主体、管理主体、信息处理主体和具有移动性的信息搜索主体,并利用 ontology 对文档进行领域分类,同时对用户的查询信息进行规范。该系统能够比较及时地反映网络中信息的动态变化,并具有较好地信息导引能力。图图4 4 基于本体论的信息检索模型基于本体论的信息检索模型郭祥文11提出了基于本体论的信息检索的方法. 该方法支持领域分类,返回用户感兴趣的领域信息,提高了检索的效率. 该方法处理的对象是无结构的网页,在对网页进行分类时,由于领域相关度只是一个判断是否属于该领域的值,不能说明

12、网页一定属于这个领域. 因此,返回的信息也会出现了一些与实际分类不符的情况. 图 4 为所提出的基于本体论的信息检索模型。廖明宏等12采用本体论、启发式检索和用户目标等人工智能新技术来设计搜索引擎,从而实现将检索的信息转化成用户有用的知识。肖燕华等13该文结合本体理论和AGENT 介绍突出了一种基于本体论的 ITERNET 信息个性化检索 AGENT 系统的实现模式。该系统的实现可以在一定程度上缓解网上信息过载的问题,结合领域知识,提供个性化信息检索服务。基于本体的信息检索国内外都有很多研究,国外研究较早,也较为成熟,但是从研究现状来看,目前仍主要集中在检索模型或方法论上的研究,真正的基于本体

13、的信息检索系统很少。另外,由于受到本体建立研究本身的限制,基于本体的检索也被限制在基于某一领域的本体,使得本体带给信息检索的优势未得到充分体现。4.4. 结束语结束语本体是否作为未来信息检索的发展方向,还很难下定论,它只是实现信息检索功能的一种工具,有特定的应用场合。将来的信息检索在信息系统的组织、提问式的处理、检索结果的呈现等方面将大量采用本体,这一点应该是毫无疑问的。国内外也已经提出基于本体的很多改进检索的方法和策略。但是,要建立一个基于本体的信息检索系统是一项长期而复杂的工程。首先必须建立本体14或某一领域的本体,其中有本体建立、本体推理等难点。另外建立以后如何将其应用于检索也是值得进一

14、步探讨的。基于本体的信息检索方面的研究在国内外虽然已经很多,但主要集中在方法论上的研究,真正进入应用阶段的基于本体的检索系统的构建还非常有限,距离理想的信息检索系统还有很长的路要走。参考文献:参考文献:1.Elena Garca,Miguel-ngel Sicilia.User Interface Tactics in Ontology-Based Information Seeking PsychNology Journal.2003,Vol 1((3), 242 2552.http:/ Andreasen, J.F. Nilsson, H.E. Thomsen, Ontology-base

15、d Querying, in: H.L. Larsen et al. (Eds.), Flexible Query Answering Systems, Recent Advances, Proceedings of the FQAS2000 conference, Lecture Notes in Artificial Intelligence, Springer, 2000, pp. 15-26. 4.Fensel, D., Angele, J., Decker,S., Erdmann, M., Schnurr,H.P., Studer,R. & Witt, A.(1998). On2br

16、oker: Lessons Learned from Applying AI to the Web. Research report no. 383, Institue AIFB, Karlsruhe University.5.Elena Garca,Miguel-ngel Sicilia. User Interface Tactics in Ontology-Based Information Seeking PsychNology Journal, 2003 Volume 1, Number 3, 242 2556.P. Varga, T. Mszros, Cs. Dezsnyi, T. P. Dobrowiecki.An Ontology-based Information Retrieval System.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号