基于本体管理的高校信息搜索系统研究

上传人:E**** 文档编号:118097611 上传时间:2019-12-11 格式:PDF 页数:63 大小:2.82MB
返回 下载 相关 举报
基于本体管理的高校信息搜索系统研究_第1页
第1页 / 共63页
基于本体管理的高校信息搜索系统研究_第2页
第2页 / 共63页
基于本体管理的高校信息搜索系统研究_第3页
第3页 / 共63页
基于本体管理的高校信息搜索系统研究_第4页
第4页 / 共63页
基于本体管理的高校信息搜索系统研究_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《基于本体管理的高校信息搜索系统研究》由会员分享,可在线阅读,更多相关《基于本体管理的高校信息搜索系统研究(63页珍藏版)》请在金锄头文库上搜索。

1、上海交通大学 硕士学位论文 基于本体管理的高校信息搜索系统研究 姓名:马佳雯 申请学位级别:硕士 专业:教育技术学 指导教师:童清艳;茅维华 20090101 2 基于本体管理的高校信息搜索系统研究 基于本体管理的高校信息搜索系统研究 摘 要 摘 要 在信息爆炸的时代,如何快、好、准地找出自己所需的信息非常 关键。研究目前的校园网搜索系统,我们不难发现,由于检索提问式 过于自由简单及单纯的字符匹配无法提供基于概念的智能搜索等原 因, 其在使用上存在如下两个关键弊端: 查准率和查全率得不到保证; 无法搜索提供网页上的隐藏信息。 本研究从以本体论构建信息知识库的概念出发, 将高校所有信息 元进行标

2、准化、层次化、关系化的描述,通过本体构造软件及构造语 言初步建立教育信息本体知识库,并搭造高校语义搜索系统构架,为 校园网语义搜索系统的完美实现打下了基础。 在整个搜索系统中,信息库的信息元是搜索的本体,而信息元之 间的逻辑关系则是进一步优化搜索的依据。相对综合性搜索而言,高 校信息内容比较集中,信息元之间的关系也较为明确。基于本体管理 的高校搜索系统将高校内所有的信息元及它们之间的逻辑关系用机 器语言的形式完整的表述出来,再与搜索引擎连接,甚至是一种智能 化的连接,这无疑将推动搜索的完整性和便捷性进入一个新的高度。 关键字:关键字:本体,标准化,语义检索,教育信息 3 THE SEARCH

3、OF UNIVERSITY SEARCH ENGINE WHICH BASED ON THE MANAGEMENT OF ONTOLOGY ABSTRACT In the time of information explosion, how to find the information witch we need quickly, high quality and accurately is very pivotal. Through the search of the university search engine which is in used, we can easily to f

4、ind two pivotal disadvantages. One is that the veracity and the extension can not be insured. The other one is that we can not find the pocket information in the web. The reason of them is too easy question methods of the search engine and character matching only. The search begins from the concept

5、of ontology. It described all the information of university in the methods of standardization, arrangement and connection. It set up the university information ontology with the help of the ontology construction software and ontology construction language. It set up the truss of the university web s

6、earch engine system. It does the basic work to prepare for the perfect realization of the university web search engine. In the search engine system, the information date of the information store is ontology, and the logic relation between the information data is the reason to perfect the search engi

7、ne. Compared with the traditional search engine, the content of the university information has more focus, and the relationship between the information data is also more clear. The university search engine described completely all the information data and the logic relation between them, and then ,i

8、t was combined with the search engine, even a wisdom connection. It would sure to push the university search engine up to a higher level. KEY WORDS: ontology, standardization, web search engine, university information 1 第一章第一章 绪论绪论 11 研究背景与研究意义研究背景与研究意义 在信息爆炸的时代,如何快、好、准地找出自己所需的信息非常关键。自 1990 年现代 搜索引擎

9、的鼻祖 Archie 诞生以来,搜索引擎技术得到了飞速发展,目前,Google、百度等 知名搜索引擎在算法、功能等方面都有着非常成熟的表现。随着企业信息化的进一步深入, 搜索引擎公司纷纷将目光转向了专业化、 企业化的领域。 高校信息化早已不是什么新鲜的课 题。信息化的目的在于方便高校内部的管理,但随着信息不断地增多,如何有效的管理和运 用这些信息的问题就凸现了出来。在 Google 公司企业搜索引擎技术的支持下,高校也有了 拥有自己门户网站搜索引擎的机会。 研究目前的搜索系统,发现其搜索方式主要有两种,关键词搜索及地图式搜索,而其中 又以关键词搜索为主。 虽然通过不断的努力, 如今的关键词搜索

10、已能满足很们很大程度上的 搜索需要,但我们不难发现,其在使用上仍存在如下两个关键弊端: 1.查准率和查全率得不到保证 由于检索提问式过于自由简单, 造成检索返回信息过多, 查准率和查全率都得不到保证。 究其根本原因:1)没有对检索词的含义作限制, 计算机无法识别其语义;2)对检索提问形式不 做规范,计算机不能“理解”真正的检索意图;3)单纯的字符匹配无法提供基于概念的智能 检索。 2.无法搜索提供网页上的隐藏信息 所谓隐含信息是指那些没有一被文字直接表述出来, 但隐含在网页内容中或者由其他相 关网页提供的一些重要的信息。 高校搜索与综合性搜索在搜索技术上大同小异, 但在高校搜索中, 信息的内部

11、管理却有 着许多耐人寻味的地方。在整个搜索系统中,信息库的信息元是搜索的本体,而信息元之间 的逻辑关系则是进一步优化搜索的依据。相对综合性搜索而言,高校信息内容比较集中,信 息元之间的关系也较为明确, 如果能将高校内所有的信息元及它们之间的逻辑关系用机器语 言的形式完整的表述出来,再与搜索引擎连接,甚至是一种智能化的连接,无疑将使得搜索 的完整性和便捷性推上一个新的高度。 本文研究意义: 1.呈现了高校信息的关系结构,为相关性搜索,关联性搜索提供支持。 2.信息概念标准化,提高搜索中信息的可读性、共享性和重用性。 3.建立了初步的高校信息意义知识库系统 4.研究了高校信息语义搜索系统实现的关键

12、技术,为其将来的实现打下了基础 12 国内外研究现状国内外研究现状 目前关于本体技术,国内外相关技术研究的状况如下: 1. (Ont0)2Agent。为了帮助用户检索所需要的 www 上已有的 ontology,主要采用参照 ontology,即以 www 上己有的 ontology 为对象建立起来的 ontology,保存各类 ontology 的 元数据。 2 2.Ontobroker。面向 www 上的网页资源,目的是帮助用户检索所需的网页,这些网页含 有用户关心的内容。Ontobroker 是用来处理 HTML,XML 和 RDF 格式的信息源和信息源语 义描述的系统。提供信息检索、查

13、询和维护支持服务。核心是用形式化本体描述背景知识, 并明确化 Web 文档的语义,以便综合利用本体的表达能力和推理机制。 3.Ontoseek。Ontoseek 是基于内容从在线黄页和产品目录中进行检索的系统,把本体用 作有语义信息的领域词汇表, 将本体驱动的内容匹配机制与一个表示形式化系统相结合, 试 图将本体和大词典库相互集成, 以便提供一个可以用领域内任意词汇进行交互式语义查询的 系统。 4.SKC。解决信息系统语义异构的问题,实现异构的自治系统间的互操作。希望通过在 ontOlogy 上的一个代数系统来实现。ntology 之间的互操作,从而实现异构系统之间的互操 作。 5.国内的一些

14、研究工作者把本体视为语义检索模型的核心, 提出基于本体的语义检索模 型体系。 采用多本体技术对多层次用户偏好模式建模, 并用多种相关反馈学习算法有效地解 决了用户兴趣和信息源的自适应变化,以及系统的可扩展性等问题。 1 13 主要研究内容及论文组织主要研究内容及论文组织 本研究从以本体论构建信息知识库的概念出发,将高校所有信息元进行标准化、层次 化、关系化的描述,通过本体构造软件及构造语言初步建立教育信息本体知识库,并搭造高 校语义搜索系统构架,为校园网语义搜索系统的完美实现打下了基础。 本文组织结构如下: 第一章,绪论。主要介绍本文的研究背景,语义检索和本体的研究现状,本体在语义检 索中的应

15、用,最后介绍本文研究内容以及论文的章节安排。 第二章,高校信息搜索系统构建理论与技术分析。介绍了本体的基本概念,本体与语义 搜索的关系及其在搜索系统中的应用, 标准化的基本方法和思路, 语义搜索系统的基本构架 及技术关键。 第三章,高校教育信息搜索系统本体规划。介绍了高校信息架构,制定了分类原则,利 用标准化方法对高校信息进行了初步分类及初步的关系描述分析。 第四章,高校教育信息搜索系统本体化建模。利用 OWL 本体描述语言系统地制定了高 校信息本体描述方法,利用 UML 对信息框架进行了图形化描述,并使用本体建构软件 Protege 对高校信息知识库进行了初步构建。 第五章,本体化在高校信息

16、搜索中的应用。提出了高校信息搜索系统的应用模块需求, 搭建了系统的基本构建框架,并对其实现所需的关键技术进行了一定程度上的应用。 第六章,总结及展望。对本文的主要研究成果进行总结,并指出进一步研究的方向。 3 第二章第二章 高校信息搜索系统构建理论与技术 分析 高校信息搜索系统构建理论与技术 分析 21 本体本体 211 本体的定义本体的定义 Ontology 最早是一个哲学的范畴, 后来随着人工智能的发展, 被人工智能界给予了新的 定义。然后最初人们对 Ontology 的理解并不完善,这些定义也出在不断的发展变化中,比 较有代表性的定义列表如下: 范畴 提出时间/提出人 定义 哲学 客观存在的一个系统的解释和说明,客 观现实的一个抽象本质 1991/Neches 等 给出构成相关领域词汇的基本术语和关 系,以及利用这些术语和关系构成的规定这 些词汇外

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号