高效的异构本体匹配技术分析

资源描述

《高效的异构本体匹配技术分析》由会员分享，可在线阅读，更多相关《高效的异构本体匹配技术分析（59页珍藏版）》请在金锄头文库上搜索。

1、中文摘要中文摘要近年来，随着Internet的飞速发展，以及人们对网络信息的需求量的增加和对信息准确度要求的提升，研究人员提出基于语义网的语义检索模型。语义网就是要给Web上的信息加上注释本体。而异构本体的出现，则是由多方面原因造成的t网络的自治性可能会导致整个网络中存在多个节点本体；人们对客观世界的认识程度和认识方法不同，以及本体的表示形式和内在逻辑结构的多样性，也会造成描述同一领域本体的差异性。因此，要想实现不同网络节点之间基于语义的信息交流，就必须解决不同节点本体之间的异构问题，实现异构本体间的互操作。目前，本体映射是解决本体异构的最有效方法。本文的工作是针对描述同一领域的

2、多个本体间存在的异构问题，设计一种快速、高效的映射算法来实现异构本体的融合。本文提出了一种基于异构本体的相似度计算模型NBJLM，通过字面概念相似度和语义结构(包括节点深度、节点密度、边权重、信息量等)相似度等方面的综合计算，可以准确地得到异构本体间的概念映射关系。同时，通过对映射方法的优化，算法的匹配速度也有很大程度的提高。实验结果表明，该算法可以有效地降低本体异构的影响，得到较好的概念相似性计算效果。关键词：语义网；异构本体；匹配；概念相似度；映射AbstractAbstractRecent years、im the rapid development of Internet

3、technology andenhancement of the demand for network information by people，the researchersproposed the Semantic Web modelSemantic Web is the web with additional information called ontologyThe emergence of heterogeneous ontologies，is caused by a variety of reasons：the autonomy of the network leads to

4、multiple nodes manage ontologies respectively throughout the network；the difference of peopleS knowledge of the objective world，fitS well as the diversity of internal logic structures of ontology, will result in the heterogeneous ontologies describing the same domainTherefore，to achieve the exchange

5、 of information between the different network nodes，we mustresolve the heterogeneous problem between the different nodesCurrently,ontologymapping is one of most effective way to solve the problem of heterogeneousontologiesIn this paper,the contents of the study is to find a fast and efficient mappin

6、g algorithm for heterogeneous ontologies in the sallle fieldThis paper put forward a method of similarity calculation based on heterogeneous ontologies，considering thefactors of similarity of literal meaning and semantic structure(including the depth ofthe node,node density,edge weight,infonIlation

7、content,etc)c粗get concept mapping between heterogeneous ontologies more accurateSimultaneousltaking into account the optimization of mapping method,the speed of matching has alsobeen improved to a large extentthe problem of how to improve the speed ofmatching more effectually has been mentioned in t

8、his paperThe experiment results show this method Call effectively get better effectiveness with concept similarity computing,excluding the effects ofheterogeneous ontologiesKeyword：semantic web；heterogeneous ontologies；match；concept similarity；mappingIl第一章绪论第一章绪论第一节研究背景近些年来，网络己经遍布人们生活的各个方面，并且随着互联网技术

9、的急速发展，网络不仅给人们提供各种便利，而且极大地促进了社会的进步，人们几乎可以应用网络搜索到任何想要的信息。然而随着用户群体的不断增加，网络规模急剧膨胀以及网络的动态性、无序性、多样性以及海量性，已经造成了很严重的信息超载和混杂的现象，这些呈指数增长的海量信息使得来自各领域的用户对信息的查找、访问以及维护的难度不断加大。这种情况的出现一方面是由于互联网络是面向用户的，所发布的信息含有大量的自然语言、图片等，只能由读者自己理解和使用，而个人计算机只能从格式上进行处理和验证，不能对知识进行处理。另一方面，由于搜索引擎智能性不高，还是多采用以关键词匹配的方法进行检索的模式，只是通

10、过简单的超链接把网络中海量的信息关联起来，并把这些超链接信息显示给用户。但是搜索引擎本身并不能理解关键词的涵义，更不可能从中发现任何语义的联系并通过概念的推理来满足用户更准确更深层次的需求。随着互联网技术的发展，如何能让计算机理解网络中的信息并参与信息交流，把用户从信息的识别和提取等繁杂的工作中解脱出来，实现更快速准确的检索，已成为亟待解决的问题。网络创始人Tim BemersLee 提出了语义网的构想，他指出语义网并不是一个独立的网络，而是通过对信息进行形式化的描述的方式对现有网络的进行扩展。即，向信息中注入计算机能够理解和处理的语义形式，让计算机对该信息进行判断和语义推理，使

11、它能够理解网络上的信息，为用户提供更有力的帮助，使得人机协作更加完善。简单来说，语义网中的资源不再只是简单地将各种信息聚集在一起，而是加上便于被计算机识别和处理的“注释，以便于提高计算机处理信息的智能化和自动化。为了使计算机能够理解这种注释信息，达到多个系统能够进行交流的目的，必须为该“注释制定统一的形式化标准，使计算机在一定程度上可以对信息进行有效的自动处理。在最初的程序开发过程中，程序员以硬编码的方式来实现计算机所识别的 “注释。这种方式虽然实现起来很简单，但硬编码对不同的网络环境动态适应第一章绪论性很差，且不便于系统之间的互操作。后来研究者借鉴了人工智能领域对本体的研究成果

12、，用形式化的语言对领域内被公认的信息进行编码。计算机可以通过将“注释”映射为编码实现对信息的语义理解【21。图11语义网结构图显示的是Tim BernersLee后来在XML2000大会上描述的语义网的七层结构框架【3】：最下层是Unicode和URI。Unicode是字符编码标准，它可以使语义网识别多种语言。URI为统一资源标识符，能够唯一标识网络上的一个资源，是整个语义网的基础。第二层是XML、Namespace和XMLSehema。XML为可扩展并具有良好的数据存储格式的标记描述符，可以描述文档的各种表现形式。XMLSchema用来限定文档结构。NameSpace为命名空间。

13、第三层是RDF和RDFschema。RDF是一种网络资源描述语言，可以用来对特定需求的语义结构进行描述。RDFSchcma是对RDF的扩展，它使用建模元语把RDF的词汇组织成层次结构。第四层是本体层。它用于描述应用领域的知识和各种资源间的联系，是语义网中最关键的部分。第五层是逻辑层。提供了一些推导方法和规则，可以对资源进行推理，提供相应的结论解释，为用户更好的理解语义网提供的帮助。第六层是检验层。使语义网代理对推理的结果进行交换和数字签名，建立一定的信任关系。TrustRule口Proof-J一Data一Logic-一【，)Data-。Ontology Vocalulary-self

14、-C_+DescDocRDF+RDFSchema叫cDXML+NS+XMLSchemaUnicodeURI图11语义网结构图2第一章绪论最后一层是信任层。通过数字化签名检验语义网的可靠性以及推理结果是否符合用户的要求。可以看出，本体位于从文档描述到知识推理的转折层，建立了资源的概念之间的语义关系，是实现语义网的关键，具有十分重要的地位。本体作为一种共享的知识模型，所表示的知识是共同认可的。它通过对概念进行严格定义，并利用概念间的关系来确定概念的精确含义，可以为计算机理解信息、描述交换信息的结构和语义等方面提供帮助。随着网络资源共享需求的日益增长，本体作为一种共享的知识模型，在复杂的语

15、义网、电子商务以及信息集成等领域中扮演极端重要的角色【4】。本体不但提供了形式化的描述领域知识手段而且还提供了对隐含的知识进行推理的手段，因此本体的研究对信息技术的发展具有十分重要的现实意义，已经成为了科研工作者的研究热点。然而由于网络分布性和自治性、本体的表示形式和内在逻辑结构的多样性以及人们对客观世界的认识程度和方法的不同而造成的不同领域或是同一领域内的专家们采用不同的组织方式来描述本体，导致异构本体的产生。而这种异构现象已成为不同系统相互理解和交互的主要障碍，并且违背了本体共享知识的特性。因此，要实现网络间的基于语义的信息交流，就必须解决不同本体之间的异构问题，实现异构本体的互操作。目前，本体匹配是解决本体异构的最有效方法之一。本体匹配是指在不改变原有本体的前提下在异构本体之间建立某些映射规则，使异构本体对同一问题达成共识，实现异构本体间的知识共享。早期的本体匹配是一个工作量大并且复杂的工程，需由人工完成，并且过程繁琐、容易出错。随着本体信息内容越来越庞大、复杂，仅仅依靠

展开阅读全文