本体论的研究和应用现状.pdf

上传人:飞****9 文档编号:136890026 上传时间:2020-07-03 格式:PDF 页数:13 大小:209.03KB
返回 下载 相关 举报
本体论的研究和应用现状.pdf_第1页
第1页 / 共13页
本体论的研究和应用现状.pdf_第2页
第2页 / 共13页
本体论的研究和应用现状.pdf_第3页
第3页 / 共13页
本体论的研究和应用现状.pdf_第4页
第4页 / 共13页
本体论的研究和应用现状.pdf_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《本体论的研究和应用现状.pdf》由会员分享,可在线阅读,更多相关《本体论的研究和应用现状.pdf(13页珍藏版)》请在金锄头文库上搜索。

1、本体论的研究和应用现状 本体论的研究和应用现状 刘红阁 郑丽萍 张少方 刘红阁 郑丽萍 张少方 摘要摘要 “本体论”原是哲学研究中发展出来的一个概念。近年来,本体论的研究和应用受到了知识工程及 相关应用领域的广泛关注。 本文对目前本体论的研究和应用现状进行了综述, 主要内容包括: 本体的定义、 发展本体的原因、本体的设计原则和方法论、本体的描述语言和国内本体的研究现状。最后本文指出了当 前本体论研究中存在的一些问题和未来本体论研究的主要方向。 关键字 关键字 本体论、知识工程、语义 Web 1 引言 1 引言 “本体论” (Ontology,大写 O)原是哲学研究中发展出来的一个概念,研究客观

2、事 物存在的本质和组成。本体论在哲学定义上的主要特点在于本体论是关于世界某个方面的 一个特定的分类体系,这个体系不依赖任何特定的语言。近年来,随着信息科学的飞速发 展,本体论逐渐用于知识工程和信息科学等领域之中。 本文就目前本体论的研究和应用现状进行了系统介绍和综合评述。首先就本体的定义 和内涵进行了深入的讨论 (第 2 节) , 其次给出了发展本体的原因以及本体的具体应用领域 (第三节) ,介绍了本体的设计原则和方法论(第 4 节) 、当前主流的本体描述语言(第 5 节) ,讨论了国内本体论研究和应用状况(第 6 节) ,最后本文指出了当前本体论研究中存 在的一些问题和未来本体论研究的主要方

3、向(第 7 节) 。 2 本体是什么? 2 本体是什么? 本体论(Ontology)和本体(ontology)在英文表示是不一样的,即一个用大写的“O” 开头, 另一个则用小写的 “o” 开头。 本体论这个术语诞生于 17 世纪, 派生于希腊语的 onto 和 logia,是一个哲学的分支。从哲学上来说,本体论是研究客观事物存在的本质,所以 本体论在哲学上的真正内涵是对世界上任何领域内的真实存在所做出的客观描述。对本体 论的理解,人们不存在什么疑问。但是对本体(ontology)的理解,哲学界和计算机科学 界存在着不同的观点。 在哲学界,本体作为表述哲学理论的术语,是指形成现象的根本实体。 近

4、十多年来, 本体论的研究日益成熟, 也已经远远超过了哲学的范畴, 和信息技术 (例 如:面向对象系统) 、知识工程及人工智能都有着密切的关系。尤其本体论最近在 Web 上的 应用直接导致了语义 Web 的诞生,企图解决 Web 信息共享中的语义问题,给 Web 带来了勃 勃生机和无限遐想。 知识工程界认为本体是一种 engineering artifact(工程人造物) 。尽管本体论的研 究日益成熟,但“本体究竟是什么”仍是一个争论中的话题。本文根据时间顺序就部分研 究者对本体做出的定义列出如下,以供参考: 首先, Neches et al.(1991)指出: “一个本体定义了组成主题领域的词

5、汇的基本术语 和关系,以及用于组合术语和关系以定义词汇的外延的规则。 ” 该定义只是给出了建立一 个本体的基本要素,即:要建立一个本体,首先要识别所处理领域的基本术语和这些术语 之间的关系,而后识别组合这些术语和关系的规则,并提供这些术语和关系的定义。 Gruber(1993)指出本体是概念化 (Conceptualization) 的一个显式的规格说明; Borst (1997) 对该定义进行了修改, 提出:“本体是被共享的概念化的一个显式的规格说明。 ” 这 两个定义后来成为人们经常引用的定义,它们都特别强调了给出显式解释的可能性。 William 和 Austin(1999)指出,本体是

6、用于描述或表达某一领域知识的一组概念或术 语,可用于组织知识库较高层次的知识抽象,也可用来描述特定领域的知识。 Chandrasekaran 等人(1999)认为本体是属于人工智能领域中的内容理论, 它研究特定 领域知识的对象分类、对象属性和对象间的关系,为领域知识的描述提供术语。 从以上不同研究者的定义,可以看出本体涉及到的概念为:术语(词汇) 、术语关系、 规则、概念化、形式化的规格说明、领域知识、表达和共享。其实,本体就是通过对于概 念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系和描述语言。 3 为什么要研究和发展本体? 3 为什么要研究和发展本体? 当前的计算机正在从单

7、一的设备向进行信息交换和事务处理的世界范围网络转变。因 此,支持数据、信息和知识的交换、重用和共享成了当今计算机技术要迫切面临的任务。 我们之所以在知识工程、自然语言处理、信息检索系统、智能信息集成和知识管理、 信息交换和软件工程等等领域研究和发展本体,是因为本体有以下突出的特点: (1) 本体可以在不同的建模方法、范式、语言和软件工具之间进行翻译和映射,以 实现不同系统之间的互操作和继承。 (2) 从功能上来讲,本体和数据库有些相似。但是本体比数据库表达的知识丰富得 多。首先,定义本体的语言,在词法和语义上都比数据库所能表示的信息丰富得多; 最重要的, 本体提供的是一个领域严谨丰富的理论,

8、而不单单是一个存放数据的结构。 (3) 本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础。这种形 式化的描述可成为软件系统中可重用和共享的组件。 (4) 本体可以为知识库的构建提供一个基本的结构。以描述对象的类型而言:有简 单事实及抽象概念, 这些可以描述成一个本体的静态实体部分, 它们主要描述的是事 物或概念的各个组成部分以及这些组成部分之间的静态联系; 本体也可以描述事物或 概念的运动和变化。 应用本体, 知识库就可以运用这类结构去表达现实世界中浩如烟 海的知识和常识, 这点在中科院数学所陆汝钤 Lu,2000研究员建立的Pangu知识库中得到 了很好的体现。 (5) 对于知识

9、管理系统来说,本体就是一个正式的词汇表。本体可以将对象知识的 概念和相互间的关系进行较为精确的定义。在这样一系列概念的支持下进行知识搜 索、知识积累、知识共享的效率将大大提高,真正意义上的知识重用和知识共享也能 成为现实。 (6) 本体适合表示抽象的描述。而企业模型是人们对企业或者企业的某些模型的抽 象描述, 因此在企业逻辑建模中, 本体的使用可以帮助我们清楚地理解企业特定领域 的相关元素、关系和概念,让知识表达更加准确便捷,帮助人们进行更好的企业决策 金芝,2001。 本体在语义 Web 和其它很多领域都有着广泛的应用。本体的最大贡献在于它可以将某 个或多个特定领域的概念和术语规范化,为其在

10、该领域或领域之间的实际应用提供便利。 4 本体的设计原则和方法学 4 本体的设计原则和方法学 Gruber(1993)指出了本体的 5 点设计原则:明确/客观、一致、可扩展性、最小编码 误差及最小本体承诺。Arpirez(1998)则认为应遵守标准术语,同层次间保持最小语义距 离及使用多种层次概念。 由于本体工程到目前为止仍处于相对不成熟的阶段, 每一个工程拥有自己独立的方法。 通常参照 IEEE1074-1995 标准(软件开发生命周期法)建立不同的工程方法。下面是知识 工程界所承认的几种本体开发方法: (1) Uschold的“骨架”法 Uschold, 1998 这个模式是从爱丁堡大学的

11、经验中产生的。采用这个模式目前已开发出Enterprise Ontology Uschold, 1998。它由一组与企业相关的术语和定义组成,主要用于企业模拟。下面是 Uschold的本体构建流程图: 确定本体应用的目的和范围 本体分析 本体的表示 (2) Grninger和Fox的“评价法” Grninger & Fox,1995: 这个方法用于构造多伦多虚拟企业本体工程(TOVE 1) ,由多伦多大学企业集成实验室 研制,使用一阶逻辑进行集成。TOVE本体包括企业设计本体、工程本体、计划本体和服务 本体。具体的本体开发过程如下: ? 定义直接可能的应用和所有解决方案:他们认为开发本体的动机

12、来自实际的应 用,一旦存在现有本体不能回答的问题,就需要开发新的本体。 ? 非形式化的本体能力问题的形成:提供潜在的非形式化的对象和关系的语义表 示。 ? 术语的抽取和定义:从非形式化能力问题中提取出非形式化的术语,然后用一 种形式语言(如KIF 2)定义这些词汇。 ? 问题形式化。 ? 形式化公理:这些公理用来定义本体词汇的语义和约束,在 TOVE 中,所有公理 用一阶谓词逻辑表示。 (3) Berneras方法 15 该方法用于欧洲的ESPRIT项目KACTUS,KACTUS的主要表达方法是CML 3,具体开发过程 为: ? 应用的说明:提供应用的上下文和应用模型所需的组件; 1 Toro

13、nto Virtual Enterprise 2 Knowledge Interchange Format 3 Conceptual Modeling Language 本体的建立 符合?本体的评价 符合 图 1:Uschold 的“骨架”法流程图 ? 相关本体论范畴的初步设计:搜索已存在的本体,进行提炼、扩充。 ? 本体的构造:最小关联原则用来确保模型既相互依赖,又尽可能一致,以至得 到最大同构。 (4) Methontology方法 Gmez-Prez, 1998 这种本体开发模式是由西班牙马德里理工大学提出的。他们使用本体生命周期的概念 来管理整个本体的开发过程,使本体的开发过程更接近于

14、软件工程中的软件开发过程。具 体分为三个阶段:管理阶段、开发阶段和维护阶段。管理阶段主要包括本体开发的计划、 控制和质量保证。开发阶段包括规格说明、概念化、形式化和执行等步骤。维护阶段和开 发阶段是同时展开的,包括知识获取、系统集成、知识评价、产生文档和配置管理等。 目前的本体构建方法论还未能像软件工程那样成为“科学”或“工程过程”的完整方 法论。因此,只有总结和发展现有的各种方法论,结合具体应用,再配合领域专家的支持, 才能提出适合具体项目的优秀本体构建方法。 5 本体描述语言 5 本体描述语言 目前为止, 已经实现的本体主要有: CYC 13、 TOVE17、 Enterprise6、 K

15、ACTUS15、 SENSUS14、 Pangu 14、NKI15。本体描述语言是用来描述本体的,它让用户可以为领域模型编写清晰、 形式化的概念描述。事实上,本体描述语言起源于人工智能领域对知识表示的研究,因此 本体的描述语言不仅仅需要具有良好定义的语法和语义,充分的表达能力,更需要有效的 推理支持(包括计算复杂性和可判定性等) 。 目前,经常被使用的本体表示语言大都以框架模型或谓词演算 4或两者相结合为基础, 最具有代表性的有KIF,Ontolingua,CycL,Loom,OIL等。还有另外一种本体的表示方法 就是用图来表示本体, 一个典型例子是WordNet。 它采用语义网络作为词汇本体

16、的基本表示 形式。另外,Sowa提出概念图 5的表示方法,它来源于Charles Sanders Peirce的存在图思 想。简单说,概念图是一个有向连通的二分有向图,包含两类结点:概念结点和概念关联 结点,每个概念关联结点存在一条或多条弧,每条弧都与一个概念结点相连。Sowa曾经用 一些典型实例说明概念图与谓词演算以及与KIF之间表示的等价性。 5.1 CycL5.1 CycL 13 CycL是CYC的知识表示语言,它是一种表达能力和灵活性都很强大的描述性语言。CYC 是位于美国德州奥斯汀的MCC 6公司的研究项目,在Lenat指导下历时十多年建立的包含 1600000 多条知识和几百个微理论的常识知识库,其目的是通过本体开发为常识推理 7提供 基础。 事实上,CYC 采用本体组成模块化的微理论(microtheories)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号