基于本体和规则的受控自然语言系统模型研究

上传人:E**** 文档编号:118097522 上传时间:2019-12-11 格式:PDF 页数:115 大小:1.10MB
返回 下载 相关 举报
基于本体和规则的受控自然语言系统模型研究_第1页
第1页 / 共115页
基于本体和规则的受控自然语言系统模型研究_第2页
第2页 / 共115页
基于本体和规则的受控自然语言系统模型研究_第3页
第3页 / 共115页
基于本体和规则的受控自然语言系统模型研究_第4页
第4页 / 共115页
基于本体和规则的受控自然语言系统模型研究_第5页
第5页 / 共115页
点击查看更多>>
资源描述

《基于本体和规则的受控自然语言系统模型研究》由会员分享,可在线阅读,更多相关《基于本体和规则的受控自然语言系统模型研究(115页珍藏版)》请在金锄头文库上搜索。

1、华中科技大学 博士学位论文 基于本体和规则的受控自然语言系统模型研究 姓名:李虎 申请学位级别:博士 专业:控制科学与工程 指导教师:田金文 2010-05-28 I 华华 中中 科科 技技 大大 学学 博博 士士 学学 位位 论论 文文 摘摘 要要 从 20 世纪 50 年代至今,自然语言处理作为人工智能的一个重要分支有很大发 展。但是由于自然语言本身的特性,目前计算语言技术还不能像人一样处理自然语 言,从而限制了自然语言在智能系统中的应用。受控自然语言是自然语言的一个子 集,以语言学、逻辑学、知识分类理论、心理学和信息学等为理论基础,在一个领 域内限制自然语言的词库、语法及意义,减少或者消

2、除语言的歧义性和复杂性的目 的,从而提高了自然语言在智能系统中的应用性。语义网是目前被广泛用于知识表 示的一种技术,目的是构造一个以本体为核心的语义网络。目前,由 W3C 组织提出 的 OWL 本体和 SWRL 规则技术规范已经广泛用于构造各种知识库系统。本文在对 受控自然语言、本体及规则的相关理论进行深入研究基础上,提出了基于本体和规 则的受控自然语言系统模型,主要工作包括以下几个方面: 首先, 建立了基于 WordNet 的受控自然语言本体词库模型 CNLNet, 采用本体论 描述领域概念及概念之间的关系,便于受控自然语言系统进行歧义消解处理。 WordNet 是一个规模最大并且使用最为广

3、泛的在线英语语义词典。 WordNet 把同义词 集合作为基本元素按照一种系统化结构进行组织,每个同义词集合代表一个词汇概 念,语义之间的关系通过概念之间的关系体现,包括同义关系、反义关系、整体与 部分和上下位关系等等,形成一个完整的词汇语义网络。本体是从哲学范畴借用的 一个概念,是语义网体系结构中的重要内容,具有强大的语义描述能力,采用形式 化和结构化的方式从不同的层次对本体及本体之间的关系进行语义描述,便于计算 机可以识别并且对其进行解释和处理。 其次,提出了基于本体词库的下文无关文法理论的受控自然语言解释器 CNLInterpreter。CNLInterpreter 有两部分组成:句法剖

4、析器和语法树解释器。句法剖 析器以概率词条化上下文无关文法理论为基础,结合 CNLNet 本体词库,把受控自 然语言句子剖析成抽象语法树;语法树解释器把抽象语法树解释成中间表达语言篇 章表述结构,篇章表述结构描述了受控自然语言句子的语义信息。实验证明该解释 器具有较好的句法剖析和语义解释能力。 II 华华 中中 科科 技技 大大 学学 博博 士士 学学 位位 论论 文文 然后,提出了基于本体和规则的受控自然语言系统的推理机 CNLReasoner。 CNLReasoner 的逻辑基础是语义网 OWL 本体公理和 SWRL 规则公理。受控自然语 言句子经过语言处理部分生成篇章表述结构,然后通过知

5、识转换工具转换成语义网 OWL 本体和 SWRL 规则知识,最后通过 Jess 规则引擎对知识进行推理。实验证明 了该推理机的正确性和有效性。 最后,建立了基于本体和规则的受控自然语言的用户接口系统模型。基于逻辑 的受控自然语言具有形式逻辑的基础,除了可以用于描述知识外,还可以作为计算 机系统的用户接口与用户进行交互。受控自然语言句子通过语言处理部分生成篇章 表述结构,通过基于本体和规则的知识库系统识别用户输入的关键语义信息,提交 给应用系统执行相关操作,并返回执行结果信息。 通过以上工作,本文详细讨论了基于本体和规则的受控自然语言系统模型。本 文在本体和规则的理论基础上提出了两种受控自然语言

6、应用模型:一是基于本体和 规则的推理系统,结合语义网本体和规则公理进行推理,构建知识库系统;二是基 于本体和规则的用户接口系统,通过本体与规则分析受控自然语言的语义信息,提 交给应用系统,执行系统动作,完成业务操作。这两个系统模型基本实现了本体、 规则和受控自然语言的有机结合,为受控自然语言在相关领域范围内应用提供技术 支持框架。实验表明,本文提出的基于本体和规则的受控自然语言系统模型不仅具 有重要的理论意义,而且具有实用价值,本文研究结果可以作为受控自然语言相关 应用研究的参考和应用基础。 关键词:关键词:受控自然语言 本体 规则 词网 语义网 上下文无关文法 语义网本体语言 语义网规则语言

7、 III 华华 中中 科科 技技 大大 学学 博博 士士 学学 位位 论论 文文 Abstract Natural Language Processing (NLP) is an important branch and topic of artificial intelligence. Due to the characteristics of natural language itself, NLP can not be processed by the current computing technology as handled by human. Therefore, the app

8、lication of natural language is limited. Controlled natural language (CNL) is a subset of NLP, which takes Linguistics, logic, classification theory of knowledge, psychology and information science, etc. as theoretical basis, reducing or eliminating the ambiguity and complexity of the language in a

9、domain by restricting the vocabulary, grammar and meaning of natural language, and providing the application of natural language. Ontology is an important component of semantic web. Information is given well-defined semantics through ontology to facilitate works collaboratively between computers and

10、 humans. Rule is used to describe knowledge. Knowledge system based on rules can be implemented through logic programming. In this paper, in-depth study has been conducted to the controlled natural language, ontology and rule characteristics, and a model of controlled language system based on ontolo

11、gy and rules is proposed on from the study, which mainly includes the following aspects: Firstly, propose an ontology lexicon model of controlled language based on WordNet. WordNet is a semantic-oriented English Dictionary, and is similar to a traditional dictionary, and provides a rich level of sem

12、antic relations, including synonymous relations, antonym relations, and the context relationships, etc., which associate words and words together to form a word network. Ontology is a concept borrowed from philosophy category, providing formal language to capture relevant domain knowledge; and provi

13、ding conventional understanding to the domain knowledge, and determining the common recognized words in a domain, and then giving a clear definition of relationships between the words from different levels of formal models. Thus, by integrating WordNet general lexicon and ontology domain lexicon, an

14、 ontology lexicon model of controlled natural language can be constructed. Secondly, propose an interpreter based on ontology lexicon. The interpreter has two components: Syntactic parser and Syntax tree interpreter. Syntactic parser, based on the theory of Probabilistic Lexicalized Context-Free Gra

15、mmar, will parse the CNL sentences into the abstract syntax tree by combining WordNet, word part of speech defined by IV 华华 中中 科科 技技 大大 学学 博博 士士 学学 位位 论论 文文 ontology domain lexicon, and the relationships between words. Syntax tree interpreter interprets abstract syntax tree into Discourse Representa

16、tion Structure of an intermediate Expression Language, which describes semantic information of the sentences. Thirdly, propose a system model of controlled language reasoning based on ontology and rules. The logic foundation of this model is axioms of Semantic web OWL and SWRL. The controlled language sentences are partially made into DRS through language processing unit, and transformed into Semantic web OWL and rule knowl

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号