信息资源组织方法论

上传人:wm****3 文档编号:52256157 上传时间:2018-08-19 格式:PPT 页数:42 大小:743.50KB
返回 下载 相关 举报
信息资源组织方法论_第1页
第1页 / 共42页
信息资源组织方法论_第2页
第2页 / 共42页
信息资源组织方法论_第3页
第3页 / 共42页
信息资源组织方法论_第4页
第4页 / 共42页
信息资源组织方法论_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《信息资源组织方法论》由会员分享,可在线阅读,更多相关《信息资源组织方法论(42页珍藏版)》请在金锄头文库上搜索。

1、信息资源组织方法论 本体方法刘炜 目 录 什么是本体? 本体有什么作用? 本体如何发挥作用? 本体如何生成 本体应用举例 本体是“概念体系的规范A specification of a conceptualization(Gruber, 1993) “本体是对概念体系的明确的、形式化、可共 享的规范说明”“An Ontology is a formal and explicit specification of a shared conceptualisation of a domain of interest” Studer 1998) 。 本体是对于存在的研究或科学 the science

2、 or study of being(见牛津英语辞典)什么是知识本体?Ontology建模元素 类(classes)或概念(concepts) 对象的集合 关系(relations) 在领域中概念之间的交互作用,如子类关系 函数(functions) 特殊的关系,关系的前n1个元素可以唯一决定第n个元素。如 Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。 公理(axioms) 代表永真断言,如概念乙属于概念甲的范围。 实例(instances) 代表元素,就是对象。本体的功能和作用 在人、机器(表现为软件代理)以及人与 机器之间共享对于信息及结构的共同理解 实现

3、一定程度的领域知识的重用 知识本体可以明确领域假设,使领域公理 得到明确描述从而达成共知 对于领域知识进行分析、明确,并使其形 式化Why develop an ontology? To share common understanding of the structure of information among people or software agents To enable reuse of domain knowledge To make domain assumptions explicit To separate domain knowledge from the opera

4、tional knowledge To analyze domain knowledge本体对于世界的假设世界是由对象组成的There are objects in the world. 对象有属性特征可以被赋值Objects have properties or attributes that can take values. 对象之间有各种关系Objects can exist in various relations with each other. 属性与关系并不是一成不变的Properties and relations can change over time. 不同的时间会发生不

5、同的事情There are events that occur at different time instants. 总是有一些事件发生一些过程有一些对象会参与There are processes in which objects participate and that occur over time. 世界以及其中的对象会有不同的状态The world and its objects can be in different states. 一个事件会引起另一些事件或状态Events can cause other events or states as effects. 对象会有许多部

6、分组成Objects can have parts. Chandrasekaran, etc 1999本体对于数字图书馆的作用 提供与描述型元数据有关语义描述的知识地图 提供资源库领域知识的规范描述 提供元数据映射方案,集成到数字图书馆体系中 的元数据服务中,成为协议的一部分 提供智能代理与信息环境之间基于语义的理解机 制 作为跨平台、跨系统之间的通信中介 分布环境下查询请求的语义理解 数字图书馆中的数据挖掘本体方法弥补元数据方法的不足 元数据方案不具有普遍适用性。无法克服特殊性与一般性 的矛盾,而形式化的知识本体可以提供一种在元数据方案 之间自动映射的机制,通过语义Web服务的体系架构进行

7、实现; 元数据应用难以实现元数据方案本身的进化,而知识本体 可以提供信息系统的其它视图,只需要通过自动或半自动 的手段应用新的元数据方案; 元数据方案自身难以对不同知识体系、不同“粒度”的资源 进行描述,而知识本体正是起到这个作用,从而实现异构 资源和系统之间的语义联系; 单纯的元数据方案对于数字资源的整个生命周期的描述非 常困难,而采用以诸如FRBR模型为基础的知识本体,这 个问题便迎刃而解,不同生命周期的知识产权属性也非常 易于描述;本体的功能实现书目数据二次文献网络资源裸数据全文库内容层本体映射 本体模型本体层元数据收获元数据映射服务智能代理元数据层浏览检索表现层本体的特点 共享:Sha

8、red understanding within a community of people 描述:Declarative specification of entities and their relationships with each other 推理:Constraints and rules that permit reasoning within the ontology 服务:Behavior associated with stated or inferred facts知识表达工具本体的实现方法比较本体方法的实现机制 本体开发工具 内容采集或创建系统 存储于检索系统 本体推

9、理中介、软件、服务 应用集成仅仅有形式化的本体是不够的,就像叙词 方法必须要有情报检索系统支持一样。本 体也需要实现机制和系统支持,包括:本体描述举例WK0dc.Creatordc.Title “约翰 克里斯朵夫”WK1hasTranslationhasRelation手稿MN0Format“手稿”罗曼罗兰DateofBirth1866Biograph.MN1hasRelationEV0CreatesMN4hasRelation Format“电影”Duration “2 小时”ST4inStateEV1InvolvesrdfType“平明版”atTime“1952”MN2EV2Involve

10、srdfType“安徽文艺版atTime“1990”Format“精装”“平装”ST1ST2hasOutputhasOutputhasInput图2:ABC本体模型描述傅雷翻译作品约翰 克里斯朵夫DateofBirth1866Biograph.傅雷Translator本体描述语言OWL 由DAML+OIL发展而来 基于RDF和RDFS 分3个版本Lite/DL/Full知识本体的创建建立本体的目标、范围、 需求分析概念(词表)汇总本体关系分析本体形式化本体维护/修订本体信息本体领域本体知识共享系统知识库本体创建阶段本体维护阶段本体操作阶段反馈最终用户领域专家本体需求分析 (1)所构建的知识本体

11、覆盖的学科领域,该学科 领域资源的基本状况。 (2)知识本体的建设目的、任务要求、实现的社 会与经济效益。 (3)利用知识本体的基本用户与核心用户,用户 需求的基本特点。 (4)较之其他资源系统,知识本体将提供什么样 的服务。 (5)知识本体和其他资源系统的关系,包括资源 的进一步映射和整合。 (6)知识本体在建设时间、进度上的要求。本体规划 (1)明确计划中要达到的工作目标,论证工作的重要性 和必要性。 (2)明确工作的具体任务和要求,每一时期的中心任务 和工作重点;对任务进行层层分解,列出工作责任矩阵, 确定完成工作的优先次序。 (3)明确计划中各项工作开始和完成的时间,在任务分 解的基础

12、上进行统筹规划,以便进行有效的控制和协调。 (4)说明完成计划的方式方法、具体措施,对资源进行 合理分配和集中使用,并进行综合平衡。 (5)规定控制标准和工作指标,也就是说必须做到什么 程度、达到什么标准才算完成了计划。本体构建 复用 利用工具确定本体概念间关系 (1)确定领域知识本体的核心概念集 (2)构建领域知识本体概念关系 (3)将本体概念及关系模型化 本体编码 本体的形式化编码阶段就是用选定的本体 语言来描述知识本体 多种方法都可以描述本体,例如关系数据 库、逻辑、OWL,主要要看如何实现本体评价 (1)本体的完整性。即本体是否包括了该领域重要概念 ,概念及关系是否完整,概念的等级、层

13、次是否多样化。 (2)本体的清晰性。即本体中的术语是否被清晰无歧义 的定义。除了规范的主题、分类术语外,对本体进化产生 的概念是否给出明确、严格的语义定义。 (3)本体的一致性。即本体中的概念间的关系在逻辑上 是否严密、一致,能否支持本体在语义逻辑上的推理。 (4)本体的可扩展性。即本体可否顺利实施进化,本体 能否在层次结构上可扩充,在语义上可丰富与完善,能否 加入新的术语概念。 (5)本体的兼容性。即本体的开放性和互操作性,本体 能否和其他领域本体及相关资源系统进行映射,包括系统 层、逻辑层、语义层、表现层等的兼容和互操作。本体工具 本体工具一般可以区分为:本体开发工具 (Developme

14、nt tools)与本体映射工具(Mapping Tools) 前者包括:Protg-2000, OntoEdit,OilEd, WebODE, Ontolingua等 后者包括:PROMPT, ONION, OBSERVER,Chimaera, FCA-Merge, GLUE等。 我们因为不涉及具体的应用,所以不关注映射工具。但是 本体领域一直极为关注不同本体的集成、映射等,所以映 射工具也是十分重要的一块。评价本体开发工具的指标 互操作性:包括把其他本体导入到此开发工具; 把用此开发工具编辑出的本体导出为各种本体语 言等 知识模型的表达能力(Expressiveness of the kn

15、owledge model) 灵活性、可变性 (Scalability) 可扩展性(Extensibility) 推理的支持程度Availability and capabilities of inference services 可用性(Usability of tools)本体工具比较的一个案例这是一个全面的对本体工具的对比。共对比了52个本体工具 http:/ r_Survey.html此案例中对比的指标共17个对比指标 Tool:名称 Version:最新版本 Release Date :最新版本的发布日期 Source :设计或者维护的机构 Modeling Features:本体的分类体系 Base Language :本体描述语言 Web Support (binary) relations and endorelations; graphs and graph morphisms; etc.Upper Classification Ontologynamespaces: orders, monotonic functions, order bimodules, adjoint pairs, Galois connections, concept lattices, concept mo

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号