第二章 信息表知识表达系统

上传人:pu****.1 文档编号:563641885 上传时间:2022-08-20 格式:DOCX 页数:7 大小:34.03KB
返回 下载 相关 举报
第二章 信息表知识表达系统_第1页
第1页 / 共7页
第二章 信息表知识表达系统_第2页
第2页 / 共7页
第二章 信息表知识表达系统_第3页
第3页 / 共7页
第二章 信息表知识表达系统_第4页
第4页 / 共7页
第二章 信息表知识表达系统_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《第二章 信息表知识表达系统》由会员分享,可在线阅读,更多相关《第二章 信息表知识表达系统(7页珍藏版)》请在金锄头文库上搜索。

1、第二章 信息表知识表达系统知识表达是智能信息系统的关键。所谓知识获取,就是要从大量 的原始数据信息中分析发现有用的规律信息,即是将知识从一种原来 的表达形式(原始数据表达形式)转换为一种新的目标表达形式(人 类或者计算机便于处理的形式,如逻辑规则等)。基于Rough集理论的 知识发现,主要是借助于信息表这样一种有效的数据表知识表达方式 本章就将介绍这种信息表知识表达系统。首先对知识利用分类的概念 进行描述,然后对信息表描述的知识表达系统进行介绍,并加以形式 化描述,再对决策表这种特殊的信息表进行详细讨论,最后讨论与决 策表相应的决策规则。2.1 知识的分类概念知识是人类通过实践,认识到的客观世

2、界的规律性的东西,是人 类实践经验的总结和提炼,具有抽象和普遍的特性。知识是信息经过 加工处理、解释、挑选和改造而形成的。知识是命题、规则等的集合 知识一般可分为说明性知识、过程性知识和控制性知识。说明性知识 提供概念和事实。例如,一个智能检索系统中,说明性知识包括说明 具体事实的数据库内容。用规则表示问题的知识称作过程性知识。智 能信息检索系统中利用过程性知识处理说明性知识。用控制策略表示 问题的知识称为控制性知识。控制性知识包含有关各种处理过程、策 略和结构的知识,常用来协调整个问题求解的过程。从认知科学的一些观点来看,可以认为知识来源于人类以及其他 物种的分类能力,本书中,我们认为知识即

3、是将对象进行分类的能力 上述的说明性知识可以认为是对现实世界客观个体的描述,即是区分 客观个体的知识;过程性知识实质上是通过利用说明性知识对客观个 体进行分类的知识;而控制性知识也是关于如何用过程性知识实现对 客观个体进行分类的知识,也可以认为是关于对过程性知识的分类。假定我们起初对论域里的个体(对象)具有必要的信息或知识, 通过这些知识能够将其划分到不同的类别。若我们对两个元素具有相 同的信息,则他们是不可区分的,即根据已有的信息不能够将其划分 开,显然这是一种等价关系。通常,我们在对现实问题进行处理的时 候,会将我们讨论的现实个体(或称元素、对象、样本)局限在某一 个特定的区域范围之内,这

4、个区域内的所有个体就组成问题的论域u。 以分类为基础,可以将分类理解为等价关系,而这些等价关系对论域U 进行划分。对于论域中由等价关系划分出的任意子集X,都可称之为U 中的一个概念。这里,我们认为空集也是一个特殊的概念。论域U中 的任意概念族称为关于 U 的抽象知识,也简称知识,它也是代表了对 u中个体的分类。这样,知识就可以定义为:给定一组数据(集合)U 和等价关系集合R,在等价关系集合R下对数据集合U的划分,称为 知识,记为U/Ro U上的一族划分(对U的分类),称为关于U的知识 库。关于U的一个知识库也可以理解为一个关系系统,其中U为论域, R是U上的一族等价关系,根据这些等价关系就可以

5、对U进行不同的 划分(知识),每种划分将把U分为不同的子集(概念)。设U是一个论域,R是U上的一个等价关系。U/R表示U上导出 的所有等价类。xR表示包含元素x的R的等价类,xeUo 一个知识库R就是一个关系系统K=U, P,其中U是论域,P是U上的一个等价 关系簇。如果QuP,且Q罚,贝0Q (Q的所有等价关系的交)也是一 个等价关系,记作 IND(Q)。定义2.1-1 设K=(U,P)和K=(U,Q)是两个知识库。如果 IND(P)=IND(Q),则称K和(或U和P)是等价的,记作辰 (或 P=Q)o 知识库K和K1等价,意味着K和K1具有相同的基础类,因而它 们具有相同的表达能力。表 2

6、.1-1个体编号头疼肌肉疼体温流感e1是是正常否e2是是高是e3是是很高是e4否是正常否e5否否高否e6否是很高是例2.1-1表2.1-1所示的个体集合组成论域U,其中包含6个个体, 每个个体是一个四元组,元组的每一维表示个体的一个属性信息。这 些个体都可以通过用其属性知识来描述。例如一个个体可以代表其是 否头疼、是否肌肉疼、体温是否正常、是否是流感。如果我们按照某 一个属性或多个属性来描述这些个体,就可以得到不同的分类知识。按照头疼来分类:U/头疼= % e2, e3, e4, e5, e6这里,e1 e2和e3这三个个体在头疼这个属性上是不可区分的, 即他们一起构成一个类,e4、e5和e6

7、这三个个体构成另一个类。456按照肌肉疼、体温和流感这三个属性分别来分类:U/肌肉疼= % e2, e3, e4, e6,e5 U/体温=e4 , e2, e5 , e3, e6U/流感=e4, e5, e2, e3, e6按照头疼和肌肉疼这两个属性来共同分类:U/头疼和肌肉疼= e, e2, e3,e4, e6 , e5 按照头疼和体温这两个属性来共同分类:U/头疼和体温= e, e2, e3, e4, e5, e6按照头疼和流感这两个属性来共同分类:U/头疼和流感= e, e2, e3, e4, e5, e6由此,可以看出,我们可以用不同的标准来对论域进行分类,得 到不同的概念和抽象,有的

8、概念是我们需要的,有的概念是没有价值 的,知识获取就是要探寻有用的概念,并得到概念之间的关系。2.2 信息表知识表达系统人之所以有智能行为是因为他们有知识。要让机器具有智能行为 的能力,就必须让机器具有相应的知识,它需要以人的知识作为其工 作基础。知识表示就是要研究用机器表示知识的可行的、有效的、通 用的原则和方法。近年来知识表示的研究引起了广泛的注意。目前, 常用的知识表示方法有逻辑模式、框架、语意网络、产生式规则、状 态空间、剧本等,这些是知识工程需要研究的内容。本节中,我们将 介绍一种基于信息表的知识表达形式,它是 Rough 集理论中对知识进 行表达和处理的基本工具。在人工智能研究中,

9、一个实例(现实世界中的一个对象、个体) 经常使用属性-值对的集合来表示,实例集就是这样的实例集合,记为 U。U可被划分为有限个类X2、X,使得1 2 nXicU, Xi, XiCX.=giHj),对 i,j=1,2, .,n 且uXi=U0信息表知识表达系统的基本成分是研究对象的集合,关于这些对 象的知识是通过指定对象的属性(特征)和它们的属性值(特征值) 来描述的。一般地,一个信息表知识表达系统S可以表示为S=。这里,U是对象的集合,也称为论域,R=CuD是属性集合,子集C和 D分别称为条件属性集和结果属性集,V=u RV是属性值的集合,V reR rr表示属性reR的属性值范围,即属性r的

10、值域,f: UxRtV是一个信息 函数,它指定 U 中每一个对象 x 的属性值。为了直观方便, U 也可以写成一个表,纵轴表示实例标记,横轴 表示实例属性,实例标记与属性的交会点就是这个实例在这个属性的 值。这个表称为信息表,是表达描述知识的数据表格。对于每个属性子集BR,我们定义一个不可分辨二元关系(不分 明关系)IND(B),即,IND(B)= (x,y)l(x,y)eU2,VbeB(b(x)=b(y).显然,IND(B)是一个等价关系,且IND(B) = c IND(b)。beB每个子集BuR也可称为一个属性,当B是单元素集时,称B为原 始的,否则称B为复合的。属性B可以认为是用等价关系

11、(在该属性 上的取值相等)表示的知识的一个名称,称为标识属性。一个表可以 看作是定义的一个等价关系簇,即知识库。实际上,信息表这种数据表格知识表达系统是对客观对象的描述 和罗列,表达的是属于说明性的知识。当信息表包含的数据足以反映 论域的时候,通过属性所对应的等价关系就可以体现论域中的过程知 识,即概念之间的逻辑关系或规则知识。事实上,从信息表所表达的 说明性知识中发现过程性知识(规则知识)就是知识发现的研究内容 在对信息表进行进一步论述之前,我们先来看几个信息表知识表达系 统的例子。例 2.2-1 表 2.2-1 给出了一个关于玩具积木的信息表。根据这个信息表,我们可以得到有关的概念描述,如

12、将玩具积木 按照颜色、形状和大小分别可以进行如下分类,得到有关玩具积木的 概念知识:U/ R1=x1,x3,x7,x2,x4,x5,x6,x8U/ R2=x1,x5,x2,x6,x3,x4,x7,x8U/ R3=x1,x3,x4,x5,x6,x2,x7,x8这里,信息表中所包含的属性集只有对对象(积木)进行描述的 属性。表 2.2-1样本集颜色(RJ形状(R2)大小(R3)XRed2Round3Small1X2BlueSquareLarge2X3RedTriangularSmall3x4BlueTriangularSmallX5YellowRoundSmall5X6YellowSquareSm

13、all6X7RedTriangularLarge/X8YellowTriangularLarge例 2.2-2 如表 2.1-1 所示的信息表,表示了流感病例的数据信息。 有的病例属于流感,有的病例不是流感。论域U= % e2, e3, e4, e5, e6, 它的属性集可以分为条件属性集C=头疼,肌肉疼,体温和结果属性 集D=流感,属性头疼的值域是是,否,肌肉疼的值域是是,否, 体温的值域是正常、高、很高,信息函数将每个对象的属性取值映 射到具体的属性值上,例如f,头疼)=是he?,体温)=咼,从表 2.1-1还可以看出,条件属性和结果属性之间还存在一定的关 系,如当肌肉疼的属性值为否,的时

14、候,流感的属性值肯定是否, 这可以形成诸如规则等形式的过程性知识,这是以后讨论知识获取的 时候将要研究的问题。用信息表来表示知识,我们对系统的实际语意、表中的取值的具 体含义内容并不感兴趣。实际上,表中的属性值都是从现实问题中采 集得到的,是对客观对象属性的抽象描述。我们以后将把信息表中的 属性值仅当作数据来研究。下面,我们再对决策表这种数据表格知识 表达系统作形式化的讨论。2.3 决策表决策表是一类特殊而重要的知识表达系统,也是一种特殊的信息 表,它表示当满足某些条件时,决策(行为、操作、控制)应当如何 进行。决策表可以定义如下:定义 2.3-1 一 个 决 策 表 是 一 个 信 息 表

15、知 识 表 达 系 统 S=vU,R,V,f, R=CuD是属性集合,子集C和D分别称为条件属性集 和结果属性集,Dh。条件属性C和结果属性D的等价关系IND(C)和IND(D)的等价类 分别称为条件类和决策类。一个决策表中的结果属性有时是唯一的,称为单一决策;有时是 不唯一的,称为多决策。对于具有多个结果属性的决策表,我们可以 通过如下两种方法变换成为单一决策的决策表。方法一 如果决策表S=vU,R,V,f, R=CuD是属性集合,子集C 和D分别称为条件属性集和结果属性集,且。二心心,贝I可以 将该决策表分解成为n个不同决策的单一决策表S,S2, :Sn,其中 Si=, U是论域,Ri=Cudi是属性集合,子集C 和dj分别 称为条件属性集和结果属性集,V.=J R.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号