《粗糙集理论的基本概念ppt课件》由会员分享,可在线阅读,更多相关《粗糙集理论的基本概念ppt课件(225页珍藏版)》请在金锄头文库上搜索。
1、 人的分类能力是对事物的认识能力 是一种知识 从认知科学的观点来理解知识 知识可以被理解为对事物的分类能力及知识的分类能力可用知识系统的集合表达形式来描述 知识在不同的范畴中有许不同的含义 粗糙集理论认为 知识直接与真实或抽象世界的不同分类模式联系在一起 知识被看作是关于论域的划分 是一种对对象进行分类的能力 第2章粗糙集理论的基本概念2 1知识与知识库 定义1 1 知识和概念 范畴或信息粒 设U是给定研究对象的非空有限集合 称为一个论域 论域U的任何一个子集X U 称为论域U的一个概念或范畴 论域U的一个划分 X1 X2 Xn 概念簇 称为关于U的抽象知识 简称知识 为了规范化 我们认为空集
2、也是一个概念 称为空概念 在粗糙集理论中 主要讨论的是那些能够在论域U上形成划分或覆盖的知识 我们知道U的划分 X1 X2 Xn 与U上的等价关系R一一对应 即给定U的一个划分 X1 X2 Xn 等同于给定U上的一个等价关系R 从数学的角度讲 关系的表示和处理比分类的表示和处理简单得多 因此 我们通常用等价关系或关系来表示分类及知识 因此知识也可以定义为 设R是U上的一个等价关系 U R X1 X2 Xn 表示R产生的分类 称为关于U的一个知识 通常情形下 我们在问题求解的过程中 处理的不是论域U上的单一划分 知识或分类 而是论域U上的一簇划分 这导致了知识库的概念 定义1 2 知识库 U为给
3、定的一个论域 S是U上的一簇等价关系 称二元组K U S 是关于论域U上的一个知识库或近似空间 因此 论域上的等价关系就代表着划分和知识 这样 知识库就表示了论域上的由等价关系 这里指属性特征及其有限个的交 导出的各种各样的知识 即划分或分类模式 同时代表了对论域的分类能力 并隐含着知识库中概念之间存在的各种关系 定义2 3 不可分辨关系 不分明关系 给定一个论域U和U上的一簇等价关系S 若P S 且P 则P P中所有等价关系的交集 仍然是论域U上的一个等价关系 称为 P上的不可分辨关系 记为IND P 也常简记为P 而且 这样 U IND P x IND P x U 表示与等价关系IND P
4、 相关的知识 称为知识库K U S 中关于论域U的P 基本知识 P 基本集 在不可能产生混淆的情况下 即P U和K都明确时 为了简便 我们可用P代替IND P 用U P代替U IND P IND P 的等价类也称为知识P的基本概念或基本范畴 事实上 P基本范畴拥有知识P的论域的基本特征 换句话说 他们是知识的基本模块 特别地 如果Q S 则称Q是关于论域U的Q 初等知识 Q的等价类为知识S的Q初等概念或初等范畴 我们用IND K IND P P S 表示知识库K U S 中所有等价关系 他对于集合的交运算是封闭的 任意有限个P 基本范畴的并 称为P 范畴 知识库K U S 中所有的范畴称为K
5、范畴 定义2 4 两个知识库的关系 设K1 U S1 和K2 U S2 为两个知识库 如果IND S1 IND S2 即U IND S1 U IND S2 则称知识库K1与K2是等价的 记为K1 K2或者S1 S2 因此当两个知识库有同样的基本范畴集时 这两个知识库中的知识都能使我们确切的表达关于论域的完全相同的事实 这就意味着可以用不同的属性集对论域的对象进行描述 以表达关于论域完全相同的知识 如果IND S1 IND S2 我们称知识库K1 知识S1 比知识库K1 知识S2 更精细 或者说K2 知识S2 比K1 知识S1 更粗糙 当S1比S2更精细时 我们也称S1为S2的转化 或S2为S1
6、的泛化 泛化意味着将某些范畴组合在一起 而特化则是将范畴分割成更小的概念 如果上述两种情形都不满足 则称两个知识库不能比较粗细 表2 1积木的信息表 2 2粗糙集的基本定义及其性质 其中 X Y为论域U的子集 符号 表示集合的补运算 例2 3如表2 2 一个决策表 所示 对于属性子集 等价关系 P 头疼 肌肉疼 请判断论域的一个子集合X e2 e3 e5 是否为P的粗糙集 若不是 请说明理由 若是 请求出X的P 下近似集 上近似集 边界域 正域 负域 表2 2例2 3中的一个医疗诊断决策表 2 3粗糙集的特征2 3 1粗糙集的数字特征1 集合的近似精度和粗糙度定义2 7 近似精度和粗糙度 给定
7、一个论域U和U上的一个等价关系R 称等价关系R定义的集合X的近似精度和粗糙度分别为 集合 范畴或概念 的不精确性是由于边界域的存在而引起的 集合的边界域越大 其精确性则越低 反应了在知识R下对于集合X表达的范畴了解的程度 显然 对每一个R和 X的R 边界域为空集 所以集合X是R 可定义的 R 精确集 当 1时 集合X有非空R 边界域 所以集合X是R 不可定义的 R 粗糙集 X的R 粗糙度与精度恰恰相反 它反映了我们在知识R下对于集合X表达的范畴了解的不完全程度 当X为空集时 我们规定 例2 6给定一个知识库K U S 和知识库中一个等价关系R IND K 它导出的等价类如下 Y1 x1 x4
8、x8 Y2 x2 x5 x7 Y3 x3 Y4 x6 其中 论域U x1 x2 x8 试计算下列集合的R 近似精度和粗糙度 其中 直观上看 粗糙集理论对事情的不精确性表述不需要任何假定的先验知识 而只是依赖于所给定的知识表达系统 通过上 下近似算子直接计算得到的 这一点与概率论和模糊集合论是完全不同的 从粗糙集理论的角度看 客观事物的不精确性是由于我们所掌握知识的有限性所导致 换句话说 是由对事物所包含对象的分类能力有限的结果所引起的 因此 人们在没有任何先验知识的条件下 可以通过分类的手段来处理不精确的数值特征 进而表示概念得精确程度 2 近似分类精度和近似分类质量 定理2 8给定一个论域U
9、和其上的一个等价关系 知识 R 其对应的划分或商集为 如果 都有 成立 则对于任意 都有 至此 我们已经介绍了两种刻画粗糙集的方法 其一为用近似程度的精确度来表示粗糙集的数字特征 其二为用粗糙集的分类表示粗糙集的拓扑特征 粗糙集的数字特征表示了集合边界域的大小 但没有说明边界域地结构 而粗糙集的拓扑特征没有给出边界域大小的信息 它提供的是边界域的结构 此外 粗糙集的数字特征和粗糙集的拓扑特征之间存在一种关系 首先 如果集合为内不可定义或全不可定义 则其精度为0 其次 当集合为外不可定义或全不可定义时 则它的补集的精度为0 这样 即使知道了集合的近似精度 我们也不能确定它的拓扑结构 反过来 集合
10、的拓扑结构也不具备精度的信息 因此 在粗糙集的实际应用中 我们需要将边界域的两种信息结合起来 既要考虑近似精度因素 也要考虑到集合的拓扑结构 下面再通过一个例子来说明这两种表示之间的关系 例2 17给定一个知识库 和一个等价关系 其中论域为 且R的等价类为 试计算和讨论下列集合的数字特征和拓扑特征 解 1 对集合 下近似 上近似 因为 是R 可定义集 边界域 近似精度 2 对集合 下近似 上近似 而言 因为 同时 边界域 近似精度 3 对集合 下近似 上近似 根据定义2 12可知 集合X3为R 内不可定义 近似精度 所以X2是R 粗糙可定义 边界域 4 对于集合 下近似 上近似 根据定义2 1
11、2可知 集合X4为R 外不可定义 5 对于集合 下近似 上近似 根据定义2 12可知 集合X5为R 全不可定义 近似精度 边界域 近似精度 边界域 2 4粗糙集中的隶属关系在集合论中 成员与集合的隶属关系 成员关系 是所有关系中最基本的关系 对隶属关系的分析是我们进行计算 推理的基础 本节主要介绍粗糙集中的隶属关系 2 4 3粗糙集合论的成员关系 定义2 14给定一个知识库 近似空间 其中 为论域 上的等价关系簇或单个的等价关系 则定义 为元素 关于知识 的隶属于集合 粗糙隶属度 也称为集合 的 粗糙隶属函数 其中 表示集合的基数 x R表示元素关于知识R的等价类 注 在粗糙集理论中 隶属度函
12、数 成员关系 依赖于我们的知识R 即一个对象是否属于一个集合依赖于我们所掌握的知识R 成员关系并不是绝对的 性质2 4粗糙集理论中成员关系 隶属度函数 的性质 值越大说明对象x属于集合X的程度就越高 当 时 表明对象x依据知识R判断肯定不属于集合X 当 时 表明对象x依据知识R判断肯定属于集合X 当隶属度 时 表明对象x依据知识R判断有可能属于集合X 同时也有可能不属于集合X 即对象x落入集合X的 边界域 这足以说明集合X的模糊性完全是由边界域不空引起的 2 对象x依据知识R判断肯定属于集合 对象x依据知识R判断可能属于集合 对象x依据知识R判断肯定不属于集合 就是集合X的特征函数 提供的不可
13、区分关系 是一个等价关系 是论域U中两两互不相交的集合组成的集合簇 则 x U 其隶属度函数定义为 2 17 我们可以利用粗糙隶属度函数来定义粗糙集合论的基本概念 例如上近似 下近似 边界域 正域 负域等 定义2 15给定一个论域U和U上的一个等价关系R x U 我们如下定义集合X的R 下近似集 R 边界域 R 正域 R 负域 由此可以看出 粗糙集定义的两种方法都是强调粗糙集概念的各个方面 由近似定义诱导出粗糙集的拓扑结构 而隶属度函数的方法则强调它的数值性质 用概率论术语可以解释为 在粗糙集理论中 一个对象是否隶属于某一集合 概念 不是该元素的客观性质 而且取决于我们对它的了解程度 即知识
14、的分类能力 这更符合人类的认知过程 粗糙集中的集合关系 集合的粗糙包含关系粗糙集合论的基本概念之一是粗糙包含关系 类似地 我们可以通过上近似和下近似来定义粗糙包含关系 显然 集合的包含关系不同于集合的粗糙包含关系 下面给出一个例子来描述粗糙包含关系 性质2 5粗糙包含关系的性质 2 5 2集合的粗糙相等关系集合的粗糙相等不同于一般的相等关系 在许多实际问题的求解过程中 我们利用所掌握的知识很难判断两个范畴之间是否完全相同 通常只能够判断两者之间是否存在较大的差异 粗糙不等 或较小的差异或极小的差异或极其微小的差异 粗糙相等 也就是说两个范畴的特征之间只有微小的差异 有时 可能还要分别考虑概念的
15、正例 反例之间存在的关系 这可以通过下粗相等或上粗相等关系来刻画 集合的粗糙相等关系对实际问题的求解有应用价值 下面将介绍这些内容 实际上 集合的粗糙相等关系主要是比较集合的拓扑结构 而不是集合的元素 在一个给定的知识库中 基于不同的知识 两个集合可能是精确相等 也可能是粗糙 近似 相等 或许是粗糙不相等 从粗糙集的观点看 集合的相等是一个相对概念 不是绝对的 它与我们所掌握的知识 或者说对事物的了解程度密切相关 综上所述 粗糙集的基本性质 诸如成员的隶属关系 集合的包含关系 集合的相等关系等都是相对的 都与我们所掌握的知识R相关 因此 在这样的意义下 可以认为粗糙集的方法是经典集合论方法的主
16、观认识 2 6知识约简知识约简在智能信息或数据的处理中占有十分重要的地位 也是粗糙集理论的核心内容之一 一般来讲 知识库中的知识 属性或等价关系 并不是同等重要的 甚至其中某些知识是不必要的 或者说是冗余的 所谓的知识约简是指在保持知识库的分类能力不变的条件下 删除其中不必要的知识 本节主要介绍知识的约简和核 还包括概念簇的约简 2 6 1知识的约简与核知识约简中有两个最基本的概念 约简 reduction 与核 core 由于它涉及知识的独立性 所以我们先介绍知识独立性的定义 如果对每一个R P R都为P中必要的 则称P为独立的 否则称P是依赖的或不独立的 定理2 10如果知识P是独立的 G P 则G一定也是独立的 定义2 19 知识的约简 给定一个知识库K U S 和知识库上的等价关系P S 对任意的G P 若G满足以下两条 1 G是独立的 2 IND G IND P 则称G是P的一个约简 记为G RED P 其中 RED P 表示P的全体约简组成的集合 显然 知识的任何一个约简与知识本身对知识库中的任意一个范畴的表达都是等同的 即它们对论语的分类能力相同 一般而言 知识的约简不唯