分析学习PPT课件.pptx－金锄头文库

资源描述

《分析学习PPT课件.pptx》由会员分享，可在线阅读，更多相关《分析学习PPT课件.pptx（60页珍藏版）》请在金锄头文库上搜索。

1、第十一章分析学习 2020 4 8 1 前言神经网络和决策树这样的学习方法需要一定数目的训练样例才能达到一定级别的泛化精度分析学习使用先验知识和演绎推理来扩大训练样例提供的信息因此它不受同样的界限制约本章讨论一种称为基于解释的学习 EBL 的分析学习方法基于解释的学习中先验知识用于分析观察到的学习样例是怎样满足目标概念的然后这个解释用于区分训练样例中哪些是相关的特征哪些是不相关的这样样例就可基于逻辑推理进行泛化而不是基于统计推理 2020 4 8 2 简介归纳和分析学习问题 PROLOG EBG算法 PROLOG EBG运行举例 1 2 3 4 目录对基于解释的学习

2、的说明 5 搜索控制知识的基于解释的学习 6 小结 7 2020 4 8 3 简介前面章节讨论的各种归纳法决策树神经网络归纳逻辑编程遗传算法在实践中的一个关键限制是在可用数据不足时性能较差正如第7章分析给定数目的训练样例学习的精度存在基本的上下界是否能开发出这样的学习方法它们训练精度上的基本限制不受可用训练数据的数量所制约 2020 4 8 4 简介基于解释的学习就是这样的一种学习方法 1 能接受显式的先验知识与训练数据一同作为输入 2 使用先验知识来分析或解释每个训练样例以推理出样例的哪些特征与目标函数相关哪些不相关 3 减小了待搜索假设空间的复杂度减小了样

3、本复杂度提高了学习器的泛化精度注意基于解释的学习与前一章所示的归纳逻辑系统如CIGOL 使用先验背景知识来指导学习不同因为后者使用背景知识推理出的特征扩大了输入实例的描述增加了待搜索假设空间的复杂度 2020 4 8 5 例子下国际象棋的学习任务我们期望程序学习识别棋局位置的重要类别比如有一目标概念黑棋将在两步内失去王后的棋盘状态下图显示了此目标概念的一个正例白马同时攻击黑王和黑后黑棋必须移动其王从而白棋就会吃掉黑后 2020 4 8 6 例子下国际象棋的学习任务当然归纳逻辑方法也能用于学习此目标概念但是我们需要提供成千上万的类似上图的训练样例才能期望归纳

4、学习到的假设被正确地泛化这里我们要研究一下人类的学习方法人类只需要少数的训练样例就能学习到这样的目标概念人类是怎样从少数训练样例中成功地泛化的呢答案在于人类非常依赖合法移动棋子的先验知识来解释或分析训练样例如上图的训练样例多数人会给出这样的解释因为白马同时攻击黑王和黑后黑子必须摆脱被将军的局面所以让白子吃掉黑后该解释的重要性在于它提供了所需要的信息以从训练样例的细节中合理泛化到正确的一般假设此解释中提到的样例特征如白马黑王黑后的位置是与目标概念有关的应该被包含在一般的假设中 2020 4 8 7 例子下国际象棋的学习任务在下棋的例子中学习器需要的先验知

5、识是下棋的合法规则即马以及其他子的合法移动对弈者必须交替移子以及要赢棋必须抓住对方的王对弈理论上只要给定这样的先验知识就有可能对任意棋盘状态计算出最优的走法然而实践中这样的计算极为复杂人类也很难做到因此在下棋以及诸如调度和规划等的搜索密集问题的人类学习中包含了一个很长的发现先验知识的过程 2020 4 8 8 基于解释学习的基本原理基于解释学习利用先验知识分析一个或少数几个实例说明观察到的学习实例是怎样满足目标概念的然后基于逻辑推理对样例进行泛化产生适合以后求解类似问题的控制规则和知识解释学习分为两步 1 通过分析一个求解实例来产生解释结构 2 对结构进行泛化

6、获取一般的控制规则 2020 4 8 9 内容安排 1 给出一个特定的基于解释的学习算法称为Prolog EBG 2 考查Prolog EBG的一般特性以及与前面讨论的归纳算法之间的关系 3 描述了应用基于解释的学习以提高大状态空间搜索的性能本章假定生成解释所基于的先验知识是完全正确的下一章讨论更一般的情况即先验知识只是近似正确注意 2020 4 8 10 归纳和分析学习问题分析和归纳学习问题的重要区别是它们设想的学习问题形式不同 1 在归纳学习中学习器被赋予一个假设空间H和训练数据D 它从H中选择一个输出假设并且希望这个假设与D一致 2 在分析学习中学习器的输入除了假设空间

7、H和训练数据D 还有一个领域理论B 由可用于解释训练样例的背景知识组成学习器中H中选择一个输出假设并希望这个假设既与D一致也与B一致 2020 4 8 11 归纳和分析学习问题分析学习举例学习的目标概念黑棋将在两步内失去王后的状态实例 xi描述一特定棋盘状态当黑棋两步内失去王后 f xi 值为真否则为假假设空间用Horn子句集表示其中谓词表示棋子的位置领域理论形式化的下棋规则注意在分析学习中引入一致性约束当领域理论B不涵蕴h的否定时则称h与B一致一致性约束减少了当数据不能单独在H中决定h时学习器面临的歧义性领域理论由一组Horn子句描述它使系统原则上可以

8、加入任何学习到的假设至后续的领域理论中 2020 4 8 12 例子 SafeToStack x y 已知实例空间X 每个实例描述一对物理对象它们由谓词Color Volume Owner Material Type Density描述它们之间的关系用谓词On描述假设空间H 每个假设是一组Horn子句规则每个Horn子句的头部为一个包含目标谓词SafeToStack的文字每个Horn子句为文字的合取这些文字基于描述实例的谓词以及谓词LessThan Equal GreaterThan和函数plus minus和time 如下例SafeToStack x y Volume x vx

9、Volume y vy LessThan vx vy 目标概念谓词SafeToStack x y 表示两个物理对象一个可被安全地叠放在另一个上 2020 4 8 13 例子 SafeToStack x y 训练样例下面显示了一个典型的正例SafeToStack Obj1 Obj2 On Obj1 Obj2 Owner Obj1 Fred Type Obj1 Box Owner Obj2 Louise Type Obj2 Endtable Density Obj1 0 3 Color Obj1 Red Material Obj1 Cardboard Color Obj2 Blue Mate

10、rial Obj2 Wood Volume Obj1 2 领域理论B SafeToStack x y Fragile y SafeToStack x y Lighter x y Lighter x y Weight x wx Weight y wy LessThan wx wy Weight x w Volume x v Density x d Equal w times v d Weight x 5 Type x Endtable Fragile x Material x Glass 求解 H中一个与训练样例和领域理论一致的假设 2020 4 8 14 例子 SafeToStack x y

11、SafeToStack x y Lighter x y Lighter x y Weight x wx Weight y wy LessThan wx wy Weight x w Volume x v Density x d Equal w times v d Weight x 5 Type x Endtable 2020 4 8 15 用完美的领域理论学习 Prolog EBG 本章考虑的基于解释的学习是在领域理论完美的情况下即领域理论正确且完整当领域理论中每个断言都是客观的真实描述时该领域理论被称为是正确的当领域理论覆盖了实例空间中所有正例时该领域理论被称为是完整的注意每个满

12、足目标概念的实例都可由领域理论证明其满足性但在这里完整性的定义不要求领域理论可证明反例不满足目标概念根据Prolog惯例不能证明的断言认定则为假因此完整性定义包含全部正例和反例 2020 4 8 16 用完美的领域理论学习 Prolog EBG 1 在某些情况下有可能提供完美领域理论比如下棋问题棋子的合法走子提供了完美的领域理论进一步讲有了这样的完美的领域理论也很难写出最优下棋策略在这种情况下我们更希望学习器得到完美的领域理论后能够形成对目标概念有帮助的描述如可能丢后的棋局状态方法是对特殊训练样例进行考查和泛化 2 在许多情况下不能够假定有完美的领域理论但我

13、们可以使用基于不完美领域理论的近似合理的解释它以完美理论为基础学习器的完美领域理论的假定是否合理如果学习器有了完美的领域理论还有必要再去学习吗 2020 4 8 17 Prolog EBG算法 Prolog EBG是一种基于解释的学习方法是一种序列覆盖算法它的过程是 1 学习单个Horn子句规则移去此规则覆盖的正例 2 在剩余正例上重复这个过程直到覆盖所有正例为止对于任意的正例集合 Prolog EBG输出的假设包含一组对应于领域理论的目标概念的逻辑充分条件 2020 4 8 18 基于解释的Prolog EBG算法 Prolog EBG TargetConcept Trai

14、ningExample DomainTheory LearnedRules Pos TrainingExamples中的正例对Pos中没有被LearnedRules覆盖的每个正例做以下操作 1 解释 Explanation 以DomainTheory表示的解释说明正例满足TargetConcept 2 分析 SuffcientConditions 按照Explanation能够充分满足TargetConcept的正例的最一般特征集合 3 改进 LearnedRules LearnedRules NewHornClause 其中NewHornClause的形式是 TargetConcept

15、 SufficientConditions 返回LearnedRules 2020 4 8 19 Prolog EBG的运行举例 Prolog EBG对每个还没有被某个Horn子句覆盖的正例通过下列步骤生成一新Horn子句 1 解释新的正例 2 分析该解释以确定一合适的泛化 3 通过加入一新的Horn子句以覆盖该正例以及其他相似实例来改进当前假设 2020 4 8 20 解释训练样例按照领域理论建立解释说明该正例如何满足目标概念当领域理论正确且完整时此解释构成了训练样例满足目标概念的证明一般情况下可能有多种解释这些解释中任意一个或所有的都可被使用每个解释可对训练样例形成不同的

16、泛化所有解释都将被给定的领域理论论证在Prolog EBG中解释的生成使用了如Prolog中的反向链式搜索找到第一个有效证明时终止如下图对前面SafeToStack Obj1 Obj2 的正例进行了解释此解释说明因为Obj1比Obj2更轻 Lighter 所以Obj1可以安全的堆叠 SafeToStack 在Obj2上更进一步知道Obj1更轻是因为它的重量 Weight 可由它的密度 Density 和体积 Volume 推得并且Obj2的重量 Weight 可由茶几 Endtable 的默认重量值得到 2020 4 8 21 解释训练样例 2020 4 8 22 分析解释从上图可以看出解释中包含了Obj1的Density 但没有它的Owner特征因此 SafeToStack x y 的假设应包含Density x 0 3 而不包含Owner x Fred 通过收集解释的叶节点中提及的特征可形成一个由领域理论论证的一般规则 SafeToStack x y Volume x 2 Density x 0 3 Type y Endtable 形成的规则构成了此训练样

展开阅读全文