人工智能知识表示与推理博弈树搜索ppt课件

资源描述

《人工智能知识表示与推理博弈树搜索ppt课件》由会员分享，可在线阅读，更多相关《人工智能知识表示与推理博弈树搜索ppt课件（61页珍藏版）》请在金锄头文库上搜索。

1、2020 4 24 人工智能ArtificialIntelligence AI 2020 4 24 2 4博弈问题的搜索技术2 4 1博弈问题的表达2 4 2极大极小搜索过程2 4 3 剪枝法 2020 4 24 2 4 1博弈问题的表达博弈是一类具有竞争性的智能活动双人博弈即两位选手对垒轮流依次走步其中任何一方都完全知道对方过去已经走过的棋步和今后可能的走步其结果是一方赢而另一方则输或双方和局 2020 4 24 博弈的例子一字棋跳棋中国象棋围棋五子棋 2020 4 24 双方的智能活动任何一方都不能单独控制博弈过程而是由双方轮流实施其控制对策的过程博弈的特点 2020

2、 4 24 如何根据当前的棋局选择对自己最有利的一步棋人工智能中研究的博弈问题 2020 4 24 用博弈树来表示它是一种特殊的与或图节点代表博弈的格局即棋局相当于状态空间中的状态反映了博弈的信息与节点或节点隔层交替出现博弈问题的表示 2020 4 24 假设博弈双方为 MAX和MIN在博弈过程中规则是双方轮流走步在博弈树中相当于博弈双方轮流扩展其所属节点为什么与节点或节点隔层交替出现 2020 4 24 从MAX方的角度来看所有MIN方节点都是与节点理由因为MIN方必定选择最不利于MAX方的方式来扩展节点只要MIN方节点的子节点中有一个对MAX方不利则该

3、节点就对MAX方不利故为与节点 2020 4 24 从MAX方的角度来看所有属于MAX方的节点都是或节点理由因为扩展MAX方节点时 MAX方可选择扩展最有利于自己的节点只要可扩展的子节点中有一个对已有利则该节点就对已有利 MAX 好招 2020 4 24 总之从MAX方来说与节点或节点交替出现反之从MIN方的角度来看情况正好相反 2020 4 24 在博弈树中先行一方的初始状态对应着树的根节点而任何一方获胜的最终格局为目标状态对应于树的终叶节点可解节点或本原问题但是从MAX的角度出发所有使MAX获胜的状态格局都是本原问题是可解节点而使MIN获胜的状态

4、格局是不可解节点 2020 4 24 例Grundy博弈分配物品的问题如果有一堆数目为N的钱币由两位选手轮流进行分配要求每个选手每次把其中某一堆分成数目不等的两小堆直至有一选手不能将钱币分成不等的两堆为止则判定这位选手为输家 2020 4 24 用数字序列加上一个说明来表示一个状态 3 2 1 1 MAX 数字序列表示不同堆中钱币的个数说明表示下一步由谁来分即取MAX或MIN 2020 4 24 现在取N 7的简单情况并由MIN先分注如果MAX走红箭头的分法必定获胜所有可能的分法 7 MIN 6 1 MAX 5 2 MAX 4 3 MAX 5 1 1 MIN 4 2

5、1 MIN 3 2 2 MIN 3 3 1 MIN 4 1 1 1 MAX 3 2 1 1 MAX 2 2 2 1 MAX 2 2 1 1 1 MIN 3 1 1 1 1 MIN 2 1 1 1 1 1 MAX 2020 4 24 对于比较复杂的博弈问题只能模拟人的思维向前看几步然后作出决策选择最有利自己的一步即只能给出几层走法然后按照一定的估算办法决定走一好招 2020 4 24 2 4 2极大极小过程对于复杂的博弈问题要规定搜索深度与时间以便于博弈搜索能顺利进行假设由MAX来选择走一步棋问题是 MAX如何来选择一步好棋 2020 4 24 对于每一格局棋局给出

6、定义或者倒推一个静态估价函数值值越大对MAX越有利反之越不利极大极小过程的基本思路 2020 4 24 对于给定的格局 MAX给出可能的走法然后MIN对应地给出相应的走法这样重复若干次得到一组端节点必须由MIN走后得到的由MAX下的棋局这一过程相当于节点扩展注博弈树深度或层数一定是偶数 2020 4 24 对于每一个端节点计算出它们的静态估价函数然后自下而上地逐层计算倒推值直到MAX开始的格局在MIN下的格局中取估值的最小值在MAX下格局中取估值的最大值取估值最大的格局作为MAX要走的一招棋 2020 4 24 例向前看一步的两层博弈树 2020 4 24

7、定义静态函数e P 的一般原则 2020 4 24 OPEN 存放待扩展的节点此时为队列即以宽度优先的策略扩展节点CLOSED 存放已扩展的节点此时为堆栈即后扩展的节点先计算静态估价函数值符号 2020 4 24 1 将初始节点S放入OPEN表中开始时搜索树T由初始节点S构成2 若OPEN表为空则转53 将OPEN表中第一个节点n移出放入CLOSED表的前端极大极小搜索过程为 2020 4 24 4 若n可直接判定为赢输或平局则令对应的e n 或0 并转2 否则扩展n 产生n的后继节点集 ni 将 ni 放入搜索树T中 2020 4 24 此时若搜索深度d ni 小于预

8、先设定的深度k 则将 ni 放入OPEN表的末端转2 否则 ni达到深度k 计算e ni 并转2 续 2020 4 24 5 若CLOSED表为空则转8 否则取出CLOSED表中的第一个节点记为np Open为空即已经扩展完节点步2 2020 4 24 6 若np属于MAX层且对于它的属于MIN层的子节点nci的e nci 有值则 e np max nci 某一个节点属于MAX的含义是该节点等待MAX来扩展 2020 4 24 续若np属于MIN层且对于它的属于MAX层的子节点nci的e nci 有值则 e np min nci 2020 4 24 7 转58 根据e S

9、的值标记走步或者结束或0 2020 4 24 第一阶段为1 2 3 4步用宽度优先算法生成规定深度k的全部博弈树然后对其所有端节点计算e P 第二阶段为5 6 7 8步是自下而上逐级求节点的倒推估价值直至求出初始节点的e S 为止再由e S 选得相对较好的走法过程结束算法分成两个阶段 2020 4 24 等对手走出相应的棋再以当前的格局作为初始节点重复此过程选择对自己有利的走法 2020 4 24 2020 4 24 例一字棋的极大极小搜索过程约定每一方只向前看一步扩展出二层记MAX的棋子为 MIN的棋子为 O 规定MAX先手 2020 4 24 若格局P对任

10、何一方都不能获胜则e P 所有空格上都放上MAX的棋子后 MAX的三个棋子所组成的行列及对角线的总数所有空格上都放上MIN的棋子后 MIN的三个棋子所组成的行列及对角线的总数静态估计函数e P 定义为 2020 4 24 若P是MAX获胜则e P 若P是MIN获胜则e P 2020 4 24 例计算下列棋局的静态估价函数值 e P 6 4 2 棋局行 2列 2对角 2 行 2列 2对角 0 2020 4 24 利用棋盘的对称性有些棋局是等价的 2020 4 24 1 0 1 0 1 1 0 1 0 2 1 2 1 2 1 1 MAX MIN MAX MAX的走步 2020

11、4 24 第二步 2 1 3 2 1 1 1 0 2 0 1 1 0 2 2 3 1 2 2 1 1 1 0 0 1 3 MIN 2020 4 24 第三步 0 2 1 1 2 2 1 0 1 1 1 1 1 1 1 2 1 1 2020 4 24 MAX MIN 2020 4 24 MAX MIN O O 2020 4 24 上机实验作业用C C 语言编写一字棋的游戏程序基本要求必须实现极大极小过程能够进行人机对垒机机对垒简单地显示对垒过程实验形式两人或者一人一组 2020 4 24 实验报告格式一字棋游戏的计算机程序学号姓名专业摘要1一字棋游戏的文字描述2

12、一字棋对垒过程的计算机描述和实现3实例人机对垒的过程机机对垒的过程 4体会5参考文献附录程序使用的简单说明 2020 4 24 提交的材料 1 文字报告 2 程序原代码提交的方式以学号姓名为压缩文件名发送到wgqu 提交的时间 11月21日口头报告介绍报告的主要内容和演示程序特别是自己觉得有特色的地方初步时间是12月初 2020 4 24 2 4 3 剪枝法极大极小搜索过程由两个完全分离的两个步骤组成 1 用宽度优先算法生成一棵博弈搜索树 2 估计值的倒推计算缺点这种分离使得搜索的效率比较低 2020 4 24 改进在博弈树生成过程中同时计算端节点的估计值及倒推值以减

13、少搜索的次数这就是过程的思想也称为剪枝法其中表示MAX节点的估值的下界已经搜索到的MAX节点的最小值表示MIN节点的估值的上界已经搜索到的MIN节点的最大值 2020 4 24 极大极小过程采用宽度优先的方式来扩展节点剪枝法改用深度优先的策略来扩展节 2020 4 24 一字棋的左边部分 MAX MIN 现扩展B得到C 其值为 1 则B的倒推值小于等于 1 即 1 再扩展B的子节点 B的值也不会大于 1 结果是B比A差不用再扩展B的其他子节点了此处 MIN节点B的值小于等于其先辈MAX节点S的值停止扩展 C 扩展S生成A B 扩展A生成5个子节点倒推得到A的

14、值为 1 可以得到S的值大于等于 1 即 1 2020 4 24 更一般的情况 MIN节点的不大于其先辈MAX节点的值则可以中止扩展 MAX节点的不小于其先辈MIN节点的值则可以中止扩展 2020 4 24 一般而言当某一个节点的后继节点倒推值已经给定时则倒推值的上下界可以被修正注意 MAX节点的值非减 MIN节点的值非增 2020 4 24 值的计算方法第一一个MAX节点的值等于其后继节点当前最大的最终倒推值第二一个MIN节点的值等于其后继节点当前最小的最终倒推值 2020 4 24 剪枝的规则为 1 若任何MIN结点的值小于或等于任何它的先辈MAX结点的

15、值则可中止该MIN结点以下的搜索此时这个MIN结点的最终倒推值就是已得到的值该值与真正的极大极小的搜索结果的倒推值可能不相同但是对起始结点而言倒推值是相同的使用它选择的走步也是相同的 2020 4 24 2 若任何MAX结点的值大于或等于它的MIN先辈结点的值则可以中止该MAX结点以下的搜索此时这个MAX结点处的倒推值就是已得到的值 2020 4 24 当搜索用规则1终止时我们称进行了剪枝而当搜索用规则2终止时我们称进行了剪枝在搜索过程中保存和值如果出现满足使用两条规则的条件我们就中止某一些搜索这一过程称为剪枝过程 2020 4 24 过程

16、的主要思想步骤 1 采用有界的深度优先搜索算法 2 立即计算端节点的估值 3 剪枝4 剪枝5 当初始节点的所有后继节点的最终倒推值全部给出后搜索过程结束 2020 4 24 例图中矩形表示MAX的节点圆圈表示MIN的节点多个画线表示被修剪的枝原来有38个节点现在只有22个节点必须估值每一次扩展一个节点 2020 4 24 MAX MAX MAX MIN MIN 2020 4 24 若以最理想的情况进行搜索即对MIN节点先扩展最低估值的节点 MAX能先扩展最高估值的节点则搜索深度为D 每一个节点都有B个后继节点对于极大极小过程搜索端节点的数目对于过程搜索端节点数目为若B 2 D 4 则极大极小过程的端节点为16 过程的节点为7 感谢亲观看此幻灯片此课件部分内容来源于网络如有侵权请及时联系我们删除谢谢配合

展开阅读全文