第三讲动态博弈与逆向归纳法课件PPT

资源描述

《第三讲动态博弈与逆向归纳法课件PPT》由会员分享，可在线阅读，更多相关《第三讲动态博弈与逆向归纳法课件PPT（80页珍藏版）》请在金锄头文库上搜索。

1、趣味博弈论杨驭云华南师范大学南海校区2021/8/261 第三讲动态博弈与逆向归纳法 2021/8/262动态博弈博弈的本质在于各参与者的决策相互依博弈的本质在于各参与者的决策相互依存，这种相互作用或者互动通过两种方式体存，这种相互作用或者互动通过两种方式体现出来。现出来。2021/8/263 第一种方式：参与者同时行动或者虽非第一种方式：参与者同时行动或者虽非同时行动，但后行动者并不知道先行动者的同时行动，但后行动者并不知道先行动者的选择。比如石头、剪刀、布，还有囚徒困境。选择。比如石头、剪刀、布，还有囚徒困境。这一类博弈称为静态博弈。这一类博弈称为静态博弈。2021/8/264

2、第二种方式：参与者的行动有先后顺序，第二种方式：参与者的行动有先后顺序，后行动者可以观察到先行动者做了什么选择，后行动者可以观察到先行动者做了什么选择，先行动者的选择影响后行动者的选择空间。先行动者的选择影响后行动者的选择空间。此类博弈称为动态博弈。此类博弈称为动态博弈。2021/8/26521支旗游戏美国哥伦比亚广播公司的电视真人秀节美国哥伦比亚广播公司的电视真人秀节目目Survivor （幸存者）中有这样一个（幸存者）中有这样一个游戏：游戏：地面插着地面插着21支旗，两个人轮流移走这些支旗，两个人轮流移走这些旗。每个人在轮到自己时可以选择移走旗。每个人在轮到自己时可以选择移走1支、支

3、、2支或支或3支旗。拿走最后支旗。拿走最后1支旗的人获胜，无支旗的人获胜，无论这支旗是最后论这支旗是最后1支，还是支，还是2支或支或3支中的一支中的一支。支。2021/8/266 请大家两两配对来玩这个游戏，轮流充请大家两两配对来玩这个游戏，轮流充当先行者。时间为当先行者。时间为10分钟。分钟。2021/8/267 你是跟着感觉走来玩这个游戏吗？你是跟着感觉走来玩这个游戏吗？2021/8/268 你是否发现越玩到后面、剩下的旗越少你是否发现越玩到后面、剩下的旗越少的时候就越清晰地知道自己正确的策略是什的时候就越清晰地知道自己正确的策略是什么？么？2021/8/269 那就让我们向前展望、倒后推

4、理，即面那就让我们向前展望、倒后推理，即面向未来，思考现在，站在未来的立场来确定向未来，思考现在，站在未来的立场来确定现在的最优行动。现在的最优行动。2021/8/2610 倒数第二步，你必须留给对方倒数第二步，你必须留给对方4支旗。支旗。2021/8/2611 倒数第三步，你必须留给对方倒数第三步，你必须留给对方8支旗。支旗。2021/8/2612 依此类推，你必须依次给对方留下依此类推，你必须依次给对方留下12、16、20支旗来确保取胜。支旗来确保取胜。2021/8/2613 所以，在这个游戏中，先行者能确保取所以，在这个游戏中，先行者能确保取胜。胜。但如果游戏开始时是但如果游戏开始时是

5、20支旗，那么后行支旗，那么后行者能确保取胜者能确保取胜。2021/8/2614n这是一个典型的完全完美信息动态博弈。这是一个典型的完全完美信息动态博弈。n完全信息：每个参与者的策略集合及收益函完全信息：每个参与者的策略集合及收益函数均为博弈各方的共同知识。数均为博弈各方的共同知识。 n完美信息：每个参与者都知道先前行动的参完美信息：每个参与者都知道先前行动的参与者采取了什么策略。与者采取了什么策略。2021/8/2615n序贯理性：每个参与者在其每一个决策时点序贯理性：每个参与者在其每一个决策时点上都将重新优化自己的选择，并且会把自己上都将重新优化自己的选择，并且会把自己将来会重新优化其选择

6、这一点也纳入当前的将来会重新优化其选择这一点也纳入当前的优化决策当中。优化决策当中。n在序贯理性下不会有在序贯理性下不会有“后悔后悔”出现。出现。n“每个参与者是序贯理性的每个参与者是序贯理性的”是博弈的共同知是博弈的共同知识。识。序贯理性2021/8/2616n逆向归纳法：按与博弈进行顺序相反的方向逆向归纳法：按与博弈进行顺序相反的方向逐一找出每个参与者在其所有决策时点上的逐一找出每个参与者在其所有决策时点上的最优策略选择，直到第一个决策时点为止。最优策略选择，直到第一个决策时点为止。n“每个参与者是序贯理性的每个参与者是序贯理性的”是逆向归纳法的是逆向归纳法的基础。基础。逆向归纳法2021

7、/8/2617索马里海盗人力资源部招聘启事你忍心蜗居在不到你忍心蜗居在不到10平米的小屋里吗？你忍平米的小屋里吗？你忍心看着自己的女友和你奋斗一辈子还供不起一套房心看着自己的女友和你奋斗一辈子还供不起一套房吗？你忍心看着父母缩衣节食把仅有的一点养老金吗？你忍心看着父母缩衣节食把仅有的一点养老金帮你还房贷吗？帮你还房贷吗？这里才是实现你梦想的地方。加入我们，待遇这里才是实现你梦想的地方。加入我们，待遇从优，装备齐全，食宿全免，一条大裤衩，一双人从优，装备齐全，食宿全免，一条大裤衩，一双人字拖，一把字拖，一把AK47，800美元底薪美元底薪+提成，全天移提成，全天移动式海景套房，多劳多得。只要

8、大干一票，在大都动式海景套房，多劳多得。只要大干一票，在大都市买楼不再是梦想；干两票，跻身上层社会，直接市买楼不再是梦想；干两票，跻身上层社会，直接与奥巴马对话不再是距离。别再犹豫了，给你一片与奥巴马对话不再是距离。别再犹豫了，给你一片海域，换你一生奇迹！海域，换你一生奇迹！2021/8/26182021/8/2619海盗分金有有10名海盗抢得了名海盗抢得了100块金子，并打算瓜分这块金子，并打算瓜分这些战利品。这是一些讲民主的海盗，也就是遵循少些战利品。这是一些讲民主的海盗，也就是遵循少数服从多数原则，他们按照习惯的方式进行分配：数服从多数原则，他们按照习惯的方式进行分配：最厉害的一名海盗

9、提出分配方案，然后所有的海盗最厉害的一名海盗提出分配方案，然后所有的海盗包括提出方案本人就此方案进行表决。如果半数以包括提出方案本人就此方案进行表决。如果半数以上（含半数）的海盗赞同这一方案，那么这一方案上（含半数）的海盗赞同这一方案，那么这一方案就获得通过并按照这一方案进行战利品的分配；否就获得通过并按照这一方案进行战利品的分配；否则，提出方案的海盗将被扔进海里喂鲨鱼，然后剩则，提出方案的海盗将被扔进海里喂鲨鱼，然后剩余海盗中最厉害的海盗又重复上述过程。余海盗中最厉害的海盗又重复上述过程。2021/8/2620 假设：没有两名海盗是同等厉害的；这假设：没有两名海盗是同等厉害的；这些金块不能再

10、分，也不允许几名海盗共有些金块不能再分，也不允许几名海盗共有1块金子。块金子。那么，最厉害的一名海盗应该提出什么那么，最厉害的一名海盗应该提出什么样的分配方案呢？样的分配方案呢？2021/8/2621 考虑到分析的便利，这里按照这些海盗考虑到分析的便利，这里按照这些海盗能力的差异给他们编上序号。最怯懦的海能力的差异给他们编上序号。最怯懦的海盗为盗为1 1号海盗，次怯懦的海盗为号海盗，次怯懦的海盗为2 2号海盗，号海盗，依此类推，最厉害的海盗为依此类推，最厉害的海盗为1010号海盗。号海盗。2021/8/2622 海盗们基于三个因素来做决定：首先，海盗们基于三个因素来做决定：首先，自己要能存活

11、下来；其次，自己得到的利益自己要能存活下来；其次，自己得到的利益最大化；最后，在所有其它条件相同的情况最大化；最后，在所有其它条件相同的情况下，优先选择把别人扔进海里。下，优先选择把别人扔进海里。 2021/8/2623 这些海盗残酷的分配规则给人的第一印这些海盗残酷的分配规则给人的第一印象是：最厉害的那名海盗是个多么不幸的人象是：最厉害的那名海盗是个多么不幸的人啊！因为作为头一个提出方案的人，仅仅能啊！因为作为头一个提出方案的人，仅仅能活下来的机会都微乎其微：即使他自己一分活下来的机会都微乎其微：即使他自己一分不要，把金子全部送给另外不要，把金子全部送给另外9人，那些人可人，那些人可能也不赞

12、同他的分配方案，那么他只有死路能也不赞同他的分配方案，那么他只有死路一条！一条！2021/8/2624 真的是这样吗？真的是这样吗？2021/8/2625 任何一个海盗想让自己的方案获得通过任何一个海盗想让自己的方案获得通过的关键是事先考虑清楚的关键是事先考虑清楚“继承者继承者”的分配方的分配方案是什么，然后拉拢案是什么，然后拉拢“继承者继承者”分配方案中分配方案中最不得意的人们，争取用最小的代价获取最最不得意的人们，争取用最小的代价获取最大收益。大收益。因此，推理过程应该是从后向前，因为因此，推理过程应该是从后向前，因为越往后策略越容易看清。越往后策略越容易看清。2021/8/2626 分

13、析的出发点应该是博弈进行到只剩两分析的出发点应该是博弈进行到只剩两名海盗，即名海盗，即1号和号和2号的时候。这时最厉害的号的时候。这时最厉害的海盗是海盗是2号，而他的最佳分配方案一目了然：号，而他的最佳分配方案一目了然：100块金子全归他一人所有，块金子全归他一人所有，1号海盗什么号海盗什么也得不到。也得不到。为什么呢？为什么呢？2021/8/2627 现在加上现在加上3号海盗。号海盗。 1号海盗知道：如果号海盗知道：如果3号的方案被否决，号的方案被否决，那么最后只剩两个海盗，而那么最后只剩两个海盗，而1号将肯定一无号将肯定一无所获；另外，所获；另外，3号也明白号也明白1号了解形势。因此，号

14、了解形势。因此，只要只要3号的分配方案给号的分配方案给1号一点儿甜头使他不号一点儿甜头使他不至于空手而归，那么不论至于空手而归，那么不论3号提出什么样的号提出什么样的分配方案，分配方案，1号都将投赞成票，因此号都将投赞成票，因此3号需要号需要分出尽可能少的一点儿金子来收买分出尽可能少的一点儿金子来收买1号海盗。号海盗。2021/8/2628 那么，那么，3号海盗会提出什么样的分配方号海盗会提出什么样的分配方案呢？案呢？2021/8/2629 答案是：答案是：3号海盗分得号海盗分得99块金子，块金子，2号号海盗一无所获，海盗一无所获，1号海盗分得号海盗分得1块金子。块金子。2021/8/2630

15、 4号海盗的策略也差不多。他需要有半号海盗的策略也差不多。他需要有半数以上的支持票，因此同数以上的支持票，因此同3号一样也需要再号一样也需要再找一人做同谋。他可以给同谋的最低贿赂是找一人做同谋。他可以给同谋的最低贿赂是1块金子，在这里，他可以用这块金子来收块金子，在这里，他可以用这块金子来收买买2号海盗。因为如果号海盗。因为如果4号被否决而号被否决而3号得以号得以通过，则通过，则2号将一无所获。号将一无所获。2021/8/2631 因此，因此，4号的分配方案就是：号的分配方案就是：99块金子块金子归自己，归自己，2号得号得1块金子，块金子，1号和号和3号什么也号什么也得不到。得不到。2021/

16、8/2632 5号海盗的策略略有不同。他需要收买号海盗的策略略有不同。他需要收买另外两名海盗，因此至少得用两块金子来贿另外两名海盗，因此至少得用两块金子来贿赂才能使自己的方案得到采纳。他的分配方赂才能使自己的方案得到采纳。他的分配方案应该是：案应该是： 98块金子归自己，块金子归自己，1块金子给块金子给3号，号，1块金子给块金子给1号。号。 2021/8/2633 这一分析过程可以按照上述思路继续进这一分析过程可以按照上述思路继续进行下去。每个分配方案都是唯一确定的，它行下去。每个分配方案都是唯一确定的，它可以让提出这个方案的海盗获得尽可能多的可以让提出这个方案的海盗获得尽可能多的金子，同时保

17、证该方案肯定能获得通过。金子，同时保证该方案肯定能获得通过。2021/8/2634 10号海盗提出的方案将是：号海盗提出的方案将是：96块金子块金子归自己所有，其他编号为偶数的海盗各得归自己所有，其他编号为偶数的海盗各得1块金子，而编号为奇数的海盗什么也得不块金子，而编号为奇数的海盗什么也得不到。到。2021/8/2635 如果海盗的人数变成了如果海盗的人数变成了100人，金子仍人，金子仍然是然是100块。那么，最厉害的海盗，也就是块。那么，最厉害的海盗，也就是编号编号100的海盗，他的方案应该是什么呢？的海盗，他的方案应该是什么呢？2021/8/2636 100号海盗提出的方案将是：号海盗提

18、出的方案将是：51块金子块金子归自己所有，其他编号为偶数的海盗各得归自己所有，其他编号为偶数的海盗各得1块金子，而编号为奇数的海盗什么也得不到。块金子，而编号为奇数的海盗什么也得不到。2021/8/2637 如果海盗的人数变成了如果海盗的人数变成了200人，金子仍人，金子仍然是然是100块。那么，最厉害的海盗，也就是块。那么，最厉害的海盗，也就是编号编号200的海盗，他的方案应该是什么呢？的海盗，他的方案应该是什么呢？2021/8/2638 所有偶数号的海盗将各得所有偶数号的海盗将各得1块金子，而所块金子，而所有奇数号的海盗将一无所获。有奇数号的海盗将一无所获。2021/8/2639 如果海盗

19、人数为如果海盗人数为201201人呢？人呢？ 2021/8/2640 201201号海盗的分配方案是：给号海盗的分配方案是：给1 1到到199199号号的所有奇数号海盗每人一块金子，自己则一的所有奇数号海盗每人一块金子，自己则一块也不要。虽然分不到金子，至少保证了自块也不要。虽然分不到金子，至少保证了自己不会被扔进海里喂鲨鱼。己不会被扔进海里喂鲨鱼。 2021/8/2641 如果海盗人数为如果海盗人数为202202人呢？人呢？ 2021/8/2642 202202号海盗同样别无选择，只能号海盗同样别无选择，只能1 1块金子块金子都不要了，他必须把这都不要了，他必须把这100100块金子全部用来

20、块金子全部用来收买收买100100名海盗，而且这名海盗，而且这100100名海盗还必须是名海盗还必须是那些按照那些按照201201号方案将一无所获的人。由于号方案将一无所获的人。由于这样的海盗有这样的海盗有101101名，因此名，因此202202号的方案将不号的方案将不再是唯一的，因为贿赂方案有再是唯一的，因为贿赂方案有101101种。种。 2021/8/2643 如果海盗人数为如果海盗人数为203203人呢？人呢？ 2021/8/2644 203203号海盗必须获得号海盗必须获得102102张赞成票，但他张赞成票，但他显然没有足够的金子去收买显然没有足够的金子去收买101101名同伙。因名同

21、伙。因此，无论提出什么样的分配方案，他都注定此，无论提出什么样的分配方案，他都注定会被扔进大海喂鲨鱼。会被扔进大海喂鲨鱼。悲催啊！悲催啊！2021/8/2645 如果海盗人数为如果海盗人数为204204人呢？人呢？ 2021/8/2646 204204号海盗知道，号海盗知道，203203号为了能保住性命，就必号为了能保住性命，就必须避免由他自己来提出分配方案这样一种局面，因须避免由他自己来提出分配方案这样一种局面，因此不管此不管204204号提出什么样的方案，号提出什么样的方案，203203号都一定会投号都一定会投赞成票。这样，赞成票。这样，204204号海盗总算可以拣到一条命：号海盗总算可

22、以拣到一条命：他可以得到他自己的他可以得到他自己的1 1票、票、203203号的号的1 1票以及另外票以及另外100100名被收买的海盗的赞成票，刚好达到保命所需的一名被收买的海盗的赞成票，刚好达到保命所需的一半票数。获得金子的海盗，就是根据半票数。获得金子的海盗，就是根据202202号方案肯号方案肯定一无所获的那定一无所获的那100100名海盗，即名海盗，即1 1到到199199号的所有奇号的所有奇数号海盗。数号海盗。2021/8/2647 如果海盗人数为如果海盗人数为205205人呢？人呢？ 2021/8/2648 205205号海盗没有那么走运了。他不能指号海盗没有那么走运了。他不能指望

23、望203203号和号和204204号支持他的方案，因为如果他号支持他的方案，因为如果他们投票反对们投票反对205205号方案，就可以看到号方案，就可以看到205205号被号被扔进海里，而他们自己的性命却仍然能够保扔进海里，而他们自己的性命却仍然能够保全。这样，无论全。这样，无论205205号海盗提出什么方案都号海盗提出什么方案都活不了命。活不了命。2021/8/2649 206号海盗的命运也是这样。他肯定可号海盗的命运也是这样。他肯定可以得到以得到205号的支持，但这不足以救他一命。号的支持，但这不足以救他一命。2021/8/2650 同样，同样，207号海盗需要号海盗需要104张赞成票，除了

24、他收张赞成票，除了他收买的买的100张赞成票以及他自己的张赞成票以及他自己的1张赞成票之外，他张赞成票之外，他还需还需3张赞成票才能免于一死。他可以获得张赞成票才能免于一死。他可以获得205号和号和206号的支持，但还差号的支持，但还差1张票却是无论如何也弄不到张票却是无论如何也弄不到了，因此了，因此207号海盗的命运也是被扔进大海里。号海盗的命运也是被扔进大海里。2021/8/2651 可是，可是，208号海盗却又时来运转了。他需要号海盗却又时来运转了。他需要104张赞成票，而张赞成票，而205、206、207都会支持他，加上他都会支持他，加上他自己一票及收买的自己一票及收买的100票，他得

25、以过关保命。获得票，他得以过关保命。获得他贿赂的必定属于那些根据他贿赂的必定属于那些根据204号方案肯定将一无号方案肯定将一无所获的人，候选人包括所获的人，候选人包括2到到200号中所有偶数号的数，号中所有偶数号的数，以及以及201、202、203、204号。号。2021/8/2652 现在，出现了一条新的并在此之后会持续有效现在，出现了一条新的并在此之后会持续有效的规律：那些方案能过关的海盗的分配方案全都是的规律：那些方案能过关的海盗的分配方案全都是把金子用来收买把金子用来收买100名同伙而自己一点都得不到，名同伙而自己一点都得不到，他们相隔的距离越来越远，而在他们之间的海盗则他们相隔的距离

26、越来越远，而在他们之间的海盗则无论提什么样的方案都会被扔进大海，因此为了保无论提什么样的方案都会被扔进大海，因此为了保命，他们必定会投票支持比他们厉害的海盗提出的命，他们必定会投票支持比他们厉害的海盗提出的任何分配方案。任何分配方案。2021/8/2653 得以避免葬身鱼腹的海盗包括：得以避免葬身鱼腹的海盗包括：201、202、204、208、216、232、264、328、456号，也就是其号码等于号，也就是其号码等于200加上加上2的某一的某一幂的海盗。幂的海盗。2021/8/2654 那么，哪些海盗是获得贿赂（那么，哪些海盗是获得贿赂（1块金子）块金子）的人呢？的人呢？ 2021/8/2

27、655 分配贿赂的方法不是唯一的，其中一种分配贿赂的方法不是唯一的，其中一种方法是让方法是让201号海盗把贿赂分给号海盗把贿赂分给1到到199号号的所有奇数编号的海盗，让的所有奇数编号的海盗，让202号分给号分给2到到200号的所有偶数编号的海盗，然后是让号的所有偶数编号的海盗，然后是让204号贿赂奇数编号的海盗，号贿赂奇数编号的海盗，208号贿赂偶号贿赂偶数编号的海盗，依此类推，也就是轮流贿赂数编号的海盗，依此类推，也就是轮流贿赂奇数编号和偶数编号的海盗。奇数编号和偶数编号的海盗。2021/8/2656 如果表决的规则是必须超过半数赞同时如果表决的规则是必须超过半数赞同时才通过分配方案，假设

28、是才通过分配方案，假设是5名海盗和名海盗和100块块金子。金子。5号海盗应该提出什么样的分配方案号海盗应该提出什么样的分配方案呢？呢？2021/8/2657蜈蚣博弈悖论悖论，是一种逻辑矛盾，它指这样一个悖论，是一种逻辑矛盾，它指这样一个命题：由它的真可以推出它的假；相反，由命题：由它的真可以推出它的假；相反，由它的假又可以推出它的真。它的假又可以推出它的真。 2021/8/2658理发师悖论小城里的理发师放出豪言：小城里的理发师放出豪言：“我帮且只我帮且只帮城里所有不自己刮脸的人刮脸帮城里所有不自己刮脸的人刮脸”。理发师该给自己刮脸吗？理发师该给自己刮脸吗？ 2021/8/2659 蜈蚣

29、博弈是由罗森塞尔（蜈蚣博弈是由罗森塞尔（Rosenthal ）在在1981年提出的一个完全完美信息条件下的年提出的一个完全完美信息条件下的动态博弈问题。由于这个博弈的扩展形式很动态博弈问题。由于这个博弈的扩展形式很像一条蜈蚣，因此被称为像一条蜈蚣，因此被称为“蜈蚣博弈蜈蚣博弈”。2021/8/2660 两个参与者两个参与者A、B轮流进行策略选择，可供选择的策轮流进行策略选择，可供选择的策略有略有“合作合作”和和“不合作不合作”两种。当出现两种。当出现“不合作不合作”时，博弈结时，博弈结束。束。规则是：规则是：A、B两次决策为一组，进行至第两次决策为一组，进行至第n组时，若组时，若A决策结束，

30、则决策结束，则A、B的收益都是的收益都是n；若；若B决策结束，则决策结束，则A得得n-1，B得得n+2。假定假定A先选，然后是先选，然后是B，接着是，接着是A，如此交替进行。另，如此交替进行。另外，外，A、B之间的博弈次数为有限次，比如之间的博弈次数为有限次，比如198次。若双次。若双方始终选择方始终选择“合作合作”，则最后，则最后A、B的收益都是的收益都是100。2021/8/2661 A、B该如何进行策略选择呢？该如何进行策略选择呢？2021/8/2662 当当A决策时，他考虑博弈的最后一步即第决策时，他考虑博弈的最后一步即第198步。步。B在在“合作合作”和和“不合作不合作”之间作出选

31、择时，之间作出选择时，因因“合作合作”给给B带来带来100的收益，而的收益，而“不合作不合作”带来带来101的收益，根据的收益，根据“理性人理性人”的假定，的假定，B会选择会选择“不不合作合作”。2021/8/2663 但是，要经过第但是，要经过第197步才到第步才到第198步。在第步。在第197步，步，A考虑到考虑到B在第在第198步时会选择步时会选择“不合作不合作”，此时他的最优策略是，此时他的最优策略是“不合作不合作”“不合作不合作”的的收益收益99大于大于“合作合作”的收益的收益98。因此，在第因此，在第197步时步时A会选择会选择“不合作不合作”。2021/8/2664 同样，要经

32、过第同样，要经过第196步才到第步才到第197步。在第步。在第196步时，步时，B考虑到考虑到A在第在第197步时会选择步时会选择“不合不合作作”，此时他的最优策略是，此时他的最优策略是“不合作不合作”“不合作不合作”的收益的收益100大于大于“合作合作”的收益的收益99。因此，在第因此，在第196步时步时B会选择会选择“不合作不合作”。2021/8/2665 如此推论下去，最后的结论是：在第如此推论下去，最后的结论是：在第1步时步时A将选择将选择“不合作不合作”，博弈结束，此时双，博弈结束，此时双方的收益均为方的收益均为1。这个结果是令人悲伤的。这个结果是令人悲伤的。 2021/8/26

33、66 从逻辑推理来看，逆向归纳法是严密的，但从逻辑推理来看，逆向归纳法是严密的，但结论是违反直觉的。结论是违反直觉的。直觉告诉我们，一开始就采取直觉告诉我们，一开始就采取“不合作不合作”的策的策略获取的收益只能为略获取的收益只能为1，而采取，而采取“合作合作”策略有可能策略有可能获取的收益为获取的收益为100，因此，因此A应采取应采取“合作合作”的策略。的策略。而从逻辑的角度，一开始而从逻辑的角度，一开始A就应采取就应采取“不合作不合作”的的策略。策略。2021/8/2667 有实验经济学家做过蜈蚣博弈的实验，实验有实验经济学家做过蜈蚣博弈的实验，实验的结果显示不会出现一开始选择的结果显示不

34、会出现一开始选择“不合作不合作”策略而策略而使双方获得收益使双方获得收益1的情况。参与者都会自动选择合的情况。参与者都会自动选择合作性策略，从而走向合作。作性策略，从而走向合作。人们在博弈中的真实行动人们在博弈中的真实行动“偏离偏离”了运用逆向归了运用逆向归纳法关于博弈的理论预测，造成二者间的矛盾和纳法关于博弈的理论预测，造成二者间的矛盾和不一致，这就是蜈蚣博弈的悖论。不一致，这就是蜈蚣博弈的悖论。2021/8/2668 逆向归纳法在逻辑上是严密的，然而它逆向归纳法在逻辑上是严密的，然而它存在着存在着“困境困境”，蜈蚣博弈悖论恰好反映了，蜈蚣博弈悖论恰好反映了这种这种“困境困境” 。2021

35、/8/2669 蜈蚣博弈悖论的产生其实是源于逆向归纳法的蜈蚣博弈悖论的产生其实是源于逆向归纳法的适用范围问题，即逆向归纳法只是在一定的条件下适用范围问题，即逆向归纳法只是在一定的条件下和一定的范围内有效，忽略了这一点笼统去谈论逆和一定的范围内有效，忽略了这一点笼统去谈论逆向归纳法的有效性不是科学的研究思路。向归纳法的有效性不是科学的研究思路。 2021/8/2670 第一，从逆向归纳法的适用范围来看，第一，从逆向归纳法的适用范围来看，应当避免在较长阶段的动态博弈中使用逆向应当避免在较长阶段的动态博弈中使用逆向归纳法。博弈的阶段数不同，博弈方的策略归纳法。博弈的阶段数不同，博弈方的策略选择会有很

36、大的差异。选择会有很大的差异。 2021/8/2671 以下象棋为例说明这个问题。下象棋是一种完以下象棋为例说明这个问题。下象棋是一种完全完美信息动态博弈，而且博弈阶段和路径数量是有全完美信息动态博弈，而且博弈阶段和路径数量是有限的，但由于象棋博弈的路径数量很大、分支选择很限的，但由于象棋博弈的路径数量很大、分支选择很多，即使用最先进的电子计算机也无法在短时间内找多，即使用最先进的电子计算机也无法在短时间内找出每步的最优决策，因此不可能有人一开始就用逆向出每步的最优决策，因此不可能有人一开始就用逆向归纳法下棋。但是实践却表明，下棋人往往在象棋博归纳法下棋。但是实践却表明，下棋人往往在象棋博弈的

37、局部阶段，即在有限步数、有限选择的范围内局弈的局部阶段，即在有限步数、有限选择的范围内局部地使用逆向归纳法。正因为如此，才有部地使用逆向归纳法。正因为如此，才有“下一步看下一步看三步三步”的说法。的说法。 2021/8/2672 又如，在蜈蚣博弈中，如果蜈蚣博弈的阶段又如，在蜈蚣博弈中，如果蜈蚣博弈的阶段数大大减少，比如说只有数大大减少，比如说只有6步，那么开始时合作步，那么开始时合作的可能性就小得多，因为选择合作的潜在利益减的可能性就小得多，因为选择合作的潜在利益减少了很多，而承担的初始风险却是同样的，逆向少了很多，而承担的初始风险却是同样的，逆向归纳法的逻辑随时可能起作用。归纳法的逻辑随时

38、可能起作用。 2021/8/2673 第二，逆向归纳法的有效性与博弈方的利益密第二，逆向归纳法的有效性与博弈方的利益密切相关。博弈方是否根据逆向归纳法来预测行为，切相关。博弈方是否根据逆向归纳法来预测行为，取决于逆向归纳法的路径是否符合博弈方的真正利取决于逆向归纳法的路径是否符合博弈方的真正利益（即长远利益、整体利益），如果符合，博弈方益（即长远利益、整体利益），如果符合，博弈方就会依逆向归纳法进行策略选择，那么逆向归纳法就会依逆向归纳法进行策略选择，那么逆向归纳法就会成立。就会成立。 2021/8/2674 在蜈蚣博弈中，根据逆向归纳法，博弈方在一在蜈蚣博弈中，根据逆向归纳法，博弈方在一开始

39、就应该选择结束博弈，即博弈双方的收益均为开始就应该选择结束博弈，即博弈双方的收益均为1。这是不符合双方的长远利益的。逆向归纳法的。这是不符合双方的长远利益的。逆向归纳法的路径与博弈方的长远利益相悖，因而博弈方不会按路径与博弈方的长远利益相悖，因而博弈方不会按逆向归纳法的逻辑推理去决策。逆向归纳法的逻辑推理去决策。2021/8/2675 在蜈蚣博弈中，如果博弈的双方彼此信任、默在蜈蚣博弈中，如果博弈的双方彼此信任、默契，彼此相信对方是理性的，彼此相信对方会追求契，彼此相信对方是理性的，彼此相信对方会追求自身的长远利益与整体利益，那么双方选择合作策自身的长远利益与整体利益，那么双方选择合作策略的可

40、能性会更大。而且在现实生活中，如果博弈略的可能性会更大。而且在现实生活中，如果博弈双方相互信任、从长远利益与整体利益出发去进行双方相互信任、从长远利益与整体利益出发去进行策略选择，结果往往是双赢。策略选择，结果往往是双赢。 2021/8/2676 第三，在现实的博弈中，逆向归纳法第三，在现实的博弈中，逆向归纳法是否有效受多种非理性因素的影响。是否有效受多种非理性因素的影响。 2021/8/2677 在现实的博弈中，不仅博弈方的理性通在现实的博弈中，不仅博弈方的理性通常是有限的，而且还受到信息不对称、道德常是有限的，而且还受到信息不对称、道德情感、法制、宗教文化等因素的制约，甚至情感、法制、宗教文化等因素的制约，甚至有时会犯错误。有时会犯错误。 2021/8/2678 逆向归纳法对于蜈蚣博弈的逻辑推理似乎是逆向归纳法对于蜈蚣博弈的逻辑推理似乎是不正确的，然而在蜈蚣博弈的实验中我们会发现，不正确的，然而在蜈蚣博弈的实验中我们会发现，即使双方开始时能走向合作，即双方均采取即使双方开始时能走向合作，即双方均采取“合作合作”策略，这种合作也很难坚持到最后一步。理性的人策略，这种合作也很难坚持到最后一步。理性的人出于自身利益的考虑，肯定会在某一步采取出于自身利益的考虑，肯定会在某一步采取“不合不合作作”策略。策略。2021/8/2679部分资料从网络收集整理而来，供大家参考，感谢您的关注！

展开阅读全文

第三讲动态博弈与逆向归纳法课件PPT

最新文档