子博弈精炼Nash均衡课堂PPT

资源描述

《子博弈精炼Nash均衡课堂PPT》由会员分享，可在线阅读，更多相关《子博弈精炼Nash均衡课堂PPT（55页珍藏版）》请在金锄头文库上搜索。

1、子博弈精炼子博弈精炼Nash均衡均衡主要内容：一、子博弈精炼Nash均衡二、子博弈精炼Nash均衡的求解三、承诺行动与要挟诉讼1.一、子博弈精炼Nash均衡博弈论的研究目的是寻找博弈的解。在静态博弈中我们将Nash均衡作为博弈的解，但纳什均衡作为博弈的解面临一个很大的问题多重性问题。当我们将Nash均衡作为扩展式博弈的解时，同样也会遇到Nash均衡的多重性问题，而且在多个Nash均衡中有些是明显不合理的。例1：新产品开发博弈市场需求大时候的情况博弈存在两个Nash均衡(开发，(开发，开发)和(开发，(开发，不开发)，其中均衡(开发，(开发，不开发)要求企业2采取战略“企业1开发自己就开

2、发，企业1不开发自己也不开发”。我们知道，“新产品开发博弈”中，如果市场需求大的话，不管对方是否开发，每个企业都应选择“开发”。因此，“当企业1开发时，企业2开发”是合理的，但是，“当企业1不开发时，企业2不开发”就不合理了。均衡(开发，(开发，不开发)不是关于博弈结果的合理预测。例2：新产品开发博弈市场需求小时候的情况该博弈存在三个Nash均衡(开发，(不开发，开发)、(开发，(不开发，不开发)和(不开发，(开发，开发)，但这三个均衡是否都是合理的呢？在“新产品开发博弈”中，如果市场需求小，那么就只能一个企业开发，另一个企业不开发，问题在于谁选择开发，谁选择不开发。对于先行动的企业1来讲，

3、只要自己选择“开发”，理性的企业2就只会选择“不开发” ，所以，均衡(不开发，(开发，开发)是不合理的。对于企业2来讲，企业1开发自己当然不能开发，如果企业1不开发自己显然应该开发。均衡(开发，(不开发，不开发)也是不合理的。因此，合理的Nash均衡是(开发，(不开发，开发)。解决Nash均衡多重性问题的一种主要方法就是精炼的方法，即在Nash均衡的基础上，通过定义更加合理的博弈解并剔除不合理的均衡。 Selten在1965年提出的“子博弈精炼Nash均衡”(subgame perfect Nash equlibrium)的概念，就是这样一种新的纳什均衡解，我们首先给出子博弈的定义。子博弈的概

4、念子博弈：是原博弈的一部分，它始于原博弈中一个单结信息集中的决策结x，并由决策结x及其后续结共同组成。一般用表示博弈树中始于决策结xi的一个子博弈。注意：1）子博弈可以作为一个独立的博弈进行分析，并且与原博弈具有相同的信息结构；2）原博弈可以作为自身的一个子博弈；例1：找出下列博弈的子博弈。该博弈存在3个子博弈：除了原博弈自己以外，还存在下面两个子博弈。(1)子博弈(2)子博弈例2：找出下列博弈的子博弈该博弈存在3个子博弈：除了原博弈自己以外，还存在下面两个子博弈。(1)子博弈(2)子博弈子博弈精炼Nash均衡的定义扩展式博弈的战略组合是一个子博弈精炼Nash均衡，当且仅当满足以下条件：

5、1)它是原博弈的Nash均衡；2)它在每一个子博弈上构成Nash均衡。说明：一个战略组合是子博弈精炼Nash均衡当且仅当它对所有的子博弈(包括原博弈)构成Nash均衡，同时也意味着原博弈的Nash均衡并不一定是子博弈精炼Nash均衡，除非它还对所有子博弈构成Nash均衡。市场开发博弈市场需求大Nash均衡：(开发，(开发，开发)和(开发，(开发，不开发)虽然(开发，(开发，不开发)是Nash均衡，但并不是子博弈精炼Nash均衡。市场开发博弈市场需求小 Nash均衡：(开发，(不开发，开发)、(开发，(不开发，不开发)、(不开发，(开发，开发)虽然(不开发，(开发，开发)和(开发，(不开发

6、，不开发)是Nash均衡，但并不是子博弈精炼纳什均衡。只有当一个战略规定的行动在所有可能的情况下都为最优时，它才是一个合理的、可置信的战略。子博弈精炼纳什均衡就是要剔除那些只在特定情况下合理而在其他情况下并不合理的行动规则。子博弈精炼纳什均衡的理解二、子博弈精炼Nash均衡的求解逆推归纳法是最常用的求解子博弈精炼Nash均衡的方法。逆推归纳法对于完美信息完美信息(perfect infor- mation)博弈问题尤为适用，但在有些情形下，对于不完美信息博弈，也能运用逆推归纳法进行求解。例：由以上分析可以得到博弈的求解过程：首先求解博弈树中最底层的子博弈(x3)，得到子博弈(x3)的结果为

7、(3,0) (即参与人1选择E)；再求解子博弈(x2) ，容易得到博弈的结果为(1,1)(即参与人2选择D)；最后求解原博弈即子博弈(x1) ，得到博弈的结果为(2,1) (即参与人1选择B)。一般情形：参与人i在信息集Ii (xi)选择行动L还是行动R，取决于选择行动L和行动R所引致的后续结果。由于参与人i选择行动L时使博弈进入了子博弈(xi+1) ，因此，参与人i选择行动L的结果就是得到子博弈(xi+1) 。同样，参与人i选择行动R的结果就是得到子博弈(xi+2) 。所以，参与人i在信息集Ii (xi)上的最优选择，取决于参与人i在信息集Ii (xi)上可能采取的行动所导致的各个子博弈

8、。这意味着，参与人i在信息集Ii (xi)上的最优选择，一定是使博弈进入能给自己带来最大支付的子博弈。因此，为了确定参与人i在信息集Ii (xi)上的选择，就必须先求解参与人i在信息集Ii (xi)上可能采取的行动所导致的各个子博弈。由以上分析可得求解有限扩展式博弈的一般步骤： 1) 找出博弈的所有子博弈； 2) 按照博弈进程的“反方向”逐一求解各个子博弈，即最先求解最底层的子博弈，再求解上一层的子博弈，.，直至原博弈。上述求解有限扩展式博弈的方法亦称“逆推归纳法”(backward induction)。由于逆推归纳法对各个子博弈逐一进行求解，因此，逆推归纳法所得到的解在各子博弈上构成Na

9、sh均衡,这意味着逆推归纳法所得的解为子博弈精炼纳什均衡。例：求解下列博弈的子博弈精炼Nash均衡由于子博弈精炼Nash均衡在任一决策结上都能给出最优决策，这也使得子博弈精炼纳什均衡不仅在均衡路径(即均衡战略组合所对应的路径)上给出参与人的最优选择，而且在非均衡路径(即除均衡路径以外的其它路径)上也能给出参与人的最优选择。所以，子博弈精炼Nash均衡不会含有参与人在博弈进程中不合理的、不可置信的行动。这就是子博弈精炼Nash均衡与Nash均衡的实质性区别。在市场需求小的“新产品开发博弈”中，(开发，(不开发，开发)为子博弈精炼Nash均衡，该均衡不仅在均衡路径上而且在任一非均衡路径上，都能

10、给出参与人的最优决策。Nash均衡(开发，(不开发，不开发)虽然在均衡路径上给出了参与人的最优决策，但却包含了参与人在非均衡路径上的不合理选择：当企业1选择“不开发”时，企业2也选择“不开发”。(不开发，(开发，开发)虽然为Nash均衡，但却包含了企业2不可置信的战略：无论企业1如何选择，企业2都将选择“开发”。在Nash均衡(不开发，(开发，开发)中，“企业2无论什么情况下都开发”这种不可置信的战略亦称为“不可置信的威胁”(incredi-ble threat)。作为求解子博弈精炼Nash均衡的方法，逆推归纳法可以将Nash均衡中的“不可置信的威胁”剔除掉。例：战略组合(A,D)和(B

11、,C)都是Nash均衡，但是，只有(A,D)为子博弈精炼Nash均衡。因为在(B,C)中，包含了参与人2不可置信的威胁：当参与人1在决策结x1选择A时，参与人2在决策结选择C。事实上，只要博弈达到决策结x2，参与人2的理性选择就是D。三、承诺行动与要挟诉讼前面分析的“新产品开发”博弈提到，当市场需求小时，Nash均衡(不开发，(开发，开发)由于含有不可置信的威胁(即企业1选择“开发”时，企业2仍选择“开发”)，而不是子博弈精炼Nash均衡。但是，如果在博弈开始之前，企业2采取某种行动使自己的支付(或行动空间)发生改变，那么原来不可置信的威胁就有可能变得可信。假设企业投入的2000万元中，有1

12、000万元用来万元用来购买研发设备购买研发设备(即固定成本)，另外1000万元用来支付新产品开发中的人力、原材料等投入(即可变成本)。假设企业提前购买研发设备(即在决定是否开发之前就购买)，可得到一定的优惠，只需900万元即可。但是如果企业购买了设备而决定“不开发”，那么所购买的研发设备就只能当“废品”处理，收回400万元。新产品开发博弈的再考察考察如下博弈情形：企业1先选择是否开发，企业2观测到企业1的决策后选择是否开发，但在企业1决策之前，企业2可以决定是否提前购买研发设备。新产品开发博弈合理的博弈进程(即子博弈精炼Nash均衡所对应的均衡路径)显然是：企业2选择提前购买研发设备(即

13、在决策结x0选择“购买”)，企业1观测到企业2提前购买研发设备后选择“不开发”(即在决策结x1选择“不开发”)，最后企业2选择“开发”(即在决策结x3选择“开发”)。博弈的结果是企业2获得300万元的利润。这里，企业2通过提前购买研发设备，使得自己在随后的博弈进程中无论如何都必须选择“开发”。此时，“企业2无论如何都会选择开发”这种战略，对企业1来讲就是可信的。在上述博弈中，企业2通过提前购买研发设备，使自己原本不可置信的威胁(即无论如何都会选择“开发”)变得可信。像“企业2提前购买研发设备”这种行动在博弈论中我们称为“承诺行动承诺行动”(commitment)。承诺行动承诺行动 (com

14、mitment)承诺行动就是在博弈开始之前参与人采取某种改变自己支付或战略空间的行动，该行动使原本不可信的威胁变得可信。在许多情况下，承诺行动对参与人来讲是有利的，因为它能使博弈的子博弈精炼纳什均衡朝有利于自己的方向改变。需要注意的是，参与人的承诺行动是有成本的，否则这种承诺就不可信。在上面的例子中，如果企业2提前购买研发设备但又选择“不开发”，那么企业2就必须承担由于“研发设备只能当废品处理”而带来的500万元损失。这里的500万元就是企业2采取承诺行动的成本。由于这个成本在企业2采取承诺行动之后是无法收回的，因此被称为沉没成本（sunk cost)。承诺行动在现实生活中有许多应用，如所

15、谓的要挟诉讼(nuisance suits)。要挟诉讼要挟诉讼要挟诉讼：是指那种原告几乎不可能胜诉而其惟一的目的是希望通过私了而得到一笔赔偿的诉讼。要挟诉讼描述了现实中这样的情形：虽然原告提出诉讼是有代价的，而且胜算很小，但因为被告辩护同样非常昂贵，被告可能情愿支付一笔补偿以求私了。要挟诉讼的模型描述 1)参与人原告(参与人1)和被告(参与人2)；2)博弈进程如下： (1) 原告决定是否指控被告，指控的成本是c。 (2) 如果私了，原告则将获得一个无协商余地的赔偿金额s0。 (3) 被告决定接受还是拒绝原告的要求。 (4) 如果被告拒绝原告的要求，原告将决定放弃还是上诉至法庭。如果上诉，诉讼

16、成本为p，被告成本为d。 (5) 如果上诉，原告以的概率胜诉而获得赔偿x，否则什么也得不到。3) 参与人的支付满足： xp，即原告的期望赔偿小于他的诉讼成本。要挟诉讼的扩展式描述：利用逆向归纳法可以很容易求出博弈的子博弈精炼Nash均衡为原告选择不指控，博弈结束。博弈的结果似乎与人们观测到的现实并不相符，因为现实中人们常常看到各种“要挟”发生。在上述模型中，“要挟”之所以没有成功，关键在于原告将会起诉的威胁并不可信。原告如何使自己的威胁变得可信呢？采取承诺行动：假设原告在指控被告的同时，甚至在指控之前就将诉讼费p支付给律师，无论以后是否上法庭，这笔费用都不退还。采取承诺行动的要挟诉讼博弈原

17、告放弃将获得-c-p，与上法庭将得到的相比，当预支指控成本后，只要即只要原告有任何赢的可能性，他就会上法庭。这就意味着只有当，原告才会愿意私了而不是上诉。与此同时，当时，被告将愿意私了而不是上法庭，因此，存在着一个私了的区域，在这个区域内，双方都愿意私了。而具体的赔偿金额将取决于双方的讨价还价能力。假设允许原告做出一个无协商余地的赔偿要求，即在均衡时，此时，如果，即使，要挟诉讼也会发生。从这我们也可以看到：原告提出指控仅仅因为他可以勒索，这个数值就是被告的辩护成本d。由于被告打官司的成本不仅包括上法庭的费用(如诉讼费、律师费等)，还涉及官司给自己声誉造成的损失，因此，被告越“大”(如大企业、大人物)，就越可能受到要挟，而且要挟越容易成功。从这我们可以看到：在博弈中，规模大并不一定能够带来好处，有时还会成为攻击的对象。被告也可以采取承诺行动避免一些无端的指控，即在关于私了的协商尚未进行之前，甚至在原告决定指控被告之前就预先支付律师费。假设被告预先支付的律师费为f，那么要挟诉讼中的私了的区域为。这里，沉没成本f的存在使得私了的区域变小。这就意味着原告与被告进行讨价还价的区间减小，原告与被告进行讨价还价的难度增大。原告和被告都采取承诺行动的要挟诉讼博弈

展开阅读全文

子博弈精炼Nash均衡课堂PPT

最新文档