博弈论原理模型与教程扩展式博弈

资源描述

《博弈论原理模型与教程扩展式博弈》由会员分享，可在线阅读，更多相关《博弈论原理模型与教程扩展式博弈（16页珍藏版）》请在金锄头文库上搜索。

1、博弈论：原理、模型与教程第二部分完全信息动态博弈第 6章扩展式博弈（已精细订正！）对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。前面介绍了一种常用的博弈问题描述方式战略式博弈，虽然这种博弈模型结构简单，只要给出博弈问题的三个基本构成要素（即参与人、参与人的战略集及参与人的支付），就可完成对博弈问题的建模。但是，由于战略式博弈假设每个参与人仅选择一次行动或行动计划（战略），并且参与人同时进行选择，因此从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。虽然战略式博弈也可以对动态博弈问题进行建模，但是从所得到的模型中只能看到博弈的结果，而

2、无法直观地了解到博弈问题的动态特性。本章将介绍一种新的博弈问题描述方式扩展式博弈。从扩展式博弈模型中，不仅可以看到博弈的结果，而且还能直观地看到博弈的进程。在介绍扩展式博弈构成的基础上，还将对扩展式博弈的战略和解进行讨论。6.1 扩展式博弈（文字描述、博弈树描述）所谓扩展式博弈（extensive form game）,是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。一般而言，要了解一个博弈问题的具体进程，就必须弄清楚以下两个问题：（1）每个参与人在什么时候行动（决策、选择）；（2）每个参与人行动时

3、，他所面临决策问题的结构，包括参与人行动时可供他选择的行动方案及所了解的信息（集）。注：行文中频繁出现的“行动”一词，有两义：其一，动词的“行动”，指选择、决策。其二，名词的“行动”，指策略、战略、谋略、行动方案、方案。上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。对于一个博弈问题，如果能够说清楚博弈过程中参与人的决策问题的序列结构，那么就意味着知道了博弈问题的具体进程。定义6 -1扩展式博弈包括以下要素：（1 ）参与人集合厂=I，2，.,n；（ 2）参与人的行动顺序，即每个参与人在何时行动；（ 3 每个参与人行动时面临的决策问题，包括参与人行动时可供他选择的行动方案及他所

4、了解的信息（集）；（ 4）参与人的支付函数，即博弈结束时每个参与人得到的博弈结果。从上述定义可以看到：如果要用扩展式博弈对一个博弈问题进行建模（或者描述），那么除了要说明博弈问题所涉及的参与人及每位参与人的支付函数以外，还必须对博弈过程中参与人所遇到的决策问题的序列结构进行详细的解释，说清楚每个参与人在何时行动，以及参与人行动时可供选择的行动方案和所了解到的信息。【例6-1】考察一个“新产品开发博弈”。试用扩展式博弈对两个企业都知道市场需求且企业同时决策的博弈情形，即完全信息静态的“新产品开发博弈”进行建模。企业1开发（0）：投入2000元资金不开发（b）:需求大J企业2不开发，

5、获利润800万元需求大t企业2开发，获利润300元需求小J企业2不开发，获利润200万元需求小t 企业2开发，赔400万元不投入资金，利润为0。图1-1 新产品开发的投入-产出图解：文字描述如下：根据定义 6-1，完全信息静态的“新产品开发博弈”的扩展式博弈包括以下要素：（1）参与人是企业 1 和企业 2；（2）两个企业同时行动，即同时选择产量；（3）每个企业行动时有两种选择“开发”和“不开发”，并且每个企业行动时不知道对方的选择1；需求大J企业2不开发，获利润800万元企业1（4）两个企业的支付如图 1-1 所示。企业2开发，赔400万元不开发（b）：不投入资金，利润为0。图 1-1

6、新产品开发的投入-产出图【例6-2】继续考察“新产品开发博弈”。试用扩展式博弈对两个企业都知道市场需求且企业 1先决策，企业2观测到企业 1的选择后再进行选择的博弈情形，即完全信息动态的“新产品开发博弈”进行建模。解：文字描述如下：根据定义 6-1，完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素：（1）参与人是企业 1 和企业 2；（2）企业 1 先行动，企业 2 后行动；（3）企业 1 行动时有两种选择“开发”和“不开发”，企业 1 行动时不知道企业 2 的行动；企业 2 行动时有两种选择“开发”和“不开发”，但企业2 行动时已经知道企业1 的行动；（4）两个企业的支付仍然

7、有如图1-1 所示。上述两个例子中，用文字描述的方法给出了博弈问题的扩展式描述。1 注意，虽然此时每个企业都不知道对方的选择，但用扩展式博弈进行建模时仍然假设参与人都同时看到了图1-1所示的投入-产出图，即图1-1对两个企业来说为共同知识。对于一些简单的博弈问题，这种文字表述的方法也许是简单可行的。但可以想象，如果遇到的是更为复杂的博弈问题，如参与人人数大于 2 ，每个参与人可以多次行动且每次行动时可供选择的行动方案不同等，文字描述所给出的模型就会显得繁冗拖沓，极不直观，因此需要寻找一种简便易行的扩展式博弈的描述方式。下面就以“新产品开发博弈”为例，介绍一种不仅简单方便，而且十分直观

8、的扩展式博弈的描述方式博弈树。所谓博弈树，就是由结和有向枝构成的“有向树。图 6-1 给出的是当市场需求为大时，完全信息动态的“新产品开发博弈 ”的博弈树。在图6-1所示的博弈树中，最上端的一个点 x1 （用空心圆表示）表示博弈的开始，将“企业1”标示在点x上，表示博弈开始于企业1的选择。企业1的选择有“开发”和“不开发”，分别用标有“开发”和 “不开发”的有向枝表示。若企业1选择“开发”则博弈从点X1达到X2 （用实心圆表示）；若企业1选择“不开发”则博弈从点x 1达到点x3 （用实心圆表示）。点x2 （或x3 ）上标有“企业2”表示企业2 在博弈到达点x2 （或x3）时，即企业1选择

9、“开发”（或“不开发”）后，再进行选择；企业2的行动也有“开发”和“不开发”，同样分别用标有“开发”和“不开发”的有向枝表示。若企业 2 选择“开发”，则博弈从点X2 （或 X3）达到点X4 （或X6）（都用实心圆表示）；若企业2选择“不开发”，则博弈从点X2（或x3 ）达到点x5 （或x7）（都用实心圆表示）。由于企业2选择后博弈结束，因此点x4、x5、X6和X7 都表示博弈的结束。在点X4、X5、X6和X7旁标有支付向量，表示博弈达到该点时企业的所得。其中，支付向量中的第一个数字表示企业 1 的所得，第二个数字表示企业 2 的所得1。1 一般情形下，支付向量中数字的顺序与博弈树中参与人的

10、行动顺序相对应。图6-1博弈树图6-1中，点x、x2、x3、x4、X5、X6和x7称为博弈树的结（node）,其中标有参与人（即企业）的结珥、x2和x3称为决策结（decision node）,表示参与人在此选择行动；标有支付向量的结x4 x5、x6和x7表示博弈结束，称为终点结（terminal node。在决策结中，决策结x1表示博弈的开始，亦称为博弈树的初始结或根（root。结与结的连线称为博弈树的枝（branch，表示博弈从枝的一个结达到另一个结参与人需要选择的行动。例如，博弈从决策结x1达到x2，需要企业1选择行动“开发”所以在连接x1和x2的枝上标有行动“开发”在博弈树中，

11、枝是有向的，表示博弈只能从枝的一个结达到另一个结。例如，在连接X1和x3的枝上，标有行动“不开发”表示当企业1选择“不开发”时，博弈从X1达到 x3 ，因此连接 x1 到 x3 的枝的方向是从 x1 指向 x3 。通过以上介绍，再考察图 6-1 中的博弈树，可以得到这样的信息：（1）博弈中的参与人是企业 1和企业2；（2）博弈中企业1 先选择，企业 2 后选择；（3）企业1选择时有行动“开发”和“不开发，企业 2选择的行动有“开发”和“不开发；（4）博弈中企业的支付。也就是说，除了“企业2行动时是否观测到企业 1的选择”这一点暂时无法从图6-1中知道以外，完全信息动态的“新产品开发博弈

12、”的扩展式描述所需要的信息（或要素）都可以从图 6-1 中得到。如果还能够直接从博弈树中知道“企业2行动时是否观测到企业 1的选择”，那么给出博弈树，就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。下面探讨如何在博弈树中，将“企业 2行动时是否观测到企业1的选择”这一信息表示出来。在完全信息动态的“新产品开发博弈”中，企业2决策时企业 1已经做出选择，此时企业 2面临的决策情形无非只有以下两种：第一种：企业2知道企业 1的选择；第二种：企业2不知道企业 1的选择。对于第一种情形，企业2知道企业 1的选择，即知道企业1选择“开发”还是“不开发”，因此企业2 知道博弈是从X1到了

13、X2还是从X1到了 X3。这就意味着当轮到企业2决策时，他知道自己是在点X2上还是在点X3上。对于第二种情形，企业2不知道企业1的选择，即不知道博弈是从X1到了 X2还是从X1到了 X3。因此，当轮到企业2决策时，他不知道自己是在点X2上还是在点X3上。所以，“企业2行动时是否观测到企业1的选择”这一问题，实际上就等价于“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”为了将“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”这一点说清楚，需要引入“信息集”（information set）的概念在博弈树中，参与人i的一个信息集（用1,表示）是参与人i决策结

14、的一个集合，它满足以下条件（1 ） I中的每个决策结都是参与人i的决策结；（2 ）当博弈到达信息集I （即博弈到达I中某个决策结）时，参与人i知道自己是在信息集I中的决策结上，但不知道自己究竟在I中哪个决策结上。因此，参与人i的信息集I可以用来描述当轮到参与人i行动时他所了解到的信息，即他知道什么（知道自己位于哪一个信息集上）、不知道什么（不知道自己位于信息集中哪一个决策结上）。例如，在“新产品开发博弈”中，假设企业 1先行动，企业2后行动，但企业 2行动时不知道企业1 的行动，那么在如图6-1所示的博弈中当企业2行动时就只知道博弈要么到达点x 2，要么到达点x3，但具体在哪一点上，企业2

15、不清楚。也就是说，企业2只知道自己位于决策结集合x2, x3上，但不知道位于x2, x3中哪一个决策结上。在这种情况下，x2,x3就是企业2的一个信息集。如果假设企业2行动时知道企业1的行动，那么在如图6-1所示的博弈中，当企业2行动时就知道博弈是到达了点x2，还是到达了点x3。此时，企业2的决策结集x2和x3都是企业2的信息集1。设X为一决策结集合，用x）表示参与人i的由决策结集X构成的一个信息集。例如，仆X3 I表示企业2的由决策结集 J X3 构成的信息集，12和12（X3 I分别表示企业2的由决结集2 和W 构成的信息集。为了更好地理解信息集这个概念，考虑如图 62 所表示的博弈情形中参与人 3 的信息集2（顺便考虑参与人2、参与人3的信息集）。由于参与人3选择时，参与人1和参与人2都已经做出选择，因此参与人3选择时可能面临的决策情形就有以下 4种：（1）既知道参与人1的选择，也知道参与人2 的选择；（2）知道参与人1 的选择，但不知道参与人2 的选择；（3）知道参与人2 的选择，但不知道参与人1 的选择；（4）既不知道参与人 1的选择，也知道参与人2的选择。1 注意，这是一种信息退化了的情况，即信息集中只含有一个决策结（亦称单结信息集）。此时，虽然信息集的定义要求参与人不知道自己在信息集哪一个决策结上，

展开阅读全文