文档详情

第七章不完全信息动态博弈.doc

re****.1
实名认证
店铺
DOC
2.76MB
约71页
文档ID:544272149
第七章不完全信息动态博弈.doc_第1页
1/71

第七章 不完全信息动态博弈本章将在动态博弈中引入信息不对称因素,其博弈的内容被称为不完全信息动态博弈(uncomplete information dynamic game)不完全信息动态博弈就其基本要素来看是前面引入的不完全信息概念与博弈的动态性质的一种综合譬如,我们在处理不完全信息要素时是通过将某些局中人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续在本章中得以采用,即博弈中局中人面临的信息不完全性(无论它是指何种信息)将完全由某些局中人的“类型”的不确定性加以刻画同时,作为动态博弈,正如我们在第五章中所指出的那样,“序贯理性”的思想将一直得到贯彻我们将第五章中引入的“子博弈精炼均衡”的思想作类似的推广于不完全信息动态博弈这种延续在逻辑上是必需的,因为一旦我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就应回到子博弈精炼均衡从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样7.1 精炼贝叶斯均衡在本小节中,我们来构造不完全信息动态博弈的均衡概念,特别是贯彻了“序贯理性”原则的精炼均衡概念。

首先,博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的局中人都选择该战略组合中给出的相应战略时,任何一个局中人都不会有单方面偏离这一选择的动机作为动态博弈,一个战略是局中人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的局中人将选择不同的战略规定因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他局中人的战略时(其他局中人的战略是类型依存的,所以,说给定其他局中人的战略即指给定其他局中人的战略与类型的依存关系),任一局中人在其任何类型下由该组合给出的类型依存战略给出的战略是其最优的显然,这里还需要附加一个条件,即给定一局中人对其他局中人的类型分布的先验概率密度,否则他将无法对选择的“最优性”加以判断这种概率分布或密度来自于博弈开始之前局中人所拥有的信息,故称为“先验”信息或“先验”概率于是,我们有如下定义:定义7.1 一个人以不完全信息动态博弈的局中人类型空间,条件概率,其中是局中人的类型,,的确定是通过Harsanyi转换实现的,因而局中人知道而其他除局中人之外的局中人不一定知道。

一个类型依存的战略组合是一个纳什均衡,当且仅当有 (7.1)条件概率是先验的,因为它是博弈所给定的条件,来自博弈开始之前局中人关于其他局中人类型的相关信息当然,“自然”这个“局中人”并不包括在由下标标记的个局中人之中,但由Harsanyi转换所假定的局中人“自然”首先行动,它决定每一个局中人的类型,但除每个局中人自己能“观察”到自己的类型外,对于其他局中人的类型,他是只具有不完全信息的按照式(7.1)定义的纳什均衡被称为贝叶斯纳什均衡,它在本质上与第6章定义的贝叶斯纳什均衡是一样的,因而并未体现出不完全信息静态博弈与不完全信息动态博弈的区别正如我们在第五章和第三章所看到的,动态博弈与静态博弈的本质区别在于动态博弈均衡中存在对“序贯理性”的要求这样,正如第五章中所做的那样,我们需要对定义7.1给出的纳什均衡加以精炼,以剔除含有不可置信承诺和威胁的均衡,这就是下面将要引入的“精炼贝叶斯纳什均衡”序贯理性在完全信息动态博弈中指的是局中人在任一子博弈上都选择最优的行动计划,而精炼均衡要求所有局中人的战略在任一子博弈上的限制都是其在给定其他局中人战略选择下的该子博弈上的最优战略,即纳什均衡战略。

在不完全信息动态博弈中,信息集不一定是单结的,因而真子博弈可能不存在此时,序贯理性指的是任一局中人在从其任一信息集开始的随后的博弈中所选择的行动计划都是最优的对于任一局中人来说,当他处于某一信息集上时,他对其他的每一个局中人的类型有一个概率判断,即他认为其他的每一个局中人的类型是某一特定类型的概率有一个判断;而给定其他每个局中人的一个特定类型情况下,他就知道其他每个局中人的战略是什么,即其他每个局中人在每个信息集上的行动选择是什么此时,他也知道每个信息集的结构,且每个信息集都是单结的这就是说,假定他认为其他每个局中人的类型是某个特定类型,博弈就变成完全信息的了在完全信息动态博弈下,他当然知道此时他的最优行动计划是什么,即他知道他在此一单结信息集开始的子博弈上的最优行动计划是什么,它不过是使其支付最大化的行动计划而已但事实上在不完全信息动态博弈中,他在此时并不准确知道其他局中人的类型是什么,但知道其他局中人的类型为每一种特定的类型组合的概率是多少于是,假定所有局中人都是风险中性的,则他将根据这种概率分布来选择使他的期望支付最大化的行动计划因为给定每一种其他局中人类型组合的概率分布及给定在其他局中人的每一种类型组合下他知道自己的最优行动计划,因而这种由概率密度加权的期望支付最大化行动计划是可以决定的。

设在局中人的第个信息集上[1],局中人自此信息集开始按行动顺序在随后的各个信息集规定其行动选择构成一个自第个信息集的一个行动计划,它是局中人的战略在这个信息集及随后各个信息集上的限制,记为[2],是局中人的一个战略给定其他局中人的战略组合,给定局中人在第个信息集上对其他局中人类型的概率密度,则类型为的第个局中人的类型依存战略在其第个信息集上的行动计划选择应满足如下条件: (7.2)其中是局中人在其第个信息集上可能选择的行动计划(不是在第个信息集上的行动选择),而指=的情形我们称为局中人在其第个信息集上的信念(belief)此时,我们称战略组合是一个“精炼贝叶斯纳什均衡”显然,在精炼贝叶斯均衡中,局中人在不同信息集上的信息完全决定了其在不同信息集上的行动选择从这种意义上看,精炼贝叶斯均衡实质上是局中人的信息之间的均衡尽管如此,我们在表述一个精炼贝叶斯均衡时,通常是同时将信息与行动选择表达出来,即一个精炼贝叶斯均衡的表达中既要写出局中人在信息集上的行动选择,也同时标明他在信息集上的信念现在面临的问题是,如何给出局中人在信息集上的信息呢?从原则上看,对信息的形成几乎是没有任何限制的,但是,按照贝叶斯统计学的假定,对于均衡路径上的信息集的信念形成可以通过贝叶斯法则加以约束,这就排除了均衡路径上信息的过多的任意性。

所谓“均衡路径”,是指由那些发生的先验概率大于零的路径组成的信息集集合当任一可能发生的局中人类型组合的先验概率大于零时,一旦这种类型组合成为真实的且成为局中人的共同知识,则它可能规定一个子博弈精炼均衡路径当类型组合有多种可能性时,这些子博弈精炼均衡路径的集合将构成一个信息集集合,它就是“均衡路径”如果局中人在其信息集上观察到了其他局中人的行动组合,则根据概率论中的贝叶斯公式: (7.3)得到 (7.4)式(7.4)中的prob表示概率式(7.4)就是“贝叶斯公式”或“贝叶斯法则”(Bayes Law),它将条件概率与先验概率联系起来这里,在均衡路径上,条件概率就是前述信念这是因为,在均衡路径上,,但是,在非均衡路径上,,贝叶斯公式的分母为零由式(7.3),贝叶斯公式的分子也为零,因而贝叶斯公式在非均衡路径上给出的条件概率是型的数,是不确定的所以,在非均衡路径,信念形成不受贝叶斯法则的制约,但也不是任意的,因为对于精炼贝叶斯均衡来说,非均衡路径上的信念与均衡路径上按贝叶斯法则决定的信念一起共同决定局中人在每一个信息集上的行动选择所构成的战略组合是精炼贝叶斯均衡。

正是在均衡路径上我们按贝叶斯法则决定信念,所以称这种精炼均衡概念为贝叶斯纳什均衡在第六章中介绍的不完全信息静态博弈,实际上是经Harsanyi转换后将不完全信息静态博弈变成完全但不完美信息的动态博弈这里,我们对不完全信息动态博弈的处理实际上也是通过Harsanyi转换将不完全信息动态博弈变成完全但不完美信息动态博弈第六章实际上介绍的是一种被称为“二阶段”的完全但不完美信息动态博弈,第一阶段是“自然”选择局中人的类型,第二阶段是一个不对称信息的静态博弈,即局中人同时选择行动的博弈我们也称信念为后验概率(Posterior probability)我们得出精炼贝叶斯均衡的正式定义如下:定义7.2 在不完全信息动态博弈中,精炼贝叶斯纳什均衡是一个类型依存战略组合及一个信念组合,满足如下条件:(1)是先验概率的集合,即,,是第个局中人在其进行行动选择的信息集上所有信念组成的组合,记为他在其第个信息集上的信念;若局中人在信息集上观察到的行动为,则记,2)是局中人的类型空间,是他的一个类型;(3)是局中人的类型依存支付(效用)函数;(4)在第个局中人的每一个信息集上,有 (5)在均衡路径上,是按照贝叶斯法则从先验概率,局中人在信息集上观察到的行动和导出的。

例7.1 在图7.1中给出的一个不完全信息动态博弈中,“自然”N首先选择局中人1的两种类型中的某一种,但局中人2对N的选择具有不完全信息,他只知道先验概率为,局中人2的类型是对称的 N22a b a b a b a b(4,0)(2,1)(0,0)(2,4)(0,1)(1,0)(1,2)hf(1,3) 0.5 0.5 1 1 L R L R 2 2 图7.1 一个不完全信息动态博弈如果局中人1的类型依存战略为试找出与此战略相对应的局中人2的一个类型依存战略,使成为一个精炼贝叶斯均衡解:局中人2的类型是对称的给定,局中人2的2个信息集和都是均衡路径上的。

根据贝叶斯法则,在信息集上,局中人的后验概率为,;同样,在信息集上,有,给定这种信念,局中人2在上的最优行动是,在上的最优行动是给定局中人2在其信息集、上的上述信念及最优行动选择,类型为的局中人1将选择,类型为的局中人1将选L,所以,和构成一个精炼贝叶斯纳什均衡我们用表示这一均衡其中,,,,在这个博弈中,还存在其它的精炼贝叶斯均衡譬如,若那么,给定局中人1的这一类型依存战略,局中人2在信息集上的信息由贝叶斯法则有:如果上述是局中人1的精炼贝叶斯均衡战略,则局中人2的信息集位于非均衡路径上,因而不受贝叶斯法则限制但是,致使上述成为局中人1的精炼贝叶斯均衡战略,就对的取值范围有另外的限制给定,局中人2在上选择的期望支付为 而他选择的期望支付为 因而他选择行动此时,当局中人1在类型时选择L的支付为1,在类型时选择L的支付为2,欲使成为精炼贝叶斯均衡战略,就要求和取某些值使类型为、的局中人1都不会偏离上述选择局中人2在信息集上选择行动的期望支付为他选择行动的期望支付为当局中人2在。

下载提示
相似文档
正为您匹配相似的精品文档