第八章 博弈论0第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策 相互影响的问题本章讨论这个问题,建立复杂环境下的决策理论开展这种研究的的理论 叫做博弈论,也称为对策论(Game Theory)最近十几年来,博弈论在经济学中得到了广泛应 用,在揭示经济行为相互制约性质方面取得了重大进展大部分经济行为都可视作博弈的特 殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡博弈 论的思想精髓与方法,已成为经济分析基础的必要组成部分第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双 方的目的都是要战胜对方,互不相容,互相影响,互相制约一般来讲,博弈现象的特征表 现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对 方的行动,每个当事人的收益都取决于所有当事人的行动当所有当事人都拿定主意作出决 策时,博弈的局势就暂时确定下来博弈论就是研究这种不相容现象的一种理论,并把当事 人叫做局中人(player) 博弈论推广了标准的一人决策理论在每个局中人的收益都依赖于其他局中人的选择的 情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个 局中人都必须考虑其他局中人面临的问题。
下面来举例说明例 1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否 正面朝上局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲 赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么 甲输掉1元,乙赢得1元 对于这个博弈,每个局中人可选择的策略都有两种: 正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}当甲和乙都作出选择时,博弈的局势就确定了 显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体, 也称为局势表,即表 1 每个局中人的收益都取决于所有局中人的决策,也就是说,局中人的收益是博弈局势的 函数本例中,甲的收益函数为:,f1)(,正正f ,,;乙的收益1)(,反正f1)(,正反f1)(,反反f 函数为:,,,g1)(,正正g1)(,反正g1)(,正反g 局中人的收益函数也可用表格或矩阵加1)(,反反g 以表示,并称其为收益表或收益矩阵表 2 中,甲的收 益列在左边,乙的收益列在右边。
表表 1 1:: 便士匹配博弈局势表便士匹配博弈局势表乙 甲正面反面正面(正,正)(正,反)反面(反,正)(反,反)表表 2:: 甲和乙的收益表甲和乙的收益表乙 甲正面反面正面 ,11,11 反面, 11 ,11第八章 博弈论1该博弈的特点在于每个局中人的收益都是另一个局中人的付出,即甲和乙的收益之和为 零,收支发生在局内,不涉及任何局外人这种博弈就是所谓的二人零和博弈习惯上,人 们喜欢把二人博弈的第一个局中人甲叫做“列” ,第二个局中人乙叫做“行” ,而且总是把列 的收益写在前面(即左边),行的收益写在后面(即右边)例 2.囚徒难题(Prisoner's Delimma)(二人变和博弈)有两个狂徒甲和乙因共同参与了一起犯罪活动而被囚禁收审他们可以选择合作,拒绝 供出任何犯罪事实;也可以选择背叛,供出对方的犯罪行径这就是所谓的囚徒博弈,也叫 做囚徒难题博弈的局中人甲和乙都有两种可选择的策略:合作与背叛 囚徒博弈的意义在于它可以解释寡头垄断厂商的 行为,关键是赋予合作与背叛具体的经济含义比如 在双头垄断的情况下,合作可以解释为“保持索要一 个高价” ,背叛可解释为“降价以争夺对手的市场” 。
右表给出了囚徒博弈的局势表 局中人可以事先讨论这局博弈,但实际决策必须 独立地做出如果甲采取合作策略,不供出乙的犯罪事实,那么乙就能得到 3000 元的收益 同样,如果乙采取合作策略,那么甲就能得到 3000 元的收益可见,如果甲乙双方都采取合 作策略,双方各得 3000 元收益 但是,审讯者用 1000 元奖赏来鼓励局中人采取背叛策略这样,只要局中人选择背叛, 他就会得到 1000 元鼓励,而不管另一个局中人会采取什么策略 需要注意的是,囚徒博弈中的货币支付来自第三方——局外人,这正是囚徒博弈同便士 匹配博弈的不同之处奥曼(Aumann)1987 年对囚徒博弈给出了一个特别简单的描述:每个局 中人都可以对仲裁人简单地宣告“给我 1000 元”或“给对方 3000 元” 简单分析一下就会发现,如果一个局中人 采取合作策略,而另一个局中人采取背叛策略, 那么采取合作策略的局中人的收益为零,而采 取背叛策略的局中人的收益为 4000 元(3000 元 收益再加上 1000 元的背叛鼓励)如果双方都 采取背叛策略,则双方的收益各为 1000 元 表 4 列出了甲乙双方的收益情况从收益表可以看出,甲乙双方的收益之和不为零,而且收 益和是变化的。
因此,囚徒博弈是一种变和博弈 直觉上看,甲和乙都应采取合作策略(互不供出对方的犯罪事实),各得 3000 元收益 但从收益表可以得出这样的结论:如果一个局中人认为另一个局中人将合作,从而他将得到 3000 元收益,那么他若采取背叛策略,就将总共能获得 4000 元的收益;如果他认为另一个 局中人为了得到 1000 元鼓励而将背叛,那么他也就只好为了自己也取得 1000 元鼓励而采取 背叛策略(否则,他将一无所获)总之,在收益最大化动机的驱使下,局中人的最优选择是 背叛这样一来,甲乙双方都采取背叛策略,各得 1000 元收益;而不是都采取合作策略,各 得 3000 元这是一个典型的博弈悖论,问题的关键在于每个局中人都有背叛的鼓励,而不管 其他局中人将做什么例 3.古诺博弈(双头垄断:产量较量)法国经济学家古诺(Cournot)于 1838 年以天然矿泉井为例,首次建立了简单的双头垄断 博弈模型,其特点是,垄断厂商双方都天真地以为对方不会改变原有产量水平,双方都追求 各自利润最大化古诺假定:①有两个天然矿泉在一起,分别为厂商甲和乙占有;②两个矿 泉都为自流井,生产成本为零,边际成本也为零;③甲和乙面对相同的需求曲线,采用相同 的价格;④双方都以为对方的产量水平不会改变。
在这些假设前提下,甲和乙各自独立决定表表 3:: 囚徒博弈局势表囚徒博弈局势表乙 甲合作背叛合作(合作,合作)(合作,背叛)背叛(背叛,合作)(背叛,背叛)表表 4:: 甲和乙的收益表甲和乙的收益表乙甲合作背叛合作3000, 3000 0, 4000背叛4000, 01000, 1000第八章 博弈论2自己的产量水平,以求利润最大化 设是甲乙双方共同面临的反需求函数当甲的矿泉水产量为,乙的产量为)(QP1Q 时,矿泉水的市场价格为,甲的利润, 乙的利润为2Q)(21P11PQ22PQ 在这个博弈中,甲乙双方的策略都表现为选择产量水平,局中人的收益即为厂商的利润当 甲的产量为时,乙以为甲不会改变这一产量,而选择一个合适的产量水平以使自己的1Q2Q 利润达到最大同样,当乙的产量水平为时,甲以为乙不会改变这一产量,而选择一22Q 个合适的产量水平以使自己的利润达到最大1Q1 为了说明这个博弈的结果,假设甲乙双方面临的反需求函数用kQPQP0)( 表示这局博弈中甲选择的最优产量,表示乙选择的最优产量水平,则甲乙各自的收益1Q2Q 分别为和。
由于实现了利润最大化,因12101))((QkP22102))((QkP 此0, 02211 解之得:当乙的产量水平为时,甲决定的产量水平为(这是甲对乙的反2Q2)(201Q 应函数);当甲的产量水平为时,乙决定的产量水平为(这是乙对甲的反1Q2)(102Q 应函数)其中,表示矿泉水市场容量(即价格为零时的矿泉水需求量)进一步求kPQ00 解可得:, 即博弈的结果是双方最终各占据矿泉市场的三分之一反应函数3021Q 说明,古诺博弈中每个局中人的决策(选定的产量水平)不但依赖于其他局中人的决策,而且 与市场的容量有关例 4.贝特兰博弈(双头垄断:价格较量)古诺博弈模型描述了双头垄断厂商之间展开的产量较量实际上厂商之间的产量较量并 不如价格较量那么普遍,寡头之间应该有激烈的价格竞争不论市场价格如何,只要某一厂 商降低价格,而其他竞争对手保持原价格不变,那么降价厂商就能占有全部市场这就是说, 我们假定消费者只从最低价格厂商那里购买产品为此,法国经济学家贝特兰(Bertrand)于 1883 年提出了以价格为选择策略的贝特兰博弈模型,反对古诺关于产量的博弈模型。
还以矿泉水为例,在贝特兰博弈模型中各厂商都预期对手不会改变价格,从而将自己的 价格确定在利润最大化的水平之上这就是说,贝特兰博弈的构建同古诺博弈相似,所不同 的是贝特兰博弈中局中人的策略是选择价格,而古诺博弈局中人的策略是选择产量水平 贝特兰博弈中两个局中人甲和乙也是面临相同的市场需求函数,不过现在价格是自变量, 产量为因变量(古诺模型正好相反)设市场需求函数为, 为了分析上简单起见,进)(PDQ 一步设(这里,,,即与古诺模型中的市场需求相同)局中人bP0kPQ00kb1 的收益仍是他所获得的利润 如果甲和乙不相互勾结串通,当乙采取了价格水平时,甲认为乙不会改变这一价格水2P 平,从而为了占领市场而要采取低于乙的价格水平的价格,于是甲的利润为2P1P ,乙的利润为零;同样,当甲采取了价格水平时,乙认为甲不会改变这一价)(111PDP1P 格水平,从而为了占领市场而要采取低于甲的价格水平的价格,于是乙的利润为1P2P , 甲的利润为零)(222PDP 如果甲和乙相互勾结串通起来,采取相同的价格策略,即,那么甲和乙就能索要21PP 一个垄断价格,并且每人可收取一半的垄断利润。
由此可见,甲和乙的利润函数分别为:第八章 博弈论3, 时当时当时当212121, 0,2)(),(),(11112111PPPPPPPDPPDPPP 时当时当时当212121, 0,2)(),(),(22222122PPPPPPPDPPDPPP如果甲和乙勾结串通,合作起来,那么双方就能按照最大利润价格获得垄)2(0bQP 断价格,并且各得最大利润的一半这里,利润最大化价格是按照 02)(00bPQbPQPPP确定的但是,占领市场的诱惑对每个局中人都存在,只要他稍微降价,他就能获得全部市 场假如甲先进入该矿泉市场,那么甲就按照利润最大化价格$P_1=Q_o/(2b)$获取最大利润继而乙进入这个市场,且乙认为甲不会改变他的价格$P_1$,于是乙为了夺取市场而采取低 于甲的价格水平的一个价格(由于乙夺走了市场,甲同样又会采取低于乙的1P2P)12PP 价格水平的价格,以夺回市场这样不断往复下去,直至最后甲乙双方都把价格水平定2P3P 为零时才可达到均衡,此时双方的收益为零,市场各占一半(即甲的销售量和乙的销售量1Q 相等,且)。
这就是甲乙双方不合作的结果,双方都变得更差2Q2021Q 以上分析表明:把贝特兰博弈与古诺博弈作比较,对同一市场来说,由于选择了不同的 策略集合(一个以产量作为策略,另一个以定价作为策略),得出了不同的博弈结果,贝特兰 博弈的均衡价格、均衡产量和均衡利润都呈完全竞争状态(超额利润为零),而古诺博弈的结 果不是这样;再把贝特兰博弈同囚徒难题博弈作比较,二者具有相似的结构,即局中人合作 会取得最好的结果,但利益的诱惑。