博弈论第一章2－金锄头文库

资源描述

《博弈论第一章2》由会员分享，可在线阅读，更多相关《博弈论第一章2（43页珍藏版）》请在金锄头文库上搜索。

1、纳什均衡的思想设想在博弈论预测的博弈结果中, 给每个参与者选定各自的战略, 为使该预测是正确的,必须使参与者自愿选择理论给它推导出的战略.这样, 每一个参与者要选择的战略必须是针对其他参与者选择战略的最优反应, 这种理论推测的结果可以叫做“战略稳定”或“自动实施”的, 因为没有参与者愿意独自离弃他所选定的战略,这一状态称做纳什均衡（Nash Equilibrium）. 定义:在n 个参与者的标准式博弈中,如果战略组合满足对每一个参与者i , 是(至少不劣于)他针对其他(n-1)个参与者所选战略的最优反应战略，则称战略组合是该博弈的一个纳什均衡(纯战略).即：对所有

2、中的都成立，亦即是以下最优化问题的解：着存在一些参与人不是针对如果不是G 的纳什均衡,就意味的最优反应战略, 即在中存在使得如果博弈论提供的战略组合解不是纳什均衡的解,则至少有一个参与者有动因偏离理论的预测,使得博弈进行和理论预测不一致. 和纳什均衡推导密切相关的是协议的理念：例一 “囚徒困境”为了更准确的理解这一概念, 看下面几个例子：如果参与者之间要商定一个协议决定博弈与者不遵守协议.必须是纳什均衡的略组合，否则至少有一个参 -1，-1 -9， 00， -9 -6， -6囚徒2沉默招认囚徒1沉默招认如何进行，那么一个有效的协议中的战略组合对于囚徒1来讲

3、,如果囚徒2选择战略“沉默”, 那么, 囚徒1选择“沉默”的收益为-1,选择“招认”的收益为0, 当然选择“招认”.同理可得囚徒2的战略选择也是“招认”.因此,此博弈的纳什均衡解为 (招认，招认). 此时双方的收益为 (-6, -6), 很明显(-1, -1) 的收益好于(-6, -6).但纳什均衡的结果是达不到的,此所谓的“囚徒困境”. 这也正是博弈论的有趣之处, 纳什均衡的结果告诉我们一个很重要的结论: “囚徒困境”个体理性和集体理性的矛盾, 每个个体都追求个体收益最优, 其结果可能都达不到最优,相反, 集体利益可能也受到损害. 注:亚当.斯密:每个个体追求最优,结果集体最优. 影

4、响.纳什认为亚当. 斯密忽略了个体选择时的相互 6 ，63 ，53 ，55 ，30 ，44 ，05 ，34 ，00 ，4左中右上中下例2对于参与者1,如果参与者2选择左,则参与者1 选择中(430),此时参与者1的收益为4,在 4下面划一横线, 同理可以求出参与者2选择中、右时, 1的选择和收益. 对于参与者2可用同样的方法求解. 格子内数字都划线的对应的双方的战略组合(下，中)即为博弈的纳什均衡解. 1， 2 0 , 00 ,02 , 1 帕特歌剧拳击克里斯歌剧拳击例3性别战博弈易知此博弈有两个纳什均衡,(歌剧, 歌剧); （拳击, 拳击)结果到底是那一个呢? 不得而知.

5、此为多重性，是纳什均衡的缺陷之一, 也是博弈论的一大难题.此博弈无纳什均衡（纯战略）.例4猜硬币博弈 -1 ， 11 ，-11 ， -1 -1 ，1参与人2 正面反面参与人1正面反面例5 博弈双方1和2就如何分100元钱进行讨价还价. 假设确定了以下规则：双方同时提出自己的要求的数额和如果 , 则博弈双方的要求都能得到满足, 即分别得到和但会选择什么数额,为什么？的纯战略纳什均衡,若你是其中一个博弈方, 你如果则该笔钱就被没收. 求该博弈解参与者1的效用函数为因此,参与者1的最优选择是 1的最优反应函数.由对称性2的最优反应函数为 . 由于双方的反应函数完

6、全相同此为方程有无数解，所以该博弈有无数个纳什均衡解其中为的解. 如果我是其中的一个参与者,我会选择得到 50. 因为在该博弈的无穷个纳什均衡中,(50, 50) (50, 50) 这个均衡称为“聚点”均衡.是比较公平容易被双方接受的.例6 考虑一个有 N 个人参加的游戏:每个人可以放最多100元钱到一部可以生钱的机器里, 机器把所有人放进去的钱的总和增加到原来的 3倍,然后再平均分给这N 个人.求此博弈的纳什均衡. 解:容易得出当N =1, 2 时,此博弈有唯一的 (100, 100)为纳什均衡. 当N =3时的情况如何? 纳什均衡. N =1, 2 时双方都放进100元钱,

7、即其中,m, n, p分别为三个参与者放进机器里的钱数. m为参与者i 放进机器里的钱数. 由可以看出, i 的最优选择是:设参与者i 的收益函数为中的任意一个数.同理可分析另外两个参与者的选择. 因此博弈有无数个纳什均衡. 当时情况如何? 设参与者的收益函数为:由于所以,任何一个参与者都不放钱到机器里. 此时博弈有唯一的纳什均衡: m =0.所以参与者i 的最优选择是: 例7 “智猪博弈” 猪圈里有两头猪. 一头大猪，一头小猪，猪圈一头有一个猪食槽，另一头安装一个按钮，控制着猪食的供应. 按一下按钮会有10个单位的猪食进槽，但谁按按钮谁需要付出2个单位的的成本. 若大猪

8、先到，大猪吃到9个单位，小猪只能吃到1个单位；若同时到，大猪吃7个单位, 小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个单位. 求此博弈的纳什均衡. 解此博弈的收益矩阵：容易求出此博弈的纳什均衡为:（按，等待）. （按，等待）,此纳什均衡显然是不合理的. 5，14，49，-10，0小猪按等待大猪按等待例如：股份公司中，股东承担着监督经理的职能，但股东中有大股东和小股东之分，他现实中类似的现象. 门从监督中得到的收益并不一样. 而监督经理是要付出成本的. 在监督成本相同的情况下,大股东从监督中得到的收益显然大于小股东. 大股东类似于“大猪”，小股东类似于“小猪”. 纳什

9、均衡是，大股东担当起监督经理的责任，小股东则搭大股东的便车. 股票市场上炒股票的大户和小户的关系，市场上大企业和小企业的关系也是如此. 两个重要的命题：命题1 在n个参与者的标准式博弈中,如果重复剔除严格劣战略剔除掉除外的所有战略,那么这一战略组合为该博弈的唯一纳什均衡. 命题2 在n个参与者的标准式博弈中如果战略组合是一个纳什均衡，那么它不会被重复剔除严格劣战略所剔除. 证明：首证命题2. (反证法)如果战略组合是标准式博弈外的一些战略之后) 是首先被严格优于 .（111 ）对每一个其他参与者尚未被剔除的战略空间中可能形成的战略组合都成立.的一个纳什均衡, 但同时假定(

10、也许在剔除掉剔除的严格劣战略, 那么在中一定存在尚未被剔除的战略代如(DS)公式, 得到由于是均衡战略中第一个被剔除的战略, 均衡战略中其它参与人的战略尚未被剔除, 于是作为上面等式的特例下式成立. 但是（112）和公式（NE）是矛盾的：（112）根据(NE), 必须是针对的最优反应, 这一矛盾证明了原命题成立.那么就不可能存在一个战略严格优于下证命题1,在证命题2的过程中,实际上已证明了1的一部分.所需证明的只是如果重复剔除严格劣战略剔除了除之外的所有战略，该战略是纳什均衡. 由命题2任何其它纳什均衡必定同样未被剔除，这已证明了在该博弈中均衡假设博弈G 是有

11、限博弈.使用反证法：假设通过重复剔除严格劣战略剔除掉除外的所有战略，该战略不是纳什的唯一性. 下面只需证明余下的战略组合是纳什均衡即可.均衡，那么一定有某一参与者i ,在他的战略集中存在使公式（NE）不成立，但同时又必须是在剔除过程中某一阶段的严格劣战略. 上述两点的正规表述为：中存在使得（113）并且在参与者i 的战略集中存在 ,在剔除过程中的某一阶段有（114）对所有其他参与者在该阶段剩余战略可能的战略组合都成立.由于其他参者的战略始终未被剔除于是下式作为(114)的一个特例成立: （1.1.5）如果 (即是的严格占优战略), 则 (115)和(113)

12、相互矛盾，此时证明结束. 如果由于在最终被剔除掉了，则一定有其他战略在其后严格优于 .这样在不等式（114）和(115)中，分别用和则证明结束，否则还可构建两个相似的不等式由于是中唯一未被剔除的战略，重复换下和后仍然成立.这一论证过程（在一个有限的博弈中）最终一定能完成证明. 再一次，如果奥古斯汀古诺(Augustin Cournot)是19世纪著名的法国经济学.法国经济学强调以数理方法对经济事实进行抽象，这与传统的英国学派重视经验事实,主张从事实中进行归纳的经验论风格迥然不同的.古诺可以说是法果经济学派的开山鼻祖.他在1838年发表的对财富理论的数学原理的

13、研究 (Researches into theMatheMatical Principles of the Theory of wealth),给出了两个企业的博弈均衡的经典式证明，直到今天仍具生命力.（平新桥微观经济学18讲167页）古诺均衡12 应用举例古诺(1838)提出了纳什所定义的均衡(但只是在特定的双头垄断模型中)，但是他并没有从理论上系统的定义均衡的意义. 古诺的研究被为是最早的博弈论的经典文献之一. 此模型告诉我们；（1）如何对一个问题的非正式描述转化为一个博弈的标准式表述；（2）如何通过计算解出博弈的纳什均衡；（3）重复剔除严格劣战略的步骤. 下面介绍古诺的双

14、头垄断模型. 令和分别表示企业1, 2 生产的同质的产产品的产量，市场中该产品的总供给为令表示市场的出清时的价格. 更为精确一点的表述为当时, 当时，为 , 产每单位品的边际成本为常数c，这里假设设企业i 生产qi 的总成本即企业不存在固定成本，且生产根据古诺的假定，两个企业同时进行产量决策. 下面将此问题化为标准式博弈：三个要素（1）参与人（企业1和企业2）；（2）参与人可以选择的战略（3）针对每一个可能出现的参与人的战略组合，每一个参与人的收益. 企业的收益是自己所选战略与其它企业所选战略的函数,假定企业的收益就是其利润为一对战略如是纳什均衡,则对每个参与者，应满足: （NE）上式对中每一个可选战略都成立，这一条件等价于: 对每个参与者 , 必须是下面最优化问题的解最优化问题的一阶条件是对收益函数关于求偏导，并令其等于零，其解为（121）那么,如果产量组合要成为纳什均衡，企业产量选择必须满足：解这一对方程组得均衡解小于 , 满足上面的假设. 且两个企业的利润为另外，每家企业当然都希望

展开阅读全文