博弈论第一章2

上传人:wm****3 文档编号:51953804 上传时间:2018-08-17 格式:PPT 页数:43 大小:1.65MB
返回 下载 相关 举报
博弈论第一章2_第1页
第1页 / 共43页
博弈论第一章2_第2页
第2页 / 共43页
博弈论第一章2_第3页
第3页 / 共43页
博弈论第一章2_第4页
第4页 / 共43页
博弈论第一章2_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《博弈论第一章2》由会员分享,可在线阅读,更多相关《博弈论第一章2(43页珍藏版)》请在金锄头文库上搜索。

1、纳什均衡的思想 设想在博弈论预测的博弈结果中, 给每个参 与者选定各自的战略, 为使该预测是正确的,必须 使参与者自愿选择理论给它推导出的战略.这样, 每一个参与者要选择的战略必须是针对其他参与 者选择战略的最优反应, 这种理论推测的结果可以 叫做“战略稳定”或“自动实施”的, 因为没有参与者 愿意独自离弃他所选定的战略,这一状态称做纳 什均衡(Nash Equilibrium). 定义:在n 个参与者的标准式博弈中,如果战略组合 满足对每一个 参与者i , 是(至少不劣于)他针对其他(n-1)个 参与者所选战略 的最 优反应战略,则称战略组合 是 该博弈的一个纳什均衡(纯战略).即:对所有

2、中的 都成立,亦即 是以下最优化 问题的解:着存在一些参与人 不是针对 如果 不是G 的纳什均衡,就意味 的最优反应战略, 即在 中存在 使得 如果博弈论提供的战略组合解 不是纳什均衡的解,则至少有一个参与者有动因 偏离理论的预测,使得博弈进行和理论预测不一 致. 和纳什均衡推导密切相关的是协议的理念:例一 “囚徒困境”为了更准确的理解这一概念, 看下面几个 例子:如果参与者之间要商定一个协议决定博弈 与者不遵守协议.必须是纳什均衡的略组合,否则至少有一个参 -1,-1 -9, 00, -9 -6, -6囚徒2沉默 招认 囚徒1沉默招认如何进行, 那么一个有效的协议中的战略组合 对于囚徒1来讲

3、,如果囚徒2选择战略“沉默”, 那么, 囚徒1选择“沉默”的收益为-1,选择“招认”的收益为0, 当然选择“招认”.同理可得囚徒2的 战略选择也是“招认”.因此,此博弈的纳什均衡 解为 (招认,招认). 此时双方的收益为 (-6, -6), 很明显(-1, -1) 的收益好于(-6, -6).但纳什均衡 的结果是达不到的,此所谓的“囚徒困境”. 这也正是博弈论的有趣之处, 纳什均衡的结果告诉我们一个很重要的结论: “囚徒困境”个体理性和集体理性的矛盾, 每个个体都追求个体收益最优, 其结果可能 都达不到最优,相反, 集体利益可能也受到损害. 注:亚当.斯密:每个个体追求最优,结果集体最优. 影

4、响.纳什认为亚当. 斯密忽略了个体选择时的相互 6 ,63 ,53 ,55 ,30 ,44 ,05 ,34 ,00 ,4左 中 右上 中 下例2对于参与者1,如果参与者2选择左,则参与者1 选择中(430),此时参与者1的收益为4,在 4下面划一横线, 同理可以求出参与者2选择中、 右时, 1的选择和收益. 对于参与者2可用同样的 方法求解. 格子内数字都划线的对应的双方的 战略组合(下,中)即为博弈的纳什均衡解. 1, 2 0 , 00 ,02 , 1 帕特 歌剧 拳击克里斯歌剧 拳击例3性别战博弈易知此博弈有两个纳什均衡,(歌剧, 歌剧); (拳击, 拳击)结果到底是那一个呢? 不得而知.

5、 此为多重性,是纳什均衡的缺陷之一, 也是 博弈论的一大难题.此博弈无纳什均衡(纯战略).例4猜硬币博弈 -1 , 11 ,-11 , -1 -1 ,1参与人2 正面 反面参与人1正面 反面例5 博弈双方1和2就如何分100元钱进行 讨价还价. 假设确定了以下规则: 双方同时提出自己的要求的数额 和 如果 , 则博弈双方 的要求都能得到满足, 即分别得到 和 但 会选择什么数额,为什么? 的纯战略纳什均衡,若你是其中一个博弈方, 你 如果 则该笔钱就被没收. 求该博弈 解 参与者1的效用函数为 因此,参与者1的最优选择是 1的最优反应函数.由对称性2的最优反应函数 为 . 由于双方的反应函数完

6、全相同 此为 方程 有无数解,所以该博弈有无数 个纳什均衡解 其中 为 的解. 如果我是其中的一个参与者,我会选择得到 50. 因为在该博弈的无穷个纳什均衡中,(50, 50) (50, 50) 这个均衡称为“聚点”均衡.是比较公平容易被双方接受的.例6 考虑一个有 N 个人参加的游戏:每个人 可以放最多100元钱到一部可以生钱的机器里, 机器把所有人放进去的钱的总和增加到原来的 3倍,然后再平均分给这N 个人.求此博弈的纳什均衡. 解:容易得出当N =1, 2 时,此博弈有唯一的 (100, 100)为纳什均衡. 当N =3时的情况如何? 纳什均衡. N =1, 2 时双方都放进100元钱,

7、 即 其中,m, n, p分别为三个参与者放进机器里的钱 数. m为参与者i 放进机器里的钱数. 由 可以看出, i 的最优选择是:设参与者i 的收益函数为中的任意一个数.同理可分析另外两个参与者的 选择. 因此博弈有无数个纳什均衡. 当 时情况如何? 设参与者 的收益函数为:由于所以,任何一个参与者都不放钱到机器里. 此时博弈有唯一的纳什均衡: m =0.所以参与者i 的最优选择是: 例7 “智猪博弈” 猪圈里有两头猪. 一头大猪,一头小猪, 猪圈一头有一个猪食槽,另一头安装一个按钮, 控制着猪食的供应. 按一下按钮会有10个单位 的猪食进槽,但谁按按钮谁需要付出2个单位的 的成本. 若大猪

8、先到,大猪吃到9个单位,小猪 只能吃到1个单位;若同时到,大猪吃7个单位, 小猪吃3个单位;若小猪先到,大猪吃6个单位, 小猪吃4个单位. 求此博弈的纳什均衡. 解 此博弈的收益矩阵:容易求出此博弈的纳什均衡为:(按,等待). (按,等待),此纳什均衡显然是不合理的. 5,14,49,-10,0小猪按 等待大猪按等待例如:股份公司中,股东承担着监督经理 的职能,但股东中有大股东和小股东之分,他 现实中类似的现象. 门从监督中得到的收益并不一样. 而监督经理 是要付出成本的. 在监督成本相同的情况下,大 股东从监督中得到的收益显然大于小股东. 大 股东类似于“大猪”,小股东类似于“小猪”. 纳什

9、均衡是,大股东担当起监督经理的责 任,小股东则搭大股东的便车. 股票市场上炒股票的大户和小户的关系, 市场上大企业和小企业的关系也是如此. 两个重要的命题: 命题1 在n个参与者的标准式博弈中,如果重复剔除严格劣战略剔除掉除 外的所有战略,那么这一战略组 合为该博弈的唯一纳什均衡. 命题2 在n个参与者的标准式博弈中如果战略组合 是一个纳什均衡, 那么它不会被重复剔除严格劣战略所剔除. 证明: 首证命题2. (反证法)如果战略组合 是标准式博弈外的一些战略之后) 是首先被 严格优于 .(111 )对每一个其他参与者尚未被剔除的战略空间中可能形成的战略组合 都成立.的一个纳什均衡, 但同时假定(

10、也许在剔除掉 剔除的严格劣战略, 那么在 中一定存在尚未被 剔除的战略 代如(DS)公式, 得到 由于 是均衡战略中第一个被剔除的战略, 均衡 战略中其它参与人的战略尚未被剔除, 于是作为上面等式的特例下式成立. 但是(112)和公式(NE)是矛盾的:(112)根据(NE), 必须是针对 的最 优反应, 这一矛盾证明了原命题成立.那么就不可能存在一个战略 严格优于 下证命题1,在证命题2的过程中,实际上已证明 了1的一部分.所需证明的只是如果重复剔除严格 劣战略剔除了除 之外的所有战略, 该战略是纳什均衡. 由命题2任何其它纳什均衡 必定同样未被剔除,这已证明了在该博弈中均衡 假设博弈G 是有

11、限博弈.使用反证法: 假设通过重复剔除严格劣战略剔除掉除 外的所有战略,该战略不是纳什 的唯一性. 下面只需证明余下的战略组合是纳什 均衡即可.均衡,那么一定有某一参与者i ,在他的战略集 中存在 使公式(NE)不成立,但同时 又必 须是在剔除过程中某一阶段的严格劣战略. 上述两点的正规表述为:中存在 使得 (113)并且在参与者i 的战略集中存在 ,在剔除过程中的某一阶段有 (114)对所有其他参与者在该阶段剩余战略可能的战 略组合 都成立.由于其他 参者的战略 始终未被剔除 于是下式作为(114)的一个特例成立: (1.1.5)如果 (即 是 的严格占优战略), 则 (115)和(113)

12、相互矛盾,此时证明结束. 如果由于 在最终被剔除掉了,则 一定有其他战略 在其后严格优于 .这样 在不等式(114)和(115)中,分别用 和则证明结束,否则还可构建两个相似的不等式 由于 是 中唯一未被剔除的战略,重复 换下 和 后仍然成立.这一论证过程(在一个有限的博弈中)最终一 定能完成证明. 再一次,如果奥古斯汀古诺(Augustin Cournot)是19世纪 著名的法国经济学.法国经济学强调以数理方法 对经济事实进行抽象,这与传统的英国学派重视 经验事实,主张从事实中进行归纳的经验论风格 迥然不同的.古诺可以说是法果经济学派的开山 鼻祖.他在1838年发表的对财富理论的数学原 理的

13、研究 (Researches into theMatheMatical Principles of the Theory of wealth),给出了两个 企业的博弈均衡的经典式证明,直到今天仍具生 命力.(平新桥微观经济学18讲167页)古诺均衡12 应用举例古诺(1838)提出了纳什所定义的均衡(但只 是在特定的双头垄断模型中),但是他并没有从 理论上系统的定义均衡的意义. 古诺的研究被为 是最早的博弈论的经典文献之一. 此模型告诉我们; (1)如何对一个问题的非正式描述转化为一个博弈的标准式表述; (2)如何通过计算解出博弈的纳什均衡; (3)重复剔除严格劣战略的步骤. 下面介绍古诺的双

14、头垄断模型. 令 和 分别表示企业1, 2 生产的同质的产 产品的产量,市场中该产品的总供给为令 表示市场的出清时的价格. 更为精确一点的表述为当 时, 当 时, 为 , 产每单位品的边际成本为常数c,这里假设 设企业i 生产qi 的总成本 即企业不存在固定成本,且生产根据古诺的假定,两个企业同时进行产量决 策. 下面将此问题化为标准式博弈:三个要素 (1)参与人(企业1和企业2); (2)参与人可以选择的战略 (3)针对每一个可能出现的参与人的战略组 合,每一个参与人的收益. 企业 的收益是自己所选战略与其它企业所 选战略的函数,假定企业 的收益就是其利润为 一对战略 如是纳什均衡,则对每个参与 者 , 应满足: (NE) 上式对 中每一个可选战略 都成立,这一条件 等价于: 对每个参与者 , 必须是下面最优化问 题的解最优化问题的一阶条件是对收益函数关于 求 偏导,并令其等于零,其解为 (121)那么,如果产量组合 要成为纳什均衡, 企业产量选择必须满足:解这一对方程组得 均衡解小于 , 满足上面的假设. 且两个企业 的利润为 另外,每家企业当然都希望

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号