《博弈论第二章》PPT课件.ppt

上传人:pu****.1 文档编号:579555979 上传时间:2024-08-26 格式:PPT 页数:107 大小:1,016.61KB
返回 下载 相关 举报
《博弈论第二章》PPT课件.ppt_第1页
第1页 / 共107页
《博弈论第二章》PPT课件.ppt_第2页
第2页 / 共107页
《博弈论第二章》PPT课件.ppt_第3页
第3页 / 共107页
《博弈论第二章》PPT课件.ppt_第4页
第4页 / 共107页
《博弈论第二章》PPT课件.ppt_第5页
第5页 / 共107页
点击查看更多>>
资源描述

《《博弈论第二章》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《博弈论第二章》PPT课件.ppt(107页珍藏版)》请在金锄头文库上搜索。

1、第二章第二章 完全信息静态博弈(一)完全信息静态博弈(一) 单纯战略纳什均衡单纯战略纳什均衡博弈论的基本概念及战略式表述博弈论的基本概念及战略式表述占优战略均衡占优战略均衡重复剔除的占优战略均衡重复剔除的占优战略均衡纳什均衡与相对优势策略划线法纳什均衡与相对优势策略划线法纳什均衡应用举例纳什均衡应用举例第一节第一节 博弈论的基本概念博弈论的基本概念 与战略式表述与战略式表述博弈论的基本概念与战略式表述博弈论的基本概念与战略式表述博弈论博弈论(game theorygame theory)是研究决策主体的行为是研究决策主体的行为 发生直接相互作用时候的决策以及这种决策的发生直接相互作用时候的决策

2、以及这种决策的均衡问题。均衡问题。博弈的战略式表述:博弈的战略式表述:G=G=N,(SN,(Si i) )i i N N,(U,(Ui i) )i i N N 有三个基本要素有三个基本要素:(1 1)参与人(参与人(playersplayers)i i N N=1,2,=1,2,n ,n ;(2 2)战略(战略(strategiesstrategies),s,si i S Si i( (战略空间战略空间) );(3 3)支付()支付(payoffspayoffs),u,ui i= =u ui i(s(si i,s,s-i-i) )。囚徒困境是塔克(Tucker)1950年提出的。该博弈是博弈论

3、最经典、著名的博弈。该博弈是博弈论最经典、著名的博弈。该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷。案例案例1 1:囚徒困境:囚徒困境囚徒困境囚徒困境 两两个个小小偷偷甲甲和和乙乙联联手手作作案案, 被被警警方方逮逮住住,但但证证据据不不足足。警警方方将将两两人人分分别别审审讯讯,政政策策是是坦坦白白从从宽宽,抗抗拒拒从从严严。若若一一人人坦坦白白但但另另一一人人不不坦坦白白,则则坦坦白白者者被被判判1 1年年,未未坦坦白白者者判判入入狱狱7 7年年;若若二二人人都都坦坦白白则则两两人人各各判判刑刑5 5年年; ;若若两

4、两人人都都不不坦坦白则未获证据,但因私入民宅各判白则未获证据,但因私入民宅各判2 2年。年。 囚徒困境囚徒困境(prisoners dilemma) -5, -5 -1, -7 -7, -1 -2, -2囚徒乙囚徒乙坦白坦白不坦白不坦白囚囚徒徒甲甲坦白坦白不坦白不坦白均衡策略与均衡支付均衡策略与均衡支付均衡策略(坦白,坦白)均衡支付(-5,-5)第二节第二节 占优策略均衡占优策略均衡第二节第二节 占优战略均衡占优战略均衡第二节第二节 占优战略均衡占优战略均衡第二节第二节 占优战略均衡占优战略均衡第二节第二节 占优战略均衡占优战略均衡 完全信息静态博弈即各局中人同时决策,且所有局中人对各方得益都

5、了解的博弈。 囚徒困境、齐威王田忌赛马、猜硬币、石囚徒困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。头剪子布、古诺产量决策都属于这种博弈。 完全信息静态博弈属于非合作博弈最基本完全信息静态博弈属于非合作博弈最基本的类型。的类型。占优策略均衡占优策略均衡完全信息静态博弈的几点特性完全信息静态博弈的几点特性同时出招,出招一次;知道博弈结构与游戏规则(共同知识);不管是否沟通过,无法做出有约束力的 承诺(非合作) 占优策略占优策略占优策略:不管对手策略为何,该参与人可占优策略:不管对手策略为何,该参与人可找到一最佳策略。或不管其它局中人选择什找到一最佳策略。或不管其它局中人选

6、择什么策略,一局中人的某个策略给他带来的支么策略,一局中人的某个策略给他带来的支付始终高于其它的策略。付始终高于其它的策略。 囚徒困境中的囚徒困境中的“坦白坦白”。 占优策略均衡占优策略均衡在博弈在博弈G=G=N,(SN,(Si i) )i i N N,(U,(Ui i) )i i N N 中,如果对所有的中,如果对所有的参与人参与人i,si,si i* *是它的占优策略,那么所有参与人选是它的占优策略,那么所有参与人选择的策略组合(择的策略组合(s s1 1*,*, ,s sn n* *)成为该对策的占优策成为该对策的占优策略均衡。略均衡。 或一个博弈的某个战略组合中的所有战略都是各或一个博

7、弈的某个战略组合中的所有战略都是各个局中人各自的占优策略,必然是该博弈比较稳个局中人各自的占优策略,必然是该博弈比较稳定的结果。定的结果。 博博弈弈均均衡衡是是指指博博弈弈中中的的所所有有参参与与者者都都不不想想改改变变自自己己的的策策略略的的这这样样一一种种相相对对静静止止的的状状态态。如如果果所所有有参参与与者者选选择择的的都都是是自自己己的的占占优优策策略略,该该博博弈弈均均衡衡又被称为又被称为占优策略均衡。占优策略均衡。即即:由由博博弈弈中中的的所所有有参参与与者者的的占占优优策策略略组组合合所所构构成成的的均均衡衡就就是是占占优优策策略略均均衡。衡。 占优策略均衡反映了所有局中人的绝

8、对偏占优策略均衡反映了所有局中人的绝对偏 好,因此非常稳定,根据占优策略均衡可好,因此非常稳定,根据占优策略均衡可以对博弈结果作出最肯定的预测。以对博弈结果作出最肯定的预测。占优策略均衡不是普遍存在的占优策略均衡不是普遍存在的. .一个博弈中所有参与者存在严格优策略,一个博弈中所有参与者存在严格优策略,那么严格优策略组合一定是该博弈的唯一那么严格优策略组合一定是该博弈的唯一均衡解。均衡解。(P34)抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A“囚徒困境囚徒困境” 的扩展的扩展两个寡头企业选择产量两个寡头企业选择产量( (随后介绍随后介绍) )公共产品的供给公共产品的

9、供给(P47)(P47)军备竞赛军备竞赛经济改革经济改革 举例:价格大战和双赢对局举例:价格大战和双赢对局 可口可乐公司和百事可乐公司几乎垄断了美国可口可乐公司和百事可乐公司几乎垄断了美国的碳酸饮料市场,他们之间的争斗如下:的碳酸饮料市场,他们之间的争斗如下: 假定两家企业都采取比较低的价格,可以各得利假定两家企业都采取比较低的价格,可以各得利润润30亿美元;都采取比较高的价格,各得亿美元;都采取比较高的价格,各得50亿美元亿美元利润;而如果一家采取较高的价格而另一家采取较低利润;而如果一家采取较高的价格而另一家采取较低的价格,那么价格高的企业的利润为的价格,那么价格高的企业的利润为10亿美元

10、,价亿美元,价格低的企业因为多销,利润将上升到格低的企业因为多销,利润将上升到60亿美元。亿美元。 30 30 60 10 10 60 50 50 百事可乐公司百事可乐公司 高价高价可可口口可可乐乐公公司司 低低价价 高高价价低价低价案例案例2:智猪博弈:智猪博弈 猪圈里有两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。支付如表。按等待按5,14,

11、4等待9,-10,0支付小猪大猪智猪博弈的扩展智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈市场中大企业与小企业在研发、广告上的博弈公共产品的提供(富户与穷户)公共产品的提供(富户与穷户)改革中不同利益分配对改革的推动改革中不同利益分配对改革的推动第三节第三节 重复剔除的占重复剔除的占优策略均衡优策略均衡绝对劣势策略:绝对劣势策略:s si i是一绝对劣势策略,当且仅当存是一绝对劣势策略,当且仅当存在另一策略在另一策略s si i S Si i,使得使

12、得u ui i(s(si i,s,s-i-i) ) u ui i(s(si i,s,s-i-i) ) 对所有对所有s s-i-i S S-i-i均成立。(均成立。( s si i 未必是优势策略)未必是优势策略) 或不管其它局中人的策略如何变化,给一个局中人或不管其它局中人的策略如何变化,给一个局中人带来的收益总是比另一种策略给他带来的收益小的带来的收益总是比另一种策略给他带来的收益小的策略。策略。重复剔除的占优策略均衡:重复剔除的占优策略均衡:逐次删去绝对劣势策略逐次删去绝对劣势策略得到唯一的占优策略。得到唯一的占优策略。一般来说,在分析一个局中人的决策行为时,可以一般来说,在分析一个局中人

13、的决策行为时,可以首先把一个严格劣势策略从该局中人的策略集中去首先把一个严格劣势策略从该局中人的策略集中去掉,然后在剩下的策略范围内,试图再找出这个局掉,然后在剩下的策略范围内,试图再找出这个局中人或者别的局中人的一个严格劣势策略,并将它中人或者别的局中人的一个严格劣势策略,并将它去掉。不断重复这一过程,直到对每一个局中人而去掉。不断重复这一过程,直到对每一个局中人而言,再也找不出严格劣势策略为止。这种分析方法言,再也找不出严格劣势策略为止。这种分析方法在博弈论中称为在博弈论中称为严格劣势策略逐次消去法,也叫重严格劣势策略逐次消去法,也叫重复剔除占优策略法。复剔除占优策略法。例:重复剔除的占优

14、策略均衡2,30,23,41,12,74,5 参与人参与人2 L M R参参与与人人1UD4,35,16,22,18,43,63,09,62,8 参与人参与人2L M R参参与与人人1UDM1,01,33,00,20,13,00,22,45,3 参与人参与人2L M R参参与与人人1UDM注意:注意: 如果每次剔除的是严格劣战略,均衡结如果每次剔除的是严格劣战略,均衡结果与剔除的顺序无关;如果剔除的是弱劣果与剔除的顺序无关;如果剔除的是弱劣势战略,均衡结果可能与剔除顺序有关。势战略,均衡结果可能与剔除顺序有关。l存在严格优势策略必然存在严格劣势策略,存在严格优势策略必然存在严格劣势策略,反之不

15、然。反之不然。甲和乙分别会选择什么策略?甲和乙分别会选择什么策略? 乙 L M R U 甲 D 1,14,21,32,31,22,1 当甲选“U”时,乙会选“R”;而当乙选“R”时,甲应该选“D”而不是“U”;但当甲选“D”时,乙会选“L”;给定乙选“L”,甲选“D”是最好的选择,他不会改变选择“D”;给定甲不改变选“D”,乙也不会改变其选择“L”。所以,可以预期(D,L)是甲乙最终完成的稳定的选择。前面的博弈分析中,只要每一个游戏者都具前面的博弈分析中,只要每一个游戏者都具有占优策略,那么该博弈就一定存在占优策有占优策略,那么该博弈就一定存在占优策略均衡。但是需要指出的是在有的博弈中,略均衡

16、。但是需要指出的是在有的博弈中,并不存在占优策略,仍可以达到博弈均衡。并不存在占优策略,仍可以达到博弈均衡。 例子:情侣博弈(性别之战)例子:情侣博弈(性别之战)一对情侣对如何度周末有不同的想法:女一对情侣对如何度周末有不同的想法:女方想看电影,而男方想看球赛。两人都希方想看电影,而男方想看球赛。两人都希望和对方一同度过周末而不愿分头行动。望和对方一同度过周末而不愿分头行动。因此女方希望男方和自己一同看电影,而因此女方希望男方和自己一同看电影,而男方希望女方和自己一起看球赛。男方希望女方和自己一起看球赛。 1 2 0 0 0 0 2 1 男男电影电影 球赛球赛 电电影影 球球赛赛 女女在这样的

17、博弈中,双方都没有上策。在这样的博弈中,双方都没有上策。该博弈中有两个均衡状态(电影,电影)、该博弈中有两个均衡状态(电影,电影)、(球赛,球赛)。(球赛,球赛)。在在一一个个均均衡衡里里,如如果果其其他他参参与与者者不不改改变变策策略略,任任何何一一个个参参与与者者都都不不会会改改变变自自己己的的策策略略,则则为纳什均衡。为纳什均衡。实际上,他们的最优策略均依赖对方的选择,实际上,他们的最优策略均依赖对方的选择,一旦对方选择了某一项活动,另一个人选择一旦对方选择了某一项活动,另一个人选择同样的活动就是最好的策略。同样的活动就是最好的策略。第四节第四节 纳什均衡 约翰约翰福布斯福布斯纳什简介纳

18、什简介约翰约翰福布斯福布斯纳什纳什(John Forbes Nash Jr.,1928年6月13日),又译约翰纳许,美国数学家,前麻省理工学院助教,主要研究博弈论和微分几何学。1994年,他和其他两位博弈论学家约翰C海萨尼(John Harsanyi)和莱因哈德泽尔腾共同获得了诺贝尔经济学奖。1950年,纳什获得美国普林斯顿高等研究院的博士学位,他在那篇仅仅27页的博士论文中提出了一个重要概念,也就是后来被称为“纳什均衡”的博弈理论。 孤独的天才孤独的天才约翰纳什1928年出生在美国西弗吉尼亚州工业城布鲁菲尔德的一个富裕家庭。他的父亲是受过良好教育的电子工程师,母亲则是拉丁语教师。纳什从小就很

19、孤僻,他宁愿钻在书堆里,也不愿出去和同龄的孩子玩耍。但是那个时候,纳什的数学成绩并不好,小学老师常常向他的家长抱怨纳什的数学有问题,因为他常常使用一些奇特的解题方法。而到了中学,这种情况就更加频繁了,老师在黑板上演算了整个黑板的习题,纳什只用简单的几步就能解出答案。中学毕业后,约翰纳什进入了匹兹堡的卡耐基技术学院化学工程系。1948年,大学三年级的纳什同时被哈佛大学、普林斯顿大学、芝加哥大学和密执安大学录取,而普林斯顿大学则表现得更加热情,当普林斯顿大学的数学系主任莱夫谢茨感到纳什的犹豫时,就立即写信敦促他选择普林斯顿,这促使纳什接受了一份1150美元的奖学金。 当时的普林斯顿已经成了全世界的

20、数学中心,爱因斯坦等世界级大师均云集于此。在普林斯顿自由的学术空气里,纳什如鱼得水,他21岁博士毕业,不到30岁已经闻名遐迩。1958年,纳什因其在数学领域的优异工作被美国财富杂志评为新一代天才数学家中最杰出的人物。 约翰纳什最重要的理论就是现在广泛出现在经济学教科书上的“纳什均衡”。而“纳什均衡”最著名的一个例子就是“囚徒困境”。“纳什均衡”是他21岁博士毕业的论文,也奠定了数十年后他获得诺贝尔经济学奖的基础。 那时的纳什“就像天神一样英俊”,1.85米的个子,体重接近77公斤,手指修长、优雅,双手柔软、漂亮,还有一张英国贵族的容貌。他的才华和个人魅力吸引了一个漂亮的女生艾里西亚,她是当时麻

21、省理工学院物理系仅有的两名女生之一。1957年,他们结婚了。之后漫长的岁月证明,这也许正是纳什一生中比获得诺贝尔奖更重要的事。 就在事业爱情双双得意的时候,纳什也因为喜欢独来独往,喜欢解决折磨人的数学问题而被人们称为“孤独的天才”。他不是一个善于为人处世并受大多数人欢迎的人,他有着天才们常有的骄傲、自我中心的毛病。他的同辈人基本认为他不可理喻,他们说他“孤僻,傲慢,无情,幽灵一般,古怪,沉醉于自己的隐秘世界,根本不能理解别人操心的世俗事务。” 普林斯顿的幽灵普林斯顿的幽灵1958年的秋天,正当艾里西亚半惊半喜地发现自己怀孕时,纳什却为自己的未来满怀心事,越来越不安。系主任马丁已答应在那年冬天给

22、他永久教职,但是纳什却出现了各种稀奇古怪的行为:他担心被征兵入伍而毁了自己的数学创造力,他梦想成立一个世界政府,他认为纽约时报上每一个字母都隐含着神秘的意义,而只有他才能读懂其中的寓意。他认为世界上的一切都可以用一个数学公式表达。他给联合国写信,跑到华盛顿给每个国家的大使馆投递信件,要求各国使馆支持他成立世界政府的想法。他迷上了法语,甚至要用法语写数学论文,他认为语言与数学有神秘的关联终于,在孩子出生以前,纳什被送进了精神病医院。几年后,因为艾里西亚无法忍受在纳什的阴影下生活,他们离婚了,但是她并没有放弃纳什。离婚以后,艾里西亚再也没有结婚,她依靠自己作为电脑程序员的微薄收入和亲友的接济,继续

23、照料前夫和他们惟一的儿子。她坚持纳什应该留在普林斯顿,因为如果一个人行为古怪,在别的地方会被当作疯子,而在普林斯顿这个广纳天才的地方,人们会充满爱心地想,他可能是一个天才。于是,在上世纪70和80年代,普林斯顿大学的学生和学者们总能在校园里看见一个非常奇特、消瘦而沉默的男人在徘徊,他穿着紫色的拖鞋,偶尔在黑板上写下数字命理学的论题。他们称他为“幽灵”,他们知道这个“幽灵”是一个数学天才,只是突然发疯了。如果有人敢抱怨纳什在附近徘徊使人不自在的话,他会立即受到警告:“你这辈子都不可能成为像他那样杰出的数学家!” 正当纳什本人处于梦境一般的精神状态时,他的名字开始出现在70年代和80年代的经济学课

24、本、进化生物学论文、政治学专著和数学期刊的各领域中。他的名字已经成为经济学或数学的一个名词,如“纳什均衡”、“纳什谈判解”、“纳什程序”、“德乔治纳什结果”、“纳什嵌入”和“纳什破裂”等。 纳什的博弈理论越来越有影响力,但他本人却默默无闻。大部分曾经运用过他的理论的年轻数学家和经济学家都根据他的论文发表日期,想当然地以为他已经去世。即使一些人知道纳什还活着,但由于他特殊的病症和状态,他们也把纳什当成了一个行将就木的废人。 传奇仍在继续传奇仍在继续有人说,站在金字塔尖上的科学家都有一个异常孤独的大脑,纳什发疯是因为他太孤独了。但是,纳什在发疯之后却并不孤独,他的妻子、朋友和同事们没有抛弃他,而是

25、不遗余力地帮助他,挽救他,试图把他拉出疾病的深渊。尽管纳什决心辞去麻省理工学院教授的职位,但他的同事和上司们还是设法为他保全了保险。他的同事听说他被关进了精神病医院后,给当时美国著名的精神病学专家打电话说:“为了国家利益,必须竭尽所能将纳什教授复原为那个富有创造精神的人。”越来越多的人聚集到纳什的身边,他们设立了一个资助纳什治疗的基金,并在美国数学会发起一个募捐活动。基金的设立人写到:“如果在帮助纳什返回数学领域方面有什么事情可以做,哪怕是在一个很小的范围,不仅对他,而且对数学都很有好处。”对于普林斯顿大学为他做的一切,纳什在清醒后表示,“我在这里得到庇护,因此没有变得无家可归。” 守得云开见

26、月明,妻子和朋友的关爱终于得到了回报。80年代末的一个清晨,当普里斯顿高等研究院的戴森教授像平常一样向纳什道早安时,纳什回答说:“我看见你的女儿今天又上了电视。”从来没有听到过纳什说话的戴森仍然记得当时的震惊之情,他说:“我觉得最奇妙的还是这个缓慢的苏醒,渐渐地他就越来越清醒,还没有任何人曾经像他这样清醒过来。” 纳什渐渐康复,从疯癫中苏醒,而他的苏醒似乎是为了迎接他生命中的一件大事:荣获诺贝尔经济学奖。当1994年瑞典国王宣布年度诺贝尔经济学奖的获得者是约翰纳什时,数学圈里的许多人惊叹的是:原来纳什还活着。 纳什没有因为获得了诺贝尔奖就放弃他的研究,在诺贝尔奖得主自传中,他写道:从统计学看来

27、,没有任何一个已经66岁的数学家或科学家能通过持续的研究工作,在他或她以前的成就基础上更进一步。但是,我仍然继续努力尝试。由于出现了长达25年部分不真实的思维,相当于提供了某种假期,我的情况可能并不符合常规。因此,我希望通过目前的研究成果或以后出现的任何新鲜想法,取得一些有价值的成果。” 而在2001年,经过几十年风风雨雨的艾里西亚与约翰纳什复婚了。事实上,在漫长的岁月里,艾里西亚在心灵上从来没有离开过纳什。这个伟大的女性用一生与命运进行博弈,她终于取得了胜利。而纳什,也在得与失的博弈中取得了均衡。2005年6月1日晚,诺贝尔北京论坛在故宫东侧菖蒲河公园内的东苑戏楼闭幕。热闹的晚宴结束后,纳什

28、没有搭乘主办方安排的专车,而是一个人夹着文件夹走出了东苑戏楼。他像一个普通老人一样步行穿过菖蒲河公园,然后绕到南河沿大街路西的人行横道上等待红绿灯。绿灯亮起,老人隅隅独行的背影在暮色中渐行渐远,终于消失不见。 普林斯顿的博弈论大师普林斯顿的博弈论大师 博弈论的思想源远流长,不过人们都把冯冯诺依曼诺依曼和摩根斯坦和摩根斯坦在1944年出版的巨著博弈论和经济行为,看做现代博弈理论诞生的标志。冯诺依曼是当代最伟大的数学家,是现代计算机科学和数理经济学特别是博弈论的奠基人。可惜,这位天才的学者在1957年55岁的时候就英年早逝,没有活到1969年开始的每年颁发经济学诺贝尔奖的日子。诺贝尔奖的规矩是只授

29、予健在的学者,已经去世的肯定没份。和冯矩是只授予健在的学者,已经去世的肯定没份。和冯诺依曼差不多同年的摩根斯坦虽然活到诺依曼差不多同年的摩根斯坦虽然活到1977年,但年,但是一方面他不像冯是一方面他不像冯诺依曼那么耀眼,另一方面博弈诺依曼那么耀眼,另一方面博弈论在经济学领域的重要性还不像现在那么清楚,所以论在经济学领域的重要性还不像现在那么清楚,所以他也错过了诺贝尔奖桂冠学者的头衔。他也错过了诺贝尔奖桂冠学者的头衔。 从从20世纪世纪30年代开始,冯年代开始,冯诺依曼是美国普林斯诺依曼是美国普林斯顿高等研究院教授,摩根斯坦在普林斯顿大学供职。顿高等研究院教授,摩根斯坦在普林斯顿大学供职。普林斯

30、顿大学属于美国最古老普林斯顿大学属于美国最古老最有影响的学府,30年代才建立的普林斯顿高等研究院,因为一开始就设置了很有成效的运作制度,并延揽了爱因斯坦和冯诺依曼这样的学界泰斗,很快就成为世界性的学术中心。 20世纪40年代末50年代初,普林斯顿大学数学系在塔克塔克教授的指导下,有一个致力于数理经济学和博弈论的博士生小组,后来大名鼎鼎 的纳什纳什和和库恩库恩就是这个小组的学生。现在凡博弈论著作都必须先讲的“囚徒困境囚徒困境”,就出于塔克塔克教授在斯坦福大学的一次演讲,他的学生纳什则从囚徒困境发展出在博弈论中占据核心位置的“纳什均衡纳什均衡”。 促使纳什在40多年以后获得诺贝尔经济学奖的主要工作

31、,就是他的博士学位论文,他在1950年7月13日22岁生日那天获得数学 哲学博士学位。其实,纳什在纯数学方面的贡献也毫不逊色,如果不说更伟大的话。微分几何的纳什定理,现在仍然是那个领域最基本、最出色的成果。 从普林斯顿大学毕业以后,纳什很快在著名的麻省理工学院得到终身的教职,那是1958年。翌年,他被美国著名的财富杂志评为美国“新数学”的最耀眼的明星。定义定义:指一策略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s1*,sn*)=(si*,s-i*)是一纳什均衡,当且仅当对所有参与人而言,ui (si*,s-i*) ui (si,s-i*)对所有siSi 均成立

32、。简单而言,当简单而言,当s s1 1* *是对是对s s2 2* *的的最适反应,最适反应,s s2 2* *也是也是s s1 1* *的最适反应时,(的最适反应时,(s s1 1*,s*,s2 2* *)就是二人博弈的纳什均衡。就是二人博弈的纳什均衡。纳什均衡的定义纳什均衡的定义纳什均衡是局中人策略选择上构成的一种“僵局”,给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其战略选择。纳纳什什均均衡衡是是指指这这样样一一组组策策略略组组合合:第第一一,在在该该策策略略组组合合中中,每每个个局局中中人人的的策策略略都都是是给给定定其其他他局局中中人人的的策策略略情情况况下下

33、的的最最佳佳反反应应。有有一一个个局局中中人人的的策策略略发发生生变变化化,原原来来的的策策略略组组合合就就不不再再是是纳纳什什均均衡衡。第第二二,该该策策略略具具有有自自我我实实施施的的功功能能。在在纳纳什什均均衡衡下下,没没有有一一个个局局中中人人可可以以通通过过单单方方面面改改变变自自己己的的策策略略而而提提高高自己的支付。也就是说,没有人愿意偏离均衡。自己的支付。也就是说,没有人愿意偏离均衡。相相对对优优势势策策略略划划线线法法:对对于于矩矩阵阵表表达达的的二二人人有有限限博博弈弈的的每每个个局局中中人人,找找出出他他相相对对于于对对手手的的每每种种可可能能的的策策略略选选择择的的相相

34、对对优优势势策策略略,并并且且在在对对手手的的这这种种策策略略选选择择和和自自己己的的相相对对优优势势策策略略组组成成的的具具体体的的策策略略对对局局时时自自己己的的得得益益之之下下,划划一一短短线线。当当这这样样做做完完以以后后,矩矩阵阵中中两两个个支支付付数数字字下下面面都都划划了了线线的的格格子子所所表表征征的的策略对局,就是这个博弈的纳什均衡。策略对局,就是这个博弈的纳什均衡。纳什均衡求解纳什均衡求解命题命题1 1:纳什均衡在占优策略重复剔除解法中不会被剔除 即:没有任何一个策略优于纳什均衡策略。命题命题2 2:重复剔除的严格占优策略均衡一定是纳什均衡。两个重要命题两个重要命题 占优策

35、略均衡占优策略均衡是比纳什均衡强的一个博弈均衡概念。占优策略均衡要求任何一个参与者对于其他参与者的任何策略选择来说,其最优策略都是惟一的。 纳什均衡纳什均衡只要求任何一个参与者在其他参与者的策略选择已经给定的情况下,其选择的策略是最优的。 两个重要关系两个重要关系每一个占优战略均衡、重复剔除的占优战略每一个占优战略均衡、重复剔除的占优战略均衡一定是纳什均衡,但并非每一个纳什均均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优战略衡都是占优战略均衡或重复剔除的占优战略均衡。均衡。纳什均衡一定是在重复剔除劣战略过程中没纳什均衡一定是在重复剔除劣战略过程中没有被剔除掉的战略组合

36、,但反之不成立,除有被剔除掉的战略组合,但反之不成立,除非他是唯一的。非他是唯一的。Nash Nash 均衡的哲学含义均衡的哲学含义l设想设想n n个参与人在博弈前规定每一个参与人选择一个参与人在博弈前规定每一个参与人选择一个特定的策略。个特定的策略。 s*=(s*=(sisi*,*,s-is-i*)*)代表这个协议,代表这个协议,要问在没有外力强制的情况下,是否有任何参与要问在没有外力强制的情况下,是否有任何参与人有积极性不遵守该协议?如没有,则说明该协人有积极性不遵守该协议?如没有,则说明该协议是可以自动实施的。能够自动实施的协议就可议是可以自动实施的。能够自动实施的协议就可以看作一个以看

37、作一个Nash Nash 均衡。均衡。l一种制度安排要发生效力必须是一种一种制度安排要发生效力必须是一种NashNash均衡,均衡,否则否则, , 这种制度便不能这种制度便不能“ 稳定稳定”。 囚徒困境囚徒困境-纳什均衡的启示纳什均衡的启示 “囚囚徒徒困困境境”体体现现了了个个人人理理性性和和团团体体理理性性的的冲冲突突。这这一一冲冲突突,形形成成了了对对微微观观经经济济学学的的“看看不不见见的的手手”的的原原理理的的挑挑战战。 “纳纳什什均均衡衡”提提出出的的悖悖论论实实际际上上动动摇摇了西方经济学的基石。了西方经济学的基石。 “看看不不见见的的手手”原原理理揭揭示示的的经经济济思思想想是是

38、:在在市市场场机机制制的的作作用用下下,个个人人理理性性和和团团体体理理性性是是一一致致的的。而而在在寡寡头头市市场场上上,寡寡头头们们却却陷陷入入了了类类似似“囚囚徒徒困困境境”的的结结局局,即即个个人人理理性性和和团团体体理理性性往往往是冲突的。往是冲突的。第五节第五节 纳什均衡应用举例纳什均衡应用举例古诺(古诺(CournotCournot)寡头模型寡头模型沙滩卖冰沙滩卖冰伯川德伯川德(Bertrand)(Bertrand)模型模型豪泰林(豪泰林(HotellingHotelling)价格竞争模型价格竞争模型公共地的悲剧公共地的悲剧斗鸡博弈斗鸡博弈萨缪尔森:萨缪尔森:“你可以将一只鹦鹉训

39、练成经济你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词学家,因为它所需要学习的只有两个词供给与需求。供给与需求。”坎多瑞(博弈论专家):坎多瑞(博弈论专家):“要成为现代经济要成为现代经济学家,这只鹦鹉必须再多学一个词,这个学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡。词就是纳什均衡。” 纳什均衡的应用纳什均衡的应用 用用纳纳什什均均衡衡可可以以分分析析古古诺诺模模型型;可可以以分分析析寡寡头头垄垄断断厂厂商商的的价价格格大大战战、广广告告大大战战、优优惠惠大大战战等等;可可以以证证明明现现实实生生活活中中许许多多有有趣趣的的问问题题,如如:多多劳劳者者不不多多得得,公公共

40、共资资源源的的过过度度使使用用,非非合合作作者者在在一一段段时时间间内内选选择择合合作作,坏坏人人做做好好事事。分分析析经济学中的委托经济学中的委托-代理制、激励理论;代理制、激励理论; 提出:提出: 法国、古诺、法国、古诺、1838年年 1 1、基本、基本假定:假定: (1)A、B两两寡寡头头,且且产产品品同同质质,生生产产成成本本为为0,并并追追求求利润最大化。利润最大化。 (2)MCA=MCB=0;一、古诺寡头模型一、古诺寡头模型(P56) (3)需求曲线线性需求曲线线性且且A、B准确了解市场需求状况;准确了解市场需求状况;(4)A、B做出决策时假定对方的行为不变。做出决策时假定对方的行

41、为不变。(5)两两个个寡寡头头同同时时作作出出产产量量决决策策,即即寡寡头头间间进进行行的的是是产产量量竞竞争争而而非非价价格格竞竞争争,产产品品的的价价格格依依赖赖于于二二者者所所生生产产的产品总量。的产品总量。特点:存在两家厂商;同时行动确定产量。特点:存在两家厂商;同时行动确定产量。通通过过预预测测另另一一家家厂厂商商的的产产量量来来选选择择自自己己的的利润最大化产量,寻求预测均衡。利润最大化产量,寻求预测均衡。厂厂商商1 1表表示示为为:max max p(qp(q1 1+q+q2 2e e)q)q1 1-c(q-c(q1 1) ),得得出出q q1 1=f=f1 1(q(q2 2e

42、e) ),同同理理得得出出q q2 2=f=f2 2(q(q1 1e e) ),称称为为反反应函数,两条曲线的交点为古诺模型的解。应函数,两条曲线的交点为古诺模型的解。2、均衡的决定、均衡的决定(1)厂商厂商A:QB为既定值为既定值A利润最大时,产量满足:利润最大时,产量满足:厂商:厂商A的反应函数的反应函数0QAQBA的反应曲线的反应曲线 (2)厂商厂商B:QA为既定值为既定值B利润最大时,产量满足:利润最大时,产量满足:厂商:厂商B的反应函数的反应函数0QAQBB的反应曲线的反应曲线(3)均衡的决定均衡的决定0QAQBEBACD若寡头数量为若寡头数量为m,则则古诺寡头模型的纳什均衡古诺寡头

43、模型的纳什均衡反应函数 q1=f1(q2) q2=f2(q1)(q1*,q2*)是该对策的纳什均衡解。q1* q12q11 q10q2*q22q21y1oy2f1(q2)f2(q1)例题:古诺模型的解例题:古诺模型的解假设p=1-(q1+q2),MC=0,则根据利润最大化的一阶条件分别得到反应函数q1=f1(q2)=(1-q2)/2,q2=f2(q1)=(1-q1)/2,求出均衡时产量为(1/3,1/3),为纳什均衡0 1二、沙滩卖冰假设游客沿沙滩0,1间均匀分布,现有两位卖冰者,他们会将摊位选在哪个位置?假设游客就近购买。生活中还有哪些类似的例子?生活中还有哪些类似的例子?商业位置博弈商业位

44、置博弈 在城市街道上,我们常见到一些地段上的商店十分拥挤,构成一个繁荣的商业中心区,但另一些地段却十分冷僻,没什么商店。对于这种现象,我们可以运用纳什均衡的概念来加以解释。 甲乙 1/2 当乙在甲的右边紧靠甲设店时,其右边街道上的顾客都是乙的顾客;如果乙不是紧靠甲而是远离甲设店,则其顾客只是其右边街道的居民,不如它紧靠甲设店时多,因而在远离甲的位置设店是劣战略。所以给定甲在1/2处设店,乙在紧靠甲的左边或右边设店是最优的。反过来,给定乙在接近1/2处设店,甲的最优选择也是在1/2附近设店。这样,甲和乙挤在1/2处设店就是纳什均衡,这就是商业中心区的形成原理。三、伯川德模型三、伯川德模型 伯伯川

45、川德德模模型型是是由由法法国国经经济济学学家家约约瑟瑟夫夫伯伯川川德德(Joseph Bertrand)于于1883年年建建立立的的。古古诺诺模模型型和和斯斯塔塔克克尔尔伯伯格格模模型型都都是是把把厂厂商商的的产产量量作作为为竞竞争争手手段段,是是一一种种产产量量竞竞争争模模型型,而而伯川德模型是伯川德模型是价格竞争模型价格竞争模型. 伯川德模型的假设为:伯川德模型的假设为: (1)各寡头厂商通过选择价格进行竞争;)各寡头厂商通过选择价格进行竞争; (2)各寡头厂商生产的产品是同质的;)各寡头厂商生产的产品是同质的; (3)寡头厂商之间也没有正式或非正式的串谋行为)寡头厂商之间也没有正式或非正

46、式的串谋行为 。伯川德模型假定,当企业制定其价格时,认为其他伯川德模型假定,当企业制定其价格时,认为其他企业的价格不会因它的决策而改变,并且企业的价格不会因它的决策而改变,并且n个(为简化,个(为简化,取取n=2)寡头企业的产品是完全替代品。)寡头企业的产品是完全替代品。A、B两个企两个企业的价格分别为业的价格分别为P1、P2 ,边际成本都等于,边际成本都等于C。伯川德模型的前提假定伯川德模型的前提假定根据模型的假定,由于根据模型的假定,由于A、B两个企业的产品是完全两个企业的产品是完全替代品,所以消费者的选择就是价格较低的企业的产品;替代品,所以消费者的选择就是价格较低的企业的产品;如果如果

47、A、B的价格相等,则两个企业平分需求。的价格相等,则两个企业平分需求。因此,两个企业会竞相削价以争取更多的顾客。当价因此,两个企业会竞相削价以争取更多的顾客。当价格降到格降到P1=P2=C时,达到均衡,即伯川德均衡。时,达到均衡,即伯川德均衡。 结论:只要有一个竞争对手存在,企业的行结论:只要有一个竞争对手存在,企业的行为就同在完全竞争的市场结构中一样,价格等于为就同在完全竞争的市场结构中一样,价格等于边际成本。边际成本。伯川德模型的推导和分析伯川德模型的推导和分析均衡及伯川德悖论均衡及伯川德悖论 根据伯川德模型,谁的价格低谁就将赢得整个市场,而根据伯川德模型,谁的价格低谁就将赢得整个市场,而

48、谁的价格高谁就将失去整个市场,因此寡头之间会相互削谁的价格高谁就将失去整个市场,因此寡头之间会相互削价,直至价格等于各自的价,直至价格等于各自的边际成本边际成本为止,即均衡解为:为止,即均衡解为:p=mc. 根据伯川德均衡可以得到两个结论:根据伯川德均衡可以得到两个结论: 1.寡头市场寡头市场的均衡价格为:的均衡价格为:P=MC; 2.寡头的长期经济利润为寡头的长期经济利润为0。 这个结论表明只要市场中企业数目不小于这个结论表明只要市场中企业数目不小于2个,无论个,无论实际数目多大都会出现实际数目多大都会出现完全竞争完全竞争的结果,这显然与实际经的结果,这显然与实际经验不符,因此被称为伯川德悖

49、论。验不符,因此被称为伯川德悖论。伯川德模型存在的问题伯川德模型存在的问题伯川德模型之所以会得出这样的结论,与它的前提假定伯川德模型之所以会得出这样的结论,与它的前提假定有关。从模型的假定看至少存在以下两方面的问题:有关。从模型的假定看至少存在以下两方面的问题: 假定企业没有生产能力的限制。如果企业的生产能假定企业没有生产能力的限制。如果企业的生产能力是有限的,它就无法供应整个市场,价格也不会降到边力是有限的,它就无法供应整个市场,价格也不会降到边际成本的水平上。际成本的水平上。 假定企业生产的产品是完全替代品。如果企业生产假定企业生产的产品是完全替代品。如果企业生产的产品不完全相同,就可以避

50、免直接的价格竞争。的产品不完全相同,就可以避免直接的价格竞争。对伯川德模型的评价对伯川德模型的评价伯川德模型假设价格为策略性变量而更为现实,但伯川德模型假设价格为策略性变量而更为现实,但是它所推导出的结果却过于极端;但由于与现实不甚相是它所推导出的结果却过于极端;但由于与现实不甚相符而遭到了很多学者的批评。这是我们为什么将其称之符而遭到了很多学者的批评。这是我们为什么将其称之为伯川德悖论的主要原因。因此,学者们在研究市场中为伯川德悖论的主要原因。因此,学者们在研究市场中企业的竞争行为时,更多的是采用古诺模型,即用产量企业的竞争行为时,更多的是采用古诺模型,即用产量作为企业竞争的决策变量。作为企

51、业竞争的决策变量。四、豪泰林模型四、豪泰林模型寡头企业竞争战略是价格伯川德(Bertrand)模型:产品同质,均衡价格等于边际成本,类似于完全竞争市场均衡。豪泰林(Hotelling)模型:存在产品差异,均衡价格不等于边际成本,垄断性提高假定长度为1的线性城市,消费者均匀分布在0,1区间内,分布密度为1;两个商店1、2分别位于x=0,x=1,即城市的两端;消费者购买商品的旅行成本与商店的距离成正比,单位距离的成本为t;住在x的消费者在两个商店之间是无差异的,需求D1=x,D2=1-x,x满足:p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。0 0 x 1x 1商店商店1 1

52、商店商店2 2豪泰林模型:以空间上差异为例根据两个商店的利润函数,1=(p1-c)x, 2=(p2-c)(1-x)( x=(p2-p1+t)/2t )选择使利润最大化的价格,得到一阶条件,求得p1*=p2*=c+t,均衡利润1=2=t/2旅行成本越高,产品差异越大,均衡价格从而均衡利润也越高。原因:随着旅行成本上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强,当旅行成本为零时,不同商店的产品之间具有完全的替代性,则为伯川德均衡结果。五、公共地的悲剧五、公共地的悲剧( (哈丁悲剧,哈丁悲剧,P87)P87)资源没有排他性产权:草地放牧、公海捕鱼、小煤窑的过度开发草地

53、放牧:n个农民,每个拥有羊的数量为gi,G=gi,v(G)代表每只羊的价值,与草地上放牧的总数G相关,饲养量增加到一定程度,随着数量继续增加,羊的价值会下降,即v(G)0农民的利润函数i=giv(gj)-gic最优化的一阶条件:i/gi=v(G)+giv(G)-c=0增加一只羊有正效应(羊的价值)、负效应(新增羊使之前所有羊的价值下降)个人边际成本小于社会边际成本,个人最优决定的饲养总量大于社会最优决定的饲养总量公共资源经常被过度利用的原因 在18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧。草地属于“可再生资源”,如果限制放牧的数量,没有被牛羊

54、吃掉的剩余草皮还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,草场就会消失。苏格兰的草地为什么消失了?苏格兰的草地为什么消失了? 由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民都会如此盘算:如果其他牧民不约束自己的放牧规模,让自己的牛羊过多地到草地上吃草,那么,我自己一家约束自己的放牧规模对保护草场的贡献是微乎其微的,不会使草场免于破坏;相反,我也加入过度放牧的行列,至少在草场消失之前还会获得一部分短期的收益。 如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧场,但自己却获得了高额的收益。因此,任何一位牧民的结

55、论都会是:无论其他牧民是否过度放牧,我选择“约束自己的放牧规模”都是劣战略,从而被剔除。大家最终都会选择过度放牧,结果导致草地消失,生态破坏。 多人的多人的“囚徒困境囚徒困境” 渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。类似的例子类似的例子公共地悲剧的解决办法:第

56、一,制度上建立中心化权利机构;第二,道德约束与非中心化奖惩联系。六、斗鸡博弈六、斗鸡博弈 0,00,2退2,0-3,-3进退进12支付“斗鸡博弈斗鸡博弈”的扩展的扩展夫妻间吵架警察与游行队伍公共产品的供给(两富户修路)补充的纳什均衡举例补充的纳什均衡举例克格勃的小花招 斯大林时期的苏联,一位指挥家正在火车上翻看当晚演出的乐谱时,两名克格勃猜测乐谱是某种密码逮捕了他。这位指挥家争辩说那只是柴科夫斯基的小提琴协奏曲,却无济于事。第二天审问者得意的走进来说:“你最好老实招了,我们已经抓住了你的朋友柴可夫斯基,他这会儿正向我们交代,你不交代就从重发落。” 不背叛就会被淘汰宋文宪公全集记载:玉殥生和三乌

57、丛臣因痛恨趋炎附势之事歃血盟誓:“二人同心,不寻私利,部位权位所诱,不趋附奸邪献媚之人。”后二人同至晋国为官。当时赵宣子在晋国得宠,各大夫竞相奔走与他家。三乌丛臣也想去拜望,又怕玉殥生知道。于是天刚蒙蒙亮就感到赵宣子家。刚一剑门忽然看到走廊中有个人坐在那里,走上前去举灯一照,原来此人便是玉殥生。欧佩克的均衡 欧佩克成员国间的生产能力各不相同。选取最大成员国沙特和一小成员国科威特,假定合作情况下,科威特每天生产100万桶石油,沙特生产400百万桶。不合作则分别多生产100万桶。投入市场的总产量为500万桶、600万桶或700万桶,相应的边际利润为16美元、12美元和8美元,该博弈的均衡为何?40

58、00,16006000,1200不合作5004800,24006400,1600合作400不合作200合作100沙特科威特支付旅行者的困境旅行者的困境该博弈是1994年由考希克巴苏教授(Kaushik Basu)提出,博弈情形如下:航空公司丢失了两位互相不认识乘客的旅行包。两个旅行包正好都是一样的,并且里面有相同价值的古董,两位乘客都向航空公司索赔100美元。为了评估出古董的真实价值,公司经理将两位乘客分开以避免两人合谋,分别让他们写下古董的价值,其金额要不低于2美元,并且不高于100美元。同时还告诉两人:如果两个数字是一样的,那么会被认为是其真实价值,他们能获得相应金额的赔偿。如果数字不一样

59、,较小的会被认为是真实价值,而两人在获得这个金额的同时有相应的奖赏/惩罚:写下较小金额的会获得2美元额外的奖励,较大的会有2美元的惩罚。现在问题在于:两位旅行者应该用什么策略来决定他们应该写下的金额?作业一7,76,67,65,75,88,56,65,84,8 乙 左 中 右上中下甲一个两人同时博弈的支付竞争如下所示,试求纳什均衡。是否存在重复剔除占优战略均衡?作业二作业二 春节前夕,某小镇上两个商铺主甲和乙同时看到一个赚钱机会:去城里贩一批鞭炮回来零售,购货款加上运输费用共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。请用战略式表示支付矩阵;请找出纳什均衡。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号