博弈论第二章博弈规则

上传人:s9****2 文档编号:593253851 上传时间:2024-09-24 格式:PPT 页数:114 大小:3.03MB
返回 下载 相关 举报
博弈论第二章博弈规则_第1页
第1页 / 共114页
博弈论第二章博弈规则_第2页
第2页 / 共114页
博弈论第二章博弈规则_第3页
第3页 / 共114页
博弈论第二章博弈规则_第4页
第4页 / 共114页
博弈论第二章博弈规则_第5页
第5页 / 共114页
点击查看更多>>
资源描述

《博弈论第二章博弈规则》由会员分享,可在线阅读,更多相关《博弈论第二章博弈规则(114页珍藏版)》请在金锄头文库上搜索。

1、参考书目参考书目1. 美美阿维纳什阿维纳什K 迪克西特迪克西特.策略思维策略思维.中国人民大中国人民大学出版社,学出版社,20022. 王则柯王则柯. 新编新编博弈论平话博弈论平话. 中信出版社,中信出版社,20033. 谢识予谢识予.经济博弈论经济博弈论(第二版第二版) .复旦大学复旦大学 出版社,出版社,20024. 美美埃里克埃里克拉斯缪森拉斯缪森.博弈与信息:博弈论概论博弈与信息:博弈论概论.北京大学出版社,北京大学出版社,20035.张维迎张维迎.博弈论与信息经济学博弈论与信息经济学.上海三联书店,上海三联书店,2004第二章第二章 博弈论基本知识博弈论基本知识2.1 2.1 什么是

2、博弈什么是博弈论2.2 2.2 博弈的博弈的结构和分构和分类2.3 2.3 博弈的表达方式博弈的表达方式2.42.4 几几类经典的博弈模型典的博弈模型2.1.1 从游戏到博弈从游戏到博弈2.1.2 一个非技术性的定义一个非技术性的定义2.1.3 博弈论模型简介博弈论模型简介第一节第一节 什么是博弈论什么是博弈论2.1.1 2.1.1 从游戏到博弈从游戏到博弈 “博弈博弈论”译自英文自英文“Game Theory”,直,直译就是就是“游游戏理理论”。 游戏的共有特征游戏的共有特征 1. 一定的规则一定的规则 2. 有一个结果(且可以折算有一个结果(且可以折算成数字)成数字) 3.策略的相互依存性

3、策略的相互依存性 4.策略至关重要策略至关重要博弈论博弈论- -无处不在的游戏 “要想在现代社会做一要想在现代社会做一个有文化的人,你必须对个有文化的人,你必须对博弈论有一个大致了解博弈论有一个大致了解”。 保罗保罗萨缪尔森萨缪尔森 年光似鸟翩翩过,世事年光似鸟翩翩过,世事如棋局局新。如棋局局新。 ( (宋宋) )僧志文僧志文 博博弈弈论论(game theory):又又称称对对策策论论,是是研研究究相相互互依依赖赖、相相互互影影响响的的决决策策主主体体的的理理性性决决策策行行为为以以及及这这些些决决策策的均衡结果的理论。的均衡结果的理论。2.1.2 2.1.2 博弈论的博弈论的基本概念基本概

4、念Governing Dynamics博弈论的基本假设博弈论的基本假设 人人是是理理性性人人(rationalrational,也也说说自自私私人人): :行行动动者者具具有有推推理理能能力力,在在具具体体策策略略选选择择时时的的目目的的是是使使决决策策者者自自己己的的目目标标效用最大化效用最大化。2.1.2 2.1.2 博弈论的博弈论的基本概念基本概念通通俗俗地地讲讲,博博弈弈论论是是一一种种“游游戏戏理理论论”。其其较较对对博博弈弈为为准准确确的的理理解解是是:一一些些个个人人、团团队队或或其其他他组组织织,面面对对一一定定的的环环境境条条件件,在在一一定定的的规规则则约约束束下下,依依靠

5、靠所所掌掌握握的的信信息息,同同时时或或先先后后,一一次次或或多多次次,从从各各自自允允许许选选择择的的行行为为或或策策略略进进行行选选择择并并加加以以实实施施,并并从从中中各各自自取取得得相相应应结结果果或或收收益的过程。益的过程。博弈论模型可以用七个方面来描述博弈论模型可以用七个方面来描述 GP,A,S,I,U,O,E 2.1.32.1.3博弈论的模型简介博弈论的模型简介P(players)P(players):): 为局中人,博弈的局中人,博弈的参与者,也称参与者,也称为“博弈方博弈方”,局中,局中人以最人以最终实现自身利益最大化自身利益最大化为目目标。个人个人团体团体双方双方多方多方虚

6、拟参与人:虚拟参与人:NatureA(action)A(action) :为各局中人的所有可能的各局中人的所有可能的策略或行策略或行动的集合。的集合。行行动的的顺序(序(The order of play)根据根据该集合是有限集合是有限还是无限是无限进行分行分类:先动优势先动优势后动优势后动优势S(strategies)S(strategies) :博弈的:博弈的进程,也是程,也是博弈博弈进行的次序。它行的次序。它规定什么人在定什么人在什么什么时候候选择什么行什么行动。因此,。因此,战略是参与人的略是参与人的 “相机行相机行动方案方案” (contingent action plan)分分类:

7、根据后行:根据后行动的人是否能的人是否能够看看到先行到先行动人的具体行人的具体行动静态博弈静态博弈动态博弈动态博弈行动与策略的区别?行动与策略的区别?行行动是指参与者可能有的具体行是指参与者可能有的具体行动战略是行略是行动的的规则而不是行而不是行动本身本身毛泽东:毛泽东:人不犯我我不犯人人不犯我我不犯人人若犯我我必犯人人若犯我我必犯人敌进我退敌进我退敌退我追敌退我追敌驻我扰敌驻我扰敌疲我打敌疲我打 I(information)I(information) :博弈信息。:博弈信息。指的是指的是参与人在博弈中的知参与人在博弈中的知识,特,特别是有关是有关其他参与人(其他参与人(对手)的特征和行手)

8、的特征和行为的的知知识分分类:根据博弈各方:根据博弈各方对各种局各种局势下所下所有局中人的信息掌握情况分:有局中人的信息掌握情况分:完全信息博弈完全信息博弈不完全信息不完全信息博弈博弈U( utility )U( utility ):也称):也称为支付(支付(pay off).为局中人局中人获得利益,或者是得利益,或者是指参与人的期望效用水平。也是博指参与人的期望效用水平。也是博弈各方追求的最弈各方追求的最终目目标。分分类:根据各方得益的不同情况:根据各方得益的不同情况零和零和博弈博弈变和变和博弈博弈田忌赛马囚徒困境Ua(t,t)=-8Ua(t,n)=0 Ua(n,n)=-1 Ua(n,t)=

9、-10Ub(t,t)=-8Ub(t,n)=-10 Ub(n,n)=-1 Ub(n,t)=0 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10, 0-10, 0-1-1,-1-1嫌疑人嫌疑人a嫌疑人bU(t,t)=0.5*(-8)+ 0.5*(-8)=-8U(t,n)=0.5*0+ 0.5*(-10)=-5U(n,t)=0.5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1结果结果(outcome) 是是指博弈分析者感指博弈分析者感兴趣的要素的集兴趣的要素的集合。是均衡行动合。是均衡行动的组合。

10、的组合。 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10, 0-10, 0-1-1,-1-1嫌疑人嫌疑人A嫌疑人BE(equilibrium)均衡均衡(equilibrium):是所有参与人的最:是所有参与人的最优战略的略的组合。合。所所谓博弈均衡,它是一种博弈均衡,它是一种稳定的定的博弈博弈结果。果。纳什均衡什均衡(Nash Equilibrium):一策):一策略略组合中,所有的参与者面合中,所有的参与者面临这样的一的一种情况:当其他人不改种情况:当其他人不改变策略策略时,他此,他此时的策略是最好的。的策略是最好的。谢识予:予:

11、给定你的定你的 策略,我的策略是最策略,我的策略是最好的的策略,好的的策略,给定我的定我的 策略,你的策略策略,你的策略也是最好的的策略也是最好的的策略囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B-8-8,-8-8-1-1,-1-1-10-10,0 00 0,-10-10一个纳什均衡点!情侣博弈情侣博弈 足球足球演唱会演唱会足球足球演唱会演唱会王菲李亚鹏2 2,1 11 1,2 21 1,1 10 0,0 0两个纳什均衡点!博弈论模型可以用五个方面来描述博弈论模型可以用五个方面来描述 GP,A,S,I,U,O,E描述博弈的最少要素:描述博弈的最少要素:参与人,战略

12、,支付参与人,战略,支付。 行动行动和和信息信息是其积木是其积木参与人、行动、结果参与人、行动、结果统称为统称为“博弈规则博弈规则” 博弈分析的目的:是使用博弈规则预测博弈分析的目的:是使用博弈规则预测均衡均衡2.1.3 2.1.3 博弈论的模型简介博弈论的模型简介博弈论模型可以用七个方面来描述博弈论模型可以用七个方面来描述 GP,A,S,I,U,O,E2.2.1 博弈方博弈方2.2.2 博弈的行动过程博弈的行动过程2.2.3 策略策略2.2.4 支付(效用、得益)支付(效用、得益)2.2.5 博弈的信息结构博弈的信息结构2.2.6 博弈方的能力和理性博弈方的能力和理性2.2.7 博弈的分类和

13、理论结构博弈的分类和理论结构第二节第二节 博弈论的结构与分类博弈论的结构与分类2.2.1 2.2.1 博弈中的博弈方博弈中的博弈方博弈方(博弈方(player/ players) 博弈中独立决策、独立承担博弈博弈中独立决策、独立承担博弈结果的个人或果的个人或组织称称为博弈方。博弈方。 1.单人博弈人博弈 2.双人博弈双人博弈 3.多人博弈多人博弈1.单人博弈单人博弈设有一商人要从有一商人要从A地运地运输一批一批货物,物,从从A地到地到B地有水、地有水、陆两条路两条路线,走走陆路运路运输成本成本10 000元,而走水元,而走水路运路运输成本只要成本只要7000元。但非常危元。但非常危险,出,出现

14、坏天气的概率坏天气的概率为0.25,此,此时会会损失失10%的的货物。物。货物物总价价值90 000元。元。此人怎此人怎样决策?决策? 好天气好天气(75%)(75%)坏天气坏天气(25%)(25%)水路水路陆路陆路自然商人-7000-7000-10000-10000-10000-10000-16000-16000囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B-8-8,-8-8-1-1,-1-1-10-10,0 00 0,-10-102.双人博弈双人博弈情侣博弈情侣博弈 足球足球演唱会演唱会足球足球演唱会演唱会王菲李亚鹏2 2,1 11 1,2 21 1,1 10

15、0,0 0选修课另一版本选修课另一版本 博弈论博弈论舞蹈舞蹈博弈论博弈论舞蹈舞蹈王菲李亚鹏4 4,3 33 3,4 41 1,1 12 2,2 2石头石头剪子剪子布布石头石头剪子剪子布布石头石头0,01,1-1,1剪子剪子-1,10,01,-1布布1,-1-1,10,0博弈方博弈方2 2博博弈弈方方1 1双人博弈小结双人博弈小结注意二点:注意二点:1. 博弈方之博弈方之间并非并非总是是对抗的。抗的。2. 个人理性决策常不能个人理性决策常不能实现自己的自己的 最大利益。最大利益。3、多人博弈、多人博弈三个或三个以上的博弈方参加的博弈。三个或三个以上的博弈方参加的博弈。竞争者竞争者破坏者破坏者竞争

16、者竞争者北京申办北京申办2000年奥运会失利年奥运会失利第一轮第一轮第二轮第二轮第三轮第三轮第四轮第四轮北京北京32374043悉尼悉尼28303745曼彻斯特曼彻斯特111111柏林柏林910伊斯坦布伊斯坦布尔尔82.2.2 策略策略1.有限博弈(有限博弈(finite games) :如:如果博弈中每个博弈方的策略是有果博弈中每个博弈方的策略是有限的,称限的,称为有限博弈。有限博弈。2.无限博弈(无限博弈(infinite games) :如:如果博弈中至少有某些博弈方的策果博弈中至少有某些博弈方的策略是无限多个的,称略是无限多个的,称为无限博弈。无限博弈。 (函数表示函数表示)2.2.3

17、 2.2.3 博弈的行动过程博弈的行动过程 1. 静静态博弈(博弈(static games):所有博弈方同所有博弈方同时选择策略的博弈。策略的博弈。 2 . 动态博弈(博弈(dynamic games):):各博弈方的各博弈方的选择和行和行动有先后次序,而且后有先后次序,而且后选择的、后行的、后行动的博弈方,在自己的博弈方,在自己选择行行动方案之前,可以看到方案之前,可以看到其他博弈方的其他博弈方的选择和行和行动。也称。也称为多多阶段博弈段博弈(multistage games) 3. 重复博弈(重复博弈(repeated games):):同一个博弈同一个博弈反复反复进行多构成的博弈。行多

18、构成的博弈。2.2.4 2.2.4 博弈的支付博弈的支付(效用,得益)(效用,得益)效用的效用的计算方法:将每一个博弈方在算方法:将每一个博弈方在同一策同一策略略结果中果中的得益相加,算出所有博弈方的的得益相加,算出所有博弈方的得益得益总和。和。Ua(1,2)= Ua1+Ua2Ub(1,2)= Ub1+Ub2 1. 零和博弈零和博弈: Ua(1,2)= Ub(1,2) =0 2 . 常和博弈常和博弈: Ua(1,2)= Ub(1,2) = m 3. 变和博弈和博弈: Ua(1,2) Ub(1,2)两个人通两个人通过猜硬猜硬币的正反的正反赌输赢,其,其中一人用手盖住一枚硬中一人用手盖住一枚硬币,

19、有另一方,有另一方在是正面在是正面还是反面朝上。若猜是反面朝上。若猜对,则猜着猜着赢1元,盖着元,盖着输1元;若猜元;若猜错,则猜着猜着输1元,盖着元,盖着赢1元。元。假假设赢着收益着收益为1,输者收益者收益为-1。猜硬币游戏猜硬币游戏猜硬币游戏猜硬币游戏 正面正面z z反面反面f f正面正面z z-1,1-1,11,-11,-1反面反面f f1 1,-1-1-1,1-1,1猜硬币方-2U1z(z,z)=-1U1z(z,f)=1 U1f(f,z)=1 U1f(f,f)=-1U2z(z,z)=-1U2z(f,z)=1 U2f(z,f)=1 U2f(f,f)=-1Uz= U1z+ U2z=-1+1

20、-1+1=0Uf= U1f+ U2f=1-1+1-1=0盖硬币方-1石头石头剪子剪子布布石头石头剪子剪子布布石头石头0,01,1-1,1剪子剪子-1,10,01,-1布布1,-1-1,10,0博弈方博弈方2 2博博弈弈方方1 1周末约会周末约会 足球足球g g演唱会演唱会d d足球足球g g2,12,10,00,0演唱会演唱会d d-1-1,-1-11,21,2王菲b李亚鹏aUag(g,g)=2Uag(g,d)=0 Uad(d,g)=-1 Uad(d,d)=1Ubg(g,g)=1Ubg(d,g)=-1 Ubd(g,d)=0 Ubd(d,d)=2UU= Uag+ Ubg=2+0+1-1=2Ud=

21、 Uad+ Ubd=-1+1+0+2=2Un= Uan+ Ubn=-1-10-10-1=-22Uat(t,t)=-8Uat(t,n)=0 Uan(n,t)=-10 Uan(n,n)=-1Ubt(t,t)=-8Ubt(n,t)=0 Ubn(t,n)=-10 Ubn(n,n)=-1 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10, 0-10, 0-1-1,-1-1嫌疑人嫌疑人b嫌疑人aUt= Uat+ Ubt=-8+0-8+0=-16囚徒困境囚徒困境奖金分配奖金分配 绩效高绩效高g g 绩效低绩效低d d绩效高绩效高g g绩效低绩效低d

22、 d王菲b李亚鹏a5 5,5 55 5,5 53 3,7 77 7,3 3Uag(g,g)=5Uag(g,d)=7 Uad(d,g)=3 Uad(d,d)=5Ubg(g,g)=5Ubg(d,g)=7 Ubd(g,d)=3 Ubd(d,d)=5Ug= Uag+ Ubg=5+7+5+7=24Ud= Uad+ Ubd=3+5+3+5=16Ud= Uad+ Ubd=30+80+30+80=220Uag(g,g)=50Uag(g,d)=10 Uad(d,g)=80 Uad(d,d)=30Ubg(g,g)=50Ubg(d,g)=10 Ubd(g,d)=80 Ubd(d,d)=30 高价高价g g低价低价d

23、 d高价高价g g5050,505010,8010,80低价低价d d80, 1080, 103030,3030联通联通b移动aUg= Uag+ Ubg=50+10+50+10=120寡头定价寡头定价2.2.5 2.2.5 博弈的信息结构博弈的信息结构1.关于得益的信息关于得益的信息 完全信息和不完全信息完全信息和不完全信息(1) 完全信息(完全信息(complete information)是是指在博弈指在博弈过程中,每一位博弈方程中,每一位博弈方对其他博弈其他博弈方的特征、策略空方的特征、策略空间及收益函数有准确的信及收益函数有准确的信息。息。(2)不完全信息()不完全信息(incompl

24、ete information): 如果博弈方如果博弈方对其他博弈方的其他博弈方的特征、策略空特征、策略空间及收益函数信息了解的不及收益函数信息了解的不够准确、或者不是准确、或者不是对所有博弈方的特征、策略所有博弈方的特征、策略空空间及收益函数都有准确的准确信息,在及收益函数都有准确的准确信息,在这种情况下种情况下进行的博弈就是不完全信息博弈。行的博弈就是不完全信息博弈。也成也成不不对称信息称信息或者或者信息不信息不对称称(asymmetric information)2.2.关于博弈过程的信息关于博弈过程的信息 完美信息和不完美信息完美信息和不完美信息完美信息(完美信息(perfect in

25、formationperfect information): :对对已经发生的的事情有清楚的了解,称具已经发生的的事情有清楚的了解,称具有完美信息。否则,称为有完美信息。否则,称为不完美信息不完美信息(imperfect informationimperfect information)2.2.6 博弈方的理性与能力博弈方的理性与能力完全理性与完全理性与有限理性有限理性个体理性与个体理性与集体理性集体理性 战争战争和平和平战争战争-50-50,-50-50100, 0100, 0和平和平0, 1000, 1005050,5050A国国B国国战争与和平战争与和平2.2.7 博弈的类型1根据参与者

26、能否形成约束性的协议,以便集体行动(1)合作博弈(cooperative game )研究人们达成合作时如何分配合作得到的收益,即收益分配问题。 (2)非合作博弈( non-cooperative /uncooperative game )研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。 行动次序行动次序信息信息静态静态动态动态完全信完全信息息完全信息静态博弈完全信息静态博弈纳什均衡(纳什均衡(纳什,纳什,纳什,纳什,1950,19511950,1951)完全信息动态博弈完全信息动态博弈子博弈精练纳什均衡子博弈精练纳什均衡(泽尔腾泽尔腾泽尔腾泽尔腾,1965,1965

27、)不完全不完全信息信息不完全信息静态博弈不完全信息静态博弈贝叶斯均衡(贝叶斯均衡(海萨尼海萨尼海萨尼海萨尼,1967-1968,1967-1968)不完全信息动态博弈不完全信息动态博弈精炼贝叶斯均衡精炼贝叶斯均衡(泽尔(泽尔(泽尔(泽尔腾等腾等腾等腾等,1975,1975) 2.2.7 博弈的分类博弈的分类 22囚徒困境囚徒困境(prisoners dilemma ) 乙的对策乙的对策甲甲的的对对策策合作合作(沉默)(沉默)背叛背叛(认罪)(认罪)合作合作(沉默)(沉默)(-1,-1)(-10,0)背叛背叛(交代)(交代)(0,-10)(-8,-8)完全信息静态博弈完全信息静态博弈空城计空城计

28、 进攻进攻后退后退坚持坚持被擒被擒, ,大胜大胜0,0,1010逃脱逃脱, ,无胜无胜5 5,0,0逃跑逃跑被擒被擒, ,大胜大胜0,100,10逃脱逃脱, ,无胜无胜5,05,0诸诸葛葛亮亮司马懿司马懿不完全信息静态博弈不完全信息静态博弈 走大路走大路走小路走小路守大路守大路被擒被擒10,10,0 0逃脱逃脱0 0,10,10守小道守小道逃脱逃脱0,100,10被擒被擒10,010,0诸诸葛葛亮亮(关关羽羽)曹操曹操不完全信息静态博弈不完全信息静态博弈曹操败走华容道曹操败走华容道相亲相亲王王实实甫甫张生和崔莺莺张生和崔莺莺 红娘红娘王王实实甫甫. .西西厢厢记记不完全信息静态博弈不完全信息静

29、态博弈完全信息动态博弈完全信息动态博弈黔之驴黔之驴黔驴技穷黔驴技穷 柳宗元柳宗元(唐)(唐)不完全信息不完全信息动态博弈动态博弈行动次序行动次序信息信息静态静态动态动态完全信完全信息息完全信息静态博弈完全信息静态博弈纳什均衡纳什均衡(纳什,纳什,纳什,纳什,1950,19511950,1951)囚徒困境,周末约会囚徒困境,周末约会完全信息动态博弈完全信息动态博弈子博弈精练纳什均衡子博弈精练纳什均衡(泽尔腾泽尔腾泽尔腾泽尔腾,1965,1965)田忌赛马,破釜沉舟,田忌赛马,破釜沉舟,昭君出塞昭君出塞不完全不完全信息信息不完全信息静态博弈不完全信息静态博弈贝叶斯均衡贝叶斯均衡(海萨尼海萨尼海萨尼

30、海萨尼,1967-1968,1967-1968)招标(暗标),空城计招标(暗标),空城计招标(暗标),空城计招标(暗标),空城计相亲,曹操华容道被捉相亲,曹操华容道被捉相亲,曹操华容道被捉相亲,曹操华容道被捉不完全信息动态博弈不完全信息动态博弈精炼贝叶斯均衡精炼贝叶斯均衡(泽尔腾等(泽尔腾等(泽尔腾等(泽尔腾等,1975,1975)黔驴技穷,拍卖,黔驴技穷,拍卖,黔驴技穷,拍卖,黔驴技穷,拍卖,龟兔赛跑龟兔赛跑龟兔赛跑龟兔赛跑 2.2.7 博弈的分类和均衡博弈的分类和均衡2.3.1 战略式表达战略式表达2.3.2 扩展式表达扩展式表达第三节第三节 博弈的表达方式博弈的表达方式2.3.1 战略式

31、表达战略式表达战略式表达(略式表达(strategic representation),又称又称标准式表达准式表达(normal from representation)。更适。更适合静合静态博弈。用博弈。用支付矩支付矩阵表示。表示。三个要素:三个要素:1.博弈的参与人集合博弈的参与人集合2.每个参与人的每个参与人的战略空略空间3.每个参与人的支付函数(由每个参与人的支付函数(由战略略组合合决定)决定)囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B-8-8,-8-8-1-1,-1-1-10-10,0 00 0,-10-10智猪博弈智猪博弈 按按等待等待按按等待等待小

32、猪大猪5 5,1 10 0,0 09 9,1 14 4,4 4完全信息静态博弈完全信息静态博弈案例:田忌赛马案例:田忌赛马上中下上中下上下中上下中中上下中上下中下上中下上下上中下上中下中上下中上上中下上中下3,-31,-11,-11,-1- 1,1 1,-1上下中上下中1,-13,-31,-11,-11,-1- 1,1中上下中上下1,-1- 1,1 3,-31,-11,-11,-1中下上中下上- 1,1 1,-11,-13,-31,-11,-1下上中下上中1,-11,-11,-1- 1,1 3,-31,-1下上中下上中1,-11,-1- 1,1 1,-11,-13,-3田忌田忌齐齐威威王王2.

33、3.2 扩展式表达扩展式表达扩展式表达(展式表达(extensive form representation )。更适合)。更适合动态博弈。用博弈。用博博弈弈树来表示来表示六个要素:六个要素:1.博弈的参与人集合博弈的参与人集合2. 参与人的行参与人的行动顺序序3. 参与人的参与人的战略行略行动空空间4. 参与人的信息集参与人的信息集5.参与人的支付函数参与人的支付函数6.外生事件(即自然外生事件(即自然选择)的概率分布)的概率分布)博弈树的基本建筑材料博弈树的基本建筑材料11.结(nodes):2.枝枝(branches):3.信息集信息集(information sets)博弈树的基本建筑

34、材料博弈树的基本建筑材料11.结(nodes):初始初始结(begining nodes )决策决策结(decision nodes )终点点结(terminal nodes )博弈从空心博弈从空心圆开始,空心开始,空心圆表示开始决策,表示开始决策,A选择后,博弈后,博弈进入入标有有B的的实心心圆。 初始初始结用用 其他决策其他决策结用用博弈树的基本建筑材料博弈树的基本建筑材料22.枝枝(branches):是从一个决策:是从一个决策结到到它的直接后它的直接后续结的的连线,某一个枝代,某一个枝代表参与人的一个行表参与人的一个行动选择。博弈树的基本建筑材料博弈树的基本建筑材料23.信息集信息集(

35、information sets):某个参与人某个参与人都知道些什么。信息集是用来都知道些什么。信息集是用来标注某个人注某个人知道些什么信息的,不同的知道些什么信息的,不同的标注表示注表示这个个人知道不同的信息。人知道不同的信息。博弈博弈树上的所有决策上的所有决策结分割成不同的信息集。每分割成不同的信息集。每一个信息集是决策一个信息集是决策结集合的一个子集,集合的一个子集,该子集子集包括所有包括所有满足下列条件的决策足下列条件的决策结。(1)每一个决策)每一个决策结都是同一个参与人的决都是同一个参与人的决策策结(2)该参与人知道博弈参与人知道博弈进入入该集合的某个集合的某个决策决策结,但不知道

36、自己究竟,但不知道自己究竟处于哪一个决于哪一个决策策结2.3.2 扩展式表达扩展式表达坦白坦白坦白不坦白不坦白(-8,-8)(0,-10)不坦白坦白坦白囚徒困境囚徒困境不坦白不坦白(-10,0)(-1,-1)ABB案例案例案例一:姑娘案例一:姑娘(girl)爱上小伙子,父上小伙子,父亲(father)不同意。威)不同意。威胁说,如果分手,我,如果分手,我们还是好父女,两人和好;如果嫁是好父女,两人和好;如果嫁给小伙小伙子,那就一刀两断。子,那就一刀两断。局中人:姑娘局中人:姑娘(girl) ,父,父亲(father) 策策 略:略: girl:分手,不分手:分手,不分手 father :和好,

37、不和好:和好,不和好 支付矩支付矩阵:2.3.2 扩展式表达扩展式表达girl不分手不分手和好和好不和好不和好father(2,1)(1,0)father分手分手和好和好父女威父女威胁不和好不和好(1,1)(0,0) 和好和好不和好不和好分手分手1, 11, 10,00,0不分不分手手2, 12, 11, 01, 0girlfather有两家房地有两家房地产公司,决定是否开公司,决定是否开发房地房地产。需求大,开需求大,开发者者利利润8千万,千万,不开不开发者者利利润0。需求大,需求大,两者都开两者都开发利利润各各为4千万。千万。需求小,开需求小,开发者者利利润1千万,千万,不开不开发者者利利

38、润0。需求小,需求小,两者都开两者都开发利利润各各为-3千万千万两者都两者都不开不开发利利润各各为0。博弈树:房地产开发博弈I博弈树:房地产开发博弈IA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4博弈树:不允许的情形博弈树:不允许的情形博弈树的基本建筑材料博弈树的基本建筑材料23.信息集信息集(information sets):某个参与人某个参与人都知道些什么。信息集是用来都知道些什么。信息集是用来标注某个人注某个人知道些什么信息

39、的,不同的知道些什么信息的,不同的标注表示注表示这个个人知道不同的信息。人知道不同的信息。博弈博弈树上的所有决策上的所有决策结分割成不同的信息集。每分割成不同的信息集。每一个信息集是决策一个信息集是决策结集合的一个子集,集合的一个子集,该子集子集包括所有包括所有满足下列条件的决策足下列条件的决策结。(1)每一个决策)每一个决策结都是同一个参与人的决都是同一个参与人的决策策结(2)该参与人知道博弈参与人知道博弈进入入该集合的某个集合的某个决策决策结,但不知道自己究竟,但不知道自己究竟处于哪一个决于哪一个决策策结博弈树:房地产开发博弈IA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不

40、开 开 不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4另一种描述:房地产开发博弈IN 大(1/2) 小(1/2) 开发 不开发 开发 不开发开发 不开发 开 不开 开 不开 开 不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) A A B1 B2 B3 B4信息集:房地产博弈信息集:房地产博弈IIA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0)

41、(0,1) (0,0) N1 N2 B1 B2 B3 B4信息集:房地产博弈信息集:房地产博弈IIIA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4第二种描述:房地产开发博弈IIIN 大(1/2) 小(1/2) 开发 不开发 开发 不开发开发 不开发 开 不开 开 不开 开 不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) A A B1 B2 B3 B4第三种描述:房地产博弈房地

42、产博弈IVN 大 小 开 不开 开 不开开发 不开发 开 不开 开 不开 开 不开 (4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) (0,0) B1 B2 A1 A2 A3 A4囚徒困境囚徒困境 A 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 B B坦白坦白 抵赖抵赖(-8,-8) (0,-10) (-10,0) (-1,-1) B 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 (-8,-8) (0,-10) (-10,0) (-1,-1)A A囚徒困境囚徒困境 A 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 B B坦白坦白 抵赖抵赖(-8,-8)

43、 (0,-10) (-10,0) (-1,-1) B 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 (-8,-8) (0,-10) (-10,0) (-1,-1)A A2.4.1 静态博弈静态博弈2.4.2 动态博弈动态博弈第四节第四节 如何寻找博弈的均衡点如何寻找博弈的均衡点纳什均衡纳什均衡纳什均衡的定什均衡的定义 对于一个于一个给定的策略定的策略组合,如果各博弈方都合,如果各博弈方都没有没有单独改独改变策略策略组合的意愿,合的意愿,则称称该策略策略组合合为纳什均衡什均衡.纳什均衡的一致什均衡的一致预测性性质 各博弈方都能各博弈方都能预测到,并且能到,并且能预测到其他博到其他博

44、弈方能弈方能预测到,能到,能预测到其他博弈方也能到其他博弈方也能预测到自己能到自己能预测到到.完全信息静态博弈纳什均衡完全信息静态博弈纳什均衡 各博弈方同时决策,且所有博弈方各博弈方同时决策,且所有博弈方对博弈中的各种情况下的得益都完全了对博弈中的各种情况下的得益都完全了解的博弈问题。解的博弈问题。 1.1.基本分析思路和方法基本分析思路和方法 2.2.纳什均衡纳什均衡 3.3.无限策略博弈分析无限策略博弈分析1.1.基本分析思路和方法基本分析思路和方法1 优势策略均衡优势策略均衡2 箭头法箭头法3 画线法画线法4 严格劣势反复消去法严格劣势反复消去法1 优势策略均衡优势策略均衡 不管其他博弈

45、方选择什么策略,一博不管其他博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于弈方的某个策略给他带来的得益始终高于其他策略,就称此策略为其他策略,就称此策略为“优势优势” 一策略组合中的策略都是博弈方的优一策略组合中的策略都是博弈方的优势策略,则称该策略为势策略,则称该策略为“优势策略均衡优势策略均衡” 如如“囚徒困境囚徒困境”2 箭头法箭头法 思路是:判断各博弈方能否通过单独改思路是:判断各博弈方能否通过单独改变自己的策略而改善自己的得益,如能,则变自己的策略而改善自己的得益,如能,则引一箭头。对可能的策略组合都考察过后,引一箭头。对可能的策略组合都考察过后,根据箭头反映的情况来判

46、断博弈的结果。根据箭头反映的情况来判断博弈的结果。犯人A犯人B坦白坦白不坦白不坦白坦白坦白-10,-100,25不坦白不坦白25,01,1 按按等待等待按按5,15,14,44,4等待等待9,-19,-10,00,0小猪大猪 足球足球演唱会演唱会足球足球2 2,1 10 0,0 0演唱会演唱会1 1,1 11 1,2 2王菲李亚鹏 某策略组合只有指向的箭头,没有某策略组合只有指向的箭头,没有指离的箭头,则为稳定性的策略组合指离的箭头,则为稳定性的策略组合 正面正面方面方面正面正面1 1,1 11 1,1 1反面反面1 1,1 11 1,1 1猜硬币方盖硬币方左左中中右右上上1,01,30,1下

47、下0,40,22,0博弈方博弈方2 2博博弈弈方方1 13 画线法画线法 由于决策的原由于决策的原则是使自己的得益尽可能的是使自己的得益尽可能的大。同大。同时由于一方的得益取决于其他方的策由于一方的得益取决于其他方的策略。略。 因此,一博弈方首先做的就是根据其他博因此,一博弈方首先做的就是根据其他博弈方的每种策略找出自己的最佳弈方的每种策略找出自己的最佳应对策略。策略。 画画线法就是在上述最佳法就是在上述最佳应对策略下画策略下画线。柴可夫斯基乐队指挥坦白坦白不坦白不坦白坦白坦白-10,-100,25不坦白不坦白25,01,1 按按等待等待按按5,15,14,44,4等待等待9,-19,-10,

48、00,0小猪大猪 足球足球演唱会演唱会足球足球2 2,1 10 0,0 0演唱会演唱会1 1,1 11 1,2 2王菲李亚鹏 某策略组合中所有的得益都某策略组合中所有的得益都有下划线则为稳定性的策略组合有下划线则为稳定性的策略组合左左中中右右上上1,01,30,1下下0,40,22,0博弈方博弈方2 2博博弈弈方方1 1 正面正面方面方面正面正面1 1,1 11 1,1 1反面反面1 1,1 11 1,1 1猜硬币方盖硬币方4 严格劣势反复消去法严格劣势反复消去法选择法法 排除法排除法 不管其他博弈方不管其他博弈方选择什么策略,一博什么策略,一博弈方的某个策略弈方的某个策略给他他带来的得益始来

49、的得益始终不高不高于其他策略,就称此策略于其他策略,就称此策略为“劣劣势” 不断的消去劣不断的消去劣势策略,策略,缩小策略小策略选择范范围,就称劣,就称劣势策略反复消去法。策略反复消去法。犯人A犯人B坦白坦白不坦白不坦白坦白坦白-10,-100,25不坦白不坦白25,01,1 按按等待等待按按5,15,14,44,4等待等待9,-19,-10,00,0小猪大猪左左中中右右上上1,01,30,1下下0,40,22,0博弈方博弈方2 2博博弈弈方方1 1动态博弈纳什均衡动态博弈纳什均衡子博弈子博弈逆推逆推归纳法法乙在开采一个价乙在开采一个价值4万元的金万元的金矿时,缺缺1万元万元钱,向甲方借,向甲

50、方借1万元万元钱。并。并许诺开开矿成功后,所得成功后,所得4万元两人平分万元两人平分(也可以理解也可以理解为许诺借一万元,到期后借一万元,到期后还2万元万元),并且可以,并且可以订立合同。如果立合同。如果违约可以上告到法院,可以上告到法院,问甲是否甲是否应该借借钱给乙?假乙?假设打官司需要付出的打官司需要付出的时间、精力、打点人、精力、打点人际关系和关系和请律律师的的总费用需要用需要1万元。万元。开金矿开金矿甲甲乙乙分分不分不分借借不借不借(1,0)(2,2)(0,4)甲甲乙乙分分不分不分借借不借不借(1,0)(2,2)甲甲打打不打不打(2,1)(0,4)子博弈和逆推归纳法子博弈和逆推归纳法3

51、.2.1 子博弈子博弈甲甲乙乙分分不分不分借借不借不借(1,0)(2,2)甲甲打打不打不打(2,1)(0,4)逆推归纳法逆推归纳法甲甲乙乙分分不分不分借借不借不借(1,0)(2,2)甲甲打打不打不打(2,1)(0,4)逆推归纳法逆推归纳法甲甲乙乙分分不分不分借借不借不借(1,0)(2,2)(2,0)逆推归纳法逆推归纳法甲甲借借不借不借(1,0)(2,2)开金矿法律完善与不完善开金矿法律完善与不完善甲甲乙乙分分不分不分借借不借不借(1,0)(2,2)甲甲打打不打不打(-1,1)(0,4)(2,1)作业作业1.1.什么是博弈什么是博弈论2.2.博弈的模型可以用哪七个方面来描述博弈的模型可以用哪七个方面来描述?分?分别做做简要的解要的解释。3. 3. 根据信息和行根据信息和行动次序,博弈可以分次序,博弈可以分为哪几哪几类,每一种分,每一种分别举2 2个例子个例子进行行说明。明。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号