完全信息动态博弈课堂PPT

资源描述

《完全信息动态博弈课堂PPT》由会员分享，可在线阅读，更多相关《完全信息动态博弈课堂PPT（57页珍藏版）》请在金锄头文库上搜索。

1、2.3 2.3 完全信息动态博弈完全信息动态博弈本节内容：本节内容：n一一博弈扩展式表述博弈扩展式表述n二二子博弈完美纳什均衡子博弈完美纳什均衡n三三应用举例应用举例1博弈的战略表述博弈的战略表述案例- 房地产开发项目-假设有A、B两家开发商市场需求：可能大，也可能小投入：1亿v假定市场上有两栋楼出售：假定市场上有两栋楼出售：需求大时，需求大时，每栋售价每栋售价1.41.4亿亿，需求小时，需求小时，售价售价7 7千万千万；v如果市场上只有一栋楼如果市场上只有一栋楼需求大时，需求大时，可卖可卖1.81.8亿亿需求小时，需求小时，可卖可卖1.11.1亿亿2博弈战略表述博弈战略表述400040

2、00，4000400080008000，0 00 0，800080000 0，0 0不开发开发商A开发不开发开发-3000-3000，-3000-300010001000，0 00 0，100010000 0，0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况博弈的战略式表述3博弈的扩展式表述o扩展式表述所扩展式表述所“扩展扩展”的主要是参与人的战略空间的主要是参与人的战略空间o战略式表述简单地给出参与人有些什么战略可以选择，战略式表述简单地给出参与人有些什么战略可以选择，而扩展式表述要给出而扩展式表述要给出每个战略的每个战略的动态动态描述描述：

3、谁在什么时：谁在什么时候行动，每次行动时有些什么具体行动方案可供选择，候行动，每次行动时有些什么具体行动方案可供选择，以及知道些什么以及知道些什么o此时的战略：如果你这样，我将怎样此时的战略：如果你这样，我将怎样4博弈的扩展式表述要素：要素：参与人集合参与人集合参与人的行动顺序参与人的行动顺序参与人的行动空间参与人的行动空间参与人的信息集参与人的信息集参与人的支付函数参与人的支付函数外生事件外生事件( (即即“自然自然”的选择的选择) )的概率分布的概率分布5A开发不开发NN大小1/21/2大小1/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(

4、0,8)(0,0)(0,1)(0,0)参与人(A,B,N)战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结,决策结结,终点结枝结,初始结信息集结结: : 包括决策结和终点结两类包括决策结和终点结两类; ;决策结决策结是参与人行动的始点是参与人行动的始点, ,终点结是决策人终点结是决策人行动的终点行动的终点. .结满足传递性和非对称性结满足传递性和非对称性x x之前的所有结的集合，称为之前的所有结的集合，称为x x的的前列前列集集P P（x x），），x x之后的所有结的集合称为之后的所有结的集合称为x x的的后续集后续集T T（

5、x x）。）。l枝枝: : 枝是从一个决策结到它的直接后枝是从一个决策结到它的直接后续结的连线续结的连线, ,每一个枝代表参与人的一每一个枝代表参与人的一个行动选择个行动选择. .l信息集信息集: : 每个信息集是决策结集合的每个信息集是决策结集合的一个子集一个子集, ,该子集包括所有满足下列条该子集包括所有满足下列条件的决策结件的决策结: :1 1 每个决策结都是同一个参与人的决每个决策结都是同一个参与人的决策结策结; ;2 2 该参与人知道博弈进入该集合的某该参与人知道博弈进入该集合的某个决策结个决策结, ,但不知道自己究竟处于哪一但不知道自己究竟处于哪一个决策结个决策结. .6信息集：房

6、地产博弈IIA 开发不开发大小大小开发不开发开不开开不开开不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4 B在决策时不确切地知道自然的选择; B的决策结由4个变为2个7信息集：房地产博弈IIIA 开发不开发大小大小开发不开发开不开开不开开不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4 B知道自然的选择;但不知道A的选择(或A、B同时决策) 8信息集：房地产博弈I

7、VN 大小开不开开不开开发不开发开不开开不开开不开 (4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) (0,0) B1 B2 A1 A2 A3 A49博弈扩展式表述o只包含一个决策结的信息集称为只包含一个决策结的信息集称为单结信息集单结信息集，如果如果博弈树的所有信息都是单结的，该博弈称为完美信博弈树的所有信息都是单结的，该博弈称为完美信息博弈。息博弈。o自然总是假定是单结的，自然总是假定是单结的，因为自然在参与人决策之因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能后行动等价于自然在参与人之前行动但参与人不能观测

8、到自然的行动。观测到自然的行动。o不同的博弈树可以代表相同的博弈，但是有一个基不同的博弈树可以代表相同的博弈，但是有一个基本规则：本规则：一个参与人在决策之前知道的事情，必须一个参与人在决策之前知道的事情，必须出现在该参与人决策结之前。出现在该参与人决策结之前。10AB坦白抵赖BBAA坦白抵赖坦白抵赖(-8,-8)(0，-10)(-10,0)(-1,-1)坦白抵赖坦白抵赖坦白抵赖(-8,-8)(0，-10)(-10,0)(-1,-1)囚徒困境博弈的扩展式表述囚徒困境博弈的扩展式表述11智猪博弈的扩展式表述？5，14，49，-10，0等待小猪大猪按等待按案例2-智猪博弈12动态博弈的战略的表述动

9、态博弈的战略的表述战略：参与人在给定信息集的情况下选择行动的规则，它规定战略：参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的参与人在什么情况下选择什么行动，是参与人的“相机行动方相机行动方案案”。在静态博弈中，战略和行动是相同的。在静态博弈中，战略和行动是相同的。作为一种行动规则，战略必须是完备的。作为一种行动规则，战略必须是完备的。13性别战博弈的扩展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx14扩展式表述博弈的战略扩展式表述博弈的战略足

10、球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx男的策略：足球，芭蕾选择足球；还是选择芭蕾。女的策略：（足球，芭蕾），（芭蕾，足球）（芭蕾，芭蕾），（足球，足球）1、追随策略：他选择什么，我就选择什么2、对抗策略：他选择什么，我就偏不选什么3、芭蕾策略：不管他选什么，我都选芭蕾；4、足球策略：不管他选什么，我都选足球。策略即：策略即：如果他选择什么，我就怎样行动的相机行动方案。在扩展如果他选择什么，我就怎样行动的相机行动方案。在扩展式博弈里，参与人是相机行事，即式博弈里，参与人是相机行事，即“等待等待”博弈到达一个自己的博弈到达一个自己的信息集（包含一个或多个决策结

11、信息集（包含一个或多个决策结)后，再采取行动方案。后，再采取行动方案。15扩展式表述博弈的纳什均衡扩展式表述博弈的纳什均衡o若A先行动，B在知道A的行动后行动，则A有一个信息集，两个可选择的行动，战略空间为:(:(开发，不开发）开发，不开发）；oB有两个信息集，四个可选择的行动，B有四个纯战略：开发策略：不论开发策略：不论A A开发不开发，我开发；开发不开发，我开发；追随策略：追随策略：A A开发我开发，开发我开发，A A不开发我不开发；不开发我不开发；对抗策略：对抗策略：A A开发我不开发，开发我不开发，A A不开发我开发；不开发我开发；不开发策略不论不开发策略不论A A开发不开发我不开发，

12、开发不开发我不开发，o简写为：简写为：o（开发，开发），（开发，不开发），（开发，开发），（开发，不开发），（不开发，开发），（不开发，不开发），（不开发，开发），（不开发，不开发），括号内的第一个元素对应A选择“开发”时B的选择，第二个元素对应A选择“不开发”时B的选择。A开发不开发BB开发不开发开发(-3,-3)(1，0)（0，1)(0,0)不开发xx什么是参与人什么是参与人的战略？的战略？16扩展式扩展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0开发,开发开发,不开发不开发, 开发不开发,不开发开发不开发开发商开发商B B开发商开发商A A战略式战略式A开发

13、不开发BB开发不开发开发(-3,-3)(1，0)（0，1)(0,0)不开发xx路径路径在扩展式博弈中，所有在扩展式博弈中，所有n n个参与人个参与人的一个纯战略组合决定了博弈树的一个纯战略组合决定了博弈树上的一个路径。上的一个路径。（开发，（开发，不开发，开发不开发，开发）决定）决定了博弈的路径为了博弈的路径为A A开发开发B B不不开发开发-（1 1，0 0）（不开发，（不开发，开发，开发开发，开发）决定）决定了路径：？了路径：？17课堂练习课堂练习: :o参与人参与人1 1（丈夫）和参与人（丈夫）和参与人2 2（妻子）必须独立决定出门时是否带（妻子）必须独立决定出门时是否带伞。他们

14、知道下雨和不下雨的可能性均为伞。他们知道下雨和不下雨的可能性均为50%50%，支付函数为：如，支付函数为：如果只有一人带伞，下雨时带伞者的效用为果只有一人带伞，下雨时带伞者的效用为-2.5-2.5，不带伞者的效用，不带伞者的效用为为-3-3；不下雨时带伞的效用为；不下雨时带伞的效用为-1,-1,不带的效用为不带的效用为0 0；如两人都不带；如两人都不带伞伞, ,下雨时每人的效用为下雨时每人的效用为-5,-5,不下雨时每人的效用为不下雨时每人的效用为1;1;给出下列四给出下列四种情况下的扩展式及战略式表述种情况下的扩展式及战略式表述: :(1)(1)两人出门前都不知道是否会下雨两人出门前都不知道

15、是否会下雨; ;并且两人同时决定是否带伞并且两人同时决定是否带伞( (即每一方在决策时都不知道对方的决策即每一方在决策时都不知道对方的决策););(2)(2)两人在出门前都不知道是否会下雨两人在出门前都不知道是否会下雨, ,但丈夫先决策，妻子观察但丈夫先决策，妻子观察到丈夫是否带伞后才决定自己是否带伞到丈夫是否带伞后才决定自己是否带伞; ;(3)(3)丈夫出门前知道是否会下雨丈夫出门前知道是否会下雨, ,但妻子不知道，但丈夫先决策，但妻子不知道，但丈夫先决策，妻子后决策妻子后决策; ;(4),(4),同同(3),(3),但妻子先决策，丈夫后决策但妻子先决策，丈夫后决策. .18完全信息动态博弈

16、完全信息动态博弈- -子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（19651965）o考虑下列问题：考虑下列问题：一个博弈可能有多个（甚至无穷多个）纳什均衡，究竟一个博弈可能有多个（甚至无穷多个）纳什均衡，究竟哪个更合理？哪个更合理？纳什均衡纳什均衡假定每一个参与人在选择自己的最优战略时假假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的定所有其他参与人的战略是给定的，但是如果参与人的，但是如果参与人的行动有先有后，后行动者的选择空间依赖于前行动者的行动有先有后，后行动者的选择空间依赖于前行动者的选择，前行动者在选择时不可能不考虑自己的行动对后选择，前行动者在选择时

17、不可能不考虑自己的行动对后行动者的影响。行动者的影响。子博弈完美纳什均衡的一个重要改进是将子博弈完美纳什均衡的一个重要改进是将“合理纳什均合理纳什均衡衡”与与“不合理纳什均衡不合理纳什均衡”分开。分开。19完全信息动态博弈-子博弈完美纳什均衡（举例）泽尔腾（1965）进入者进入不进入（0，300）在位者合作（40，50）斗争（-10，0）市场进入阻挠博弈树特点：剔除博弈中包含的不可置信威胁。承诺行动-破釜沉舟-背水一战v给定进入者进入，剔除（进入，斗争），（进入，默许）是唯一的子博弈完美纳什均衡不可置信威胁支付函数行动20子博弈完美纳什均衡子博弈完美纳什均衡o一个纳什均衡称为完美纳什均衡，当

18、只当参与人的战略在每个子博弈中都构成纳什均衡，也就是说，组成完美纳什均衡的战略必须在每一个子博弈中都是最优的。o一个完美纳什均衡首先必须是一个纳什均衡，但纳什均衡不一定是完美纳什均衡。o承诺行动-当事人使自己的威胁战略变得可置信的行动。21完全信息动态博弈完全信息动态博弈- -子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（19651965）o泽尔腾引入子博弈完美纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈的一个合理的预测结果，简单说，子博弈完美纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。22子博弈完美纳什均衡子博弈完美纳什均衡- -不可

19、置信威胁不可置信威胁o美国普林斯顿大学古尔教授在美国普林斯顿大学古尔教授在19971997年的年的经济学透视经济学透视里发表文里发表文章，提出一个例子说明威胁的可信性问题：章，提出一个例子说明威胁的可信性问题：o两兄弟老是为玩具吵架，哥哥老是要抢弟弟的玩具，不耐烦的父亲宣布两兄弟老是为玩具吵架，哥哥老是要抢弟弟的玩具，不耐烦的父亲宣布政策：好好去玩，不要吵我，不管你们谁向我告状，我都把你们两个关政策：好好去玩，不要吵我，不管你们谁向我告状，我都把你们两个关起来，关起来比没有玩具更可怕。现在，哥哥又把弟弟的玩具抢去玩了，起来，关起来比没有玩具更可怕。现在，哥哥又把弟弟的玩具抢去玩了，弟弟没有办法

20、，只好说：快把玩具还我，不然我就要去告诉爸爸。哥哥弟弟没有办法，只好说：快把玩具还我，不然我就要去告诉爸爸。哥哥想，你真要告诉爸爸，我是要倒霉的，可是你不告状不过没有玩具玩，想，你真要告诉爸爸，我是要倒霉的，可是你不告状不过没有玩具玩，而告了状却要被关禁闭，告状会使你的境遇变得更坏，所以你不会告状，而告了状却要被关禁闭，告状会使你的境遇变得更坏，所以你不会告状，因此哥哥对弟弟的警告置之不理因此哥哥对弟弟的警告置之不理。o的确，如果弟弟是会算计自己利益的理性人，在这样的环境下，的确，如果弟弟是会算计自己利益的理性人，在这样的环境下，还是不告状的好。可见，弟弟是理性人，他的告状威胁是不可置还是不告

21、状的好。可见，弟弟是理性人，他的告状威胁是不可置信的。信的。23子博弈完美纳什均衡子博弈完美纳什均衡A开发不开发BB开发不开发开发(-3,-3)(1，0)（0，1)(0,0)不开发( (不开发，（开发，开发），（开发，（不开发，开发），（开发不开发，（开发，开发），（开发，（不开发，开发），（开发, ,（不开发，不开发）（不开发，不开发）如果如果A A选择开发，选择开发，B B的最优选择是不开发，如果的最优选择是不开发，如果A A选择不开发，选择不开发，B B的最优选的最优选择是开发，择是开发，A A预测到自己的选择对预测到自己的选择对B B的影响，因此开发是的影响，因此开发是A A的最优选

22、择。子博弈的最优选择。子博弈完美纳什均衡结果是：完美纳什均衡结果是：A A选择开发，选择开发，B B选择不开发。选择不开发。xx 对于对于( (不开发，（开发，开发），不开发，（开发，开发），这个组合之所以构成纳什均衡，是因这个组合之所以构成纳什均衡，是因为为B B威胁不论威胁不论A A开发还是不开发，他都开发还是不开发，他都将选择开发，将选择开发，A A相信了相信了B B的威胁，不开的威胁，不开发是最优选择，但是发是最优选择，但是A A为什么要相信为什么要相信B B的威胁呢？的威胁呢？毕竟，如果毕竟，如果A A真开发，真开发，B B选择开发选择开发得得-3-3，不开发得，不开发得0 0，所

23、以，所以B B的最优选择的最优选择是不开发。如果是不开发。如果A A知道知道B B是理性的，是理性的，A A将选择开发，逼迫将选择开发，逼迫B B选择不开发。自选择不开发。自己得己得1 1，B B得得0 0，即纳什均衡，即纳什均衡( (不开发，不开发，（开发，开发）是不可置信的。因（开发，开发）是不可置信的。因为它依赖于为它依赖于B B的一个不可置信的威胁。的一个不可置信的威胁。同样：同样：（不开发，不开发）也是一（不开发，不开发）也是一个不可置信威胁，纳什均衡（开发个不可置信威胁，纳什均衡（开发, ,（不（不开发，不开发）是不合理的。开发，不开发）是不合理的。24子博弈完美纳什均衡子博弈

24、完美纳什均衡o泽尔腾引入子博弈完美纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈的一个合理的预测结果，简单说，子博弈完美纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。o什么是子博弈，什么是子博弈完美纳什均衡？o有没有更好的方法找到子博弈完美纳什均衡？25子博弈A 开发不开发大小大小开发不开发开不开开不开开不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4A 开发不开发大小大小开发不开发开不开开不开开不开 (4,

25、4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4A 开发不开发大小大小开发不开发开不开开不开开不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B426完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）不开发A开发不开发BB开发不开发开发(1，0)（0，1)(0,0)(-3,-3)xx不开发开发不开发(1，0)(-3,-3)x开发（0，1)(0,0)x子博弈I子

26、博弈II房地产开发博弈找出房地产开发博弈的子博弈找出房地产开发博弈的子博弈( (不开发，（开发，开发），（开发，（不开发，开发），（开发不开发，（开发，开发），（开发，（不开发，开发），（开发, ,（不开发，不开发）（不开发，不开发）27完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）o子博弈完美纳什均衡：扩展式博弈的战略组合是一个子博弈完美纳什均衡，如果:（1）它是原博弈的纳什均衡；（2）它在每一个子博弈上给出纳什均衡。28A开发不开发BB开发不开发开发(1，0)（0，1)(0,0)(-3,-3)xx房地产开发博弈开发不开发(1，0)(-3,

27、-3)x开发（0，1)(0,0)x子博弈I子博弈II(不开发，（开发，开发），（开发，（不开发，开发），（开发，（不开发，不开发）在c上构成均衡，在b上不构成；在b和c上都构成在b上构成均衡，在c上不构成完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）不开发判断下列均衡结果哪个构成子博弈完美纳什均衡？不开发bc29子博弈精炼纳什均衡可信性问题子博弈和逆向归纳法子博弈精炼纳什均衡应用举例有同时选择的两阶段动态博弈30可信性：开金矿博弈甲在开采一价值甲在开采一价值4 4万元的金矿时缺万元的金矿时缺1 1万元资金，而乙万元资金，而乙正好有正好有

28、1 1万元资金可以投资。甲希望乙能将万元资金可以投资。甲希望乙能将1 1万元资金借万元资金借给自己用于开矿，并许诺在采到金子后与乙对半分成，给自己用于开矿，并许诺在采到金子后与乙对半分成，乙是否该将钱借给甲呢？乙是否该将钱借给甲呢？31开金矿I无法律的博弈乙甲借不借分不分 (2,2) (0,4) (1,0)32开金矿II有法律保障的博弈乙甲借不借分不分 (2,2) 打不打 (1,0) (0,4) (1,0)33逆向归纳法开不开开不开开不开(-3,-3) (1,0) (0,1) (0,0) A B B34122左右ABCD（3,1）（5,6）（4,2）（2,

29、7）h1h12h22122左右BD（5,6）（2,7）h1h12h2212左B（5,6）h1h1235o用逆向归纳法求解的子博弈完美纳什均衡也要求“所有的参与人是理性的”是共同知识。o如果博弈由多个阶段组成，则从逆向归纳法得到的均衡可能并不非常令人信服。36子博弈精炼纳什均衡n扩展式博弈的战略组合s*=(s1*,si*,sn*)是一个子博弈精炼纳什均衡，如果：n(1)它是原博弈的纳什均衡；n(2)它在每一个子博弈上给出纳什均衡。n一个战略组合是一一个战略组合是一个子博弈精炼纳什均衡，当只个子博弈精炼纳什均衡，当只当当它在每一个子博弈上都构成一个纳什均衡它在每一个子博弈上都构成一个纳什均衡37子

30、博弈精炼纳什均衡应用举例o斯坦克尔伯格(Stackelberg)寡头竞争模型o劳资博弈o讨价还价博弈3839库诺特模型与斯氏模型比较张教材张教材107页页张教材张教材43页页40劳资博弈劳资博弈工会决定工资水平，但企业决定雇用多少人。工会决定工资水平，但企业决定雇用多少人。工会不只追求高工资，还希望被雇人数多。不喜欢高工会不只追求高工资，还希望被雇人数多。不喜欢高工资高失业，也不喜欢低工资低失业。工会方的效用工资高失业，也不喜欢低工资低失业。工会方的效用是工资水平和雇用人数两者的函数是工资水平和雇用人数两者的函数u=u(w,L)。工会的。工会的目标是最大化总效用目标是最大化总效用假设收益是劳动

31、雇用量的函数假设收益是劳动雇用量的函数R(L)(边际效益递减), ,再假设只有劳动成本，工厂的利润函数为再假设只有劳动成本，工厂的利润函数为(w,L)R(L)- wL41讨价还价博弈(1)o假设有甲乙两人就如何分割假设有甲乙两人就如何分割1 1万元进行谈判，并且万元进行谈判，并且已定下了如下规则：已定下了如下规则：o首先，由甲提出一个分割比例，对此，乙可以接受首先，由甲提出一个分割比例，对此，乙可以接受也可以拒绝；如果乙拒绝，则乙自己应提出另一个也可以拒绝；如果乙拒绝，则乙自己应提出另一个方案，让甲选择接受与否。如此循环。方案，让甲选择接受与否。如此循环。o在循环中，只要有任何一方接受对方的方

32、案博弈就在循环中，只要有任何一方接受对方的方案博弈就告结束，而如果方案被拒绝，则被拒绝的方案与以告结束，而如果方案被拒绝，则被拒绝的方案与以后的讨价还价过程不再有关系。后的讨价还价过程不再有关系。42讨价还价博弈(2)o每次一方提出一个方案和另一方选择是否每次一方提出一个方案和另一方选择是否接受为一个阶段。再假设讨价还价每多进接受为一个阶段。再假设讨价还价每多进行一个阶段，由于谈判费用和利息损失等，行一个阶段，由于谈判费用和利息损失等，双方的得益都要打一次折扣，折扣率为双方的得益都要打一次折扣，折扣率为， 00 11，称为消耗系数。，称为消耗系数。o如果限制讨价还价最多只能进行三个阶段，如果

33、限制讨价还价最多只能进行三个阶段，到第三阶段乙必须接受甲的方案，这就是到第三阶段乙必须接受甲的方案，这就是一个三阶段讨价还价博弈。一个三阶段讨价还价博弈。43 接受接受不接受，出不接受，出S 乙必须接受乙必须接受讨价还价博弈(3)甲甲出出S1乙乙接受接受不接受，出不接受，出S2 甲甲 (S1, 10000-S1) S2, (10000-S2) 2S, 2(10000-S)44轮流出价的讨价还价模型n分蛋糕的动态博弈分蛋糕的动态博弈n游戏规则：游戏规则：第一轮由第一个参与人（小鹃）提出条件，第一轮由第一个参与人（小鹃）提出条件，第二个参与人小明可以接受，从而游戏结束，也可以不第二个参与人小

34、明可以接受，从而游戏结束，也可以不接受，则游戏进入第二轮；小明提出条件，小鹃可以接接受，则游戏进入第二轮；小明提出条件，小鹃可以接受，从而结束游戏，也可以不接受，从而进入第三轮；受，从而结束游戏，也可以不接受，从而进入第三轮；蛋糕融化呈线性，游戏结束，蛋糕融化蛋糕融化呈线性，游戏结束，蛋糕融化n第一种情况：第一种情况：假设博弈只有一步，小鹃提出分配方案，假设博弈只有一步，小鹃提出分配方案，如果小明同意，两个人按照约定分蛋糕，如果小明不同如果小明同意，两个人按照约定分蛋糕，如果小明不同意，两人什么也得不到。结果会怎样？意，两人什么也得不到。结果会怎样？45轮流出价的讨价还价模型n第二种情况：第二

35、种情况：桌上放了一个冰淇淋蛋糕，但两轮谈桌上放了一个冰淇淋蛋糕，但两轮谈判过后，蛋糕将完全融化。博弈结果如何？判过后，蛋糕将完全融化。博弈结果如何？n第三种情况：第三种情况：桌上的冰淇淋蛋糕在三轮谈判后将完桌上的冰淇淋蛋糕在三轮谈判后将完全融化，结果又如何？全融化，结果又如何？n第四种情况第四种情况：桌上的冰淇淋蛋糕在四轮谈判后将完：桌上的冰淇淋蛋糕在四轮谈判后将完全融化，或者在五轮谈判、六轮全融化，或者在五轮谈判、六轮,100轮谈判后轮谈判后将完全融化，结果又如何？将完全融化，结果又如何？博弈的结果是：假如“轮数”是偶数，双方各得一半，假若轮数是奇数，则小鹃得到（n+1）/2n；小明得到（

36、n-1）/（2n）46囚徒的救赎o好莱圬大片肖申克的救赎是一部很好看的电影，主要内容是一个被冤屈的囚犯如何凭着坚定的信念和聪明才智逃出牢房。我们的“囚犯”也可以通过好的策略合作，摆脱“困境”的诅咒。47囚徒的救赎囚徒的救赎-一报还一报一报还一报一报还一报能够赢得竞赛不是靠打击对方，而是靠从对方引出使双一报还一报能够赢得竞赛不是靠打击对方，而是靠从对方引出使双方都有好处的行为。方都有好处的行为。如果重复博弈多次，就有报复的机会，这种惩罚的规则是：人家对如果重复博弈多次，就有报复的机会，这种惩罚的规则是：人家对你怎么做，你就对他怎么做，如果他上次背叛了你，你这次背叛他，你怎么做，你就对他怎么做，如

37、果他上次背叛了你，你这次背叛他，如果上次他与你合作，你这次就选择与他合作。如果上次他与你合作，你这次就选择与他合作。艾克谢罗德认为，一报还一报体现了这个策略符合四个优点：清晰、艾克谢罗德认为，一报还一报体现了这个策略符合四个优点：清晰、善意、报复性和宽恕性。善意、报复性和宽恕性。这一法则不会引发作弊，所以是善意的；这一法则不会引发作弊，所以是善意的；它不会让作弊者逍遥法外，所以是报复的；它不会让作弊者逍遥法外，所以是报复的；它不会长时间怀恨在心，只要作弊者改正，就愿意恢复合作，所以是它不会长时间怀恨在心，只要作弊者改正，就愿意恢复合作，所以是宽恕的。宽恕的。一报还一报从自己的不可欺负性得到好处

38、，还放弃了占他人便宜的一报还一报从自己的不可欺负性得到好处，还放弃了占他人便宜的可能性可能性48囚徒的救赎o重复囚徒困境的几个建议：o1、不要嫉妒o2、不要首先背叛o3、对合作和背叛都要给予回报o4、不要耍小聪明49旅行者困境-做人不要太精明n哈佛大学巴罗教授：哈佛大学巴罗教授：n两个旅行者从一个以生产细瓷花瓶闻名的地方旅行回来，两个旅行者从一个以生产细瓷花瓶闻名的地方旅行回来，在提取行李的时候，发现花瓶被摔坏了，就向航空公司在提取行李的时候，发现花瓶被摔坏了，就向航空公司索赔。航空公司知道花瓶的价格大概杂八、九十元，但索赔。航空公司知道花瓶的价格大概杂八、九十元，但不知道他们购买的确切价格。

39、因此航空公司请两位旅客不知道他们购买的确切价格。因此航空公司请两位旅客在在100100元以内写出花瓶的价格，如果两个人写得一样，元以内写出花瓶的价格，如果两个人写得一样，就按照写的数额赔偿，如果不一样，原则上按照低的价就按照写的数额赔偿，如果不一样，原则上按照低的价格赔偿，并认为该旅客讲了真话，奖励格赔偿，并认为该旅客讲了真话，奖励2 2元，而讲假话元，而讲假话的罚款的罚款2 2元。元。n这个博弈的最终结果将是什么？这个博弈的最终结果将是什么？50旅行者困境o一位富翁的狗在散步时跑丢了，于是他急匆匆到电视台一位富翁的狗在散步时跑丢了，于是他急匆匆到电视台发了一则启示：有狗丢失，归还者得酬金发了

40、一则启示：有狗丢失，归还者得酬金1 1万元，并附万元，并附有狗的彩照。一个乞丐看到广告后，第二天一大早就报有狗的彩照。一个乞丐看到广告后，第二天一大早就报着狗准备去领酬金，当他经过一家大商店的墙体屏幕时，着狗准备去领酬金，当他经过一家大商店的墙体屏幕时，发现酬金涨到了发现酬金涨到了3 3万元，乞丐又折回住处，把狗重新拴万元，乞丐又折回住处，把狗重新拴在那里，在接下来的几天里，乞丐从来没有离开过这只在那里，在接下来的几天里，乞丐从来没有离开过这只大屏幕，当酬金涨到使全市居民感到惊讶时，乞丐返回大屏幕，当酬金涨到使全市居民感到惊讶时，乞丐返回他的住处，可是那只狗已经死了他的住处，可是那只狗已经死了

41、-在这个世界上，金在这个世界上，金钱一旦被作为筹码，就不会再买到任何东西。钱一旦被作为筹码，就不会再买到任何东西。51重复博弈和无名氏定理序贯博弈：不同阶段的博弈结构不同重复博弈：同样结构的博弈重复多次，其中的每次博弈可称“阶段博弈”影响重复博弈均衡结果有二，其一：博弈重复次数。其一：博弈重复次数。多次博弈可能使参与人选择“合作”影响重复博弈均衡结果之二：信息的完备性。之二：信息的完备性。当一个人的支付函数(包括行动和结果)不为其他人所知时，他可能有积极性选择“合作”策略从而建立“好”声誉以换取长期利益52有限次重复博弈:连锁店悖论1.1.市场的市场的“先来后到先来后到”重复博弈中，在位者在第

42、一次选重复博弈中，在位者在第一次选择择“斗争斗争”时不可置信的威胁。惟一的子博弈精炼纳时不可置信的威胁。惟一的子博弈精炼纳什均衡是他总是什均衡是他总是“默许默许”。2.2.倒着想：如果已经进入了倒着想：如果已经进入了n-1n-1个，在最后一个时，其威个，在最后一个时，其威胁本来是不可置信的，则最后一个会胁本来是不可置信的，则最后一个会“默许默许”，再往，再往前推，由于每阶段的前推，由于每阶段的“斗争斗争”都是不可置信的，则所都是不可置信的，则所有大门都在有大门都在“默许默许”下向后来者敞开下向后来者敞开3.3.悖论：我悖论：我n n大的市场岂容你染指？斗！但事实不会如此大的市场岂容你染指？斗！

43、但事实不会如此4.4.只要博弈的重复次数是有限的，只要博弈的重复次数是有限的，“重复重复”并不改变囚并不改变囚徒困境的结果。徒困境的结果。53无限次重复博弈和无名氏定理1.解开连锁店难题的办法之一是引入信息的不完全性。(不确定性可以成为经济运行的资源)2.当博弈重复无限次时，存在着完全不同与一次博弈的子博弈精炼纳什均衡3.冷酷战略或触发战略：只要你骗我一次/背叛，我永远不理你/不合作。4.无名氏定理：有一个一次博弈G可作为某无穷博弈的一个阶段，G有纳什均衡及其结果，对于无限博弈，肯定存在一个贴现因子，使无限博弈的结果不劣(弱优)于G的纳什均衡结果54参与人不固定的重复博弈重复博弈时，厂商不敢以

44、劣货欺人在经济学或管理学中使用“信誉”这样一个不好解释的概念，但在博弈论中却在某些假设之下“逻辑地”证明了。所谓“信誉”，无非对自己行为的预期为什么买于“坐贾”而非“行商”？为什么车站旁边的劣质品那么多？企业存在的一个原因是创造一个“长期参与人”，因其考虑长期利益而遵章守纪、态度积极55不确定环境下的重复博弈o寡头市场上，低需求时容易使他们都选择“合作”，但在高需求时，利润的诱惑使他们都选择“背叛”。这种情况可以重复o能同甘却不能共苦，似乎有道德谴责的意味，但这一现象总是发生，发生的逻辑是什么？博弈论可以解释56作业：作业：o五个海盗抢到五个海盗抢到100颗宝石，他们决定按如下方法来颗宝石，他

45、们决定按如下方法来分配：先抽签决定顺序（分配：先抽签决定顺序（1、2、3、4、5）；然）；然后先由后先由1号提出分配方案，其余的人进行表决，当号提出分配方案，其余的人进行表决，当且仅当有半数和超过半数的人同意时，则按且仅当有半数和超过半数的人同意时，则按1号所号所提方案分配，否则将提方案分配，否则将1号扔进大海喂鲨鱼；当号扔进大海喂鲨鱼；当1号号提出分配方案被否决后，则由提出分配方案被否决后，则由2号提出分配方案，号提出分配方案，其余的人进行表决，当且仅当半数和超过半数的人其余的人进行表决，当且仅当半数和超过半数的人同意时，则按同意时，则按2号所提方案分配，否则将号所提方案分配，否则将2号扔进号扔进大海喂鲨鱼；以后依此类推。假定这些海盗都是理大海喂鲨鱼；以后依此类推。假定这些海盗都是理性人，问第一个海盗应提出怎样的分配方案才能获性人，问第一个海盗应提出怎样的分配方案才能获得通过并使自己的收益最大？得通过并使自己的收益最大？57

展开阅读全文

完全信息动态博弈课堂PPT

最新文档