2chen博弈论第2次课——博弈规则

资源描述

《2chen博弈论第2次课——博弈规则》由会员分享，可在线阅读，更多相关《2chen博弈论第2次课——博弈规则（114页珍藏版）》请在金锄头文库上搜索。

1、第二章博弈论基本知识,管理博弈论,陈方英泰山学院旅游与资源环境学院,参考书目,1. 美阿维纳什K 迪克西特.策略思维.中国人民大学出版社，20022. 王则柯. 新编博弈论平话. 中信出版社，20033. 谢识予.经济博弈论(第二版) .复旦大学出版社，20024. 美埃里克拉斯缪森.博弈与信息：博弈论概论.北京大学出版社，20035.张维迎.博弈论与信息经济学.上海三联书店，2004,第二章博弈论基本知识,2.1 什么是博弈论2.2 博弈的结构和分类2.3 博弈的表达方式2.4 几类经典的博弈模型,2.1.1 从游戏到博弈2.1.2 一个非技术性的定义2.1.3 博弈论模型简介,第一

2、节什么是博弈论,2.1.1 从游戏到博弈,“博弈论”译自英文“Game Theory”，直译就是“游戏理论”。,游戏运气不可控制，但是策略至关重要！,游戏的共有特征 1. 一定的规则 2. 有一个结果（且可以折算成数字） 3.策略的相互依存性 4.策略至关重要,博弈论-无处不在的游戏,“要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解”。保罗萨缪尔森,年光似鸟翩翩过，世事如棋局局新。 (宋)僧志文,博弈论（game theory）：又称对策论，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。,2.1.2 博弈论的基本概念,Governing Dyn

3、amics,博弈论的基本假设人是理性人（rational，也说自私人）:行动者具有推理能力，在具体策略选择时的目的是使决策者自己的目标效用最大化。,2.1.2 博弈论的基本概念,通俗地讲，博弈论是一种“游戏理论”。其较对博弈为准确的理解是：一些个人、团队或其他组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略进行选择并加以实施，并从中各自取得相应结果或收益的过程。,博弈论模型可以用七个方面来描述 GP，A，S，I，U，O，E,2.1.3博弈论的模型简介,P（players）,P（players）：为局中人，博弈的参与者，也称为

4、“博弈方”，局中人以最终实现自身利益最大化为目标。,个人团体,双方多方,虚拟参与人：Nature,A(action),A(action) ：为各局中人的所有可能的策略或行动的集合。行动的顺序（The order of play）根据该集合是有限还是无限进行分类：,先动优势,后动优势,S(strategies),S(strategies) ：博弈的进程，也是博弈进行的次序。它规定什么人在什么时候选择什么行动。因此，战略是参与人的 “相机行动方案” （contingent action plan）分类：根据后行动的人是否能够看到先行动人的具体行动,静态博弈,动态博弈,行动与策略的区别？,行动是指参

5、与者可能有的具体行动战略是行动的规则而不是行动本身,毛泽东：人不犯我我不犯人人若犯我我必犯人,敌进我退敌退我追敌驻我扰敌疲我打,I(information),I(information) ：博弈信息。指的是参与人在博弈中的知识，特别是有关其他参与人（对手）的特征和行为的知识分类：根据博弈各方对各种局势下所有局中人的信息掌握情况分：,完全信息博弈,不完全信息博弈,U（ utility ）,U（ utility ）：也称为支付（pay off）.为局中人获得利益，或者是指参与人的期望效用水平。也是博弈各方追求的最终目标。分类：根据各方得益的不同情况,零和博弈,变和博弈,田忌赛马,囚徒困境,Ua(t

6、,t)=-8Ua(t,n)=0 Ua(n,n)=-1 Ua(n,t)=-10Ub(t,t)=-8Ub(t,n)=-10 Ub(n,n)=-1 Ub(n,t)=0,嫌疑人a,嫌疑人b,U(t,t)=0.5*(-8)+ 0.5*(-8)=-8U(t,n)=0.5*0+ 0.5*(-10)=-5U(n,t)=0.5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1,结果（outcome）是指博弈分析者感兴趣的要素的集合。是均衡行动的组合。,嫌疑人A,嫌疑人B,E(equilibrium),均衡(equilibrium)：是所有参与人的最优战略的组合。所谓博弈

7、均衡，它是一种稳定的博弈结果。纳什均衡（Nash Equilibrium）：一策略组合中，所有的参与者面临这样的一种情况：当其他人不改变策略时，他此时的策略是最好的。谢识予：给定你的策略，我的策略是最好的的策略，给定我的策略，你的策略也是最好的的策略,两个小偷甲和乙联手作案，私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯，政策是若一人招供但另一人未招，则招者立即被释放，未招者判入狱10年；若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。,囚徒困境,嫌疑人A,嫌疑人B,-8，-8,-1，-1,-10，0,0，-10,一个纳什均衡点！,情侣博弈,王菲

8、,李亚鹏,2，1,1，2,1，1,0，0,两个纳什均衡点！,博弈论模型可以用五个方面来描述 GP，A，S，I，U，O，E描述博弈的最少要素：参与人，战略，支付。行动和信息是其积木参与人、行动、结果统称为“博弈规则” 博弈分析的目的：是使用博弈规则预测均衡,2.1.3 博弈论的模型简介,博弈论模型可以用七个方面来描述 GP，A，S，I，U，O，E2.2.1 博弈方2.2.2 博弈的行动过程2.2.3 策略2.2.4 支付（效用、得益）2.2.5 博弈的信息结构2.2.6 博弈方的能力和理性2.2.7 博弈的分类和理论结构,第二节博弈论的结构与分类,2.2.1 博弈中的博弈方,博弈方（play

9、er/ players）博弈中独立决策、独立承担博弈结果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈,1.单人博弈,设有一商人要从A地运输一批货物，从A地到B地有水、陆两条路线，走陆路运输成本10 000元，而走水路运输成本只要7000元。但非常危险，出现坏天气的概率为0.25，此时会损失10%的货物。货物总价值90 000元。此人怎样决策？,自然,商人,-7000,-10000,-10000,-16000,囚徒困境,嫌疑人A,嫌疑人B,-8，-8,-1，-1,-10，0,0，-10,2.双人博弈,情侣博弈,王菲,李亚鹏,2，1,1，2,1，1,0，0,选修课另一版本,

10、王菲,李亚鹏,4，3,3，4,1，1,2，2,石头剪子布,博弈方2,博弈方1,双人博弈小结,注意二点：1. 博弈方之间并非总是对抗的。2. 个人理性决策常不能实现自己的最大利益。,3、多人博弈,三个或三个以上的博弈方参加的博弈。,竞争者,破坏者,竞争者,北京申办2000年奥运会失利,2.2.2 策略,有限博弈（finite games）：如果博弈中每个博弈方的策略是有限的，称为有限博弈。2.无限博弈（infinite games）：如果博弈中至少有某些博弈方的策略是无限多个的，称为无限博弈。 (函数表示),2.2.3 博弈的行动过程,1. 静态博弈（static games）:所有博弈方

11、同时选择策略的博弈。 2 . 动态博弈（dynamic games）：各博弈方的选择和行动有先后次序，而且后选择的、后行动的博弈方，在自己选择行动方案之前，可以看到其他博弈方的选择和行动。也称为多阶段博弈（multistage games） 3. 重复博弈（repeated games）：同一个博弈反复进行多构成的博弈。,2.2.4 博弈的支付（效用，得益）,效用的计算方法：将每一个博弈方在同一策略结果中的得益相加，算出所有博弈方的得益总和。Ua（1,2）= Ua1+Ua2Ub（1,2）= Ub1+Ub2 1. 零和博弈: Ua（1,2）= Ub（1,2） =0 2 . 常和博弈: Ua（1,

12、2）= Ub（1,2） = m 3. 变和博弈: Ua（1,2） Ub（1,2）,两个人通过猜硬币的正反赌输赢，其中一人用手盖住一枚硬币，有另一方在是正面还是反面朝上。若猜对，则猜着赢1元，盖着输1元；若猜错，则猜着输1元，盖着赢1元。假设赢着收益为1，输者收益为-1。,猜硬币游戏,猜硬币游戏,猜硬币方-2,U1z(z,z)=-1U1z(z,f)=1 U1f(f,z)=1 U1f(f,f)=-1U2z(z,z)=-1U2z(f,z)=1 U2f(z,f)=1 U2f(f,f)=-1,Uz= U1z+ U2z=-1+1-1+1=0,Uf= U1f+ U2f=1-1+1-1=0,盖硬币方-1,石头

13、剪子布,博弈方2,博弈方1,周末约会,王菲b,李亚鹏a,Uag(g,g)=2Uag(g,d)=0 Uad(d,g)=-1 Uad(d,d)=1Ubg(g,g)=1Ubg(d,g)=-1 Ubd(g,d)=0 Ubd(d,d)=2,UU= Uag+ Ubg=2+0+1-1=2,Ud= Uad+ Ubd=-1+1+0+2=2,Un= Uan+ Ubn=-1-10-10-1=-22,Uat(t,t)=-8Uat(t,n)=0 Uan(n,t)=-10 Uan(n,n)=-1Ubt(t,t)=-8Ubt(n,t)=0 Ubn(t,n)=-10 Ubn(n,n)=-1,嫌疑人b,嫌疑人a,Ut= Uat

14、+ Ubt=-8+0-8+0=-16,囚徒困境,奖金分配,王菲b,李亚鹏a,5，5,5，5,3，7,7，3,Uag(g,g)=5Uag(g,d)=7 Uad(d,g)=3 Uad(d,d)=5Ubg(g,g)=5Ubg(d,g)=7 Ubd(g,d)=3 Ubd(d,d)=5,Ug= Uag+ Ubg=5+7+5+7=24,Ud= Uad+ Ubd=3+5+3+5=16,Ud= Uad+ Ubd=30+80+30+80=220,Uag(g,g)=50Uag(g,d)=10 Uad(d,g)=80 Uad(d,d)=30Ubg(g,g)=50Ubg(d,g)=10 Ubd(g,d)=80 Ubd

15、(d,d)=30,联通b,移动a,Ug= Uag+ Ubg=50+10+50+10=120,寡头定价,2.2.5 博弈的信息结构,1.关于得益的信息完全信息和不完全信息（1）完全信息（complete information）是指在博弈过程中，每一位博弈方对其他博弈方的特征、策略空间及收益函数有准确的信息。（2）不完全信息（incomplete information）: 如果博弈方对其他博弈方的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有博弈方的特征、策略空间及收益函数都有准确的准确信息，在这种情况下进行的博弈就是不完全信息博弈。也成不对称信息或者信息不对称(asymmetric information),2.关于博弈过程的信息完美信息和不完美信息完美信息（perfect information）:对已经发生的的事情有清楚的了解，称具有完美信息。否则，称为不完美信息（imperfect information）,2.2.6 博弈方的理性与能力,完全理性与有限理性个体理性与集体理性,A国,B国,战争与和平,2.2.7 博弈的类型1,

展开阅读全文