《精编》博弈论与领导干部决策思维

资源描述

《《精编》博弈论与领导干部决策思维》由会员分享，可在线阅读，更多相关《《精编》博弈论与领导干部决策思维（130页珍藏版）》请在金锄头文库上搜索。

1、张泰城博弈论与领导干部决策思维引言 20世纪90年代至2003年诺贝尔经济学奖三次 1994 1996 2001 授予了与博弈论相关的研究领域总共有八位经济学家获奖是获奖人数最多的领域排在第二位的是金融博弈论研究的最大特点一般决策研究数学表达 Y f x1 x2 xn 博弈论的决策研究数学表达 Y f x1 x2 xn z z为他人行为特点决策者目标函数的自变量中包含他人行为严格地讲博弈论是一种方法应用范围不仅包括经济学政治学军事外交国际关系公共选择还有犯罪学都涉及到博弈论实际上不少人把博弈论看成是数学的一个分支纳什1951年的奠基性文章就是发表

2、在数学杂志上夏普里1953年的文章本身也是一篇数学手稿一博弈论基础知识 1 博弈论的基本概念博弈论译自英文 GameTheory 直译游戏理论游戏有下列特征 1 都有规则 2 都有结果赢输平结果能折算成数值 3 都有策略或者说计谋选择不同的策略或计谋往往带来不同的结果 4 策略和利益有相互依存性即每一个游戏者所得结果的好坏不仅取决于自身的策略选择也取决于其他参加者的策略选择策略本身常常没有绝对的好坏之分只有相对于他方策略的相对好坏博弈论也称为对策论其实并不是很恰当因为对策在实际中常被用来表示具体的针对性反应方案或站在某个决策方的立场上找针对其他方

3、的对策博弈论所研究的决策问题却是有开始有次序有结果的整个过程博弈的通俗含意不过是弈棋赌胜但由于它是带有文言性质的词因而显得学术味浓一些既能反映这门学科的特点和实质又给人一种高深莫测的感觉博弈的简明定义博弈即一些个人或其他组织面对一定的环境条件在一定的规则下同时或先后一次或多次从各自允许选择的行为或策略中进行选择并加以实施各自取得相应结果的过程博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题博弈论研究的对象是理性的参与者如何选择策略或如何作出行动的决定使自己的目标最大化 2 构成一个博弈的基本要素博弈的七要素参与人行动信

4、息战略支付函数结果均衡参与人是博弈中选择行动以最大化自己效用的决策主体可以是个人团体等行动是参与人的决策变量战略是参与人选择行动的规则它告诉参与人在什么时候选择什么行动信息指的是参与人在博弈中的知识特别是有关其他参与人对手的特征和行动的知识支付函数是参与人从博弈中获得的效用水平是每个参与人真正关心的东西结果是指博弈分析者感兴趣的要素的集合均衡是所有参与人的最优战略或行动的组合博弈的三要素1 博弈的参加者2 博弈方各自可选择的全部策略或行动的集合3 博弈方的得益 3 博弈的表述形式 1 标准形式策略形式守城弃城攻城退兵诸葛亮司马懿华容道大路

5、华容道大路诸葛亮曹操 2 扩展形式博弈树 3 联盟形式特殊函数形式 4 博弈的类别博弈分类可依不同的判据进行博弈人数单人博弈两人博弈多人博弈策略的数量有限博弈无限博弈得益情况零和博弈常和博弈变和博弈博弈过程静态博弈动态博弈重复博弈信息结构完全信息博弈静动态不完全信息博弈静动态完美信息动态博弈不完美信息动态博弈博弈方的理性和行为逻辑完全理性博弈有限理性博弈合作博弈非合作博弈常见的博弈分类从这个角度博弈可以分为静态博弈和动态博弈静态博弈指的是博弈参与人同时行动或虽非同时但后行动者不知道前行动者采取了什么具体行动动态

6、博弈指的是参与人的行动有先后顺序且后行动者能观察到先行动者所选择的行动 1 参与人行动的先后顺序 2 参与人的信息从这个角度博弈可以分为完全信息博弈和不完全信息博弈完全信息指的是每一个参与人对所有其他参与人对手的特征战略空间及支付函数有准确的知识否则就是不完全信息将上述两个角度的划分结合起来共有四种不同类型的博弈即完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈博弈的分类表二博弈论中的经典分析及启示 1 囚徒困境囚徒困境博弈是1950年图克 Tucker 提出的它非常简单却反映了博弈的根本特征是阐释众多经济社会问题的经典范式

7、警察抓住两个罪犯分别关押并与罪犯讲清如果一人坦白一人抗拒坦白者立即释放抗拒者判刑8年若两人都坦白按律从轻各判5年罪犯知道他们若抗拒警察掌握的证据只能各判1年最后的结果会怎样乙抗拒坦白甲抗拒坦白博弈完全信息分析方法上策均衡严格下策反复消去法画线法箭头法等乙抗拒坦白甲抗拒坦白此博弈的均衡为坦白坦白该均衡就是大名鼎鼎的纳什均衡纳什均衡在对方策略确定的情况下每个参与者的策略都是最好的没有人愿意先改变自己的策略假如博弈中的所有参与人事先达成一项协议这个协议是否可以自动实施若当事人都会自觉遵守这个协议这个协议就构成

8、纳什均衡没有人有积极性偏离协议换句话说如果一个协议不构成纳什均衡它就不可能自动实施因为至少有一个参与人会违背这个协议结论一种制度安排要生效必须是纳什均衡不满足纳什均衡要求的制度没有意义类似囚徒困境应试教育公共产品供给不足修路公寓楼道的路灯卡特尔的内在不稳定性产量限制价格限制商业诚信此博弈的纳什均衡为 3 3 乙诚信欺诈诚信甲欺诈交通规则乙守规违规守规甲违规启示个人理性与集体理性的矛盾冤假错案是怎样产生的个人的最优决策不一定带来集体的最优结果集体的最优结果未必来源于个人的最优决策领导的政绩改变博弈结果的根本方法是改变博弈的支付矩阵囚徒困境的

9、解脱有这样一个博弈此时两者的纳什均衡为不合作不合作奖励假如对采取合作策略的博弈方奖励3 奖励矩阵为最终结果为上述两个矩阵相加博弈的纳什均衡为合作合作解开了囚徒困境惩罚思拉恩埃格特森在新制度经济学中举的例子非洲努埃尔人部落间有两个大家庭X Y 每家拥有同样的武力潜能和侵犯倾向每家拥有相当于10头牛的财产每家都拥有两种策略侵犯对方不侵犯对方博弈表述为纳什均衡为侵犯侵犯双方的收益为 4 4 通过联姻努埃尔人引入了一个惩罚矩阵由于亲戚关系侵犯者遭受成本包括心理成本的损失此时 X Y就由非合作均衡变为合作均衡上述方阵变为 2 赌胜博

10、弈赌胜博弈属于零和博弈的范畴是具有某种对称性的零和博弈猜硬币博弈正面反面抛硬币方正面反面猜硬币方石头剪子布博弈石头剪子布博弈方1 石头剪子布博弈方2 齐威王田忌赛马齐威王上中下田忌上下中中上下中下上下上中下中上上中下下中上上下中中上下中下上下上中以上三个博弈是零和博弈没有纯策略纳什均衡纯策略单一的确定的策略石头剪子布博弈方1 石头剪子布博弈方2 取胜原则保密不泄漏自己的策略避免自己的决策有倾向性让对方琢磨不透混合策略以一定的概率分布在备选策略中随机选取启示当博弈是零和博弈时只有混合策略均衡什么样的决策

11、是科学决策随机决策当面对零和博弈时科学吗 3 警卫与小偷案例1两地巡逻警卫负责A B两地保安 A地财产2万元 B地1万元警卫一次只能在一个地方巡逻小偷一次也只能去一个地方警卫在某地巡逻小偷也去了该地便不会失窃小偷去了警卫没去的地方则偷盗成功警卫怎么巡逻效果最好巡逻A地巡逻B地盗窃A地盗窃B地警卫小偷这个博弈是零和博弈没有纯策略纳什均衡点但有混合策略均衡点当警卫去A地巡逻时小偷有的机会去A地的机会去B地此时 A的得益为 3 2 万元当警卫去B地时同样小偷有的机会去A地的机会去B地此时 B的得益为 1 3 万元警卫总的得益为万元同理

12、我们可得小偷的总的得益为万元警卫的最优策略是掷骰子决定去A地还是B地巡逻掷l 4点去A地掷5 6两点去B地这样警卫有2 3的机会去A地 1 3的机会去B地警卫的期望得益是 7 3大于2 小偷的最优策略是同样掷骰子决定去A地还是B地偷盗掷到1 4点去B地掷5 6两点去A地即小偷有l 3的机会去A地 2 3的机会去B地期望收益为2 3万元启示当博弈是零和博弈时即一方所得是另外一方的所失时只有混合策略均衡博弈方的策略应当是随机的不能让对方知道自己的策略哪怕是倾向性的策略如果对方知道你出其中一个策略的可能性大你失败的可能性就大案例2小偷和守卫此案例

13、为塞尔顿 1994年诺贝尔经济学奖得主 1996年3月在上海讲演中举的例子有一仓库小偷行窃时守卫睡觉可获价值V的财物小偷行窃时守卫没睡觉则被抓被抓后要坐牢效用为 P 守卫睡觉而未遭偷窃有S的效用因睡觉被窃遭解雇得益为 D 小偷不偷守卫无得也无失守卫不睡出一份力挣一份钱也无得失小偷不偷偷守卫睡不睡分析这个博弈不存在纯策略纳什均衡小偷的策略 D Pt Pt S 0 守卫得益睡小偷偷的概率 1 小偷有偷与不偷两种策略图中横轴表示小偷选择偷的概率Pt 不偷的概率等于1 Pt 守卫的策略 P Pg Pg S 0 小偷得益偷守卫睡的概率

14、1 V 守卫有睡与不睡的策略其概率分布也可用图表示激励悖论政策目标和政策结果的意外关系 P Pg Pg S 0 小偷得益偷守卫睡的概率 1 V Pg P 加重对小偷的惩罚相当于 P向下移动到 P 短期内小偷会停止偷窃但长期中小偷减少偷窃会使守卫更多地选择睡觉加重对小偷惩罚的主要作用是守卫可以更多地偷懒 D Pt Pt S 0 守卫得益睡小偷偷的概率 1 Pt D 加重对失职守卫的处罚意味着D增大到D 短期效果是守卫更加尽职长期中的真正作用恰恰是会降低盗窃发生的概率启示怎样避免激励悖论 4 情侣博弈性别战一对情侣男的爱看足球女的爱看芭蕾

15、都愿共度周末其博弈表述为有两个纳什均衡足球足球芭蕾芭蕾究竟哪一个会发生不知道男足球芭蕾足球芭蕾女启示先动优势后动优势甲有先动优势先选B策略稳得10 乙有后动优势最好让A先选乐得100 甲 A B C D 乙斗鸡博弈两只斗鸡相遇或进或退双方都前进两败俱伤一方前进一方后退前进者胜利后退者丢面子都后退都丢面子博弈表述为鸡甲前进后退前进后退鸡乙此博弈有两个纳什均衡一方前进一方后退结果无法预测例子 20世纪60年代的古巴导弹危机夫妻矛盾 5 智猪博弈猪圈里有一大一小两头猪食槽在一头按钮在另一头按一次有10

16、个单位食品进入食槽但按者要支付2个单位若同时按同时跑向食槽各支付2个单位大猪吃7个单位小猪吃3个单位大猪按小猪坐吃大猪吃6个单位支付2个单位小猪吃4个单位小猪按大猪坐吃大猪吃9 小猪吃1 支付2个单位都坐等都没吃小猪等按大猪等按智猪博弈扣除支付此博弈的纳什均衡大猪按小猪坐吃 4 4 启示多劳并不多得要推动工作就要想办法找到大猪若你是大猪做了好不仅不要想得好还要能受委屈大德无名 6 海滩占位博弈霍特林模型有一海滩日光浴场均匀地散布着许多日光浴者有A与B两个小贩以同样的价格质量向日光浴者提供同一品牌的矿泉水在直线状的海滩上他们会如何选择自己的摊位点呢海滩占位设海滩的长度为l 图中 0 1 线段表示海滩号代表日光浴者由于日光浴者总是到距自己最近的摊位购买矿泉水理想的摊位点如下 A在1 4处 B在3 4处这样既方便了日光浴者 A B两人又平分市场可谓皆大欢喜然而理性的小贩A会想如果我将摊位往B那儿挪动至A 位置那么从0至A 范围内的人显然是我的顾客而A 与B之间的中点将从原来的1 2处

展开阅读全文