《精编》博弈论与领导干部决策思维

上传人:tang****xu5 文档编号:133372717 上传时间:2020-05-26 格式:PPT 页数:130 大小:1.10MB
返回 下载 相关 举报
《精编》博弈论与领导干部决策思维_第1页
第1页 / 共130页
《精编》博弈论与领导干部决策思维_第2页
第2页 / 共130页
《精编》博弈论与领导干部决策思维_第3页
第3页 / 共130页
《精编》博弈论与领导干部决策思维_第4页
第4页 / 共130页
《精编》博弈论与领导干部决策思维_第5页
第5页 / 共130页
点击查看更多>>
资源描述

《《精编》博弈论与领导干部决策思维》由会员分享,可在线阅读,更多相关《《精编》博弈论与领导干部决策思维(130页珍藏版)》请在金锄头文库上搜索。

1、张泰城 博弈论与领导干部决策思维 引言 20世纪90年代至2003年 诺贝尔经济学奖三次 1994 1996 2001 授予了与博弈论相关的研究领域 总共有八位经济学家获奖 是获奖人数最多的领域 排在第二位的是金融 博弈论研究的最大特点一般决策研究 数学表达 Y f x1 x2 xn 博弈论的决策研究 数学表达 Y f x1 x2 xn z z为他人行为 特点 决策者目标函数的自变量中包含他人行为 严格地讲 博弈论是一种方法 应用范围不仅包括经济学 政治学 军事 外交 国际关系 公共选择 还有犯罪学 都涉及到博弈论 实际上 不少人把博弈论看成是数学的一个分支 纳什1951年的奠基性文章就是发表

2、在数学杂志上 夏普里1953年的文章本身也是一篇数学手稿 一 博弈论基础知识 1 博弈论的基本概念 博弈论 译自英文 GameTheory 直译 游戏理论 游戏有下列特征 1 都有规则 2 都有结果 赢 输 平 结果能折算成数值 3 都有策略或者说计谋 选择不同的策略或计谋往往带来不同的结果 4 策略和利益有相互依存性 即每一个游戏者所得结果的好坏 不仅取决于自身的策略选择 也取决于其他参加者的策略选择 策略本身常常没有绝对的好坏之分 只有相对于他方策略的相对好坏 博弈论也称为 对策论 其实并不是很恰当 因为 对策 在实际中常被用来表示具体的针对性反应方案 或站在某个决策方的立场上找针对其他方

3、的对策 博弈论所研究的决策问题却是有开始 有次序 有结果的整个过程 博弈 的通俗含意不过是弈棋 赌胜 但由于它是带有文言性质的词 因而显得学术味浓一些 既能反映这门学科的特点和实质 又给人一种高深莫测的感觉 博弈的简明定义 博弈即一些个人或其他组织 面对一定的环境条件 在一定的规则下 同时或先后 一次或多次 从各自允许选择的行为或策略中进行选择并加以实施 各自取得相应结果的过程 博弈论 是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题 博弈论研究的对象是理性的参与者如何选择策略或如何作出行动的决定 使自己的目标最大化 2 构成一个博弈的基本要素 博弈的七要素参与人 行动 信

4、息 战略 支付函数 结果 均衡 参与人是博弈中选择行动以最大化自己效用的决策主体 可以是个人 团体等 行动是参与人的决策变量 战略是参与人选择行动的规则 它告诉参与人在什么时候选择什么行动 信息指的是参与人在博弈中的知识 特别是有关其他参与人 对手 的特征和行动的知识 支付函数是参与人从博弈中获得的效用水平 是每个参与人真正关心的东西 结果是指博弈分析者感兴趣的要素的集合 均衡是所有参与人的最优战略或行动的组合 博弈的三要素1 博弈的参加者2 博弈方各自可选择的全部策略或行动的集合3 博弈方的得益 3 博弈的表述形式 1 标准形式 策略形式 守城 弃城 攻城 退兵 诸葛亮 司马懿 华容道 大路

5、 华容道 大路 诸葛亮 曹操 2 扩展形式 博弈树 3 联盟形式 特殊函数形式 4 博弈的类别 博弈分类可依不同的判据进行 博弈人数 单人博弈 两人博弈 多人博弈 策略的数量 有限博弈 无限博弈 得益情况 零和博弈 常和博弈 变和博弈 博弈过程 静态博弈 动态博弈 重复博弈 信息结构 完全信息博弈 静 动态 不完全信息博弈 静 动态 完美信息动态博弈 不完美信息动态博弈 博弈方的理性和行为逻辑 完全理性博弈 有限理性博弈 合作博弈 非合作博弈 常见的博弈分类 从这个角度 博弈可以分为静态博弈和动态博弈 静态博弈指的是博弈参与人同时行动 或虽非同时但后行动者不知道前行动者采取了什么具体行动 动态

6、博弈指的是参与人的行动有先后顺序 且后行动者能观察到先行动者所选择的行动 1 参与人行动的先后顺序 2 参与人的信息 从这个角度 博弈可以分为完全信息博弈和不完全信息博弈 完全信息指的是每一个参与人对所有其他参与人 对手 的特征 战略空间及支付函数有准确的知识 否则 就是不完全信息 将上述两个角度的划分结合起来 共有四种不同类型的博弈 即 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈 博弈的分类表 二 博弈论中的经典分析及启示 1 囚徒困境 囚徒困境 博弈是1950年图克 Tucker 提出的 它非常简单 却反映了博弈的根本特征 是阐释众多经济社会问题的经典范式

7、警察抓住两个罪犯 分别关押 并与罪犯讲清 如果一人坦白 一人抗拒 坦白者立即释放 抗拒者判刑8年 若两人都坦白 按律从轻各判5年 罪犯知道 他们若抗拒 警察掌握的证据只能各判1年 最后的结果会怎样 乙 抗拒 坦白 甲 抗拒 坦白 博弈 完全信息 分析方法 上策均衡 严格下策反复消去法 画线法 箭头法等 乙 抗拒 坦白 甲 抗拒 坦白 此博弈的 均衡 为 坦白 坦白 该均衡就是大名鼎鼎的 纳什均衡 纳什均衡 在对方策略确定的情况下 每个参与者的策略都是最好的 没有人愿意先改变自己的策略 假如博弈中的所有参与人事先达成一项协议 这个协议是否可以自动实施 若当事人都会自觉遵守这个协议 这个协议就构成

8、纳什均衡 没有人有积极性偏离协议 换句话说 如果一个协议不构成纳什均衡 它就不可能自动实施 因为至少有一个参与人会违背这个协议 结论 一种制度安排要生效 必须是纳什均衡 不满足纳什均衡要求的制度没有意义 类似囚徒困境应试教育公共产品供给不足 修路 公寓楼道的路灯 卡特尔的内在不稳定性产量限制 价格限制 商业诚信 此博弈的纳什均衡为 3 3 乙诚信欺诈 诚信甲欺诈 交通规则 乙守规违规 守规甲违规 启示 个人理性与集体理性的矛盾 冤假错案是怎样产生的 个人的最优决策不一定带来集体的最优结果 集体的最优结果未必来源于个人的最优决策 领导的政绩 改变博弈结果的根本方法是改变博弈的支付矩阵 囚徒困境的

9、解脱 有这样一个博弈 此时 两者的纳什均衡为 不合作 不合作 奖励 假如对采取 合作 策略的博弈方奖励3 奖励矩阵为 最终结果为上述两个矩阵相加 博弈的纳什均衡为 合作 合作 解开了囚徒困境 惩罚 思拉恩 埃格特森在 新制度经济学 中举的例子 非洲努埃尔人部落间有两个大家庭X Y 每家拥有同样的武力潜能和侵犯倾向 每家拥有相当于10头牛的财产 每家都拥有两种策略 侵犯对方 不侵犯对方 博弈表述为 纳什均衡为 侵犯 侵犯 双方的收益为 4 4 通过联姻 努埃尔人引入了一个惩罚矩阵 由于亲戚关系 侵犯者遭受成本 包括心理成本 的损失 此时 X Y就由非合作均衡变为合作均衡 上述方阵变为 2 赌胜博

10、弈 赌胜博弈属于 零和博弈 的范畴 是具有某种对称性的零和博弈 猜硬币博弈 正面反面 抛硬币方 正面反面 猜硬币方 石头 剪子 布博弈 石头剪子布 博弈方1 石头剪子布 博弈方2 齐威王 田忌赛马 齐威王 上中下 田忌 上下中 中上下 中下上 下上中 下中上 上中下 下中上 上下中 中上下 中下上 下上中 以上三个博弈是零和博弈 没有纯策略纳什均衡 纯策略 单一的确定的策略 石头剪子布 博弈方1 石头剪子布 博弈方2 取胜原则 保密 不泄漏自己的策略 避免自己的决策有倾向性 让对方琢磨不透 混合策略 以一定的概率分布在备选策略中随机选取 启示 当博弈是零和博弈时 只有混合策略均衡 什么样的决策

11、是科学决策 随机决策 当面对零和博弈时 科学吗 3 警卫与小偷 案例1两地巡逻 警卫负责A B两地保安 A地财产2万元 B地1万元 警卫一次只能在一个地方巡逻 小偷一次也只能去一个地方 警卫在某地巡逻 小偷也去了该地 便不会失窃 小偷去了警卫没去的地方 则偷盗成功 警卫怎么巡逻效果最好 巡逻A地 巡逻B地 盗窃A地 盗窃B地 警卫 小偷 这个博弈是零和博弈 没有纯策略纳什均衡点 但有混合策略均衡点 当警卫去A地巡逻时 小偷有的机会去A地 的机会去B地 此时 A的得益为 3 2 万元 当警卫去B地时 同样小偷有的机会去A地 的机会去B地 此时 B的得益为 1 3 万元 警卫总的得益为 万元 同理

12、 我们可得小偷的总的得益为万元 警卫的最优策略是 掷骰子决定去A地还是B地巡逻 掷l 4点去A地 掷5 6两点去B地 这样警卫有2 3的机会去A地 1 3的机会去B地 警卫的期望得益是 7 3大于2 小偷的最优策略是 同样掷骰子决定去A地还是B地偷盗 掷到1 4点去B地 掷5 6两点去A地 即小偷有l 3的机会去A地 2 3的机会去B地 期望收益为2 3万元 启示 当博弈是零和博弈时 即一方所得是另外一方的所失时 只有混合策略均衡 博弈方的策略应当是随机的 不能让对方知道自己的策略 哪怕是 倾向性 的策略 如果对方知道你出其中一个策略的 可能性 大 你失败的可能性就大 案例2小偷和守卫 此案例

13、为塞尔顿 1994年诺贝尔经济学奖得主 1996年3月在上海讲演中举的例子 有一仓库 小偷行窃时守卫睡觉 可获价值V的财物 小偷行窃时守卫没睡觉 则被抓 被抓后要坐牢 效用为 P 守卫睡觉而未遭偷窃有S的效用 因睡觉被窃遭解雇 得益为 D 小偷不偷 守卫无得也无失 守卫不睡 出一份力挣一份钱 也无得失 小偷 不偷 偷 守卫 睡 不睡 分析 这个博弈不存在纯策略纳什均衡 小偷的策略 D Pt Pt S 0 守卫得益 睡 小偷偷的概率 1 小偷有 偷 与 不偷 两种策略 图中横轴表示小偷选择 偷 的概率Pt 不偷 的概率等于1 Pt 守卫的策略 P Pg Pg S 0 小偷得益 偷 守卫睡的概率

14、1 V 守卫有 睡 与 不睡 的策略 其概率分布也可用图表示 激励悖论 政策目标和政策结果的意外关系 P Pg Pg S 0 小偷得益 偷 守卫睡的概率 1 V Pg P 加重对小偷的惩罚 相当于 P向下移动到 P 短期内小偷会停止 偷 窃 但长期中 小偷减少 偷 窃会使守卫更多地选择 睡 觉 加重对小偷惩罚的主要作用是守卫可以更多地偷懒 D Pt Pt S 0 守卫得益 睡 小偷偷的概率 1 Pt D 加重对失职守卫的处罚 意味着D增大到D 短期效果是守卫更加尽职 长期中的真正作用 恰恰是会降低盗窃发生的概率 启示 怎样避免激励悖论 4 情侣博弈 性别战 一对情侣 男的爱看足球 女的爱看芭蕾

15、 都愿共度周末 其博弈表述为 有两个纳什均衡 足球 足球 芭蕾 芭蕾 究竟哪一个会发生 不知道 男 足球 芭蕾 足球 芭蕾 女 启示 先动优势 后动优势 甲有先动优势 先选B策略 稳得10 乙有后动优势 最好让A先选 乐得100 甲 A B C D 乙 斗鸡博弈 两只斗鸡相遇 或进或退 双方都前进 两败俱伤 一方前进 一方后退 前进者胜利 后退者丢面子 都后退 都丢面子 博弈表述为 鸡甲 前进 后退 前进 后退 鸡乙 此博弈有两个纳什均衡 一方前进 一方后退 结果无法预测 例子 20世纪60年代的古巴导弹危机夫妻矛盾 5 智猪博弈 猪圈里有一大一小两头猪 食槽在一头 按钮在另一头 按一次有10

16、个单位食品进入食槽 但按者要支付2个单位 若同时按 同时跑向食槽 各支付2个单位 大猪吃7个单位 小猪吃3个单位 大猪按 小猪坐吃 大猪吃6个单位 支付2个单位 小猪吃4个单位 小猪按 大猪坐吃 大猪吃9 小猪吃1 支付2个单位 都坐等 都没吃 小猪 等 按 大猪 等 按 智猪博弈 扣除支付 此博弈的纳什均衡 大猪按 小猪坐吃 4 4 启示 多劳并不多得 要推动工作 就要想办法找到 大猪 若你是 大猪 做了好不仅不要想得好 还要能受委屈 大德无名 6 海滩占位博弈 霍特林模型 有一海滩日光浴场 均匀地散布着许多日光浴者 有A与B两个小贩 以同样的价格 质量向日光浴者提供同一品牌的矿泉水 在直线状的海滩上他们会如何选择自己的摊位点呢 海滩占位 设海滩的长度为l 图中 0 1 线段表示海滩 号代表日光浴者 由于日光浴者总是到距自己最近的摊位购买矿泉水 理想的摊位点如下 A在1 4处 B在3 4处 这样既方便了日光浴者 A B两人又平分市场 可谓皆大欢喜 然而 理性的小贩A会想 如果我将摊位往B那儿挪动至A 位置 那么从0至A 范围内的人显然是我的顾客 而A 与B之间的中点将从原来的1 2处

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号