博弈论1纯策略

上传人:cl****1 文档编号:569367841 上传时间:2024-07-29 格式:PPT 页数:29 大小:195.50KB
返回 下载 相关 举报
博弈论1纯策略_第1页
第1页 / 共29页
博弈论1纯策略_第2页
第2页 / 共29页
博弈论1纯策略_第3页
第3页 / 共29页
博弈论1纯策略_第4页
第4页 / 共29页
博弈论1纯策略_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《博弈论1纯策略》由会员分享,可在线阅读,更多相关《博弈论1纯策略(29页珍藏版)》请在金锄头文库上搜索。

1、博弈论与市场竞争策略博弈论与市场竞争策略11994年诺贝尔经济学奖年诺贝尔经济学奖约翰纳什John F. Nash b.1928, developed an equilibrium concept for non-cooperative games that later came to be called Nash equilibrium 约翰海萨尼John C. Harsanyi b.1920 showed how games of incomplete information can be analyzed R泽尔腾einhard Selten,b.1930 first to refine

2、 the Nash equilibrium concept for analyzing dynamic strategic interaction.2for their pioneering analysis of equilibria in the theory of non-cooperative games. Since then game theory has be taken as the Foundation for Understanding Complex Economic Issues3一、博弈论的基本理论框架一、博弈论的基本理论框架41/博弈论的理论意义与特征博弈论的理论意

3、义与特征古典经济学:根据资源稀缺性配置资源的科学,价格是资源稀缺性的信号,由此对经济行为进行成本收益分析,MRMC实现利润最大化 忽视了他人决策对彼此经济利益的影响制度经济学: 科斯:对人之间的交易过程的成本收益分析 诺斯:对交易过程的制度环境进行分析,包括制度约束与制度变迁与交易过程的关系5古典经济学及制度经济学的缺点古典经济学及制度经济学的缺点都是边际成本收益分析理论,但人们选择的对象不是最小交易成本,而是根据对方行动方案进行行为选择孤立地分析行为者边际收益与成本,而未分析他人行动对此行为者的影响,只适合于利益无关者的利益分析于是出现分析利利益益相相关关者者的的策略选择理论博弈论6由此形成

4、博弈论对经济学的贡献:肖特:价格只提供社会资源稀缺性的机制,而经济决策还需要了解人们各种可能经济行为的信息,及其产生的后果博弈论研究利益相关者的策略选择的相互影响的利益函数,研究人的行为及其形成的制度 从博弈论的角度看世界:整个社会生活是人们的策略选择及其相互影响的过程,也即博弈过程。实际生活中的博弈如市场竞争、高考填报志愿、买卖股票、家庭生活等等一切人们之间相互影响的过程,无所不包72/博弈论基本要素博弈论(博弈论(Game Theory):各方在游戏规则规定下的):各方在游戏规则规定下的理性行为的理论。三大基本要素:理性行为的理论。三大基本要素:1.参加者(选择者)。用1,2, 表示;2.

5、选择对象与范围:策略空间,策略组合:每方可能采取的策略是被选择对象。被选择对象的总体构成其策略空间。用S1, S2, S3表示;所有各方都采取了某种策略后,构成策略组合(strategy profile);3. 利益函数:第 i个参加者的利益函数ui 为其在一定的策略组合中得到的利益收益矩阵(payoff matrix,又称“支付矩阵”):所有策略组合中各方所得的收益组成的矩阵8参加者、策略空间与利益函数三者构成博弈信息。以此为标准划分:1. 完全信息博弈:各参加者对以上三类信息都了解,据此选择自己的博弈策略;2. 不完全信息博弈:各参加者在对上述三类信息不充分了解的的博弈行为根据参加者博弈行

6、为的先后次序关系分为:根据参加者博弈行为的先后次序关系分为:1.静静态态博博弈弈:各各方方同同时时选选择择策策略略,其其间间无无先先后因果关系;后因果关系;2.动动态态博博弈弈:各各方方根根据据他他人人已已选选策策略略来来确确定定自身采取的策略。自身采取的策略。博弈基本类型博弈基本类型9完全信息静态博弈完全信息静态博弈 游游戏戏各各方方在在完完全全知知道道博博弈弈过过程程的的三三大大要要素的情况下同时选择策略素的情况下同时选择策略不完全信息静态博弈(高考填报志愿)不完全信息静态博弈(高考填报志愿)完全信息动态博弈(走象棋、围棋)完全信息动态博弈(走象棋、围棋) 游游戏戏各各方方的的完完全全知知

7、识识博博弈弈过过程程的的三三大大要要素的情况下,相继作出策略选择素的情况下,相继作出策略选择不完全信息动态博弈(国际市场竞争)不完全信息动态博弈(国际市场竞争)由此交叉形成四种博弈类型:由此交叉形成四种博弈类型:10矩矩阵阵的的每每个个位位置置显显示示每每个个参参加加者者的的每每个个策略组合,此位置即一博弈格局策略组合,此位置即一博弈格局每每个个博博弈弈格格局局上上列列出出每每个个参参加加者者的的利利益益函数,于是得到函数,于是得到payoff matrix ,例如,例如: 企业企业2 价格不变价格不变 涨价涨价利益函数与利益函数与payoff matrix(收益矩阵,又译收益矩阵,又译为为“

8、支付矩阵)支付矩阵)140, 25-20, 30100, -3010, 10企业1价格不变 涨价11二、纯博弈(确定性博弈)12 纳什均衡Nash:一个数学天才,诺贝尔经济学奖得主,美国大片Beautiful Mind 主人翁纳什均衡:在完全信息静态博弈中各方都实现个利益最大化的策略组合状态纯策略:假定每个参加者每次只选择一个策略进行博弈混合策略:每个参加者每次按照各种几率选择不同策略进行博弈,如监督博弈13二、博弈案例二、博弈案例1:占优策略与劣策略:占优策略与劣策略(dominant strategy and dominated strategy)课本上译为课本上译为“支配性策略支配性策略

9、”与与“被支配策略被支配策略”141/1/支配性策略支配性策略(dominant strategy,占优策略占优策略) )下的纳什均衡下的纳什均衡 不不论论对对方方采采取取何何种种策策略略时时,某某一一策策略略均均为为最最优优策策略略,则此策略为占优策略。则此策略为占优策略。 如:如: 企业企业2 价格不变价格不变 涨价涨价140, 25-20, 30100, -3010, 10企业1价格不变 涨价企业1价格不变:10-30,企业2应当选择“价格不变”企业1涨价: 3025,企业2应当选择“价格不变”结论:结论:“价格不变价格不变”是企业是企业2的占优策略,企业的占优策略,企业1在决策时必须以

10、此为前提在决策时必须以此为前提15双方占优策略下的纳什均衡:囚徒困境双方占优策略下的纳什均衡:囚徒困境博弈各方都有占优策略,形成纳什均衡,例如:甲乙两个同案犯(抢劫与过失杀人,各自策略空间为(坦白、抵赖),其利益函数用表中所填被判年数: 乙甲坦白(不合作)抵赖(合作)坦白(不合作)10, 100, 15抵赖(合作)15, 02, 2甲方占优策略:乙坦白,因-10-15,故坦白为利益最大策略。乙抵赖,因0-2,坦白亦利益最大。故坦白为占优策略。乙方占优策略也为坦白。二者组合构成纳什均衡态。 16对亚当斯密“看不见的手”的挑战亚当斯密:个人自利的理性会被“看不见的手”自动纳入增进社会集体福利的轨道

11、纳什说:不!相互影响的集体中各个部分如果不合作而只追求自身利益最大化,将使整个集体陷入到最不利的纳什均衡态。必须使用某种力量来约束个人的自利行为,每个人作出适当牺牲,才能实现集体利益最大化亚当斯密“看不见的手”实际上是用资源总量控制对人们行为的经济约束市场约束,一旦此约束失效,当有其他约束来补充(道德与权力)17囚徒悖论的实践结果囚徒悖论的实践结果与亚当与亚当斯密斯密“看不见的手看不见的手”相矛盾,市场经济相矛盾,市场经济下处处充满集体理性与个体理性之冲突:下处处充满集体理性与个体理性之冲突:污染问题:企业面临的污染问题:企业面临的“囚徒困境囚徒困境”公用地悲剧:长江中的鱼虾为何越来越小?公用

12、地悲剧:长江中的鱼虾为何越来越小?价格战问题(寡头垄断模型):价格卡特尔困境价格战问题(寡头垄断模型):价格卡特尔困境超市布点问题:为什么超市会集中在一起?资源超市布点问题:为什么超市会集中在一起?资源配置不经济配置不经济为什么有人见义不勇为?为什么有人见义不勇为?诚实纳税的企业为什么吃亏?因为大家都不诚实诚实纳税的企业为什么吃亏?因为大家都不诚实18克服纳什悖论的基本途径:制度约束克服纳什悖论的基本途径:制度约束道德约束:使人们在社会舆论与社会公道德约束:使人们在社会舆论与社会公德压力下按照集体理性的行为(例如朋德压力下按照集体理性的行为(例如朋友义气等等)友义气等等)规则约束:使人们行为服

13、从集体理性的规则约束:使人们行为服从集体理性的要求,对违背者处罚。如:对不诚实纳要求,对违背者处罚。如:对不诚实纳税者受社会信用机制的处罚,建立休渔税者受社会信用机制的处罚,建立休渔期,制止倾销价期,制止倾销价二者相结合将起到好结果二者相结合将起到好结果19如何制定规则来约束如何制定规则来约束世界上有两种符合集体利益的正义:世界上有两种符合集体利益的正义: 实质正义与规则正义。实质正义必须通过实质正义与规则正义。实质正义必须通过规则正义来实现,否则将被虚置。因此规规则正义来实现,否则将被虚置。因此规则正义最重要。则正义最重要。分蛋糕或分粥故事:分蛋糕或分粥故事: 20个人的小集体,个人的小集体

14、,每天吃粥。如果所有人抡吃,导致纳什悖每天吃粥。如果所有人抡吃,导致纳什悖论:每人早早来等粥,成本极高,对谁都论:每人早早来等粥,成本极高,对谁都不利。不利。怎样制定规则,使分粥最公平?怎样制定规则,使分粥最公平?202/重复性博弈下的策略:重复性博弈下的策略: 对看不见的手的辩护对看不见的手的辩护以上纳什均衡是一次性博弈,参加者仅仅以上纳什均衡是一次性博弈,参加者仅仅从当次利益最大化出发,导致悖论从当次利益最大化出发,导致悖论如果是重复博弈,参加者不仅要考虑眼前如果是重复博弈,参加者不仅要考虑眼前利益,还要考虑其行为所引起的未来后果,利益,还要考虑其行为所引起的未来后果,也即对方的反应。也即

15、对方的反应。Robert Axelrod用请众多博弈论专家用计用请众多博弈论专家用计算机进行博弈表明:针锋相对是正确策略。算机进行博弈表明:针锋相对是正确策略。作用:简单易行;使行为者不敢先行欺骗;作用:简单易行;使行为者不敢先行欺骗;除非其希望合同瓦解;欺骗行为受到惩罚;除非其希望合同瓦解;欺骗行为受到惩罚;诚实行为得到回报。诚实行为得到回报。213/劣策略(劣策略(dominated strategy)下的纳什均下的纳什均衡。累次取优方法。智猪博弈衡。累次取优方法。智猪博弈不不论论对对方方采采取取何何种种策策略略其其利利益益函函数数都都最最小小的的策策略略称称劣劣策策略略(dominate

16、d strategy),因因而而是是必必须须淘淘汰的策略汰的策略“累累次次取取优优”方方法法:每每一一步步决决策策都都要要剔剔除除自自己己和和对方的劣策略,从而作出策略选择对方的劣策略,从而作出策略选择这这种种博博弈弈常常常常发发生生在在博博弈弈各各方方不不对对称称的的情情况况下下。例如双方存在例如双方存在“主从关系主从关系”例子:智猪博弈例子:智猪博弈22智猪博弈智猪博弈:题:大猪与小猪必须先踩猪圈一头之杠杆,才题:大猪与小猪必须先踩猪圈一头之杠杆,才能放出能放出8斤食物,到猪圈另一头进食。踩杠需斤食物,到猪圈另一头进食。踩杠需耗食耗食1斤。如小猪踩,则跑到另一头后后大猪斤。如小猪踩,则跑到

17、另一头后后大猪已将已将8斤吃光;如大猪踩,则小猪已吃斤吃光;如大猪踩,则小猪已吃3斤,斤,大猪可吃大猪可吃5斤。问纳什均衡点为何。斤。问纳什均衡点为何。 小猪大猪不劳动(不合作)劳动(合作)不劳动(不合作)0,08, 1劳动(合作)(51), 3(5-1), (3-1)23智猪博弈的社会事例:拖欠工资时,谁积极讨回工资,谁坐享其成?要举办某项大家都得利的集体活动,但要付出成本。谁会“伸头”承办?市场竞争中,哪些企业最关心全行业利益?国际联盟中,哪些国家会积极维护联盟集体利益?智猪博弈智猪博弈是此类博弈的典型。24智猪博弈智猪博弈的实际意义一个联盟如果由对称的成员组成,其最容易形成“囚徒困境”,

18、个人理性导致集体非理性,不是一个值得信赖的联盟。一个联盟的行为要遵循集体理性,应当由不对称成员组成,其主要成员的个体理性与联盟集体理性趋向一致,作为“家长”负责任。例:沙特与欧佩克。沙特如果违背集体协议,整个欧佩克将解体。25讨论:防止全行业亏损的恶性竞争的根本途径是什么? 建立“主从型”寡头垄断产业结构(但要防止完全垄断)。可以防止企业间恶性价格战股市:全是散户好,还是庄家-散户结构好? 在不允许制造虚假信息的前提下,后者好。因为大户最关心该企业的真实运行状况。联合国安理会为什么要设常任理事国?因为大国与世界整体利益关系最大中国产业结构最大问题是什么? 小而分散,对全行业、全社会不承担责任。264/两个纳什均衡的博弈: 斗鸡博弈(chicken Game)题:两人相对过独木桥。两人都强硬要先过,必落水,效用为(-1,-1);两人都软弱谦让,无人过桥,效用为(0,0);一人硬一人软,则效用为(2,1)。 甲乙强硬(不合作)软弱(合作)强硬(不合作)1,11, 2软弱(合作)2, 10, 027斗鸡博弈的实际意义:困难:强硬者得益多,软弱者得益少,但都强硬大家都不得益。许多现实事例类似于此博弈:1.交通堵塞;2.夫妻吵架,朋友吵架;3.职务晋升;社会需要用法律与道德制约强硬者:制定优先次序与奖励谦让者2829

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号