文档详情

补充内容博弈决策概要

ni****g
实名认证
店铺
DOC
207.50KB
约26页
文档ID:451252000
补充内容博弈决策概要_第1页
1/26

§6 博弈决策概要博弈决策指以博弈理论为指引进行决策,其重要特点是决策时要考虑竞争对手的竞争方略论述博弈理论的学科称博弈论(game theory),博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯•诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and Economic Behavior)一书,最早提出了博弈论的概念现代博弈论则是由纳什(Nash, John F.)、海萨尼(Harsany, John C.)、泽尔腾(Selten, Reinhard)、夏普利(Sharpley, Lloyd S.)等人发展起来的,1994年的诺贝尔经济学奖就授予了前三位经济学家目前,博弈论已经成为现代经济学的基本分析工具之一,并且应用到了政治、经济、军事、社会、自然科学等各个领域6.1博弈论基本概念博弈是一种对抗性竞争行为,如下棋、打牌、比赛,等等,是我们政治、军事、经济和生活中常用的一种行为。

1博弈现象例1:“齐王赛马”春秋战国时期,齐王和田忌各有“上、中、下”三级别赛马,齐王的马比田忌的同级别马要略胜一筹,但齐王的“中、下”级马跑但是田忌的“上、中”级马 问比赛双方采用何种方略为宜?例2:“价格联盟”6月,国内九大彩电公司结盟深圳,商定共同提高彩电零售价格之后,又有空调价格联盟、民航机票价格联盟、电脑价格联盟,证券佣金价格联盟等等但这些“联盟”均先后解体价格联盟能提高有关公司利润,为什么联盟方略不能持续?例3:“搭便车”中国股市“非流通股股改”过程中,大小股东对“对价”往往不能达到一致意见,影响股改善程,使自身利益受损问大小股东的对的方略是什么?注:“搭便车现象”是奥尔森专家(1965)在《集体行动的逻辑:公共利益和团队理论》一书中提出的,是指在集体行动中,个人支付成本获得的收益被集体中的其她成员免费分享的现象由于个人支付所有成本而只享有较少的收益分额因而集体中的理性个人没有动力去提供公共物品2博弈概念1)定义博弈即某些个人或组织,在一定环境条件下,按一定规则,同步或先后,一次或多次,从各自容许选择的行为或方略中进行选择并加以实行,各自获得相应成果的过程例“囚徒困境”A、B二犯罪嫌疑人因在超市盗窃被抓现行,法院调查确信A、B二人系合伙累犯,但无本来犯罪的定案证据不能定罪。

二嫌犯是惯犯,懂得这个法律规定,故只承认被抓现行的这次盗窃行为,这个盗窃罪依法只能判2年为使二犯受到应有的惩罚,检方当二人面说:坦白从宽,抗拒从严!如坦白交待所有罪行,从宽判1年;如抗拒不交待,被另一人坦白检举,将重判;如二人都坦白将各判6年然后将二人分开关押审讯问二嫌疑人的合理选择是什么?“囚徒困境”中二囚犯互相间构成一种博弈,即坦白还是抵赖的选择问题2)博弈的要素构建一种博弈,需要如下基本要素:(1)局中人(参与者)(players):每局博弈至少有两个参与者,如二囚犯;(2)行动集(action set):规定每个参与者可以采用的行动的集合,如坦白,抵赖;(3)时序(playing sequence):游戏规则中规定的每个参与者决策的先后顺序局中人共享信息同步行动称静态博弈;局中人一方在理解对方行动后再行动称动态博弈例中二囚徒分开,不知对方选择,可觉得是同步行动;(4)方略(strategies):方略是局中人在一局博弈中的一套完整的行动筹划方略与行动不同,方略涉及信息例如囚徒困境,每个局中人的行动只有两种:坦白,抵赖但方略就涉及:(坦白,抵赖)、(抵赖,抵赖)、(抵赖,坦白)、(坦白,坦白)四种。

尽管最后的均衡是(坦白,坦白),但方略有四种方略告诉局中人,在每一种可预见的状况下选择什么行动如:在预见“一方宽判1年,对方判”的状况下,局中人选择的行动是:坦白(一方),抵赖(对方)5)得益(payoffs):局中人在不同状况下所得到的效用如局中人二囚犯A、B在选择“坦白、抵赖”行动状况下,A、B的得益是(-1 ,-10)6)信息(information):局中人决策所根据的信息如坦白和抵赖所导致的多种刑期信息分为完全信息和不完全信息在完全信息中,局中人在决策时懂得在此之前的所有信息,并且局中人A懂得局中人B懂得所有信息,并且局中人A懂得局中人B懂得局中人A懂得所有信息,如此以至无穷例如下棋在不完全信息中,局中人不懂得与博弈有关的所有信息例如猜“石头——剪刀——布”的游戏7)均衡(equilibria):均衡是所有局中人选用的最佳方略所构成的方略组合如(坦白、坦白)在上述要素中,局中人、行动集、时序、方略、得益和信息规定了一局博弈的游戏规则3)博弈论研究内容参见图6-1 博弈论内容体系图图6-1博弈论内容体系图3博弈决策思想与经济学决策思想的区别博弈决策与老式经济学决策不同,其重要区别如表6-1表6-1博弈决策思想与经济学决策思想的重要区别表6-1博弈决策经济学决策决策约束条件行动、方略、得益与博弈对手的也许方略。

如收益率、价格、成本、等等决策目的基于个体“理性”的行为主体利益最大化,谋求行为主体的最佳方略基于个体“理性”的行为主体利益最大化,谋求行为主体的满意方案决策思路针对竞争对手方略的最佳方略比较各方案的综合经济效益重要特性重要考察竞争对手方略及互相方略组合,考察对象具主观随机性重要考察环境变量,考察对象具相对客观稳定性合用特点合用于面向主观选择的竞争性、对抗性问题的分析与解释合用于面对客观环境问题的分析与解释成败核心自己决策能力PK对手决策能力自己决策能力表6-2囚徒B坦白抵赖囚徒A坦白-6,-6-1,-10抵赖-10,-1-2,-26.2博弈矩阵1博弈矩阵概念用以描述博弈有关的局中人,方略和得益等决策属性的表格称博弈得益矩阵,简称博弈矩阵例如:“囚徒困境”中的博弈矩阵可表达如表(6-2)借助博弈矩阵可以以便地进行博弈决策分析6.3有鞍点博弈决策有鞍点博弈决策是二人有限零和博弈决策中,不管双方当时采用什么方略,当博弈双方通过充足研究,不断改善博弈方略之后,双方找到了一种都不能再改善的方略汇合点,该点称鞍点,鞍点所反映的双方方略都是最优方略二人有限零和博弈是指这样的一类博弈问题:参与博弈的“局中人”只有二个,每个局中人都备有有限个可供选择的方略,并且在任一次博弈对局中,一方所得为另一方所失,局中人总的得失和为“零”。

二人有限零和博弈,可一般地体现为表(6-3)表6-3甲方得失值乙方方略β1β2┄βj┄βn甲方方略α1g11g12 ┄g1j┄g1nα2g21g22┄g2j┄g2n┆┆┆┆αigi1gi2┄gij┄gin┆┆┆┆┆αmgm1gm2 ┄gmj┄gmn甲方的支付表可用矩阵表达g11g12 ┄g1j┄g1ng21g22┄g2j┄g2n┆┆┆gi1gi2┄gij┄gin┆┆┆┆gm1gm2 ┄gmj┄gmn简记为G =( g i j )其最优方略的一般解法是“线性规划法”,当存在鞍点时可用“小中求大法”求解最优方略1二人有限零和博弈(有鞍点时)“小中求大法”拟定鞍点环节:对甲方的支付矩阵而言,先求甲方矩阵各行最小值;再找出其中的最大值;措施原理是假设甲方在各方略最不利的状况下,选一种相对有利的方略,该方略相应的收益是最起码的收益;对乙方而言,甲乙利益是互相冲突的,因此,甲方最小得益就是乙方最大得益,可用“大中求小法”找出乙方在不利状况下的相对有利方略,如果行max(min)= 列min(max)= K则K就是“鞍点”,K是甲方的收益,也是乙的损失双方相应的方略称为最优纯方略的解表6-4甲方支付表乙方方略β1β2β3β4minmax甲方方略α113124-9-9α216381033α3-3-1290-3α415-6106-6maxXX1632910min3具体措施原理与求甲方最优方略同样:先求出各列最大值(由于用的甲方支付表,甲方最大就是乙方最小),再选其中的最小值(甲方最小就是乙最大),该值相应的乙方方略就是乙方的最优方略。

例如:设甲方支付矩阵如表(6-4) 甲方最优方略是α2 ,乙方最优方略是β2 ,双方博弈的值是3,博弈值相应的点就是鞍点在这个博弈中,甲只要坚持α2方略,收益至少是3个单位乙只有坚持β2 方略,损失才不会超过3 2二人有限零和博弈(无鞍点时)当博弈无鞍点时,阐明双方都无拟定的方略,是一种你变我变的状态,如齐王赛马,当齐王懂得田忌的方略后,就会采用将出场马顺序打乱的方略这种没有拟定状态的博弈问题称为“二人零和混合方略博弈”这个问题可通过求最优方略的概率值解决如齐王赛马,计算可知双方的方略是将马的6个出场顺序所有列出,然后任选一种出场顺序进行比赛这样的方略,齐王获胜无鞍点决策与有鞍点决策的最大不同是:有鞍点可以事先告诉对方自己的方略选择,成果不变。

无鞍点决策对方略选择要互相保密,否则不保密的一方必输如田忌若先行探测到齐王马的出场顺序,采用针对性方略就能保证获胜6.4二人有限零和博弈决策实务解析表6-5甲方支付表乙厂方略B1B2B3B4minmax甲厂方略A11.40.51.01.60.5A20.60.81.11.20.6A31.51.451.21.31.21.2maxXX1.51.41.21.6min1.2例:假设有二家生产彩电的公司,在某地进行市场销售竞争甲厂产品设计了三种不同质量级别的A1,A2,A3,乙厂产品设计了四种质量级别B1,B2,B3,B4,市场预测这种产品销售总量可达0台分析预测甲方在与乙厂竞争中,各级别产品销量如表(6-5)试求甲乙二厂各自的最优市场销售方略,即各厂应向市场提供哪种质量级别的产品?解:运用“最小最大法”,可求得鞍点是1台,即甲厂的方略是生产A3质量级别产品,销量可达1台乙厂应生产B3质量级别产品,销售量可达0-1=8000台6.5 “纳什均衡”基。

下载提示
相似文档
正为您匹配相似的精品文档
相关文档