博弈论与决策行为－金锄头文库

资源描述

《博弈论与决策行为》由会员分享，可在线阅读，更多相关《博弈论与决策行为（173页珍藏版）》请在金锄头文库上搜索。

1、第2章博弈论与决策行为21 博弈论的基本概念l一、博弈参与人博弈参与人（player）是博弈中选择行动以最大化自己效用的决策主体。参与人可以是自然人，也可以是企业、团队、国家，甚至是国家组成的集团（如欧盟、OPEC等）。除一般意义上的参与人外，博弈论中还有“虚拟参与人”（pseudo player）自然（nature），“ 自然”是指不以博弈参与人意志为转移的外生事件，“自然”选择的是外生事件的各种可能现象，并用概率分布来描述“自然”的选择机理。也可以说，自然就是决定外生的随机变量的概率分布的机制。l 二、行动 l 行动（action or move）是参与人在博弈的某个

2、时点的决策变量。 l 与行动相关的一个重要问题是行动的顺序。静态博弈与动态博弈就是依据行动的顺序进行区分的。所谓静态博弈，就是指参与人同时选择行动，或虽然不是准确意义上的同时，但后行动者并不知道先行动者采取了什么具体行动；动态博弈则是指参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。l 三、战略 l 博弈中各参与人的行动规则称为“战略”(strategy) ，它规定参与人在什么情况下选择什么行动。各参与人可以选择的全部战略或战略选择的范围称为“战略空间”。 l 如果一个博弈中每个参与人的战略数都是有限的，则称为“有限博弈”(finite game)，如果一个

3、博弈中至少有某些参与人的战略有无限多个，则称为“无限博弈”(infinite game)。l 四、得益 l 得益(payoff)是指在一个特定的战略组合下参与人从博弈中所获得的利益，是参与人追求的根本目标，也是他们行为和判断的主要依据。博弈的一个基本特征是参与人的得益不仅取决于自己的战略选择，而且取决于所有参与人的战略选择，因此参与人的得益是所有参与人战略组合的函数。l 五、信息 l 信息指的是参与人在博弈过程中能够了解和观察到的知识，这些知识包括“自然”的选择、其他参与人的特征和行动等。 l 一般地，将各博弈方都完全了解所有博弈方各种情况下得益的博弈称为“完全信息 (c

4、ompleteinformation)博弈”，而将至少部分博弈方不完全了解其他博弈方得益情况的博弈称为“不完全信息(incompleteinformation)博弈” 。l 六、合作博弈与非合作博弈 l 合作博弈(cooperative games)与非合作博弈 (non-cooperative games)的区别，主要在于博弈的当事人之间能否达成一个有约束力的协议。如果有，就是合作博弈；反之，就是非合作博弈。 l 当前，非合作博弈是博弈论研究的主流领域。非合作博弈按照参与人的信息状态和行动顺序两个角度进行划分，得到四种不同类型的博弈：完全信息静态博弈、完全信息动态博弈、不完全

5、信息静态博弈、不完全信息动态博弈。22 完全信息静态博弈参与者同时选择行动，根据所有参与者的选择，每个参与者得到各自的结果（一定的收益或支出）。每一参与者的收益函数（根据所有参与者选择行动的不同组合决定某一参与者收益的函数）在所有参与者之间是共同知识。221博弈的标准式表述和求解l 博弈标准式表述含有以下三个要素：（1）参与人集合，（2）每一个参与人可供选择的战略集，（3）针对所有参与人可能选择的战略组合，每一个参与人获得的收益。l 用G表示一个博弈，如果G有n个博弈方，每个博弈方的全部可选战略的集合称为“战略空间”，分别用S1,，Sn表示，SijSi表示博弈方i的第

6、j个战略，其中j可取有限个值（有限战略博弈），也可取无限个值（无限战略博弈）；博弈方i的得益用ui表示，是各博弈方战略的多元函数，n个博弈方的博弈G写成G=S1,Sn;u1,un占优战略均衡 l 在博弈中，如果所有的参与人都有占优战略存在，因而博弈将在所有参与人的占优战略的基础上达到均衡，这种均衡称为占优战略均衡。在上表中，“A坦白，B也坦白”就是占优战略均衡。 l 占优战略均衡只要求所有的参与人是理性的，而并不要求每个参与人知道其他参与人也是理性的。 l 不论其他参与人是否理性，占优战略总是一个理性参与人的最优选择。重复剔除严格劣势战略均衡l 在绝大多数博弈中，占优战略均

7、衡是不存在的。我们可以通过逐步剔除劣势策略找出博弈的均衡。l 劣战略(dominated strategies)：是指在其他博弈参与人战略为既定的条件下，某一参与人可能采取的战略中，对自己相对不利的战略。 l 严格劣战略(strictly dominated strategies)则是指：无论其他博弈参与人采取什么战略，某一参与人可能采取的战略中，对自己相对不利的战略。l 首先找出某一博弈参与人的严格劣战略，将它剔除掉，重新构造一个不包括已剔除战略的新的博弈；然后继续剔除这个新的博弈中某一参与人的严格劣战略；重复进行这一过程，直到剩下唯一的参与人战略组合为止。 l 这个唯一

8、剩下的参与人战略组合，就是这个博弈的均衡解，称为“重复剔除的占优战略均衡 ”(iterated dominance equilibrium).与占优战略均衡相比，重复剔除劣势战略均衡不仅要求博弈的所有参与人都是理性的，而且要求每个参与人都了解所有的其他参与人都是理性的。在上例中，如果大猪不能排除小猪按按钮的可能性，按按钮就不一定是大猪的最优选择。纳什均衡（NASH EQUILIBRIUM）l 设想在博弈论预测的博弈结果中，给定每个参与人选定各自的战略，为使该预测是正确的，必须使参与人自愿选择理论给他推到出的战略。 l 这样，每个参与人要选择的战略必须是针对其他参与人选择战略的最优

9、反应，这种理论推测结果可以叫做“战略稳定”或“自动实施”的，因为没有参与人愿意独自离弃他所选定的战略，我们把这一状态就称为纳什均衡。qNash Equilibrium：“Im doing the best I can given what you are doing”“Youre doing the best you can given what I am doing.”l 定义：在博弈G=S1,Sn;u1,un中，如果由各个博弈方的各一个策略组合（s1*，,sn*）中，任一博弈方i的策略si*都是对其余博弈方策略组合（s1*，, si-1*，si+1*, sn*）的最佳策略，即

10、ui（s1*，, si-1*，si*,si+1*, sn*）ui（s1*， , si-1*，sij,si+1*, sn*）对任意sijSi都成立，则称（s1*，,sn*）为G的一个纳什均衡。l 可以证明：纳什均衡战略决不会在重复剔除劣战略的过程中被剔除掉，而重复剔除劣战略后所留战略却不一定满足纳什均衡战略的条件，因此纳什均衡是一个比重复剔除严格劣战略要强的解的概念。无限策略博弈分析和反应函数l 在无限策略、连续策略空间的博弈中，我们仍然可以以纳什均衡概念为基础进行博弈分析。古诺的寡头模型寡头产量竞争以两厂商产量竞争为例2 22126qqqq-=反应函数古诺模型的反应函数q1* =

11、q2*=24.5，4.55，3.753.75，54，4不突破突破厂商2不突破突破厂商 1以自身最大利益为目标：各生产 2单位产量，各自得益为4 以两厂商总体利益最大：各生产 1.5单位产量，各自得益为4.5两寡头间的囚徒困境博弈222完全信息静态博弈的典型应用l 一、豪泰林（Hotelling）价格竞争模型 l 在古诺模型中，产品是同质的。在这个假设下，如果企业的竞争战略是价格而不是产量，伯川德（Bertrand）证明，即使只有两个企业，在均衡情况下，价格等于平均成本，企业的利润为零，与完全竞争市场均衡一样。这便是所谓的“伯川德悖论”。（Bertrand Paradox）l 与古

12、诺模型相比，伯川德模型中的纳什均衡是完全竞争的结果：双方的定价都等于成本，这与古诺模型中双方均获得正利润的结果截然不同。 l 为什么？每个厂商都有削价的动机，如果一方削价（哪怕是些微的），它就可以占领整个市场并提高其利润水平。因此，直至价格被压低至成本水平（假如双方相同），双方都将价格定为在略低于对手的水准。 l 纳什均衡的含义：一旦双方的索价等于成本，任一方就不存在调整其价格的动机了。l 解开这一悖论的办法之一是引入产品的差异性。如果不同企业生产的产品是有差异的，替代弹性就不会是无限的，此时消费者对不同企业的产品有着不同的偏好，价格不是他们唯一感兴趣的变量。在存在产品

13、差异的情况下，均衡价格不会等于成本。l 产品差异有多种形式，经典的豪泰林模型考虑了一种特殊的差异，即空间上的差异。在模型中，产品在物质性能上是相同的，但在空间位置上有差异。因为不同位置上的消费者要支付不同的运输成本，他们关心的是价格与运输成本之和，而不仅仅是价格。l 假定有一个长度为1的线性城市，消费者均匀分布在 0,1区间里，分布密度为1。 l 两个商店，分别位于城市的两端，商店1在x=0，商店 2在x=1，出售性能相同的产品。 l 每个商店提供单位产品的成本为c，消费者购买商品的旅行成本为t l 住在x的消费者如果在商店1购买，要花费tx的旅行成本；如果在商店2购买，要花费

14、t(1-x)的旅行成本 l 假定消费者具有单位需求，即或者消费1个单位，或者消费0个单位。l 考虑两商店之间价格竞争的纳什均衡，即行动变量为价格pi，( i=1，2)。需求函数Di(p1，p2)，( i=1，2)。 l 如果住在x的消费者在两个商店之间是无差异的，即满足： l p1 + tx = p2 + t(1-x)l 那么，住在比x距离近的消费者都会在商店1购买，住在比x距离远的消费者都会在商店2购买。则需求函数分别为： l l 利润函数分别为：l 求使得利润最大的价格水平，分别令以下一阶导数为零：l 解得： l p1* = p2* = c + t l 每个企业的均衡利润为：

15、l u1 = u2 = t/2l 当旅行成本为零时，不同商店的产品之间具有完全的替代性，没有任何一个商店可以把价格定得高于成本，我们就得到伯川德均衡结果: l p1* = p2* =c l u1 = u2 = 0l 更为一般地，我们可以讨论商店位于任何位置的情况。假定商店1位于a（a=0)，商店2位于1-b （b=0），不失一般性，假定1-a-b=0，即商店 1位于商店2的左边。如果旅行成本是旅行距离的二次式，即旅行成本为td2，d为消费者到商店的距离l 需求函数分别为：l 纳什均衡为：l 当a=b=0时，商店1位于0，商店2位于1：l 当a=1-b时，两个商店位于同一位置：二、公共

16、资源问题l 在经济学中，所谓公共资源是指具有：（1）没有哪个人、企业或组织拥有所有权；（2）大家都可以自由利用。具有这样两个特征的自然资源或人类生产的供大众免费使用的设施或财货。 l 在人们完全从自利动机出发自由利用公共资源时，公共资源倾向于被过度利用、低效率使用和浪费，并且过度使用会达到任何利用它们的人都无法得到实际好处的程度。 l 设某村庄有n个农户，该村有一片大家可以自由放牧羊群的公共草地。由于这片草地的面积有限，因此只能让不超过某一数量的羊吃饱，如果在这片草地上放牧羊群的实际数量超过这个限度，则每只羊都无法吃饱，从而每只羊的产出（毛、皮、肉的总价值）就会减少，甚至只能勉强存活或饿死。 l 假设这些农户在夏天才到公共草地上放牧，而每年春天就要决定养羊的数量，则可看作各农户在决定自己的养羊数量的时候不知道其他农户养羊的数量，即各农户决定养羊数量的决策时同时做出的。 l 假设所有农户都清楚这片公共草地最多只能养多少只

展开阅读全文