（财务知识）理性双矩阵经济博弈的期望均衡分析

资源描述

《（财务知识）理性双矩阵经济博弈的期望均衡分析》由会员分享，可在线阅读，更多相关《（财务知识）理性双矩阵经济博弈的期望均衡分析（10页珍藏版）》请在金锄头文库上搜索。

1、几个常见理性双矩阵经济博弈的期望均衡分析基金项目：国家自然科学基金（78970025）作者简介：姜殿玉（1955-），男，辽宁凌源市人，教授。研究方向：博弈论与决策经营分析。姜殿玉淮海工学院经济管理系，江苏，连云港，222001摘要：关于完全信息静态博弈，有纯Nash均衡，混合Nash均衡和相关均衡等概念。如果每个局中人除了博弈的结构以外其他一无所知是全体局中人的共同知识（称为完全静态的），那么期望均衡是在极大熵准则是全体局中人的共同知识的条件下的一种均衡。本文首先介绍理性对策及其期望均衡的概念，然后由此分析了在文献中经常出现的一些经典博弈的期望均衡的结果，并与混合Nash均衡结果进行比较

2、。说明对于完全静态博弈，当局中人比通常情况下聪明（极大熵准则是他们的共同知识）的时候，其决策结果比混合Nash均衡更为确定和具有理性。关键词：极大熵准则，完全静态博弈，混合Nash均衡，期望均衡Expected Equilibrium Analysis on Some Rational Economics Bi-matrix GamesJIANG DianyuSchool of Economical Management, Huaihai Institute of Technology, Lianyungang, 222001, China Abstract: In a static game

3、 with complete information, we have the concepts of pure Nash equilibria, mixed Nash equilibria and correlated equilibria. If it is all the players common knowledge that every player knows nothing except structure of the game, called completely static, then a so called expected equilibrium was defin

4、ed that is an equilibrium in the case that maximum entropy principle is all the players common. In this paper, we introduce the concepts of a rational game and its expected equilibria, then analysis the expected equilibria in some classical games in many literatures. We compare the expected equilibr

5、ia and mixed Nash equilibria in these games as well. The results show that for a completely static game the players decision results are more certain and rational if they are more intelligent, i.e. maximum entropy principle is their common. Keywords: maximum entropy principle; completely static game

6、; mixed Nash equilibrium; expected equilibrium1引言传统的完全信息静态博弈假定（1）局中人的集合，（2）每个局中人的行动集合和（3）博弈的效用函数是全体局中人的共同知识1。但是并不要求全体局中人的共同知识的集合中不含有其他成分。如果这种博弈不含有其他成分，那么就称为完全静态博弈2-4 。如果局中人的共同知识集合中有并且仅仅有（1），（2），（3）和（4）极大熵准则5：如果局中人对于可能发生的随机事件仅仅有一部分信息，那么他在决策时应该选择使得不知道的信息的不确定性达到最大的策略，那么这个博弈称为理性博弈2-4。文献2，7关于理性博弈引进了期望均衡的

7、概念，并且给出其算法。文献2对于经典的博弈问题囚徒困境、夫妻争执和鹰-鸽博弈用期望均衡的概念进行了探讨，所得结论是经典均衡无法得到的，并且更符合实际。本文首先介绍理性对策及其期望均衡的概念，然后由此分析了在文献中经常出现的一些经典博弈的期望均衡的结果，并与混合Nash均衡结果进行比较。说明对于完全静态博弈，当局中人比通常情况下聪明（极大熵准则是他们的共同知识）的时候，其决策结果比混合Nash均衡更为确定和具有理性，且均衡的计算非常简洁。2、理性双矩阵博弈设1和2是两个局中人，和分别是局中人1和2的行动集合。和分别是局中人1和2的支付矩阵，即当剧中人1和2分别采用行动和时，局中人1和2分别得到

8、效用和。设单纯形，分别是局中人2和1的判断集合9，即表示局中人2判断局中人1以概率选择行动，表示局中人1判断局中人2以概率选择行动。设是可能取值为1，2，n的随机变量，其概率分布列为，那么对于不同的概率分布列，随机变量取值的不确定性可能不同例如对于三个服从0-1分布的随机变量，；，；，的不明确性最小：几乎必然取1；的不明确性次之，而的不明确性最大：以同样的可能性取0和1给定随机变量的分布列，我们用符号表示其不明确性1948年，Shannon证明了10，这里规定，式中的是正常数，通常可以取作1称为Shannon熵对于取定的底，记随机变量的Shannon熵是这个随机变量在一次试验中究竟取什么值的不

9、明确性或“模糊度”的度量，也就是要准确判定这个随机变量究竟取什么值所需要的平均信息量定理1 11（1），（2）当且仅当存在着使得，（3）当且仅当定义1 一个双矩阵对策称为完全静态的，如果局中人1，2的共同知识集合为。极大熵准则（PME）：对于完全静态博弈，局中人1（或2）判断局中人2（或1）以概率（或）的随机变量（或）的Shannon熵最大。定义2 一个双矩阵对策称为理性的，如果局中人1，2的共同知识集合为。给定理性双矩阵对策，因为局中人1（或2）判断对方以概率（或）采取行动（或），所以当局中人1（或2）采取行动（或）时，其赢得的主观期望为（或）。局中人1（或2）应该选择使得其主观期望（或）最

10、大的行动（或）。定义3称为理性博弈的期望均衡集合。显然期望均衡集合总是存在的并且可交换的，所以总可以实现。3小偷-守卫博弈 8一个小偷欲偷窃有一个守卫看守的仓库。如果小偷偷窃时守卫在睡觉，则小偷就能得手，偷得价值为的赃物；如果小偷偷窃时守卫没有睡觉，则小偷就会被抓住。设小偷被抓住后要坐牢，负效用为。守卫睡觉而未遭偷窃有的正效用。因睡觉被解雇的负效用为。如果小偷不偷，则他既无得也无失。守卫不睡觉意味着出一分力挣一分钱，也无得失。则赢得矩阵为。这个例子出现在文献8（pp.94），起源于Selten, R教授于1996年3月在上海的一次演讲，作者用图解法分析了这个博弈的混合Nash均衡。显然，这个

11、对策没有纯Nash均衡。按照传统方法，可得混合Nash均衡和失盗的概率分别为，。解释：是固定的。当较大时，对于守卫失盗后果严重时（比如守卫知道自己被解雇以后再也找不到待遇与现工作相当的新工作，而只能比现工作差，则守卫必然珍惜现有工作，尽职尽责不睡觉）是双方的共同知识。小偷在行窃的时候就要谨慎行事，故行窃的概率较小。当固定，较小时，小偷被抓住的惩罚相对于仓库里的物品较轻是双方的共同知识，那么守卫就会知道小偷偷的可能性较大，从而守卫睡觉的可能性较小。当固定，较小时，仓库里的物品比较廉价时说方的共同知识。守卫就会知道小偷下手的可能性不大，从而守卫睡觉的可能性较大。实施方法：如果小偷有次对这个仓库起贼

12、心，那么他最好随机选择次下手。守卫在天值班中最好随机选择天睡觉。这样，失盗的概率是。现在做期望均衡分析。易知，；，。情况1当时，。说明当物品较贵重（比如仓库是黄金库），小偷被抓惩罚较轻（比如判刑一年）；对于守卫失盗也无所谓时（比如守卫知道即使被解雇，也可以马上找到新工作其待遇不低于当时待遇），期望均衡为（偷，睡觉）。结果是失盗。情况2当时，。说明当物品较廉价（比如都是发泡塑料废品。），小偷被抓惩罚较重（判刑一年）；对于守卫失盗后果严重时（比如守卫知道自己被解雇以后再也找不到待遇与现工作相当的新工作，而只能比现工作差，则守卫必然珍惜现有工作，尽职尽责不睡觉）。期望均衡为（不偷，不睡觉）。情况3当

13、时，。说明当物品较廉价，小偷被抓惩罚较重；对于守卫失盗也无所谓时，期望均衡为（不偷，睡觉）。情况4当时，。说明当物品较贵重，小偷被抓惩罚较轻；对于守卫失盗后果严重时，期望均衡为（偷，不睡觉）。4穷人-富人巡逻博弈(见12 pp.11-12)在一个小区里，住着一个富人，一个穷人。组织夜间巡逻能够有效防止偷盗，但夜间巡逻的成本为。假设富人的财产为，穷人的财产为，显然。如果两人都巡逻，那么巡逻成本由两人均摊；如果只有一个人巡逻，那么成本由巡逻者承担。如果富人和穷人都巡逻，富人的收益为，穷人收益为。如果穷人巡逻，富人“搭便车”不巡逻，那么富人收益为；穷人收益为。如果富人巡逻，而穷人不巡逻，那么富人的收

14、益为。穷人“搭便车”财产得保，受益为。如果两人都不巡逻，则两人财产都被偷光，收益都是零。于是得到赢得矩阵为。纯Nash均衡为（不巡逻，巡逻）和（巡逻，不巡逻）。但是这两个Nash均衡是有分歧的，因而无法实现。下面讨论几种情况（巡逻成本理解为雇用保安的工资）1、当时，有，。期望均衡为（巡逻，巡逻）。这就是说，当穷人不是十分贫穷，其财产多于巡逻成本的二分之三时，穷人和富人都巡逻（越富有，责任心越大）。2、当时，。期望均衡为（不巡逻，不巡逻）。这就是说，当富人的财富小于巡逻成本的二分之三时，穷人和富人都不肯巡逻。理解为如果富人和穷人都雇不起保安，那么两户都不巡逻。充分穷的时候，即使被盗也没有什么损失

15、。即所谓“死猪不怕开水烫”，乞丐不怕招小偷。3、当时，。期望均衡为（巡逻，不巡逻）。这就是说，如果富人充分富，穷人充分穷，那么富人重视自己的财产，巡逻的积极性就高；而穷人失盗也无所谓，所以巡逻的积极性不高。倾向于搭便车。在12 pp.11-12中，从而符合这种情况。结论是富人巡逻，穷人“搭便车”。但是在该文献中，这个结论是由逻辑推理得出的，而不是用数学方法得到的。此例说明，纯Nash均衡分析结果失效，但期望均衡分析结果给出比较符合实际的结果。5智猪博弈1猪圈里圈着一大一小两头猪。猪圈的一头有一个猪食槽，另一头安装着一个按钮，控制着猪食的供应。按一下按钮，有个单位的猪食进槽，但需要支付个单位的成本。如果大猪等待，小猪按按钮，那么大猪吃到个单位的猪食，小猪吃到个单位的猪食。如果大猪按按钮，小猪等待，那么大猪吃到个单位的猪食，小猪吃到个单位的猪食。如果两头猪都去按按钮，那么大猪吃到个单位，小猪吃到个单位。如果两头猪都等待，那么谁也吃不到猪食。由于按完按钮后再跑到猪食槽处需要一定的时间，所以按按钮的猪比等待的猪吃到猪食要晚一些，因此有（1）。此外假定：（2），（3）。试分析可能出现的局势。由于按按钮的猪需要付出个单位的成本，所以赢得矩阵为。因为，。所以纯Nash均衡为（按，等），即大猪按，小猪等。又因为

展开阅读全文