理性双矩阵经济博弈的期望均衡分析

上传人:第*** 文档编号:33596014 上传时间:2018-02-16 格式:DOC 页数:10 大小:416KB
返回 下载 相关 举报
理性双矩阵经济博弈的期望均衡分析_第1页
第1页 / 共10页
理性双矩阵经济博弈的期望均衡分析_第2页
第2页 / 共10页
理性双矩阵经济博弈的期望均衡分析_第3页
第3页 / 共10页
理性双矩阵经济博弈的期望均衡分析_第4页
第4页 / 共10页
理性双矩阵经济博弈的期望均衡分析_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《理性双矩阵经济博弈的期望均衡分析》由会员分享,可在线阅读,更多相关《理性双矩阵经济博弈的期望均衡分析(10页珍藏版)》请在金锄头文库上搜索。

1、几个常见理性双矩阵经济博弈的期望均衡分析 1姜殿玉 淮海工学院经济管理系,江苏, 连云港,222001摘要:关于完全信息静态博弈,有 纯 Nash 均衡,混合 Nash 均衡和相关均衡等概念。如果每个局中人除了博弈的结构以外其他一无所知是全体局中人的共同知识(称为完全静态的),那么期望均衡是在极大熵准 则是全体局中人的共同知识 的条件下的一种均衡。本文首先介绍理性对策及其期望均衡的概念,然后由此分析了在文献中 经常出现的一些经典博弈的期望均衡的结果,并与混合 Nash 均衡结果进行比较。 说明对于完全静态博弈,当局中人比通常情况下聪明(极大熵准则是他们的共同知识)的时候,其决策结果比混合 Na

2、sh 均衡更为确定和具有理性。关键词:极大熵准则,完全静 态博弈,混合 Nash 均衡,期望均衡Expected Equilibrium Analysis on Some Rational Economics Bi-matrix GamesJIANG DianyuSchool of Economical Management, Huaihai Institute of Technology, Lianyungang, 222001, China Abstract: In a static game with complete information, we have the concepts

3、of pure Nash equilibria, mixed Nash equilibria and correlated equilibria. If it is all the players common knowledge that every player knows nothing except structure of the game, called completely static, then a so called expected equilibrium was defined that is an equilibrium in the case that maximu

4、m entropy principle is all the players common. In this paper, we introduce the concepts of a rational game and its expected equilibria, then analysis the expected equilibria in some classical games in many literatures. We compare the expected equilibria and mixed Nash equilibria in these games as we

5、ll. The results show that for a completely static game the players decision results are more certain and rational if they are more intelligent, i.e. maximum entropy principle is their common. Keywords: maximum entropy principle; completely static game; mixed Nash equilibrium; expected equilibrium1 基

6、金项目:国家自然科学基金(78970025)作者简介:姜殿玉(1955-) ,男,辽宁凌源市人,教授。研究方向:博弈论与决策经营分析。1 引言传统的完全信息静态博弈假定(1)局中人的集合, (2)每个局中人的行动集合和(3)博弈的效用函数是全体局中人的共同知识 1。但是并不要求全体局中人的共同知识的集合中不含有其他成分。如果这种博弈不含有其他成分,那么就称为完全静态博弈 2-4 。如果局中人的共同知识集合中有并且仅仅有(1) , (2) , (3)和(4)极大熵准则 5:如果局中人对于可能发生的随机事件仅仅有一部分信息,那么他在决策 时应该选择使得不知道的信息的不确定性达到最大的策略,那么这个

7、博弈称为理性博弈 2-4。文献2 ,7关于理性博弈引进了期望均衡的概念,并且给出其算法。文献2对于经典的博弈问题囚徒困境、 夫妻争执和鹰 -鸽博弈用期望均衡的概念进行了探讨,所得结论是经典均衡无法得到的,并且更符合实际。本文首先介绍理性对策及其期望均衡的概念,然后由此分析了在文献中经常出现的一些经典博弈的期望均衡的结果,并与混合 Nash 均衡结果进行比较。说明对于完全静态博弈,当局中人比通常情况下聪明(极大熵准则是他们的共同知识)的时候,其决策结果比混合Nash 均衡更为确定和具有理性, 且均衡的计算非常简洁。2、理性双矩阵博弈设 1 和 2 是两个局中人, 和 分别是局中人 1 和 2 的

8、行1,2ImL1,2JnL动集合。 和 分别是局中人 1 和 2 的支付矩阵,即当剧中人 1 和 2()ijmnAa()ijnBb分别采用行动 和 时,局中人 1 和 2 分别得到效用 和 。IJijaijb设单纯形,1 1(,)|0,;mmi iXxxLL|12nnj jYy y分别是局中人 2 和 1 的判断集合 9,即 表示局中人 2 判断局中人 1 以概率 选(,)mx ix择行动 , 表示局中人 1 判断局中人 2 以概率 选择行动 。iI(,)nyLjyjJ设 是可能取值为 1,2,n 的随机变量,其概率分布列为, ,ipPrn, L那么对于不同的概率分布列,随机变量取值的不确定性

9、可能不同例如对于三个服从 0-1分布的随机变量, ;0Pr11Pr, ; , ,3.2 7.02 5.0Pr35.01Pr3的不明确性最小: 几乎必然取 1; 的不明确性次之,而 的不明确性最大:以同112样的可能性取 0 和 1给定随机变量 的分布列, ,ipPrn, L21我们用符号 表示其不明确性1948 年,Shannon 证明了 10),(1npHL,niibnpC11log,这里规定 ,式中的 是正常数,通常可以取作 1 称为0logb ),(1npHLShannon 熵对于取定的底 ,记 )1(bniibbp11log),(L随机变量的 Shannon 熵是这个随机变量在一次试验

10、中究竟取什么值的不明确性或“模糊度”的度量,也就是要准确判定这个随机变量究竟取什么值所需要的平均信息量定理 1 11(1) , (2) 当且仅当存在着1),(01nnpHL0),(1nnpH使得 , (3) 当且仅当ni0 0,;0 iipii Lpi ,L定义 1 一个双矩 阵对策 称为完全静态的,如果局中人 1,2 的共(,)(,)ijmnABab同知识集合为 。(,)1,2;,CIJ极大熵准则(PME):对于完全静态博弈,局中人 1(或 2)判断局中人 2(或 1)以概率(或 )的随机 变量 (或 )的 Shannon 熵最大。jyix1(,)nyL1(,)mx定义 2 一个双矩 阵对策

11、 称为理性的,如果局中人 1,2 的共同知,ijnABab识集合为 。(,),;(,);MEPCABIJ给定理性双矩阵对策 ,因为局中人 1(或 2)判断对方以概率ijmn(或 )采取行动 (或 ) ,所以当局中人 1(或 2)采取行动 (或1nmjJI iI)时,其赢得的主观期望为 (或 ) 。jJ11()nijEia21()mijEjb局中人 1(或 2)应该选择使得其主观期望 (或 )最大的行动 (或i2jiI) 。jJ定义 3 称 11|()max()iiIE221|()max()jnjJE为理性博弈 的期望均衡集合。(,),ijnABb显然期望均衡集合总是存在的并且可交换的,所以总可

12、以实现。3小偷-守卫博弈 8一个小偷欲偷窃有一个守卫看守的仓库。如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为 的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。设小偷被v抓住后要坐牢,负效用为 。守卫睡觉而未遭偷窃有 的正效用。因睡觉被解雇的负效ps用为 。如果小偷不偷,则他既无得也无失。守卫不睡觉意味着出一分力挣一分钱,也d无得失。则赢得矩阵为。(,)(,0)vdps守 卫睡 觉 不 睡小 偷偷 不 偷这个例子出现在文献8(pp.94) ,起源于 Selten, R 教授于 1996 年 3 月在上海的一次演讲,作者用图解法分析了这个博弈的混合 Nash 均衡。显然,这个对策没有

13、纯 Nash 均衡。按照传统方法,可得混合 Nash 均衡和失盗的概率分别为, 。(,),(,)sdpvspdv解释: 是固定的。当 较大时,对于守卫失盗后果严重时(比如守卫知道自己被解雇以后再也找不到待遇与现工作相当的新工作,而只能比现工作差,则守卫必然珍惜现有工作,尽职尽责不睡觉)是双方的共同知识。小偷在行窃的时候就要谨慎行事,故行窃的概率较小。当 固定, 较小时,小偷被抓住的惩罚相对于仓库里的物品较轻是双方的共同知识,vp那么守卫就会知道小偷偷的可能性较大,从而守卫睡觉的可能性较小。当 固定, 较小时,仓库里的物品比较廉价时说方的共同知识。守卫就会知道小偷pv下手的可能性不大,从而守卫睡

14、觉的可能性较大。实施方法:如果小偷有 次对这个仓库起贼心,那么他最好随机选择 次下手。MsMd守卫在 天值班中最好随机选择 天睡觉。这样,失盗的概率是 。NpNvpsv现在做期望均衡分析。易知, ; ,1()2Evp1(2(0)E21()Esd21(0)E。情况 1当 时, , 。说明当物品较贵重(比,sd1()2()如仓库是黄金库) ,小偷被抓惩罚较轻(比如判刑一年) ;对于守卫失盗也无所谓时(比如守卫知道即使被解雇,也可以马上找到新工作其待遇不低于当时待遇) ,期望均衡为(偷,睡觉) 。结果是失盗。情况 2当 时, , 。说明当物品较廉价(比,vpsd1()2E2(1)E如都是发泡塑料废品

15、。 ) ,小偷被抓惩罚较重(判刑一年) ;对于守卫失盗后果严重时(比如守卫知道自己被解雇以后再也找不到待遇与现工作相当的新工作,而只能比现工作差,则守卫必然珍惜现有工作,尽职尽责不睡觉) 。期望均衡为(不偷,不睡觉) 。情况 3当 时, , 。说明当物品较廉价,小,vpsd1()2E2(1)E偷被抓惩罚较重;对于守卫失盗也无所谓时,期望均衡为(不偷,睡觉) 。情况 4当 时, , 。说明当物品较贵重,小,s1()2()偷被抓惩罚较轻;对于守卫失盗后果严重时,期望均衡为(偷,不睡觉) 。4穷人-富人巡逻博弈(见12 pp.11-12)在一个小区里,住着一个富人,一个穷人。组织夜间巡逻能够有效防止偷盗,但夜间巡逻的成本为 。假设富人的财产为 ,穷人的财产为 ,显然 。如果crp0,2rpc两人都巡逻,那么巡逻成本由两人均摊;如果只有一个人巡逻,那么成本由巡逻者承担。如果富人和穷人都巡逻,富人的收益为 ,穷人收益为 。如果穷人巡逻,富2cc人“搭便车”不巡逻,那么富人收益为 ;穷人收益为 。如果富人巡逻,而0rp穷人不巡逻,那么富人的收益为 。穷人“搭便车”财产得保,受益为 。如rc0p果两人都不巡逻,则两人财产都被偷光,收益都是零。于是得到赢得矩阵为。(2,)(,)0rcprcp穷 人巡 逻 不 巡 逻富 巡

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号