博弈论精要

上传人:枫** 文档编号:512034760 上传时间:2023-10-08 格式:DOCX 页数:15 大小:18.79KB
返回 下载 相关 举报
博弈论精要_第1页
第1页 / 共15页
博弈论精要_第2页
第2页 / 共15页
博弈论精要_第3页
第3页 / 共15页
博弈论精要_第4页
第4页 / 共15页
博弈论精要_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《博弈论精要》由会员分享,可在线阅读,更多相关《博弈论精要(15页珍藏版)》请在金锄头文库上搜索。

1、博弈论精要 (童话版)北望经济学园这篇寓言的作者把博弈论的一些基本的理论要素表现在这篇精悍的德文章中写得的 确非常精妙,大家不妨耐心品位以下.那蚂蚁一直在旁边袖手微笑,待到此时,方才向狐狸说道:“狐兄豪气干云,小弟十分敬佩,倒想领略一番。”狐狸笑道:“不知蚁兄是要下里巴人还是要阳春白雪?” 蚂蚁奇道:“下里巴人又如何?阳春白雪又如何?” 狐狸缓缓说道:“下里巴人,至俗也,便是那乡间七旬老母,犹能听得手舞足蹈,击节而歌。却可惜譬如那山溪之水,来势汹汹,去也匆匆,入骨不过三分矣。” “那阳春白雪,又当如何?” 狐狸道:“夫阳春白雪也,一望无垠,恰似大海潮生,初时广袤沉静,星光点点,不觉有异。然细心

2、听处,远方隐隐似有天籁之音,像那闷雷滚过,却又悠扬有如长 笛呜咽。 待到听得更是真切之时,又有冰河破碎,清泉下流,入小河,汇大江,浩浩荡荡, 终归大海,成了万丈涛声,千年不绝。”蚂蚁叹道:“怎信世间能有如此神奇之学问。你且先让我们听听那下里巴人罢)狐狸道:“博弈便是赌博。”绛仙不满道:“我说不准赌博的)蚂蚁摇手道:“姑娘莫恼,刚才既是我说要下里巴人,才有赌博这些鄙陋之事,须 不要怪狐兄。”狐狸宛尔笑道:“姑娘也可把它看作打架。博弈之要义,先要知你是谁,要看你出 手,然后我的还手必要是最有利自己。此为最基本。”“然高手过招,赢在料敌机先。纵然彼先出手,但既知我是谁,故出手后,必要想以我之能,当如

3、何还手。彼出招与我还招,构成一个局面,非但可定我之生死,亦可以定彼之生死。彼必要选择对其最有利的局面为先着。是故彼未出手,我已知其 意矣。”“那也未必) 绛仙插嘴道,“我可以用对方从来没有见过的天山折梅手,对方防不胜防,便无从计算得失了。”“姑娘莫急,”狐狸道,“博弈论中,什么样的人用哪些招数,都是事先假定好的,也是大家各方都知道的,而且大家都知道大家知道的,却不允许你弄些稀奇古怪 的旁门左道来捣乱。”“狐兄之意我已知之,”蚂蚁沉吟道,“于我方,最想知道的是对方如何出手,只 要确定对方的招数,我便可以在此前提下选择于自己最有利的应对措施,得到一个 我的盈利函数。然而对方也能想象到我盈利函数最大

4、化下的出招,并因此计算他自 己的所得。对方所出招必定是能使他盈利最大的招数。”“所以我便可知对方如何出招,对方也知我会如何应对。我若不如此应对,必定吃亏;对方若不如此出招,必定不能使其利益最大。”“Nod,”狐狸点头,“这些招数的组合,便成为了一条均衡路径。“但凡事总要未雨绸缪,难保中途哪个出错,出了一个对他自己不利的臭招,你下 一招也得针对新情况,解决新问题。”“所以,对于局中人任何招数,无论香臭也罢,如果真的发生了,我们就要根据前 面蚁兄说的原则重新计算出招和应招。但是我们只朝前看,不算旧帐。”如果每一个回合的每一招(无论这一招的出现如何愚蠢)我们都想好了其后的最 佳出招和应招,即任何招数

5、的出现,其后都有均衡路径;而最长的那条均衡路径,为整个博弈的均衡路径。那么,我们就算完事大吉,高枕无忧了。”但文书还是不服气:“你这个总是分了出招的先后顺序,所以别人出后你可以悠然地选择自己最优的。倘若你们都是同时出招,你看到对手出招时,你的剑也已经刺出,变不了招,岂非全都乱了套?”狐狸笑道:“文书想的周到。不过这个虽原理与前无异,倒也不好用话来说,且先AA- _ AA- ”等它一等。”“狐兄总是这么刚愎自用,”绛仙幽幽地叹口气,“俗话说,画虎画皮难画骨、知人知面不知心。你怎么就一定知道对方是什么人?”狐狸的心不觉颤了一下,因为很久以前自己也曾这般叹过,故而听来分外熟悉。不过这好比微风吹起的一

6、丝涟漪,很快就从水面的这边,掠过水面的那边,然后就消失了。狐狸道:“按博弈论的要求,我们即便不知道对方一定是什么人,但却知道他属于哪一类人的概率。譬如是好人的概率是2/3,坏人的概率是1/3。能够知道这个,我们也可以作出选择了。”“但是”绛仙欲言又止,因为她想到了1/3 的那种可能,所以她并不满意狐狸的这个回答。但是她知道这已经是最好的回答。所以也不再问。狐狸笑着把眼睛从她身上扫过。“先前我们知道博弈中每个人是什么类型,然后我们可以算出每个人的盈利函数,每个人的决策,便是根据这盈利函数来的。现在我们只知道每个人属于哪个类型的概率,也还是一样按照刚才的步骤进行,只不过盈利函数成为数学期望值罢了。

7、无论先出招还是后出招,都是一样希望自己的盈利期望最大。”文书嚅嗫道:“这个数学期望”狐狸乐了:“大二数学便有这些东东,文书缘何记不得了?譬如你有1/3 的可能得到9 元钱,有 2/3 的可能得到 18 元钱,那你可能得到钱的数学期望便是 9*1/3+18*2/3=15 元。一个量乘以自身的概率,便是数学期望。”说到这里,狐狸不觉朝蚂蚁望了一下:“现在所说,虽力图下里巴人,但”蚂蚁已知其意,挥手道:“下里巴人也不应是文书这样的幼儿园水平,概率的起码意义要懂)“换言之,”蚂蚁笑道,“即便国人素质低,狐兄要说的,也至多是阳春白雪,未可算是艳阳高照。在下还听的懂,尽管放心的说下去。”狐狸摇头道:“我要

8、说的,就要说完了。现在我们在每个局中人的类型、每种类型局中人的各个招数上,都各假设一个概率,这些概率假设可全用符号来表示未知量,它们可以代表小数,也可以代表0,也可以代表 1。”“但是引入这些符号之时,便要这些符号之间满足概率上的约束,譬如归一化约束。作为代数式,这种约束是可以满足的。”“此时,局中人选择策略,实质上便是计算概率。概率为0,便不选此策略;概率为1,便一定选此策略,概率若为小数,则为混合策略。”“令p a, p b, p c为A, B, C决策顺序中局中人所属类型的概率向量(各个决策顺序的局中人可同可不同,但我们只把顺序作为区分标准),0 a, 0 b,0 c为分布在相应局中人各

9、招数上的概率向量。注意,这儿p a, 0 a等都是向量,譬如p a=( p a1, p a2,p an)。”“由此可以列出依照A, B, C的先后次序决策时,各人的盈利代数式:Ua=fa(p a, p b, p c;0 a, 0 b, 0 c0 n)Ub=fb(p a, p b, p c; p a, p b, p cp n)Un=fn(p a, p b, p c; p a, p b, p cp n)”“现在先不考虑出招较早的那些人,首先考虑最后一个决策者,他当取P n*使得Un*=maxfn(p a, p b, p c; p a, p b, p cp n)的p n*策略。此时,p n*pn可以

10、表示为p a, p b, p c; p a, p b, p cp n-1的函数式。因此可得(n-1 )个决策者的盈利式为:Un-1*=maxfb1(p a, p b, p c; p a, p b, p cp n-1)p n-1同样又确定p n-1*,并消掉p n-1变量,依次类推。最后确定p a*后,把p a* 的数值代入其它所有人的策略代数式,即可求得依先后顺序计算的所有局中人均衡 策略。此时,各人的盈利函数为代数方程,自变量概率向量在01 区间又是连续的,因此完全可用解方程的办法来求极值。”“博弈论的全部内容,我便已说完了。”文书呆了一呆,并不相信自己的耳朵,急忙从包里抱出本5、600 页

11、厚的博弈论,嘴里嚷嚷道:“打死我都不信,那博弈论里面有什么完全信息、不完全信息、静态动态、占优弱劣、多重性、贝叶斯、有限、无限、颤抖手、序贯那么多花样,你却拿这几句话来打发我,而且还是夹杂在童话故事中间)“文书说得有一定道理,”蚂蚁也接口道,“倘若有如此简单,这些经济学家也不成其为经济学家了。狐兄终究是年少,须知武学一道,总是要循序渐进,不好来半 点浮躁的。”“我也如此说过他好多次了,他总是不听。”绛仙看了狐狸一眼,眼神中倒有一大 半是怨色。不过狐狸最受不了这种温柔的责备,因为这个时候还招也罢,不还招也罢,大约都是显得自己愚蠢。当真是没有这么简单,”狐狸暗自思忖,“譬如此时我便计算不出最优策略

12、。”但是文书看到大家都支持他,狐狸又没有作声,顿时感到自己把天底下最充分的理由都占全了。于是打开书本,按书上的条目一条一条的问狐狸问题:“譬如你就没有说什么是完全信息)“这个区分重要么?”“不重要么?”狐狸火了 : “本公子不知道什么是完全信息一样可以搞定)“哈哈哈哈,”文书大乐,“狐兄开什么玩笑?什么是完全信息这种最基本的东东都不懂,还要搞定?”它便笑着边转动脑袋望着蚂蚁和绛仙。 不过蚂蚁和绛仙都没有笑。绛仙有点担心的望着狐狸。这使得文书很扫兴。蚂蚁镇静地道:“不妨等狐兄说完搞定的办法。”狐狸朝蚂蚁投去感激的一眼,转向文书:“你说说什么是完全信息,看我能否搞定 ?”文书便照着书本念了:“完全

13、信息是指自然不首先行动或自然的初始行动被所有参 与人准确观察到的情况,即没有事前的不确定性”“Too simple! too naive) 狐狸不等文书说完就打断了,“你所说的完全信息便是我以上方程中p a, p b, p c均事先确定为0或1的情况)文书不料被如此打断,脸上一红,急忙又翻过一页:“那完美信息呢?”“摆脱) 狐狸微笑中夹杂一丝嘲讽,“每次你说一个东东,请随即念它的书本定 义,好节省大家的时间)文书有点恼羞成怒,但是它克制住了自己:“完美信息,便是指你对别人究竟是什么人和他曾经采取了什么具体行动都一清二楚,没有半点含糊)狐狸两眼朝天,懒懒地说:“就是p a, p b0 a, 0

14、b都是0或者1。“纳什均衡:给定别人不动,没有人有兴趣动?”“每个人盈利函数对于自己策略0 的偏导小等于 0。注意啊,这儿是偏导,可不是全导!全导可是要好多人都可能调整策略了。”狐狸答得太快了,文书决定把刚才蚂蚁的那个重磅炸弹扔出来:“怎么解决静态均衡的问题,你还一直没有说过呢)“Sigh!”狐狸啐了一声。“你一样列出各人盈利函数多项式;然后对个人赢利函数取对自己策略的偏导为零 得出方程式,每个人都有自己的方程式。把这些方程式联解的解,就是静态博弈之 均衡。”文书急忙去翻下页,嘴里叽里咕哝的,想是十分的不满意。它头也不抬:“子博弈精炼纳什均衡?”不过狐狸也不含糊:“p a, |J b0 a,

15、0 b都是0或者1时得出的均衡就是子博弈精炼纳什均衡)“不完全信息博弈?”“J a, J b都是小数)贝叶斯纳什均衡?”“只要我那代数式成立便是贝叶斯纳什均衡)“海萨尼转换?”“这是废话,不需要!你把P换成0便是,符号变一变,计算上没有什么大不了的改进,画蛇添足)“不完全信息静态”“什么静态都跟我刚才说的方法一样)“精炼贝叶斯均衡”“停停!怎么个精炼法?”“哼哼,”文书感觉大是欣喜。它骄傲地说:“听好了!精炼贝叶斯均衡就是.修改后验概率。”它念了十分钟。蚂蚁和绛仙都糊涂了。“Robbish) 狐狸不耐烦地道,“莫不是知道某0已经发生,来确定某p是否合理?”“你按我那式子计算出来的均衡策略解集中,倘若没有某0,岂不就p出了矛盾? 当然是要修改P,此时便需要进一步精炼;倘若解集中就有某0,则此均衡就没有 问题,就是那精炼贝叶斯均衡吧?说起来不过就是以前p已知,求0 ;变为0已知 ,求p而已!何必再安些名词出来?” “那,不完美信息博弈的精炼贝叶斯均衡.”“同上)文书的脸色有些难看:“序贯均衡?”“呵呵,你那序贯均衡无非是

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号