有限理性和进化博弈

资源描述

《有限理性和进化博弈》由会员分享，可在线阅读，更多相关《有限理性和进化博弈（68页珍藏版）》请在金锄头文库上搜索。

1、第五章有限理性和进化博弈,进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心，以进化稳定策略为基本均衡概念的进化博弈分析。,本章分四节,5.1 有限理性博弈及其分析框架 5.2 最优反应动态 5.3 复制动态和进化稳定性：两人对称博弈 5.4 复制动态和进化稳定性：两人非对称博弈,5.1 有限理性博弈及其分析框架,5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架,5.1.1 有限理性及其对博弈的影响,有限理性博弈方：不满足完全理性假设的博弈方有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略有限理性意味着均衡是不断调整和

2、改进而不是一次性选择的结果，而且即使达到了均衡也可能再次偏离有限理性博弈方会在博弈过程中学习博弈，通过试错寻找较好的策略,有一定的统计分析能力和对不同策略效果的事后判断能力,5.1.2 有限理性博弈分析框架,最优反应动态：有快速学习能力的小群体成员的反复博弈复制动态：学习速度很慢的成员组成的大群体随机配对的反复博弈进化稳定策略（ESS）,5.2 最优反应动态,5.2.1 协调博弈的有限博弈方快速学习模型 5.2.2 古诺调整过程,给定前期经验(博弈结果)，各博弈方本期能找到和采用针对前期其他博弈方策略的最佳反应策略,5.2.1 协调博弈的有限博弈方快速学习模型,模型：初始状态：共32种可

3、能，只有无A,1A,有相邻2A，有不相邻2A，有连3A，有非3连A，4A,5A共8种有实质差异,反应、策略调整规则推导,设xi(t)为在t时期博弈方i的邻居中采用A策略邻居的数量xi(t)=0,1,2，博弈方i的得益：即：t期i的邻居中只要有1个采用A，则i在t+1期采用A 特点：i在t+1期策略与自己在第t期策略无直接关系,最优反应动态模拟：初次博弈 1个A,初次博弈相邻2个A,初次博弈相连3个A,进化稳定策略(ESS)：,(1) 在博弈方的动态调整中会达到 (2) 对少量偏离的扰动有稳健性,5.2.2 古诺调整过程-博弈策略无限连续,古诺模型反应函数,1 2 3 4 博弈方1 2.5

4、1.5 2.125 1.875 博弈方2 3 1.75 2.25 1.9375,问题：两寡头始终假设对方产量不变,最优反应动态模拟,收敛条件,博弈方有限理性：知道自己的反应函数，不知道对方的利润、反应函数，也没有预见能力,反应函数斜率,5.3 复制动态和进化稳定性：两人对称博弈,理性层次：博弈方有限理性，学习速度较慢分析框架：大群体成员的随机配对反复博弈隐含：博弈方都是相似的，即对称博弈学习速度慢的表示：优势策略转变是一个渐进的过程，非所有博弈方同时调整,5.3 复制动态和进化稳定性：两人对称博弈,5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2 一般两人对称博弈复制动态和

5、进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略,5.3.1 签协议博弈的复制动态和进化稳定策略,签协议博弈：,假设群体中采用“同意”比例x 则不同策略期望得益：,群体平均得益：,博弈方策略类型比例动态变化是有限理性博弈分析的核心，其关键是动态变化的速度决定模仿速度的因素：模仿对象的数量大小模仿对象的成功程度以采用“同意”策略类型博弈方的比例为例，其动态变化速度可用下列微分方程反映：,动态微分方程的相位图,稳定状态、不动点：x*=0, x*=1,签协议博弈复制动态相位图,X=0时采用同

6、意策略类型博弈方比例的变化率为0。必须要有模仿的对象才能学习,除X=0外，从其他初始情况出发的复制动态过程，最终都收敛到x=1，即都“同意”,进化稳定策略的检验,5.3.2一般两人对称博弈复制动态和进化稳定策略,一般模型,进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置是无差异的。其中abcd可以是任何得益，根据问题设定。,复制动态分析,复制动态的进化规则是生物学中生物特征进化规则设x为采用策略1的比例,复制动态相位图,X*可能与x=0或x=1重合,5.3.3 协调博弈的复制动态和进化稳定博弈,dx/dt,复制动态进化博

7、弈的结果常常取决与带有很大偶然性的初始状态。,5.3.4 鹰鸽博弈的复制动态和进化稳定策略,双方争夺的利益,失败一方的损失,复制动态方程和相位图,dx/dt,采用鹰策略博弈方比例,设v=2,c=12,ESS，意义：在较大规模群体的长期进化中，采取攻击型策略的博弈方数量最终稳定在1/6左右，发生严重战争的可能性为1/36,5.3.5 蛙鸣博弈的复制动态和进化稳定策略,动物进化竞争是生物多样性、复杂性的基本机制蛙鸣博弈：,蛙鸣博弈不同均衡的条件,蛙鸣博弈复制动态方程和不动点,x鸣叫雄蛙比例,可能的不动点：x*=0x*=1x*=(m-z)/(1-p),复制动态方程,蛙鸣博弈复制动态相位图,d

8、x/dt,0(m-z)/(1-P)v20,设v1=10，v2=2，c=12,非对称鹰鸽博弈博弈方1群体复制动态相位图,非对称鹰鸽博弈博弈方2群体复制动态相位图,两群体复制动态关系和稳定性,x*=1,y*=0和x*=0,y*=1是这个博弈的进化稳定策略当初始位置落在A区域，最终收敛到x*=0,y*=1 当初始位置落在D区域，最终收敛到x*=1,y*=0,第六章完全但不完美信息动态博弈,信息不充分、不对称会使人们决策选择的难度增加，对博弈的结果和效率产生影响，也使博弈分析的难度增加。本章将主要以二手车交易模型为核心，介绍不完美信息动态博弈的完美贝叶斯均衡分析方法。,本章分五节,6.1 不完美

9、信息动态博弈 6.2 完美贝叶斯均衡 6.3 单一价格二手车模型 6.4 双价二手车交易 6.5 有退款保证的双价二手车交易,6.1 不完美信息动态博弈,6.1.1 概念和例子 6.1.2 不完美信息动态博弈的表示 6.1.3 不完美信息动态博弈的子博弈,6.1.1 概念和例子,完美信息：博弈中后面阶段的博弈方有关于前面阶段博弈进程的充分信息完美信息动态博弈：动态博弈中的所有博弈方都有完美信息的博弈完全信息：各博弈方对博弈结束时每个博弈方的得益是完全清楚的不完美信息动态博弈的基本特征之一是博弈方之间在信息方面是不对称的，如二手车市场,6.1.2 不完美信息动态博弈的表示,多节点信息集扩展

10、形表示,买方信息不完美,6.1.3 不完美信息动态博弈的子博弈,因为原博弈本身不会成为原博弈的后续阶段，因此子博弈不能从原博弈的第一个节点开始，即原博弈不是自己的子博弈包含所有在初始节点之后的选择节点和终点，但不包含不跟在此初始节点之后的节点不分割任何的信息集。,专对有多节点信息集的不完美信息动态博弈,6.2 完美贝叶斯均衡,6.2.1 完美贝叶斯均衡定义 6.2.2 均衡要求的初步解释 6.2.3 关于判断形成的进一步解释,6.2.1 完美贝叶斯均衡定义,在不完美信息动态博弈中纳什均衡和子博弈完美纳什均衡都不能解决问题，需要引进新的均衡概念纳什均衡和子博弈完美纳什均衡分析方法，反应函数和

11、逆推归纳法等同样也要改进、变化,一个策略组合和相应的判断满足下列4个要求，称为一个“完美贝叶斯均衡”：,要求1：在各个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。非单节点信息集：可能性的概率分布；单节点信息集： “判断达到该节点的概率为1”要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。即在各个信息集，给定轮到选择博弈方的判断和其他博弈方的“后续策略”，该博弈方的行为及以后阶段的“后续策略”，必须使自己的得益或期望得益最大。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定要求4：在不处于均衡路径上的信息集处，

12、“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定,6.2.2 均衡要求的初步解释,1、判断的必要性2、序列理性要求实质是利益最大化要求，排除博弈方策略中不可信的威胁或承诺。博弈方2威胁：轮到自己选择时将唯一地只选D（当1选L可能性较大时不符合序列理性） 3、判断与策略的一致性：符合策略和BAYES法则（包括均衡路径和非均衡路径上）,什么是“均衡路径上的信息集”？,在均衡路径上的信息集：如果博弈按照均衡策略进行，则该信息集会以正的概率达到。不在均衡路径上的信息集：博弈按均衡策略进行时绝对不可能达到，或者达到的概率为0。,1、均衡策略组合：“博弈方1第一阶段L，博弈方2第二阶段U”均衡路径

13、上判断：p=1 2、均衡策略组合：“博弈方1第一阶段R，博弈方2第二阶段D”p=1,与2的均衡策略不符p=0,与1的均衡策略不符结论：不存在与该策略组合一致的不在均衡路径上判断，因此该策略组合不可能构成完美贝叶斯均衡。,不可信威胁：若博弈方1第一阶段不选R，则博弈方第二阶段唯一选择D。在博弈方1选L概率较大时，不符合最大利益原则,子博弈完美纳什均衡,6.2.3 关于判断形成的进一步解释,二手车交易为例,p(g),p(b):通过经验性知识和数据，或平均情况得到,买方判断符合贝叶斯法则,p(s|g),p(s|b):取决于卖方均衡策略,车况好差：好车差车各占一半,即p(g)=p(b)=0.5 卖

14、方策略：好车一定卖，差车有一半概率卖出时选择卖,具体例子：,符合卖方均衡策略也符合自己的均衡策略,假设买方p(s)=0.5,三方三阶段不完全信息动态博弈,逆推分析：（1）博弈方3选U期望得益为 p*1+(1-p)*2=2-p 选D的期望得益为 p*3+(1-p)*1=1+2p 因此，p1/3时选D，p1/3，更准确p=1符合博弈方2，3均衡策略（3）博弈方1知道从博弈方2开始的子博弈均衡为(L,D)，因此F是均衡策略完美贝叶斯均衡：策略组合(F,L,D)以及博弈方3的判断p=1,要求4的必要性 (B,L,U)及博弈方3的判断p=0符合要求1-3，不符合4，不构成完美贝叶斯均衡,6.3 单

15、一价格二手车模型,6.3.1 单一价格二手车交易博弈模型 6.3.2 均衡的类型 6.3.3 模型的纯策略完美贝叶斯均衡 6.3.4 模型的混合策略完美贝叶斯均衡,6.3.1 单一价格二手车交易博弈模型,基本假设：,其中V、W为好差车对买方的价值,买卖双方积极的选择(一方卖一方买)均存在一定风险，保守选择则可能丧失获得潜在利益的机会,6.3.2 均衡类型,完全失败：市场上所有的卖方，无论商品好坏，都选择不卖完全成功：质量好的商品的卖方将商品投放市场，质量差的商品的卖方不敢将商品投放市场部分成功：所有的卖方，无论商品好坏，都将商品投放市场，而买方也不管好坏商品都买进接近失败：所有好商品的卖方都将商品投放市场，而只有部分“差”商品的卖方将商品投放市场，同时买方以一定的概率随机决定是否买进,

展开阅读全文