第五节 演化博弈模型,一、演化博弈思想,传统博弈理论的两个苛刻假设: (1)完全理性(2)完全信息 与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件 演化博弈论(Evolutionary Game Theory)把博弈理论分析和动态演化过程分析结合起来的一种理论在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡演化博弈理论源于生物进化论为什么将演化思想引入到博弈论中? (1)博弈论对生物学的影响博弈论的策略对应生物学中的基因 ,博弈论的收益对应生物学中的适应度在生物学中应用的博弈论与经济学中的传统博弈论最大区别就是非完全理性的选择 (2)演化化思想对社会科学的影响例如,在市场竞争中,我们不必要去理性的想那个策略才是最优的,最后能够在市场存活下来的企业,一定是适应能力最强的公司在演化博弈理论中,演化稳定策略 (Evolutionary Stable Strategy, ESS)和复制动态(Replication Dynamics)是两个核心概念演化稳定策略是指在博弈的过程中,博弈双方由于有限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。
于是,博弈方在博弈的过程中需要不断进行学习,有过策略失误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策略经过一段时间的模仿和改错,所有的博弈方都会趋于某个稳定的策略 复制动态实际上是描述某一特定策略在一个种群中被采用的频数或频度的动态微分方程,可以用下式表示:,,当时间趋于无穷大时,博弈参与方策略选择行为是怎样的?这就是演化博弈稳定性问题,一个稳定状态必须对微小扰动具有稳健性才能称为演化稳定策略也就是说,如果我们假定为演化稳定策略的稳定点,则该点除了本身必须是均衡状态以外,还必须具有这样的性质:如果某些博弈方由于偶然的错误偏离了它们,复制动态仍然会使x回复到x*在数学上,这相当于要求:当干扰使x低于时x* ,dx/dt必须大于0;当干扰使得x出现高于时x*, dx/dt必须小于0,这就要求这些稳定状态处于的导数必须小于0 演化稳定策略的影响因素分析,演化博弈关注的问题,二、复制动态中的对称博弈,,(一)签协议博弈,,假设:群体中“Y”的比例为x,“N”的比例为1-x,对于甲,Y:同意 N:不同意,,,,,设:群体比例的动态变化速度为,,图1 签协议博弈的复制动态相位图,x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”,,,(二)一般两人对称博弈,,群体中采用S1的比例为x,S2的比例为1-x,对于甲,,,,,,当F(x) =0时, 复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d),则复制动态方程F(x):,,稳定性定理,,若x0; 若xx*,为使xx*,应满足F(x)<0.,,,,,这意味着: 当F(x*)<0,x*为ESS,,(三)协调博弈的复制动态和ESS,,,,,,当F(x) =0时,x*=0,x*=1,x*=11/61为稳定状态,复制动态方程F(x):,图2 协调博弈的复制动态相位图,,(四)鹰鸽博弈的复制动态和ESS,,,,,令x为采用“鹰”策略的群体比例,1-x为采用“鸽”策略的群体比例,则复制动态方程F(x):,当F(x) =0时,x*=0,x*=1,x*=v/c为稳定状态,,,,,, 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益),F (0) 0, F(1)0,而F(1/6)<0, 则ESS为: x*=1/6,当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为1/36;和平共处的可能性为25/36;一方霸道、一方忍让的可能性为10/36。
发生战争的可能性随着c/v比值的增加而降低,即:和平共处的可能性也随着增加 假设v=8,c=8(表示种群间和平共 处所得到的收益等于两者冲突导致的损失),ESS: x*=1,当cv时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益主要原因在于当一方忍让时,另一方可获得更多收益 这是一种悲剧目前,人类的现状和理性尚不能解决这种悲剧四)蛙鸣博弈的复制动态和ESS,,,,,令x为采用“鸣”策略的群体比例,1-x为采用“不鸣”策略的群体比例,则复制动态方程F(x):,m、P为求偶成功的概率 z为机会成本(体力消耗、危险性等),满足:m (0.5,1,m
当“鸣叫”的收益大于群体鸣叫而个别雄蛙“搭便车”的收益时,所有雄蛙都将鸣叫对称博弈:相似/相同群体中的演化博弈行为 非对称博弈:不同群体间的演化博弈行为,三、复制动态中的非对称博弈,,有两个群体:竞争者和在位者,(一) 市场阻入博弈,,,,,,A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y,,对A而言:,,,则竞争者群体的复制动态方程FA(x):,采用A表示竞争者,B表示在位者,假设:,,,,,,竞争者群体的复制动态方程:,A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y,,,,,竞争者的群体复制动态相位图为:,(b) y1/2 ESS: x*=0,(a) y=1/2 x*0,1,(c) y<1/2 ESS: x*=1,,,,,A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y,,,,,,对B而言:,则在位者群体的复制动态方程FB(x):,,,,,,在位者群体的复制动态方程:,A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y,,,,,在位者的群体复制动态相位图为:,(b) x0 ESS: y*=0,(a) x=0 y*0,1,,,,,,A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y,,,最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例,通过分析可知:ESS为x*=1,y*=0 即无论两个群体的初始状态落在哪个区域,最终的演化博弈结果为竞争者“进入”,在位者“不打击”,,,有两个实力不同的群体,争夺/分享资源,(二) 非对称鹰鸽博弈,若简化问题分析,令v1=10,v2=2,c=12,,,A:采用“鹰”策略的群体比例为x “鸽”策略的群体比例为1-x B:采用“鹰”策略的群体比例为y “鸽”策略的群体比例为1-y,对A而言:,则A群体的复制动态方程FA(x):,采用A表示甲,B表示乙,假设:,,,A群体的复制动态方程:,A的群体复制动态相位图为:,(b) y5/6 ESS: x*=0,(a) y=5/6 x*0,1,(c) y<5/6 ESS: x*=1,A:采用“鹰”策略的群体比例为x “鸽”策略的群体比例为1-x B:采用“鹰”策略的群体比例为y “鸽”策略的群体比例为1-y,,对B而言:,则B群体的复制动态方程FB(x):,A:采用“鹰”策略的群体比例为x “鸽”策略的群体比例为1-x B:采用“鹰”策略的群体比例为y “鸽”策略的群体比例为1-y,,,B群体的复制动态方程:,B的群体复制动态相位图为:,A:采用“鹰”策略的群体比例为x “鸽”策略的群体比例为1-x B:采用“鹰”策略的群体比例为y “鸽”策略的群体比例为1-y,(b) x1/6 ESS: y*=0,(a) x=1/6 y*0,1,(c) x<1/6 ESS: y*=1,,,,,,A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y,,,最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例,当初始状态落在A区域,ESS为x*=0,y*=1 当初始状态落在D区域,ESS为x*=1,y*=0 当初始状态落在B、C区域,为不稳定状态,但可以确定最终大部分结果是落在D区。
落在区域A的概率为1/36,区域D的概率为25/36剩下的10/36的可能性中绝大部分也会稳定在D区域谢谢大家!,。