第三章第五节演化博弈模型

上传人:cn****1 文档编号:498723066 上传时间:2023-06-24 格式:DOC 页数:37 大小:1.19MB
返回 下载 相关 举报
第三章第五节演化博弈模型_第1页
第1页 / 共37页
第三章第五节演化博弈模型_第2页
第2页 / 共37页
第三章第五节演化博弈模型_第3页
第3页 / 共37页
第三章第五节演化博弈模型_第4页
第4页 / 共37页
第三章第五节演化博弈模型_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《第三章第五节演化博弈模型》由会员分享,可在线阅读,更多相关《第三章第五节演化博弈模型(37页珍藏版)》请在金锄头文库上搜索。

1、第五节演化博弈模型、演化博弈思想传统博弈理论的两个苛刻假设:(1)完全理性(2)完全信息与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。演化博弈论(Evolutionary Game Theory)把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上,它不同于博弈论将重点放在静态均衡 和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。为什么将演化思想引入到博弈论中?(1)博弈论对生物学的影响。博弈论的策略对应生物学中的基因,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性

2、的选择。(2)演化化思想对社会科学的影响。例如,在市场竞争中,我们不必要去理性的想那个策略才是最优的,最后能够在市场存活下来的企业,一定是适应能力最强的公司。在演化博弈理论中,演化稳定策略(Evolutionary Stable心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。 于是,博弈方在博弈的过程中需要不断进行学习,有过策略失误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个稳定的策略。复制动态实际上是描述某一特定策略在一个种群中被采用的频数或频度的动态微分方程,可以用下

3、式表示:dK = x (u .x)-u(x.x)dt1上式中兔为一个种群中采用纯策峪出例或概率,他月表示采用纯策略时的适应度,演化博弈关注的问题当时间趋于无穷大时,博弈参与方策略选择行为是怎样的? 这就是演化博弈稳定性问题,一个稳定状态必须对微小扰 动具有稳健性才能称为演化稳定策略。也就是说,如果我 们假定为演化稳定策略的稳定点,则该点除了本身必须是 均衡状态以外,还必须具有这样的性质:如果某些博弈方 由于偶然的错误偏离了它们,复制动态仍然会使X回复到X*o在数学上,这相当于要求:当干扰使X低于时X* , dx/dt必须大于0;当干扰使得x出现高于时x*, dx/dt必须小于0,这就要求这些稳

4、定状态处于的导数必须小于0。演化稳定策略的影响因素分析(_)签协议博弈1, 10 , 00, 00 , 0Y乙NY 甲NY:同意N:不同意假设:群体中的比例为卩的比例为,对于 甲 Uy = Xl + (l-X)0=XUN = x 0+(1 兀) 0 = 0则:竺 dt设:群体比例的动态变化速度为U=x-UY+(l-xUN=x2普=巫呵、当“时,稳定;、制动态方程当兀0时,最终稳定于兀4 dxldtdt1 , 10 , 01 90, 0i 0, 0=乙甲Y图1签协议博弈的复制动态相位图0=0,兀率=1为稳定状态,此时,dx/dt=Q 但r1为ESS,即最终所有人都将选择(二) 一般两人对称博弈S

5、1 乙 S2群体中采用S1的比例为心S2的比例为1% 对于甲5 =XQ+(1 X)b U =AC+(1 X)/ U = xU+(l-x)U2则复制动态方程Fd):F(x) = = x(U -U = x(l-x)兀(Q-c) + (l-x)(b-)当 F(x)=:O 时,复制动态稳定状态为:x=0, x=l,工舔=b)/(abc+d)稳定性定理F(x)=dx/d, % 则灯若xr*,为使xf:*,应满足卩(兀)0;若m*,为使兀F*,应满足F(x)vO4 F(x)F(x)=dx/dZ, 口,则口这意味着:当F(h)vO,兀那为ESSX乙ABF二不F(17)“(Q-c) + (l-x)-d)当F(

6、兀)=0时,护=0,兀半=1,=x(l-x)(61x-l 1)小=11/61为稳定状态%11/61图2协调博弈的复制动态相位图护=0和1为ESS(三)协调博弈的复制动态和ESSI dx/dt可知,当F)v0,F(l)v0, 而F/61)0,则这意味着:当初始兀vll/61时,ESS为兀30;当初始兀11/61时,ESS为护=10(四)鹰鸽博弈的复制动态和ESS(l-x) X(Q_=x(l-x)(v-c)/2, (v-c)/2v , 00 , Vv/2, v/2itii乙令兀为采用“鹰”策略的群体比例,为采用“鸽”策略的群体比当F(x) =0时,x=0, x=l, x=v/c为稳定状态乙鹰鸽乙乙

7、A dxldtF0)0,F(1)0,而F(l/6) FU F-Jm-z ,i-m1 .m m-7o , o, ill 厶 m、P为求偶成功的概率 z为机会成本(体力消耗、危险性等)满足:m G (0.5,1, mPm-z0A dxldtESS: x*= (m-z)/(1-P)在这种情况下,无论初始状况如何,最后总有(mz)/(1P)比例的雄蛙鸣叫。当个别雄蛙“搭便车”的收益大于群体雄蛙“鸣叫”所获得的收益时,则总会存 在搭便车“不鸣叫”的雄蛙。蛙E鸣不鸣m-z ,1-m不鸣 1-m, m-z尸二 # = x(17)0-可-(1-P)x若(m-z)/(1-P) m若(m-z)/(1-P) 1,即

8、m-z1-Pdx/dt dxldt11蛙E鸣不鸣蛙E鸣不鸣ESS: x=lESS: h=0显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫” O当“鸣叫”的收益大于群体鸣叫而个别雄蛙“搭便车”的收益时,所有雄蛙都将鸣 叫三、复制动态中的非对称博弈A对称博弈:相似/相同群体中的演化博弈行为A非对称博弈:不同群体间的演化博弈行为(一)市场阻入博弈解者有两个群体:竞争者和在位者进入不进入TA/(竞争者IX采用A表示竞争者,B表示在位者0 02 , 21 , 51 , 57A 7B打击不打击进入A不进假设:A: “进入”的群体比例为兀“不进”的群体比例为B: “打击”的群体比例为y“不打击”的群体

9、比例为1丿对A而言:匕=尹0+(1-巧2 = 2-2丁百a =兀乙+(1-兀)心為=2x(l-y)+(l-x)则竞争者群体的复制动态方程卩:(-乙)=兀(1-兀)(1-2刃B打击不打击A: “进入”的群体比例为兀0 , 02 , 21 , 5= 1,5 =进入A不进“不进”的群体比例为B: “打击”的群体比例为y“不打击”的群体比例为1丿B打击不打击dx竞争者群体的复制动态方程:FA(x) = = x(UAe-UA) = x(l-x)(l-2)竞争者的群体复制动态相位图为:B打击不打击B打击不打击m dx/dtan dx/dtdx/dtB打击不打击(a)尸 1/2 h 0,1(b) yl/2E

10、SS: x=0(c) y2+(1兀)5 = 53x口b =丁+(1-夕)心血=5-2xy-3x则在位者群体的复制动态方程Fb():FB(y) = = yBs-B) = y-y)(-2x)进入A不进“不进”的群体比例为“不打击”的群体比例为1丿在位者群体的复制动态方程:竹(刃=务=) = y(i-y)(-2x)B: “打击”的群体比例为y打击不打击A: “进入”的群体比例为兀打击不打击A: “进入”的群体比例为兀在位者的群体复制动态相位图为:A dy/dt打击不打击A: “进入”的群体比例为兀dy/dt打击不打击A: “进入”的群体比例为兀打击不打击A: “进入”的群体比例为兀(a) x=0严 0,1(b)兀工0ESS: y*=0打击不打击A: “进入”的群体比例为兀进入A不进“不进”的群体比例为“不打击”的群体比例为1丿最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例1/2B: “打击”的群体比例为y0打击不打击A: “进入”的群体比例为兀0打击不打击A: “进入”的群体比例为兀綿通过分析可知:ESS为工严=0 脇即无论两个群体的初始状态落在哪个区1:域,最终的演化博弈结果为竞争者“进入”,在位者“不打击”0(二)非对称鹰鸽博弈有两个实力不同的群体,争夺/分享资源鹰乙鸽lT(V1-C)(V2-C

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号