进化博弈基本动态理论

资源描述

《进化博弈基本动态理论》由会员分享，可在线阅读，更多相关《进化博弈基本动态理论（7页珍藏版）》请在金锄头文库上搜索。

1、2003 年年 5 月月 Zhongguo Jingji Pinglun,ISSN 1536- 9056 總第總第三三卷卷，第第 5 5 期期（總第總第 1818 期期）中國經濟評論中國經濟評論 China Business Review(Journal), Inc.,USA58进进化博弈基本化博弈基本动态动态理理论论1广东省顺德职业技术学院经济管理系张良桥摘摘要：要：本文主要介绍进化博弈理论的基本动态模型：对称博弈模仿者动态模型和非对称博弈模仿者动态模型及其相关结论。为了便于理解，在文中引用了一些简单的例子说明它们之间的区别与联系。在此基础上文中还介绍了理论家们对随机动态所进行的相

2、关研究及其所取得的理论成果。最后本文比较了经典博弈理论2与进化博弈理论在动态概念上的差别。关关键词键词：：进化稳定策略模仿者动态随机稳定均衡进化博弈理论至少自 Lewontin（1960）用于解释生态现象就已经产生了，并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。进化博弈理论从有限理性的个体出发，以群体为研究对象，认为现实中个体并不是行为最优化者，个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。进化博弈理论强调系统达到均衡的动态调整过程，认为系统的均衡是达到均衡过程的函数，也就说均衡依赖于达到均衡的路径。动态概念在进化博弈理论中占有相当

3、重要的地位，许多博弈理论家对群体行为调整过程进行了广泛而深入的研究，根据他们考虑问题的角度不同而提出了不同的动态模型，如 Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型；Brgers and Sarin(1995，1997)等提出的强化动态3（Reinforcement Dynamics）模型等等。但到目前为止，在进化博弈理论中应用最多的还是由 Taylor and Jonker(1978)提出的模仿者动态（Replicator Dynamics）模型。模仿者动态是进化博弈理论的基本动态，它能较好地描绘出有限理性个体的群体行为变化趋势，由之得出的结论

4、能够比较准确地预测个体的群体行为，因而倍受博弈论理论家们的重视。本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。一、确定性模仿者一、确定性模仿者动态动态一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。按所研究的群

5、体数目不同，进化博弈动态模型可分为两大类：单群体(Monomorphic Population)动态模型与多群体(Polymorphic Populations)动态模型。单群体动态模型是指所考察的对象只含有一个群体，并且群体中个体都有相同的纯策略集，个体与虚拟的参与人4进行对称博弈。多群体动态模型5是指所考察的对象中含有多个群体，不同1 本文为2002年秋季在陕西省西安市西北大学经济管理学院召开的第二届中国经济学年会的入选论文。张良桥,男,硕士,广东省顺德职业技术学院经济管理系教师，邮编:528300,电话: 0765-2338178,2323748,13660431173,电子邮件:

6、。 2 本文把源于冯诺意曼和摩根斯滕经纳什发展而成的博弈称之为经典博弈论，可参阅文献1，2。3 其实质就是个体与群体进行博弈，即个体通过对群体选择不同策略的个体数的观察来确定自己的选择。3 Selten(1980)通过对个体引入角色限制，首次考察了非对称博弈中的均衡问题，并证明了“在非对称博弈中进化稳定均衡等价于严格纳什均衡”。 4 其实质就是个体与群体进行博弈，即个体通过对群体选择不同策略的个体数的观察来确定自己的选择。5 Selten(1980)通过对个体引入角色限制，首次考察了非对称博弈中的均衡问题，并证明了“在非对称博弈中进化稳定均衡等价进进化博弈基本化博弈基本动态动态理理论论59

7、群体个体可能有不同的纯策略集，不同群体个体之间进行的是非对称博弈。博弈中个体选择纯策略所得的支付不仅随其所在群体的状态变化而变化，而且也随其他群体状态的变化而变化。下面重点介绍单群体与多群体动态模仿者动态模型。 1. 单单群体确定性模仿者群体确定性模仿者动态动态模型模型单群体模仿者动态模型是由 Taylor and Jonker (1978)在考察生态演化现象时首次提出的。他们把一个生态环境中所有的种群看作为一个大群体，而把群体中每个种群都想象或程式化为一个特定的纯策略。群体在不同时刻所处的状态一般用混合策略来表示。所谓模仿者动态是指使用某一纯策略的人数所占比例的增长率等于使用该策

8、略时所得支付6与群体平均支付之差，或者与平均支付成正比例。为了说明的方便，本文首先给出一些符号，然后给出 Taylor and Jonker (1978)模仿者动态公式的推导过程。假定群体中每一个个体在任何时候只选择一个纯策略，比如，第 j 个个体在某时刻选择纯策略（当然is由于突变或策略转移，同一个体在不同时刻可以选择不同的纯策略）。表示群体中各个体可供选择的纯策略集；N 表示群体中个体总数；ni(t)表示在时刻 t,21kksssSL 选择纯策略 i 的个体数。表示群体在时刻 t 所处的状态，其中表示在该时刻选择纯策略的人数在群体中所),(21kxxxxLixi占的比例，即。Ntnxi

9、i)(表示群体中个体进行随机配对匿名博弈时，群体中选择纯策略的个体所得的期望支付。),(xsfiis表示群体平均期望支付。iiixsfxxxf),(),(下面给出连续时间模仿者动态公式，此时动态系统的演化过程可以用微分方程来表示。在对称博弈中每一个个体都认为其对手来自于状态为 x 的群体。事实上，每个个体所面的对手是代表群体状态的虚拟个体7。假定选择纯策略的个体数的增长率等于8，那么可以得到如下的等式：is),(xsfi),()(xsftndtdn iii由定义可知，两边对 t 微分可以9：Nxtnii)()(),()()()()( 11tnxsfxdttdn dttdnxdttdn dtd

10、xNikiiiikiiiii 两边同时除以 N 得到iiixxxfxsfdtdx),(),(上式就是对称博弈模型中模仿者动态公式的微分形式。可以看出，如果一个选择纯策略的个体得到is的支付少于群体平均支付，那么选择纯策略的个体在群体中所占比例将会随is着时间的演化而不断减少；如果一个选择策略的个体得到的支付多于群体平is均支付，那么选择策略的个体在群体中所占比例将会随着时间的演化而不断is于严格纳什均衡”。6 在这里所说的支付与生态学里所说的繁殖成活率或适应度（fitness）是一个等价的概念。7 在许多进化博弈理论的文献中，都认为个体与自然（Nature）进行博弈。8 在这里是模仿者动态的最

11、基本的假定，由此可以得到以后的所在的结论。9 方程两边对时间求导时要注意，则可得。Nxtnii)(t)()()(21tntntnNkL kii iii dttdnxdtdxNdttdn1)()(011 -204 110表进进化博弈基本化博弈基本动态动态理理论论60地增加；如果个体选择纯策略所得的支付恰好等群体平均支付，则选择该纯策略的个体在群体中所占比is例不变。从上面的公式推导过程可以看出，Taylor and Jonker 提出的模仿者动态仅仅考虑到纯策略的继承性，而没有考虑到混合策略的可继承性。Bomze（1986）证明了如果允许混合策略也可以被继承，那么在模仿者动态下，进化稳定

12、策略10等价于渐近稳定性。另外，下面不加证明11地给出 Hofbauer et al. (1979); Zeeman (1980)提出并证明的一个命题， “在模仿者动态下，对称博弈中每一个 ESS 都是渐近稳定的”。这个命题的逆命题并不成立，下面用 Fudenberg(1995)的一个反例来给予说明，考察表矩阵所示的对称博弈：该博弈有唯一对称的纳什均衡12（），且均衡时的期望支付为。这个均衡并不是进化稳31 ,31 , 3132定均衡，因为它能够被策略侵入；又因为在平衡点处雅可比行列式的特征根是和，)21 ,21 , 0(3132 该均衡状态是动态系统的汇13（Sink），因此均衡是渐近稳定

13、的，所以对称博弈的渐近稳定均衡并不一定是进化稳定均衡。从模拟者动态方程可以看出，支付函数的正向变换或者位移变换14只改变群体0,ff 演化速度而不影响群体演化路径。因而，在进行分析时，可以对支付矩阵进行必要的简化处理。另外，由此还可以求出的两个种群相对增长率：0,jixx),(),(2xsfxsfxxxxxxxdtxxdji jijijjiji上式说明：个体博弈时，获得相对较多支付的群体则具有更高的增长率。 2. 多群体模仿者多群体模仿者动态动态模型模型 Selten(1980)引入角色限制行为（Role Conditioned Behavior）而把群体分为单群体与多群体，不同群体根据个体

14、可供选择的纯策略集不同来划分。多群体时，不同群体中的个体有不同纯策略集、不同群体平均支付及不同群体演化速度。因而，多群体模仿者动态公式推导比较复杂，下面给出多群体模仿者动态方程（参阅文献24）：j ijjj ij ixxxfxsfdtdx),(),(其中，上标（）表示第个群体，其中 K 表示有 K 个群体；表示第个群体中选择第jKj, 2 , 1Ljj ixj个纯策略的个体数占该群体总数的百分比；表示群体在某时刻所处的状态，表示), 2 , 1(jNiiLjxjjx第个群体以外的其他群体在时刻所处的状态；表示群体中个体行为集中的第 i 个纯策略；表示混jtj isjx合群体的混合策略组合

15、，表示混合群体状态为时群体中个体选择纯策略时所能得到的期望),(xsfj ixjj is支付；表示混合群体的平均支付。),(jjxxf多群体模型并不是对单群体模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡15”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。下面就利用一个例子来给予说明。10 进化稳定策略与纳什均衡策略之间的区别在文献4中有详细的介绍。11 由于该命题的证明要用到动力系统的熵理论，在此就不给出证明，可参阅文献1012所谓纳什均衡是指一个策略组合，在该组合下任何参与人单独偏离都不会变动比不偏离好，也就是说，在给定其它参与人选择条件下，每一个参与人都选择了使自己获得最大期望效用或利润的决策。事实上，这个博弈也有两个非对称的纳什均衡，但由于我们所考察的是对称博弈，群体中不可能分离出两类不同的参与者，所以博弈结果不可能趋于非对称的纳什均衡。另外，由于进化稳定策略集是纳什均衡的子集，所以要找进化稳定策略首先需要找出纳什均衡，然后找进化稳定策略。13 一个稳定状态叫做汇(Sink)，如果在该状态的雅可比矩阵的特征根都在单位圆内（离散时）或者有负实部（连续时）。1

展开阅读全文

进化博弈基本动态理论

最新文档