R-P-S博弈的演化分析－金锄头文库

资源描述

《R-P-S博弈的演化分析》由会员分享，可在线阅读，更多相关《R-P-S博弈的演化分析（19页珍藏版）》请在金锄头文库上搜索。

1、本科毕业论文设计石头-剪子-布博弈的演化分析学院：理学院专业：数学与应用数学班级：数学111 学号： 1107010265 学生_敖成凯指导杨光惠 2015 年6月10日石头-剪子-布博弈的演化分析Evolutionary Analysis of Rock-Scissors-Paper Game 敖成凯Ao Cheng-kai贵州大学本科毕业论文设计诚信责任书本人郑重声明：本人所呈交的本科毕业论文,是本人在导师的指导下独立研究成果.毕业论文中凡引用别人已发表或未发表的数据、观点、结果等,均在引用处标明.特此声明.论文作者签名：日期： / 目录目录I摘要IIAbstractI

2、II前言1第一章绪论21.1选题背景与意义21.2研究方法与目的21.3研究思路与论文结构21.4国内外文献运用综述31.5 相关理论基础31.5.1石头剪子布的经典博弈方式31.5.2石头剪子布的演化博弈方式5第二章RPS游戏有关数据分析62.1数据采集方法62.2数据收集结果62.2.1每个阶段收益情况62.1.2策略选择结果72.3通过数据分析结果7第三章 RPS游戏的演化分析83.1 RPS游戏的混合纳什均衡83.2博弈演化相关知识83.3 广义的RPS游戏博弈稳定性10第四章RPS博弈的演化分析结果124.1结论124.2未来展望13参考文献14致谢15石头-剪子-布博弈的演化分析

3、摘要现实社会中决策者怎样在多次相同的非合作博弈下决策是一个具有挑战性的问题.在石头R-剪子S-布P游戏的博弈过程中,每个参与者都将会随机选择决策来避免被利用,其所得结果是一个持续循环的路径.以石头-剪子-布游戏为研究对象较少的情况下,研究它是一个有趣的项目,利用理论框架描述该游戏是具有重要的意义.在这里,通过建立实验模型来观察并统计RSP游戏中产生的数据与结果,可以发现R、S、P决策选择趋近相同,游戏策略的循环方向和选择频率对收益影响不大.在对其演化分析中我将采用RPS游戏的收益矩阵和广义收益矩阵为研究对象,可以发现不同的值其演化的稳定性不同.通过以上过程,最终可以得到,部分参与者在游戏过程中

4、随机选择策略并利用对手的非随机选择策略能破坏 RPS博弈的演化稳定性,但当所有参与者都掌握这个方法时,RPS博弈的演化稳定性将不会被破坏.关键词：决策；纳什均衡；博弈论；演化分析；数据分析；复制子动态Evolutionary Analysis of Rock-Scissors-Paper GameAbstract In a repeated non-cooperative game, how to make decisions is a challenging problem for players. In the process of Rock -Scissors -Paper game,

5、players will randomly choose a decision to avoid being exploited, and the result is a process of continuous cycling. Due to its rare research, it is interesting and instructive by using theoretical framework to describe the game. Here, data and results of RPS game are observed in the model, we can f

6、ind that decisions of R, P or S been chosen to approach the same, the cycling direction and selection frequency of game-strategy are has little effect on earnings. I will use payoff-matrix and generalizedpayoff-matrix to conduct evolutionary analysis, it will be found that its evolutionary stability

7、 varies with the values of in the generalizedpayoff-matrix. The final result is that some of the participants randomly choose a decision and opponent for non-randomly choose a decision in the game, the evolutionary stability of RPS game will be destroy, but when all the participants master this meth

8、od, the evolutionary stability of RPS game will be not destroyed.Keywords:Decision-making; Nash equilibrium; Game theory; Evolution analysis; Dataanalysis; Replicator dynamics. 前言本论文是根据经济博弈论、博弈论与信息经济学、演化博弈论三本书为理论基础,以中国传统猜拳游戏为模型,通过实际游戏过程进行理论分析其博弈的演化过程.首先,本文论述RPS游戏模型的背景与意义.其次,阐述研究目的,研究思路,研究方法与结构布局.然后

9、,对RPS游戏模型所得数据进行理论分析.最后,探究该游戏的演化过程以与未来的发展.通过以上过程,我们运用博弈论这个工具,加强了我们对博弈方法的了解与运用,分析其过程运用概率论与数理统计来分析数据和常微分方程表示演化过程,使得我们感受到数学的无穷美丽与博弈演化过程的精彩绝伦.查阅资料我们发现游戏具有数学上的非传递性,正因为如此,该游戏规则拥有着绝对的平衡,参与者没有任何游戏漏洞利用.但它是有意思的存在,因为该游戏过程中充满了心理博弈的较量.进行一次游戏,没有研究的意义,它是不完全信息的,而游戏过程中通过观察对手的行动而决策,又非静态博弈,对本次游戏的演化研究也没有意义.故我们需要一个不断重复游戏

10、来达到游戏的完全信息后静态博弈的演化分析.在游戏过程中,我们了解和运用了博弈论知识,知道最佳可行策略方案就是随机选择策略,然而人们在游戏过程中又不可能达到随机选择性,故提升胜利的方法便是利用对手的非随机性,长期下来我发现会克制自己的行为惯性并利用别人的行为惯性的人胜利次数会增加,用演化的方法解释为该人掌握了选择模型.在理论研究中,我们可以发现该游戏只有一个混合策略纳什均衡,而没有纯策略纳什均衡,故我们将利用该游戏的收益矩阵来研究其演化博弈.首先我们探讨了在该模型基本信息,然后探讨了该模型的广义收益矩阵中小于0,等于0,大于0时策略拥有不同的演化稳定性.最后可以发现：在个别参与者掌握并使用选择性

11、方法能提升自己的胜利,会使群体发生模仿行为,使得群体都能掌握并使用该方法后,达到了一个新的稳定状态,与是群体中任意两个的比赛胜利结果几乎相等.本文是在杨老师的指导下完成,通过本次研究 RPS游戏博弈的演化分析,使得我对博弈论有着更深的认识.第一章绪论1.1选题背景与意义演化博弈理论Evolutionary Game Theory是将博弈理论分析和动态演化过程分析相结合,对长期博弈中每个博弈者在不同时间段的博弈稳定分析的一种理论.其方法论中,它即不同于博弈论将重心放在静态均衡或比较静态均衡的状态上,又不同于早期的演化经济学忽视静态均衡状态而趋于动态变化的不可知论.目前演化博弈理论的应用可以说是

12、很广泛,可也才刚刚起步而已,因而整个理论体系还有待深化、完善使其完美. 本文通过对RPS游戏的游戏过程和结果的统计探究,揭示其博弈的离散动态过程,并在此基础之上发现问题并展开分析,为进一步研究提供参考.最终了解该游戏具有可玩性与持续性的原因,并探究该游戏中不同决策的稳定性与游戏的稳定性.1.2研究方法以目的本文采用扑克牌A、2、3代替石头R、剪子S、布P完成两人六组各100局比赛.以实际方式研究RPS游戏中参与者在赢利或失利下所采取的各种措施,统计不同策略的使用情况,总结其中的问题并提出相应的方法以研究2人3决策的博弈演化过程是否存在演化稳定策略和游戏是否具有系统稳定性.我们将采用统计学方法统

13、计和分析数据,使用博弈论的方式来研究其理论基础,运用数学常微分方程知识表示其演化过程并寻求其是否有演化稳定策略和系统的稳定性.1.3研究思路与论文结构本文主要是探究RPS博弈的演化过程,并寻求其稳定性策略与系统的稳定性,是否可以通过改变决策提高个别参与者利益,验证该决策方案是否稳定.故我们将探究RPS游戏的广义收益矩阵的演化稳定策略,在实际游戏中是否存在这样的结果并探究其是否趋于稳定.本文第一章是绪论,主要是针对文章的选题意义与背景,研究方法与过程和写作进行安排.第二章对游戏过程与结果做记录与分析,为理论研究做依据.第三章是对游戏做混合纳什均衡分析与博弈过程的演化分析,并对其结果做比较.第四章

14、对游戏结果做分析并提出建议,同时对演化博弈论今后的发展做简单展望.1.4国内外文献运用综述本节主要介绍文章所涉与的文献资料,通过他们的理论来探索RPS博弈的演化分析过程既有指导意义.下面介绍主要运用的文献. 博弈论与经济行为问世于1944年,在Von Neumann和 Morgenstern的手上诞生,使得关于策略性行为的理论出现.1950年John Nash的非合作博弈Non-cooperative Games博士论文提出了纳什均衡这一个重要概念.1982年Maynard Smith著作了演化与博弈论,奠定了演化博弈论的基础.他把博弈论的分析方法运用到生物学领域,并分析了群体行为的动力学机制

15、,同时提出了演化的稳定策略.使得博弈论进入许多领域.1995年Jorgen Weibull著作了演化博弈论,比较完善系统的总结了演化理论.21世纪以来,研究主要在博弈的演化稳定性问题,合作博弈演化问题和随机扰动的演化博弈问题.国内以1996年张维迎编著了博弈论与信息经济学与2002年谢识予编著了经济博弈论为代表.而在数据处理上我参考了程依明等编写的概率论与数理统计 2011年出版与王高峰等编写的常微分方程 2012年重印.1.5 相关理论基础1.5.1石头剪子布的经典博弈方式RPS游戏是我国广为流传的猜拳游戏,人们常用它来赌胜负.该游戏的规则为两人用不同手势分别代表石头、剪子或布,双方同时出一种手势,手势相同为平,手势不同时,以石头五指握拳赢剪子只伸出食指和中指、剪子赢布五指伸直、布赢石头.该游戏简单,却包含许多道理,且它是一个两个各三种可选策略的零和博弈.该博弈中得到好的得益结果的机会都在于,一是不让对方猜到自己的策略选择,二是要猜测对方的策略选择.其得益矩阵如下,得益0表示平,得益1表示赢,得益-1表示输

展开阅读全文

R-P-S博弈的演化分析

最新文档