数模博弈论课件

上传人:鲁** 文档编号:570195467 上传时间:2024-08-02 格式:PPT 页数:203 大小:1.03MB
返回 下载 相关 举报
数模博弈论课件_第1页
第1页 / 共203页
数模博弈论课件_第2页
第2页 / 共203页
数模博弈论课件_第3页
第3页 / 共203页
数模博弈论课件_第4页
第4页 / 共203页
数模博弈论课件_第5页
第5页 / 共203页
点击查看更多>>
资源描述

《数模博弈论课件》由会员分享,可在线阅读,更多相关《数模博弈论课件(203页珍藏版)》请在金锄头文库上搜索。

1、数学建模数学建模数模博弈论0 0、 引言引言数模博弈论数学建模与素质教育数学建模与素质教育 -数学教育本质上是一种素质教育。数学教育本质上是一种素质教育。 -数学建模的教学及竞赛是实施素质教数学建模的教学及竞赛是实施素质教 育的有效途径。育的有效途径。 -按素质教育的要求搞好数学建模竞赛。按素质教育的要求搞好数学建模竞赛。 数模博弈论学校中的教学,应该是传授知识、培养学校中的教学,应该是传授知识、培养能力和提高素质的统一体,教学改革应能力和提高素质的统一体,教学改革应该推动这方面有机结合和相互促进,而该推动这方面有机结合和相互促进,而不是相互隔离,甚至对立。数学的教学不是相互隔离,甚至对立。数

2、学的教学也不应该例外。不仅如此,由于数学这也不应该例外。不仅如此,由于数学这学科的特点,在某种意义上来说:数学学科的特点,在某种意义上来说:数学教育本质上就是一种素质教育。教育本质上就是一种素质教育。数模博弈论为什么这样说呢?难道我们学数学的目的不就为什么这样说呢?难道我们学数学的目的不就是获取知识,要学得一大堆重要的数学定理、是获取知识,要学得一大堆重要的数学定理、公式和结,懂得各种各样的数学方法和手段吗公式和结,懂得各种各样的数学方法和手段吗?否!否! 如果将数学教学仅仅看成是知识的传授(特别如果将数学教学仅仅看成是知识的传授(特别是那种照本宣科式的传授),那么即使包罗了是那种照本宣科式的

3、传授),那么即使包罗了再多的定和公式,可能仍免不了沦为一堆僵死再多的定和公式,可能仍免不了沦为一堆僵死的教条,难以发挥作用;而掌握了数学的思想的教条,难以发挥作用;而掌握了数学的思想方法和精神实质,就以由不多的几个公式演绎方法和精神实质,就以由不多的几个公式演绎出千变万化的生动结论,显示出无穷无尽的威出千变万化的生动结论,显示出无穷无尽的威力。力。 数模博弈论许多在实际工作中成功地应了数学,并取得相许多在实际工作中成功地应了数学,并取得相当突出成绩的毕业生都有这样的体会:在工作当突出成绩的毕业生都有这样的体会:在工作中真正需要用到的具体数学分支科,具体的数中真正需要用到的具体数学分支科,具体的

4、数学定理、公式和结论,其实并不很多,学校里学定理、公式和结论,其实并不很多,学校里学过的一大堆数学知识很多都似乎没有派上么学过的一大堆数学知识很多都似乎没有派上么用处,有的甚至已经淡忘,但所受的数学训练,用处,有的甚至已经淡忘,但所受的数学训练,所领会的数学思想和精神,却无时无刻不在发所领会的数学思想和精神,却无时无刻不在发挥着积的作用,成为取得成功的最重要的因素。挥着积的作用,成为取得成功的最重要的因素。因此,如果就事论事,仅仅将数学作为知识来因此,如果就事论事,仅仅将数学作为知识来学习,而忽略了学思想对你们的熏陶以及你们学习,而忽略了学思想对你们的熏陶以及你们数学素质的提高,就失去了数学课

5、程最本质的数学素质的提高,就失去了数学课程最本质的特点和要求,失去了开设数课程的意义。特点和要求,失去了开设数课程的意义。 实际实际上,通过严格的数学训练,可以使你们具备一上,通过严格的数学训练,可以使你们具备一些特有的素质,而这些素质是其他课程的学习些特有的素质,而这些素质是其他课程的学习和其方面的实践所无法代替或难以达到的。和其方面的实践所无法代替或难以达到的。 数模博弈论在数学学习过程中,你们应该学习解决一些理在数学学习过程中,你们应该学习解决一些理论或实际的问题。这些问题没有现成的答案,论或实际的问题。这些问题没有现成的答案,没有固定的方法,没有指定的参考书,没有规没有固定的方法,没有

6、指定的参考书,没有规定的数学工具,甚至也没有成型的数学问题。定的数学工具,甚至也没有成型的数学问题。主要靠你们独立思考、反复钻研并相互切磋,主要靠你们独立思考、反复钻研并相互切磋,去形成相应的数学问题,进而分析问题的特点,去形成相应的数学问题,进而分析问题的特点,寻求解决问题的方法,得到有关的结论,并判寻求解决问题的方法,得到有关的结论,并判断结论的对错与优劣总之,你们应该亲口尝一断结论的对错与优劣总之,你们应该亲口尝一尝梨子的滋味,亲身去体验一下数学的创造过尝梨子的滋味,亲身去体验一下数学的创造过程,取得在课堂里和书本上无法代替的宝贵经程,取得在课堂里和书本上无法代替的宝贵经验。毫无疑问,数

7、学模型及数学实验的教学以验。毫无疑问,数学模型及数学实验的教学以及数学建模竞赛的开展,在这方面应该是一个及数学建模竞赛的开展,在这方面应该是一个有益的尝试和实践。有益的尝试和实践。 数模博弈论从应用数学的发展趋势来说,应用数学正迅速地从从应用数学的发展趋势来说,应用数学正迅速地从传统的应用数学进入现代应用数学的阶段。现代应传统的应用数学进入现代应用数学的阶段。现代应用数学的一个突出的标志是应用范围的空前扩展,用数学的一个突出的标志是应用范围的空前扩展,从传统的力学、物理等领域扩展到生物、化学、经从传统的力学、物理等领域扩展到生物、化学、经济。金融、信息、材料、环境、能源济。金融、信息、材料、环

8、境、能源等各个学等各个学科和种种高科技乃至社会领域。传统应用数学领域科和种种高科技乃至社会领域。传统应用数学领域的数学模型大都是清楚的,且已经是力学、物理等的数学模型大都是清楚的,且已经是力学、物理等学科的重要内容,而很多新领域的规律仍不清楚,学科的重要内容,而很多新领域的规律仍不清楚,数学建模面临实质性的困难。因此,数学建模不仅数学建模面临实质性的困难。因此,数学建模不仅凸现出其重要性,而且已成为现代应用数学的一个凸现出其重要性,而且已成为现代应用数学的一个重要组成部分。同学们接受数学建模的训练,和你重要组成部分。同学们接受数学建模的训练,和你们学习数学知识一样,对于今后用数学方法解决种们学

9、习数学知识一样,对于今后用数学方法解决种种实际问题,是一个必要的训练和准备,这是你们种实际问题,是一个必要的训练和准备,这是你们成为社会需要的优秀人才必不可少的能力和素养。成为社会需要的优秀人才必不可少的能力和素养。 数模博弈论数学建模竞赛所提倡的团队精神,对于数学建模竞赛所提倡的团队精神,对于培养同学们的合作意识,学会尊重他人,培养同学们的合作意识,学会尊重他人,注意学习别人的长处,培养求同存异、注意学习别人的长处,培养求同存异、取长补短、同舟共济、团结互助等集体取长补短、同舟共济、团结互助等集体主义的优秀品质所起的不可忽略的作用。主义的优秀品质所起的不可忽略的作用。数学建模竞赛培养你们查资

10、料,应用资数学建模竞赛培养你们查资料,应用资料的能力。料的能力。数学建模竞赛培养你们把写科技论文的数学建模竞赛培养你们把写科技论文的能力和包装成果的能力。能力和包装成果的能力。数模博弈论(一)、(一)、数学建模简介数学建模简介数模博弈论1、什么是数学模型?、什么是数学模型? 数学模型数学模型是对于现实世界的一个特定对象特定对象,一个特定目的特定目的,根据特有的内在规律内在规律,做出一些必要的假必要的假设设,运用适当的数学工具数学工具,得到一个数学结构数学结构。 简单地说:就是系统的某种特征的本质的数学表达式(或是用数学术语对部分现实世界的描述),即用数学式子(如函数、图形、代数方程、微分方程、

11、积分方程、差分方程等)来描述(表述、模拟)所研究的客观对象或系统在某一方面的存在规律。名词解释名词解释数模博弈论2、什么是数学建模、什么是数学建模? 数学建模数学建模是利用数学方法解决实际问题的一种实践。即通过抽象、简化、假设、引进变量等处理过程后,将实际问题用数学方式表达,建立起数学模型,然后运用先进的数学方法及计算机技术进行求解。 观点:观点:“所谓所谓高科技高科技就是一种就是一种数学技术数学技术”数模博弈论 数学建模数学建模其实并不是什么新东西,可以说有了数学并需要用数学去解决实际问题,就一定要用数学的语言、方法去近似地刻划该实际问题,这种刻划的数学表述的就是一个数学模型,其过程就是数学

12、建模的过程。数学模型一经提出,就要用一定的技术手段(计算、证明等)来求解并验证,其中大量的计算往往是必不可少的,高性能的计算机的出现使数学建模这一方法如虎添翼似的得到了飞速的发展,掀起一个高潮。 数学建模数学建模将各种知识综合应用于解决实际问题中,是培养和提高同学们应用所学知识分析问题、解决问题的能力的必备手段之一。数模博弈论数学建模的一般方法和步骤数学建模的一般方法和步骤 建立数学模型的方法和步骤并没有一定的模式,但一个理想的模型应能反映系统的全部重要特征特征: 模型的可靠性可靠性和模型的使用性使用性建模的一般方法: 机理分析 测试分析方法 机机理理分分析析:根据对现实对象特性的认识,分析其

13、因果关系,找出反映内部机理的规律,所建立的模型常有明确的物理或现实意义。 测测试试分分析析方方法法:将研究对象视为一个“黑箱”系统,内部机理无法直接寻求,通过测量系统的输入输出数据,并以此为基础运用统计分析方法,按照事先确定的准则在某一类模型中选出一个数据拟合得最好的模型。 测试分析方法也叫做系统辩识系统辩识。 将这两种方法结合起来使用,即用机理分析方法建立模型的结构,用系统测试方法来确定模型的参数,也是常用的建模方法。数模博弈论 在实际过程中用那一种方法建模主要是根据我们对研究对象的了解程度和建模目的来决定。机理分析法建模的具体步骤大致可见右图。符合实际不符合实际交付使用,从而可产生经济、社

14、会效益实际问题抽象、简化、假设 确定变量、参数建立数学模型并数学、数值地求解、确定参数用实际问题的实测数据等来检验该数学模型建模过程示意图数模博弈论 模型模型 数学模型的分类:数学模型的分类: 按研究方法和对象的数学特征分:初等模型、几何模型、优化模型、微分方程模型、图论模型、逻辑模型、稳定性模型、扩散模型等。 按研究对象的实际领域(或所属学科)分:人口模型、交通模型、环境模型、生态模型、生理模型、城镇规划模型、水资源模型、污染模型、经济模型、社会模型等。数学模型及其分类数学模型及其分类数模博弈论过去全国大学生数学建模竞赛题过去全国大学生数学建模竞赛题数模博弈论 返回返回数模博弈论 返回返回数

15、模博弈论数模博弈论1、如何预报人口、如何预报人口? 要预报未来若干年(如2005)的人口数,最重要的影响因素是今年的人口数和今后这些年的增长率(即人口出身率减死亡率),根据这两个数据进行人口预报是很容易的。记今年人口为 ,k年后人口为 ,年增长率为r,则预报公式为: 预报正确的条件: 年增长率r保持不变。数学建模实例数学建模实例数模博弈论1、指数增长模型、指数增长模型(马尔萨斯人口模型): 英国人口学家马尔萨斯(Malthus17661834)于1798年提出。2、阻滞增长模型、阻滞增长模型(Logistic模型)3、更复杂的人口模型、更复杂的人口模型 随机性模型、考虑人口年龄分布的模型等 可

16、见数学模型总是在不断的修改、完善使之能符合实际情况的变化。人口模型数模博弈论 2、椅子能在不平的地面上放稳吗?椅子能在不平的地面上放稳吗? 把四只脚的椅子往不平的地面上一放,通常只有三只脚着地,放不稳,然而有人认为只要稍挪动几次,就可以四脚着地,放稳了,对吗?数模博弈论3、双层玻璃的功效、双层玻璃的功效 北方城镇的有些建筑物的窗户是双层的,即窗户上装两层厚度为的玻璃夹着一层厚度为的空气,如左图所示,据说这样做是为了保暖,即减少室内向室外的热量流失。 我们要建立一个模型来描述热量通过窗户的热传导(即流失)过程,并将双层玻璃窗与用同样多材料做成的单层玻璃窗(如右图,玻璃厚度为)的热量传导进行对比,

17、对双层玻璃窗能够减少多少热量损失给出定量分析结果。 返回返回数模博弈论 怎样撰写数学建模的论文?怎样撰写数学建模的论文?1、摘要、摘要:问题、模型、方法、结果问题、模型、方法、结果2、问题重述、问题重述4、分析与建立模型、分析与建立模型5、模型求解、模型求解6、模型检验、模型检验7、模型推广、模型推广8、参考文献、参考文献9、附录、附录实例实例3、模型假设、模型假设 返回返回数模博弈论博弈模型博弈模型数模博弈论第一部分、博弈论基本概念第一部分、博弈论基本概念 宇宙间处处存在矛盾、冲突、争斗、合作、共生等宇宙间处处存在矛盾、冲突、争斗、合作、共生等现象,这些现象很很早就引起各类学者的重视。哲学家

18、现象,这些现象很很早就引起各类学者的重视。哲学家们对此作过深刻讨论,毛泽东的矛盾论便是其中的们对此作过深刻讨论,毛泽东的矛盾论便是其中的代表。另一方面,数学被认为是科学的语言,能否用数代表。另一方面,数学被认为是科学的语言,能否用数学语言描述各种带有矛盾因素的模型或现象?博弈论便学语言描述各种带有矛盾因素的模型或现象?博弈论便是这样一种处理各类带有矛盾因素的模型的数学工具,是这样一种处理各类带有矛盾因素的模型的数学工具,现在已被数学、经济学、社会学、军事学、生物学等专现在已被数学、经济学、社会学、军事学、生物学等专家广泛应用于讨论各类带有冲突、矛盾、合作、竞争、家广泛应用于讨论各类带有冲突、矛

19、盾、合作、竞争、进化等问题及相关模型之中。博弈论已成为人们分析复进化等问题及相关模型之中。博弈论已成为人们分析复杂系统与作重大决策时的有力工具。杂系统与作重大决策时的有力工具。一、引言一、引言数模博弈论 数学历史悠久,并且不断发展前进,被称为数学历史悠久,并且不断发展前进,被称为“科学科学的语言的语言”。在。在20世纪前,它最有效的应用范围是天文、世纪前,它最有效的应用范围是天文、物理、力学等所谓精确的自然科学。由于概率论与统计物理、力学等所谓精确的自然科学。由于概率论与统计理论的发展,数学又逐渐应用于生物学与社会科学,而理论的发展,数学又逐渐应用于生物学与社会科学,而分析矛盾现象的数学方法和

20、理论也是在这一背景下于分析矛盾现象的数学方法和理论也是在这一背景下于20世纪初开始萌芽并逐步发展起来的,这个数学分枝世纪初开始萌芽并逐步发展起来的,这个数学分枝称为博弈论(称为博弈论(Game Theory)。)。 数模博弈论 数学研究的方法是从大量的同类现象中抽象出基数学研究的方法是从大量的同类现象中抽象出基本要素,进步构造出能描述这类现象的模型。许多冲本要素,进步构造出能描述这类现象的模型。许多冲突模型在游戏中就存在,博弈论早期就是由研究国际突模型在游戏中就存在,博弈论早期就是由研究国际象棋开始的,所以被命名为象棋开始的,所以被命名为Game Theory。人们很。人们很快认识到此种理论可

21、用于经济、政治、军事等领域,快认识到此种理论可用于经济、政治、军事等领域,所谓所谓“世事纷争一棋局世事纷争一棋局”,正说明其中一些道理。,正说明其中一些道理。1944年冯年冯诺曼(诺曼(John,Von Neumann)和奥)和奥摩根斯特恩(摩根斯特恩(Osker Morgentern)合著的竞赛)合著的竞赛论与经济行为(论与经济行为(Theory Of GSmes and Economic Behavior)问世,总结了初期研究成果,)问世,总结了初期研究成果,奠定了博弈论的基础。由于该理论主要讨论在复杂的奠定了博弈论的基础。由于该理论主要讨论在复杂的矛盾冲突等活动中,局中人(矛盾冲突等活动

22、中,局中人(Player)采取何种合理)采取何种合理的策略(的策略(strategy)而能处于)而能处于“优越优越”的地位,以便的地位,以便取得较好效益,所以将它译为博弈论。取得较好效益,所以将它译为博弈论。 数模博弈论 博弈论博弈论(Game theory)可以被定义为是对智能)可以被定义为是对智能的理性决策者之间冲突与合作的数学模型的研究。的理性决策者之间冲突与合作的数学模型的研究。博弈论为分析那些涉及两个或更多个参与者且其决博弈论为分析那些涉及两个或更多个参与者且其决策会影响相互间的福利的局势提供了一般的数学方策会影响相互间的福利的局势提供了一般的数学方法。就此而论,博弈论便为社会科学各

23、分支的学者法。就此而论,博弈论便为社会科学各分支的学者和实际的决策者提供了非常重要的视角。博奕理论和实际的决策者提供了非常重要的视角。博奕理论家所研究的局势,不仅仅是家所研究的局势,不仅仅是“游戏游戏(Game)”一词所一词所不幸表示的消遣活动,不幸表示的消遣活动,“冲突分析冲突分析”或或“相互相互影响影响的决策理论的决策理论”或许是描述博弈论更为准确的术语。或许是描述博弈论更为准确的术语。数模博弈论 博弈理论家力图通过研究定量模型和假设例子博弈理论家力图通过研究定量模型和假设例子来理解冲突与合作。这些例子可能在很多方面都是来理解冲突与合作。这些例子可能在很多方面都是脱离现实的简化,但与实际生

24、活中大量更为复杂的脱离现实的简化,但与实际生活中大量更为复杂的情况相比,这种简化能使我们更容易看出冲突与合情况相比,这种简化能使我们更容易看出冲突与合作的一些基本问题。当然,这也是任何一个研究领作的一些基本问题。当然,这也是任何一个研究领域都应用的分析方法域都应用的分析方法把问题放在忽略掉现实中把问题放在忽略掉现实中不重要的细枝末节的一个简化模型中加以考虑。因不重要的细枝末节的一个简化模型中加以考虑。因此,即使从未遇到像博弈理论家在研究中明确规定此,即使从未遇到像博弈理论家在研究中明确规定局中人立场的局势,研究过这些假设例子的人们,局中人立场的局势,研究过这些假设例子的人们,仍然能够较好地理解

25、实际的竞争局势。仍然能够较好地理解实际的竞争局势。数模博弈论 常见的游戏如棋类,两人对奕,此两人便称为常见的游戏如棋类,两人对奕,此两人便称为局中人,他们各有一套棋路,或善于用马,或长于局中人,他们各有一套棋路,或善于用马,或长于用炮。在每次轮到一方走子时,他可能有许多走法,用炮。在每次轮到一方走子时,他可能有许多走法,这些走法依赖于当时棋局形势以及棋手想要达到的这些走法依赖于当时棋局形势以及棋手想要达到的目的,以及他惯用的走法,从而形成他走棋的指导目的,以及他惯用的走法,从而形成他走棋的指导思想。对奕时指导棋手行动的思想便称为策略。对思想。对奕时指导棋手行动的思想便称为策略。对局终了可能有三

26、种结局:甲胜;乙胜;和局。如果局终了可能有三种结局:甲胜;乙胜;和局。如果用数量表示各种结局,例如胜家赢得彩金若干(设用数量表示各种结局,例如胜家赢得彩金若干(设所得彩金由输家付给,则输家当然失去若干),和所得彩金由输家付给,则输家当然失去若干),和局时都不能取得彩金,此种表示结局的数称为支付局时都不能取得彩金,此种表示结局的数称为支付(payoff)。局中人、策略、支付是博弈论中常见)。局中人、策略、支付是博弈论中常见的基本概念。的基本概念。数模博弈论 有些游戏中并无有些游戏中并无“机会机会”(chance)因素,而是)因素,而是全凭局中人的技艺。但某些游戏如全凭局中人的技艺。但某些游戏如“

27、桥牌桥牌”、“打百打百分分”等,等,“机会机会”却有较大作用,分发到游戏者手中却有较大作用,分发到游戏者手中的牌是随机的,它们情况要复杂一些。的牌是随机的,它们情况要复杂一些。 游戏并非只有双方,可以有多方,如三人玩的跳游戏并非只有双方,可以有多方,如三人玩的跳棋便有三个局中人。一般只有两个局中人的称为两人棋便有三个局中人。一般只有两个局中人的称为两人博奕(或二人对策),有二个局中人的称为博奕(或二人对策),有二个局中人的称为n人博弈。人博弈。 在博弈论的语言中,一个博弈(在博弈论的语言中,一个博弈(game)指的是)指的是涉及到两个或更多个参与人的某个社会局势。博弈所涉及到两个或更多个参与人

28、的某个社会局势。博弈所涉及的参与人被称为局中人(涉及的参与人被称为局中人(players)。正如前面)。正如前面博弈论的定义所述,博弈理论家一般要对局中人做两博弈论的定义所述,博弈理论家一般要对局中人做两个基本的假设:他们都是理性的和他们都是智能的。个基本的假设:他们都是理性的和他们都是智能的。这两个形容词在这里都是技术性术语,所以需要对其这两个形容词在这里都是技术性术语,所以需要对其逐一解释。逐一解释。数模博弈论 如果一个决策者在追逐其目标时能前后一致地做如果一个决策者在追逐其目标时能前后一致地做决策,我们就称他是理性的(决策,我们就称他是理性的(rational)。在基于决策)。在基于决策

29、理论的基本结论而建立起来的博弈论中,我们假设每理论的基本结论而建立起来的博弈论中,我们假设每个局中人的目标是追求其个人期望支付值的最大化,个局中人的目标是追求其个人期望支付值的最大化,支付则是用某个效用(支付则是用某个效用(Utility)尺度来度量的。理性)尺度来度量的。理性决策者应该按使自己的期望支付最大化的方式去做决决策者应该按使自己的期望支付最大化的方式去做决策的思想,至少可以追溯到伯努里(策的思想,至少可以追溯到伯努里(Bernoull,1738),但这个思想在近代被辨明为是正当的,则应),但这个思想在近代被辨明为是正当的,则应归功于冯归功于冯诺依曼和摩根斯特恩(诺依曼和摩根斯特恩(

30、1947)。借助关于)。借助关于理性决策者应该如何行动方面所做的一些非常弱的假理性决策者应该如何行动方面所做的一些非常弱的假设,他们证明了,对任一理性的决策者,一定存在某设,他们证明了,对任一理性的决策者,一定存在某种方式对他所关心的各种可能结果赋予效用数值,使种方式对他所关心的各种可能结果赋予效用数值,使其总是选择最大化自己的期望效用。我们称这一结论其总是选择最大化自己的期望效用。我们称这一结论为期望效用最大化定理(为期望效用最大化定理(expectedutility maximization theorem)。)。数模博弈论二、二、 博弈论概述博弈论概述、博弈论几个经典的例子、博弈论几个经

31、典的例子、博弈论的基本概念、博弈论的基本概念、博弈论与经济学、博弈论与经济学 数模博弈论、博弈论几个经典的例子、博弈论几个经典的例子 两个共同作案的犯罪嫌疑人被捕,并受到指控。两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一个人招认犯罪,否则警方无充分证据将他除非至少一个人招认犯罪,否则警方无充分证据将他们按罪判刑。警方把他们关入不同的牢室,并对他们们按罪判刑。警方把他们关入不同的牢室,并对他们说明不同行动带来的后果。如果两人都采取沉默的抗说明不同行动带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱入狱1个月

32、;如果双方都坦白,根据案情两人将被判个月;如果双方都坦白,根据案情两人将被判入狱入狱6个月;如果一个招工而另一个拒不坦白,招认个月;如果一个招工而另一个拒不坦白,招认者因有主动认罪立功表现将立即释放,而另一人将被者因有主动认罪立功表现将立即释放,而另一人将被判入狱判入狱9个月(所犯罪行判个月(所犯罪行判6个月,干扰司法加判个月,干扰司法加判3个个月)。月)。例一例一 囚徒困境囚徒困境数模博弈论 囚徒困境问题可以用图囚徒困境问题可以用图11所示的双变量矩阵的所示的双变量矩阵的形式来描述。形式来描述。数模博弈论 在此博弈中,每个囚徒有两种战略可供选择:在此博弈中,每个囚徒有两种战略可供选择:坦白(

33、或招认)、不坦白(或沉默)。图坦白(或招认)、不坦白(或沉默)。图1-1的矩的矩阵中每一个单元的两个数字表示一组特定的战略阵中每一个单元的两个数字表示一组特定的战略组合下两个囚犯的收益(或支付、效用,这里已组合下两个囚犯的收益(或支付、效用,这里已经开始引用经济学的术语了),其中第经开始引用经济学的术语了),其中第1个数字是个数字是囚徒囚徒1(习惯上是位于矩阵横行上的参与者)的收(习惯上是位于矩阵横行上的参与者)的收益,第益,第2个数字是囚徒个数字是囚徒2(位于竖行上的参与者)(位于竖行上的参与者)的收益。如果囚徒的收益。如果囚徒1选择沉默,而囚徒选择沉默,而囚徒2选择坦白,选择坦白,那么囚徒

34、那么囚徒1的收益是的收益是9(表示判刑(表示判刑9个月),囚徒个月),囚徒2的收益为的收益为0(表示马上释放)。(表示马上释放)。数模博弈论 博弈论囚徒困境问题提供的解是战略组合(坦白,博弈论囚徒困境问题提供的解是战略组合(坦白,坦白)。严格的定义与详细的阐述留到第坦白)。严格的定义与详细的阐述留到第2章讨论。这章讨论。这个战略组合是个占优战略组合,因为无论对方如何选个战略组合是个占优战略组合,因为无论对方如何选择,自己的最优选择都是坦白。如果囚徒择,自己的最优选择都是坦白。如果囚徒2不坦白,囚不坦白,囚徒徒1坦白的话他就会马上获释,不坦白的话还得坐一个坦白的话他就会马上获释,不坦白的话还得坐

35、一个月的牢,所以坦白比不坦白好;如果囚徒月的牢,所以坦白比不坦白好;如果囚徒2坦白,囚徒坦白,囚徒1坦白的话要判坦白的话要判6个月,不坦白的话则要判个月,不坦白的话则要判9个月,这样个月,这样对囚徒对囚徒1来说,还是坦白比不坦白好。因此坦白是囚徒来说,还是坦白比不坦白好。因此坦白是囚徒1的占优战略。同样的分析表明,坦白也是囚徒的占优战略。同样的分析表明,坦白也是囚徒2的占的占优战略。均衡的结果是每个囚徒都选择坦白,各判刑优战略。均衡的结果是每个囚徒都选择坦白,各判刑6个月。个月。数模博弈论 初次接触博弈论的人,难免会提出这样的问题:初次接触博弈论的人,难免会提出这样的问题:战略组合(沉默,沉默

36、),即如果两个人都不坦白,战略组合(沉默,沉默),即如果两个人都不坦白,各人只判刑一个月,不是比战略组合(坦白,坦白)各人只判刑一个月,不是比战略组合(坦白,坦白)带来的各判刑带来的各判刑6个月要好吗?如果经济学中的个月要好吗?如果经济学中的“有效有效”的术语,(沉默,沉默)是一个有效结局。有效的术语,(沉默,沉默)是一个有效结局。有效结局并不是囚徒问题的博弈解,与此相关的理论问结局并不是囚徒问题的博弈解,与此相关的理论问题在第题在第2章里可以找到答案。章里可以找到答案。 与囚徒困境类似的博弈问题在经济、社会领域有与囚徒困境类似的博弈问题在经济、社会领域有许许多多的版本,下面再举几个例子。许许

37、多多的版本,下面再举几个例子。数模博弈论 A,B两个公司以高低两种价格向市场竞相销售两个公司以高低两种价格向市场竞相销售同一种产品。双方协定以高价格垄断市场,可以同一种产品。双方协定以高价格垄断市场,可以使彼此获得满意的利润收益,至少要好于双方都使彼此获得满意的利润收益,至少要好于双方都以低价格出售产品的情形。但如果某一方坚持高以低价格出售产品的情形。但如果某一方坚持高价,而另一方为了独占市场却将产品以低价格推价,而另一方为了独占市场却将产品以低价格推销(协定不受遵守而不受处罚),那么后者将获销(协定不受遵守而不受处罚),那么后者将获高盈利而前者将损失惨重。市场上商品的价格战,高盈利而前者将损

38、失惨重。市场上商品的价格战,常常出现的结局一般是以低价格销售商品,消费常常出现的结局一般是以低价格销售商品,消费者从中得到好处,这种结果正是博弈论预测的合者从中得到好处,这种结果正是博弈论预测的合理结局,你们不妨自己设计一个类似于图理结局,你们不妨自己设计一个类似于图1-1的的A,B公司的收益矩阵。公司的收益矩阵。数模博弈论 公司产品的供给也是一个类似囚徒困境的问公司产品的供给也是一个类似囚徒困境的问题。每个人可供选择的战略是:出钱、不出钱。题。每个人可供选择的战略是:出钱、不出钱。如果大家都出钱兴办公共事业,所有人的福利都如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱,

39、你不出钱,我得会增加。问题是,如果我出钱,你不出钱,我得不偿失;如果我不出钱你出钱,我就可以占你的不偿失;如果我不出钱你出钱,我就可以占你的便宜。结果是每个人的最优选择都是不出钱。便宜。结果是每个人的最优选择都是不出钱。数模博弈论 再有个例子是军备竞赛问题。美苏冷战期间,再有个例子是军备竞赛问题。美苏冷战期间,两个超级大国构成博弈的两方,可供选择的战略两个超级大国构成博弈的两方,可供选择的战略是:扩军(增加军费运算)、裁军(减少军费运是:扩军(增加军费运算)、裁军(减少军费运算)。如果双方都热衷于扩军,两国都要为此付算)。如果双方都热衷于扩军,两国都要为此付出高额军费(从社会福利角度来看这是一

40、笔庞大出高额军费(从社会福利角度来看这是一笔庞大的付收益)的付收益);如果双方都选择裁军,则可省下这如果双方都选择裁军,则可省下这笔钱;如果一方面裁军而另一方面进行扩军,扩笔钱;如果一方面裁军而另一方面进行扩军,扩军的一方到时候就会以武力相威胁甚至发动战争,军的一方到时候就会以武力相威胁甚至发动战争,这是,战争胜败双方的收益与支付将出现难以估这是,战争胜败双方的收益与支付将出现难以估量的差异。我们可以给出一个假象的双变量收益量的差异。我们可以给出一个假象的双变量收益矩阵,如图矩阵,如图1-2所示。所示。数模博弈论 博弈论给出军备竞赛问题的是战略组合博弈论给出军备竞赛问题的是战略组合(扩军,扩军

41、,扩军扩军),博弈理论预测双方都扩军可以达到对抗中,博弈理论预测双方都扩军可以达到对抗中的相对稳定,这是一个符合现实的合理结局。的相对稳定,这是一个符合现实的合理结局。数模博弈论例二例二 海滩占位海滩占位 甲乙两个冷饮摊贩,他们在一个直线状的海甲乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格、相同的质量向均匀分布在滩上,以同样的价格、相同的质量向均匀分布在海滩上的众多游客(他们来此享受海水和阳光,海滩上的众多游客(他们来此享受海水和阳光,进行日光浴或游泳活动)销售冷饮。既然是做生进行日光浴或游泳活动)销售冷饮。既然是做生意,目的总是希望尽可能多赚点钱,甲乙两人又意,目的总是希望尽可能多

42、赚点钱,甲乙两人又是在同一地点做同样的生意,竞争就是不可避免是在同一地点做同样的生意,竞争就是不可避免的事情了。这两个冷饮摊贩应该如何安置自己的的事情了。这两个冷饮摊贩应该如何安置自己的摊位,才能相安无事地做各自的生意呢?摊位,才能相安无事地做各自的生意呢?数模博弈论 假定游客总是到距离自己最近的摊位购买冷饮,假定游客总是到距离自己最近的摊位购买冷饮,这也是合乎常情的。为了叙述方便,不妨将海滩长这也是合乎常情的。为了叙述方便,不妨将海滩长度标准化为度标准化为1。按通常的想法,如果海滩左端定为。按通常的想法,如果海滩左端定为0,甲在,甲在1/4处设摊,乙在处设摊,乙在3/4处设摊(见图处设摊(见

43、图13),),这样既方便了顾客,又照顾到甲乙二人各占约一半这样既方便了顾客,又照顾到甲乙二人各占约一半顾客的生意,可谓公平合理。问题不是简单的解决顾客的生意,可谓公平合理。问题不是简单的解决了吗?了吗?数模博弈论 事情并不像想象的那么简单。甲乙二人做同样事情并不像想象的那么简单。甲乙二人做同样的生意,两人之间就存在竞争,这就构成了一个博的生意,两人之间就存在竞争,这就构成了一个博弈问题。站在甲的角度考虑,只要手段合法,多揽弈问题。站在甲的角度考虑,只要手段合法,多揽一点顾客就可以多赚一点钱。基于这样的理性想法,一点顾客就可以多赚一点钱。基于这样的理性想法,甲就会将自己的摊位向右挪动到甲就会将自

44、己的摊位向右挪动到A点(见图点(见图13)。)。这时,从这时,从0到到M(这里(这里M是是A至至3/4处的中点)范围内处的中点)范围内的顾客都会去买甲的冷饮,甲就从乙的手里挖走一的顾客都会去买甲的冷饮,甲就从乙的手里挖走一部分顾客,即图部分顾客,即图13中阴影所示的中阴影所示的1/2到到N的那一部的那一部分。乙也是一个理性的生意人,他会估计到甲可能分。乙也是一个理性的生意人,他会估计到甲可能作出的动作,因此,他也会将自己的摊位向左边移作出的动作,因此,他也会将自己的摊位向左边移动。照此下去,最后的结果是甲乙二人都挤在一起,动。照此下去,最后的结果是甲乙二人都挤在一起,紧接着,在海滩的中点(紧接

45、着,在海滩的中点(1/2处)做冷饮生意。处)做冷饮生意。数模博弈论 博弈论对海滩占位问题的解是甲乙二人均选择在博弈论对海滩占位问题的解是甲乙二人均选择在海滩中点海滩中点(1/2处)设摊,而不是原先想象的甲乙分处)设摊,而不是原先想象的甲乙分别在别在1/4和和3/4处占位,即使集中在一起营业会给海滩处占位,即使集中在一起营业会给海滩两端的顾客带来不便。两端的顾客带来不便。 社会经济领域内,就有不少与海滩占位博弈类似社会经济领域内,就有不少与海滩占位博弈类似的现象。比如,在城市商业网点的布局上,常常会出的现象。比如,在城市商业网点的布局上,常常会出现相同行业的多家商店都挤在一起,形成现相同行业的多

46、家商店都挤在一起,形成“电子一条电子一条街街”、“装饰城装饰城”、“饮食广场饮食广场”等。只要把这个城等。只要把这个城市想象成东西或南北方向的一个市想象成东西或南北方向的一个“海滩海滩”,从博弈论,从博弈论中就不难找到答案。中就不难找到答案。 又如,同一城市的不同航空公司经营的飞往同一又如,同一城市的不同航空公司经营的飞往同一目的地的航班,常常出现起飞时刻几乎相同的现象。目的地的航班,常常出现起飞时刻几乎相同的现象。数模博弈论 就是在文化娱乐方面,也能运用海滩占位的就是在文化娱乐方面,也能运用海滩占位的博弈结论予以解释。如果把电视中高雅艺术节目博弈结论予以解释。如果把电视中高雅艺术节目与较低档

47、的节目比作海滩的两端,那么众多的电与较低档的节目比作海滩的两端,那么众多的电视观众就可以看作是散布在海滩上的游客。电视视观众就可以看作是散布在海滩上的游客。电视台常常将黄金时段的电视节目定位在中等档次,台常常将黄金时段的电视节目定位在中等档次,以提高收视率。以提高收视率。数模博弈论例三例三 智猪争食智猪争食 猪圈里喂养两头猪,一头大猪,一头小猪。猪圈的猪圈里喂养两头猪,一头大猪,一头小猪。猪圈的一边有一个猪食槽,对面的一边装有控制开关。只要猪一边有一个猪食槽,对面的一边装有控制开关。只要猪用鼻头去拱控制开关,就会一次有用鼻头去拱控制开关,就会一次有6个单位的饲料流进个单位的饲料流进猪食槽。如果

48、大猪和小猪都不去拱开关,那么它们都吃猪食槽。如果大猪和小猪都不去拱开关,那么它们都吃不到饲料。如果小猪去拱开关,那么等它跑到另一边的不到饲料。如果小猪去拱开关,那么等它跑到另一边的猪食槽时,大猪已将流出的饲料全部都吃光了。如果大猪食槽时,大猪已将流出的饲料全部都吃光了。如果大猪去拱开关,那么等它跑到猪食槽旁边,小猪差不多已猪去拱开关,那么等它跑到猪食槽旁边,小猪差不多已吃掉了吃掉了5个单位的饲料,结果大猪只能吃到个单位的饲料,结果大猪只能吃到1个单位的饲个单位的饲料。如果大猪、小猪一起去拱开关,再一起跑去吃食,料。如果大猪、小猪一起去拱开关,再一起跑去吃食,那么大猪可抢到那么大猪可抢到4个单位

49、的饲料,小猪也只能吃掉个单位的饲料,小猪也只能吃掉2个单个单位的饲料。假定每拱一次开关需要消耗位的饲料。假定每拱一次开关需要消耗0.5个单位饲料个单位饲料的能量。大猪和小猪长期在一起进食,上面所说的情况的能量。大猪和小猪长期在一起进食,上面所说的情况(信息、知识)已为它们所掌握。仿照例一囚徒困境的(信息、知识)已为它们所掌握。仿照例一囚徒困境的情形,就可以画出如图情形,就可以画出如图14所示的双变量矩阵。所示的双变量矩阵。 数模博弈论 在这个博弈中,大猪与小猪都有两种战略选择:在这个博弈中,大猪与小猪都有两种战略选择:拱、不拱。在这个例子中可以发现,不论大猪选择拱拱、不拱。在这个例子中可以发现

50、,不论大猪选择拱还是不供,小猪的最优选择总是不拱。这是因为,如还是不供,小猪的最优选择总是不拱。这是因为,如果大猪去拱开关,小猪不拱(等在猪食槽旁边)比拱果大猪去拱开关,小猪不拱(等在猪食槽旁边)比拱后再跑回去争食要划算(后再跑回去争食要划算(51.5);如果大猪不去拱);如果大猪不去拱开关,小猪不拱顶多都不得食,而去拱就要白白消耗开关,小猪不拱顶多都不得食,而去拱就要白白消耗能量,不划算(能量,不划算(0-0.5)。所以,不拱是小猪的占优)。所以,不拱是小猪的占优战略。给定小猪总是选择不拱,大猪的最优选择总是战略。给定小猪总是选择不拱,大猪的最优选择总是拱。这样,智猪争食问题的博弈论解是战略

51、组合(拱,拱。这样,智猪争食问题的博弈论解是战略组合(拱,不拱)。不拱)。数模博弈论智猪争食模型在社会经济领域也可以找到许多实例。智猪争食模型在社会经济领域也可以找到许多实例。 比如股份公司中就有大股东和小股东之分。股东比如股份公司中就有大股东和小股东之分。股东都有监督经理的职能,他们从监督中得到的收益并不都有监督经理的职能,他们从监督中得到的收益并不一样。在监督成本相同的情况下,大股东从监督中得一样。在监督成本相同的情况下,大股东从监督中得到的好处显然多于小股东。通常在股份公司里,总是到的好处显然多于小股东。通常在股份公司里,总是由大股东担当监督任务,而小股东则搭大股东的便车。由大股东担当监

52、督任务,而小股东则搭大股东的便车。 股票市场上也有类似现象。一般大户总是重视搜股票市场上也有类似现象。一般大户总是重视搜集信息,积极进行行情分析。对小户而言,跟大户是集信息,积极进行行情分析。对小户而言,跟大户是常见现象。常见现象。数模博弈论 进行产品研究、开发以及新产品广告宣传时,对进行产品研究、开发以及新产品广告宣传时,对大企业而言,其资金实力及可望的收益会使大企业有大企业而言,其资金实力及可望的收益会使大企业有投资的积极性,而小企业往往会得不偿失。小企业通投资的积极性,而小企业往往会得不偿失。小企业通常采取与大企业建立协作生产或移植部分技术的做法。常采取与大企业建立协作生产或移植部分技术

53、的做法。 介绍上面三个博弈论的例子,首先,是让你们介绍上面三个博弈论的例子,首先,是让你们对博弈论有一个初步的感性认识。虽然在阐述中也对博弈论有一个初步的感性认识。虽然在阐述中也涉及了专业术语,诸如理性、有效、战略、占优战涉及了专业术语,诸如理性、有效、战略、占优战略、博弈解等,但是这些术语的含义是你们可以接略、博弈解等,但是这些术语的含义是你们可以接受的。其次,通过这些例子想给你们留下一个深刻受的。其次,通过这些例子想给你们留下一个深刻印象:博弈论与社会经济等诸多领域的联系是如此印象:博弈论与社会经济等诸多领域的联系是如此广泛、如此密切。下面章节对囚徒困境博弈在不同广泛、如此密切。下面章节对

54、囚徒困境博弈在不同的理论的高度还要进行研究和分析,这个例子还会的理论的高度还要进行研究和分析,这个例子还会在不同地方被引用。在不同地方被引用。数模博弈论二、博弈论的基本概念二、博弈论的基本概念 什么是博弈论什么是博弈论?简而言之,博弈论是研究多人谋简而言之,博弈论是研究多人谋略和决策问题的理论。要较深入地理解这句话,还略和决策问题的理论。要较深入地理解这句话,还需要关注以下一些问题。首先,一个博弈问题必须需要关注以下一些问题。首先,一个博弈问题必须至少有两个参与博弈的主体(可能是个人,也可能至少有两个参与博弈的主体(可能是个人,也可能是团体,如企业、国家),他们在博弈过程中都有是团体,如企业、

55、国家),他们在博弈过程中都有各自的切身利益。由于利益的驱动,他们在作出自各自的切身利益。由于利益的驱动,他们在作出自己的决策时,总想使出最好的招数(最优战略)。己的决策时,总想使出最好的招数(最优战略)。 数模博弈论 其次,博弈中的各个主体之间总不可避免地存在着其次,博弈中的各个主体之间总不可避免地存在着竞争。竞争自然贯穿博弈的全过程,竞争又将博弈的主竞争。竞争自然贯穿博弈的全过程,竞争又将博弈的主体紧紧地联系在一起,相互依存,相互较量(说得通俗体紧紧地联系在一起,相互依存,相互较量(说得通俗一些就是一些就是“钩心斗角钩心斗角”)。再者,既然主体间要进行较)。再者,既然主体间要进行较量,每一个

56、博弈主体就不会闭目塞听,靠灵机一动想出量,每一个博弈主体就不会闭目塞听,靠灵机一动想出高招去赢得对手,而是需要高招去赢得对手,而是需要“眼观六路,耳听八方眼观六路,耳听八方”。尽量掌握博弈中对手的特点和已经采取或可能采取的行尽量掌握博弈中对手的特点和已经采取或可能采取的行动的知识和信息。最后,就是博弈主体最为关心的博弈动的知识和信息。最后,就是博弈主体最为关心的博弈结果了。博弈结果随主体之间使出招数(战略)的不同结果了。博弈结果随主体之间使出招数(战略)的不同而不同。博弈结果通俗的说就是输赢的大小,博弈论用而不同。博弈结果通俗的说就是输赢的大小,博弈论用收益(或效用)来描述博弈的结果。博弈论就

57、是从理论收益(或效用)来描述博弈的结果。博弈论就是从理论上进行研究和分析,为博弈预测出一个理想的结局。预上进行研究和分析,为博弈预测出一个理想的结局。预测结局的正确性体现在博弈主体各方面都能自愿选择理测结局的正确性体现在博弈主体各方面都能自愿选择理论给他推导出的战略,并且没有博弈主体愿意独自偏离论给他推导出的战略,并且没有博弈主体愿意独自偏离他依照博弈理论所选定的战略。可想而知,他依照博弈理论所选定的战略。可想而知, 每个博弈主每个博弈主体所选战略一定是针对其他主体所选战略的最优反应。体所选战略一定是针对其他主体所选战略的最优反应。 数模博弈论 以上只是对博弈论粗线条的描述,为了后面对博以上只

58、是对博弈论粗线条的描述,为了后面对博弈理论进行深入的讨论,下面对博弈论的几个重要的弈理论进行深入的讨论,下面对博弈论的几个重要的基本概念给出明确的定义。基本概念给出明确的定义。 (1)参与者。)参与者。参与者指的是一个博弈中的决策主体,参与者指的是一个博弈中的决策主体,通常又称为参与人或局中人。参与者参加博弈的目的通常又称为参与人或局中人。参与者参加博弈的目的是通过合理选择自己的行动,以期取得最大化自己的是通过合理选择自己的行动,以期取得最大化自己的收益(或效用)水平。参与者可以是自然人,也可以收益(或效用)水平。参与者可以是自然人,也可以是企业、团体、国家,甚至是国家组成的集团(如欧是企业、

59、团体、国家,甚至是国家组成的集团(如欧盟、盟、OPEC等)。对参与者而言,在博弈过程中,他等)。对参与者而言,在博弈过程中,他必须有不同的行动可作应对选择。在博弈的结局中,必须有不同的行动可作应对选择。在博弈的结局中,他能知道或计算出各参与者不同的行动组合产生的效他能知道或计算出各参与者不同的行动组合产生的效益(或效用)。益(或效用)。1节中三个例子的参与者是不言自明节中三个例子的参与者是不言自明的。的。数模博弈论 在博弈论中,为了分析研究问题的需要,还有在博弈论中,为了分析研究问题的需要,还有一个虚拟参与者一个虚拟参与者“自然自然”。这里,。这里,“自然自然”就就是指不以博弈参与者的意志为转

60、移的外生事件。是指不以博弈参与者的意志为转移的外生事件。“自然自然”选择的是外生事件的各种可能现象,并且用选择的是外生事件的各种可能现象,并且用概率分布来描述概率分布来描述“自然自然”的选择肌理。的选择肌理。 数模博弈论例四例四 房地产开发博弈 现有开发商现有开发商A(按博弈论说法是参与者(按博弈论说法是参与者1)正在)正在考虑是否要投资开发一座商住楼。他面临的行动选考虑是否要投资开发一座商住楼。他面临的行动选择是开发或不开发。如果要开发,就必须投入择是开发或不开发。如果要开发,就必须投入1亿亿元资金;如果不去开发,投资就是元资金;如果不去开发,投资就是0。房地产开发。房地产开发市场总是存在风

61、险的。首先,风险来自市场需求的市场总是存在风险的。首先,风险来自市场需求的不确定性,需求可能大,也可能小。其次,风险来不确定性,需求可能大,也可能小。其次,风险来源是竞争对手源是竞争对手房地产开发商房地产开发商B(参与者(参与者2)。开)。开发商发商B也面临与开发商也面临与开发商A相同的决策问题。相同的决策问题。数模博弈论 假定市场上有两座楼出售,需求大时,每座售价假定市场上有两座楼出售,需求大时,每座售价可达可达1.4亿元;需求小时,售价为亿元;需求小时,售价为7千万元。如果市场千万元。如果市场上只有一座楼出售,需求大时,售价高达上只有一座楼出售,需求大时,售价高达1.8亿元;亿元;需求小时

62、,也能卖出需求小时,也能卖出1.1亿元可以用图亿元可以用图1-5所示的双变所示的双变量矩阵描述这个博弈问题。量矩阵描述这个博弈问题。数模博弈论 在这个例子中,市场需求就是作为虚拟参与者在这个例子中,市场需求就是作为虚拟参与者“自然自然”出现在博弈问题之中。出现在博弈问题之中。“自然自然”(市场需(市场需求)是以一定的概念表现出不同的状态(需求大还求)是以一定的概念表现出不同的状态(需求大还是小)。不言而喻,是小)。不言而喻,“自然自然”直接关系到博弈的决直接关系到博弈的决策结果。这个例子几乎涉及到博弈论讨论的重要问策结果。这个例子几乎涉及到博弈论讨论的重要问题的方方面面。相关的研究分析将在后面

63、有关章节题的方方面面。相关的研究分析将在后面有关章节阐述。阐述。 在博弈论的讨论中,一般都是用在博弈论的讨论中,一般都是用i=1,2,n 代代表参与者,用表参与者,用N代表代表“自然自然”。数模博弈论(2)信息。)信息。信息指的是参与者在博弈过程中能了解到信息指的是参与者在博弈过程中能了解到和观察到的知识。这些知识包括和观察到的知识。这些知识包括“自然自然”的选择,其的选择,其他参与者的特征和行动等。信息对参与者是至关重要他参与者的特征和行动等。信息对参与者是至关重要的,因为一个参与者在每一次进行决策之前,必须根的,因为一个参与者在每一次进行决策之前,必须根据观察到的其他参与者的行动和了解的有

64、关情况作出据观察到的其他参与者的行动和了解的有关情况作出自己的最佳选择。自己的最佳选择。 由于信息内涵的不同,派生出各种有关信息的概由于信息内涵的不同,派生出各种有关信息的概念将博弈论划分成不同的类型,因此寻求博弈间的方念将博弈论划分成不同的类型,因此寻求博弈间的方法也不同。本着由浅入深认识事物的规律,这里不打法也不同。本着由浅入深认识事物的规律,这里不打算把这些概念一股脑儿和盘托出,而是分散到以后的算把这些概念一股脑儿和盘托出,而是分散到以后的章节中,逐步予以介绍。这里只就信息有关的两个基章节中,逐步予以介绍。这里只就信息有关的两个基本的、重要的概念进行讨论。本的、重要的概念进行讨论。数模博

65、弈论 首先,关于首先,关于“共同知识共同知识”的概念。一个博弈问题的概念。一个博弈问题所涉及的所涉及的“自然自然”的不同选择、参与者的行动以及相的不同选择、参与者的行动以及相应产生的效用(效果、收益)都是一种知识(信息)。应产生的效用(效果、收益)都是一种知识(信息)。比如,房地产开发商博弈问题,市场需求的大小,开比如,房地产开发商博弈问题,市场需求的大小,开发商发商A、B是开发还是不开发,不同情况下的利润和亏是开发还是不开发,不同情况下的利润和亏损,都是知识。开发商损,都是知识。开发商A、B知道这些知识也是一种信知道这些知识也是一种信息,开发商息,开发商A知道开发商知道开发商B知道这些知识也

66、是一种信息,知道这些知识也是一种信息,如此等等。博弈论所谓的共同知识指的是如此等等。博弈论所谓的共同知识指的是“所有参与所有参与者知道,所有参与者知道所有参与者知道,所有参与者知道,所有参与者知道所有参与者知道,所有参与者知道所有参与者知道所有参与者知道者知道所有参与者知道所有参与者知道”的知识。的知识。可以联想到市场需求大小是一种知识。可能开发商可以联想到市场需求大小是一种知识。可能开发商A、B都知道市场需求有大与小两种状态,但是开发商都知道市场需求有大与小两种状态,但是开发商A并并不知道开发商不知道开发商B知道市场需求,这时市场需求就不构成知道市场需求,这时市场需求就不构成共同知识,而只能

67、说是共同知识,而只能说是A与与B“共同共同”享有的知识。享有的知识。数模博弈论 为了说明共同知识的重要性,我引用一个众所周为了说明共同知识的重要性,我引用一个众所周知的寓言。故事发生在一个村庄,村里有知的寓言。故事发生在一个村庄,村里有100对已婚对已婚夫妇,他们都是地道的逻辑学家,但也有一些多少有夫妇,他们都是地道的逻辑学家,但也有一些多少有点奇特的社会风俗。每天晚上,村里的男人们都将点点奇特的社会风俗。每天晚上,村里的男人们都将点起篝火,绕圈围坐举行一个会议,且每个人都谈论自起篝火,绕圈围坐举行一个会议,且每个人都谈论自己的妻子。在会议开始时,如果一个男人有理由认为己的妻子。在会议开始时,

68、如果一个男人有理由认为他的妻子对他总是守贞的,那么他就对在坐的男人们他的妻子对他总是守贞的,那么他就对在坐的男人们赞扬她的美德。另一方面,如果在当前会议之前的任赞扬她的美德。另一方面,如果在当前会议之前的任何时间,只要他发现了他妻子不贞的证据,那他就会何时间,只要他发现了他妻子不贞的证据,那他就会悲鸣恸哭,并祈求神灵严厉地惩罚她。再则,如果一悲鸣恸哭,并祈求神灵严厉地惩罚她。再则,如果一个妻子曾有不贞,那她和她的情人将会立即通知村里个妻子曾有不贞,那她和她的情人将会立即通知村里除她丈夫外所有的男人。所有这些传统都是村民们的除她丈夫外所有的男人。所有这些传统都是村民们的共同知识。共同知识。 数模

69、博弈论 事实上,每个妻子都已对自己的丈夫不忠。于是,事实上,每个妻子都已对自己的丈夫不忠。于是,每个丈夫都知道除自己的妻子外都是不贞的女人,而每个丈夫都知道除自己的妻子外都是不贞的女人,而对自己的妻子每晚都要赞扬。对自己的妻子每晚都要赞扬。 这种状况持续了很多年,直到一个传教徒走访到这这种状况持续了很多年,直到一个传教徒走访到这个村庄。他坐在髯火旁参加了一次会议并听到每个男人个村庄。他坐在髯火旁参加了一次会议并听到每个男人都赞扬自己的妻子之后,他站到丈夫们围坐的圆中心,都赞扬自己的妻子之后,他站到丈夫们围坐的圆中心,大声地说:大声地说:“这个村里有一个妻子已经不贞了。这个村里有一个妻子已经不贞

70、了。”在此在此后的后的99个晚上丈夫们继续开会并赞扬他们的妻子,但个晚上丈夫们继续开会并赞扬他们的妻子,但在第在第100个晚上,他们全都悲鸣偷哭并祈求严厉地惩罚个晚上,他们全都悲鸣偷哭并祈求严厉地惩罚他们的妻子。他们的妻子。数模博弈论 为了理解在这个寓言中发生了什么,首先注意到为了理解在这个寓言中发生了什么,首先注意到若只有一个妻子不贞,则因为(知道没有另外的不贞若只有一个妻子不贞,则因为(知道没有另外的不贞女人,且若有的话他是知道的)她丈夫能够立刻知道女人,且若有的话他是知道的)她丈夫能够立刻知道这个不贞的女人是他的妻子,所以在传教徒访问后的这个不贞的女人是他的妻子,所以在传教徒访问后的第一

71、天晚上就会悲鸣恸哭。而且,由归纳法可以证明,第一天晚上就会悲鸣恸哭。而且,由归纳法可以证明,对于对于1与与100之间的任一正整数,如果恰有个不贞的妻之间的任一正整数,如果恰有个不贞的妻子,那么在传教徒访问后的连续个晚上,所有的丈夫子,那么在传教徒访问后的连续个晚上,所有的丈夫仍全都赞扬自己的妻子,但在第个晚上,个不贞妻子仍全都赞扬自己的妻子,但在第个晚上,个不贞妻子的丈夫会悲鸣恸哭。于是,在的丈夫会悲鸣恸哭。于是,在99个赞扬之夜过后的第个赞扬之夜过后的第100个晚上,每个丈夫都知道一定有个晚上,每个丈夫都知道一定有100个不贞的妻子,个不贞的妻子,包括他自己的妻子在内。包括他自己的妻子在内。

72、数模博弈论 现在,让我们试问一下,这个传教徒告诉了这些丈现在,让我们试问一下,这个传教徒告诉了这些丈夫们他们所不知道的什么?每个丈夫都已经知道了夫们他们所不知道的什么?每个丈夫都已经知道了99个不贞的妻子,故这对任何人来说都不是新闻。但个不贞的妻子,故这对任何人来说都不是新闻。但“这这个传教徒对所有男人做了一个声明个传教徒对所有男人做了一个声明”是共同知识,从而是共同知识,从而这个传教徒所声明的内容,即有一个不贞的妻子,也就这个传教徒所声明的内容,即有一个不贞的妻子,也就成了所有男人中间的共同知识。在传教徒宣告之前,每成了所有男人中间的共同知识。在传教徒宣告之前,每个形如个形如“(每个丈夫知道

73、)有一个不贞的妻子(每个丈夫知道)有一个不贞的妻子”的判断的判断对于对于99都是正确的,但对都是正确的,但对100就不正确了。例如,若从就不正确了。例如,若从1到到100对丈夫们编号,则对丈夫们编号,则1已经知道已经知道2已经知道已经知道3已经知已经知道道99已经知道已经知道100的妻子是不贞的,但的妻子是不贞的,但1不知道不知道2已经已经知道知道3已经知道已经知道99已经知道已经知道100已经知道已经知道1的妻子是不的妻子是不贞的。因而,从这个寓言中引申出的含义是,从一个共贞的。因而,从这个寓言中引申出的含义是,从一个共同知识的事实推出的结果与从(例如)只知道每个人已同知识的事实推出的结果与

74、从(例如)只知道每个人已经知道每个人已经知道的一个事实推出的结果可以非常经知道每个人已经知道的一个事实推出的结果可以非常不同。不同。数模博弈论 其次,关于其次,关于“完全信息完全信息”的概念。完全信息的概念。完全信息是博弈论非常重要的基本概念,有了上述的共同是博弈论非常重要的基本概念,有了上述的共同知识概念,这里就可以给出完全信息的严格定义。知识概念,这里就可以给出完全信息的严格定义。完全信息指的是所有参与者各自选择的行动的不完全信息指的是所有参与者各自选择的行动的不同组合所决定的各参与者的收益对所有参与者来同组合所决定的各参与者的收益对所有参与者来说是共同知识。简单通俗地说,完全信息是指每说

75、是共同知识。简单通俗地说,完全信息是指每一个参与者对自己以及其他参与者的行动,以及一个参与者对自己以及其他参与者的行动,以及各参与者选择的行动组合产生的收益等知识有完各参与者选择的行动组合产生的收益等知识有完全的了解。全的了解。数模博弈论(3 3)战略。)战略。战略是参与者如何对其他参与者的行动战略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候该选作出反应的行动规则,它规定参与者在什么时候该选择什么行动。或者说。战略是参与者择什么行动。或者说。战略是参与者“相机行动方案相机行动方案”。数模博弈论数模博弈论 战略是一个与过程有关的概念,行动是与时序无关战略是一个与过程有

76、关的概念,行动是与时序无关的动作。打个比方,行动好比拳术中的一招一式,战略的动作。打个比方,行动好比拳术中的一招一式,战略就是一招一式构成的套路。就是一招一式构成的套路。数模博弈论(4)收益。)收益。在博弈论中,收益指的是在一个特定的战在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定效用或期望效用。效用通略组合下参与者得到的确定效用或期望效用。效用通常表现为博弈结果中常表现为博弈结果中 的输赢、得失、盈亏。效用必须的输赢、得失、盈亏。效用必须能用数值刻画其大小。收益是博弈参与者真正关心的能用数值刻画其大小。收益是博弈参与者真正关心的问题。问题。 博弈论的一个基本特征是一个参与者的收

77、益不仅博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选择,而且取决于所有参与者的战取决于自己的战略选择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各选定一个战略略选择。或者说,收益是所有参与者各选定一个战略形成的战略组合的函数。在博弈论中,通常用形成的战略组合的函数。在博弈论中,通常用ui表示参表示参与者与者i的收益,一个战略组合是,每个参与者的收益可的收益,一个战略组合是,每个参与者的收益可以表示为以表示为 数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论 均衡是博弈论最重要、最基础的一个概念,对于均衡是博弈论最重要、最基础的一个概念,对于不同类型、不同条件的博弈

78、问题又形成各种各样特定不同类型、不同条件的博弈问题又形成各种各样特定的均衡的概念,它们构成博弈论五彩缤纷的预测结果。的均衡的概念,它们构成博弈论五彩缤纷的预测结果。各种均衡在社会经济等不同的领域都展现出广阔的应各种均衡在社会经济等不同的领域都展现出广阔的应用前景。读者充分、深刻地理解这些均衡概念是非常用前景。读者充分、深刻地理解这些均衡概念是非常重要的。重要的。 有了上面完全信息的概念,再结合参与者行动的有了上面完全信息的概念,再结合参与者行动的先后次序的界定,就可以对博弈论的类型作出划分。先后次序的界定,就可以对博弈论的类型作出划分。如果参与者同时选择各自的行动,则这类博弈称为如果参与者同时

79、选择各自的行动,则这类博弈称为静态的。值得注意的是,这里所说的静态的。值得注意的是,这里所说的“同时同时”具有具有双层含义。一种含义就是双层含义。一种含义就是“同时同时”的字面解释,也的字面解释,也就是参与者在同一时间一起行动;另一种含义是参就是参与者在同一时间一起行动;另一种含义是参与者行动虽然有先后,但后行动者并不知道先行动与者行动虽然有先后,但后行动者并不知道先行动者采取了什么具体行动。者采取了什么具体行动。数模博弈论 动态博弈指的是参与者的行动有先后顺序,并动态博弈指的是参与者的行动有先后顺序,并且后行动者能够观察到先行动者所选择的行动。后且后行动者能够观察到先行动者所选择的行动。后行

80、动者就可以依据获得的信息,采取自己认为最有行动者就可以依据获得的信息,采取自己认为最有力的战略。凭直观理解,完全信息总要比不完全信力的战略。凭直观理解,完全信息总要比不完全信息要好一些,静态的情形又要比动态的情形要简单息要好一些,静态的情形又要比动态的情形要简单一些。如果将信息的完全与不完全、状态的静与动一些。如果将信息的完全与不完全、状态的静与动交叉组合,就构成了四种不同类型的博弈。从简单交叉组合,就构成了四种不同类型的博弈。从简单到复杂排列,就是完全信息静态博弈到复杂排列,就是完全信息静态博弈完全信息完全信息动态博弈动态博弈不完全信息静态博弈不完全信息静态博弈不完全信息不完全信息动态博弈。

81、动态博弈。 数模博弈论3、博弈论研究著名学者简介、博弈论研究著名学者简介(1)、计算机之父、博弈论创始人)、计算机之父、博弈论创始人冯冯诺伊曼诺伊曼 约翰约翰冯冯诺伊曼诺伊曼(John Von Neumann,19031957),美籍匈牙利人。,美籍匈牙利人。19211923年在年在苏黎世大学学习。很快又在苏黎世大学学习。很快又在1926年以优异的成绩获年以优异的成绩获得了布达佩斯大学数学博士学位,此时冯得了布达佩斯大学数学博士学位,此时冯诺伊曼诺伊曼年仅年仅22岁。冯岁。冯诺伊曼是诺伊曼是20世纪最优秀的数学家之世纪最优秀的数学家之一,因一,因1946年发明电子计算机而被西方人誉为年发明电子

82、计算机而被西方人誉为“计计算机之父算机之父”。数模博弈论 19271929年冯年冯诺伊曼相继在柏林大学和汉堡大诺伊曼相继在柏林大学和汉堡大学担任数学讲师。学担任数学讲师。1930年接受了普林斯顿大学客座教授的年接受了普林斯顿大学客座教授的职位,西渡美国,职位,西渡美国,1931年成为该校终身教授。他是美国国年成为该校终身教授。他是美国国家科学院、秘鲁国立自然科学院和意大利国立林且学院的家科学院、秘鲁国立自然科学院和意大利国立林且学院的院士。院士。 冯冯诺伊曼建立了算子代数这门新的数学分支。在格诺伊曼建立了算子代数这门新的数学分支。在格论、连续几何、理论物理、动力学、连续介质力学、气象论、连续几

83、何、理论物理、动力学、连续介质力学、气象计算、原子能和经济学等领域都做过重要的工作。然而,计算、原子能和经济学等领域都做过重要的工作。然而,冯冯诺伊曼对人类的最大贡献是对计算机科学、计算机技诺伊曼对人类的最大贡献是对计算机科学、计算机技术和数值分析的开拓性工作。术和数值分析的开拓性工作。 冯冯诺伊曼于诺伊曼于20世纪世纪20年代开始创立博弈理论,年代开始创立博弈理论,1944年他与经济学家奥斯卡年他与经济学家奥斯卡摩根斯特恩合作出版的巨著摩根斯特恩合作出版的巨著博弈论与经济行为,标志着现代系统博弈理论的初步博弈论与经济行为,标志着现代系统博弈理论的初步形成。冯形成。冯诺伊曼和摩根斯特恩在该书中

84、提出的标准型、诺伊曼和摩根斯特恩在该书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。门学科的理论基础。数模博弈论()、博弈论大师()、博弈论大师纳什纳什 纳什纳什(John Nash),1928年年6月月13日出生于美国弗吉尼亚日出生于美国弗吉尼亚西部的西部的“布鲁菲尔德布鲁菲尔德”(Bluefield),高中毕业后进入卡内基,高中毕业后进入卡内基梅隆大学学习化学工程专业,梅隆大学学习化学工程专业, 由于对数学的喜好和天赋,由于对数学的喜好和天赋,一年后正式转到数学系。在毕业时,他取得数学学士和理学一年后正

85、式转到数学系。在毕业时,他取得数学学士和理学学士两个学位。学士两个学位。1950年纳什年纳什22岁时通过论文答辩获得普林斯顿大学的博岁时通过论文答辩获得普林斯顿大学的博士学位。正是这篇天才论文,奠定了他博弈论大师的地位,士学位。正是这篇天才论文,奠定了他博弈论大师的地位,并为他铺垫了通向诺贝尔经济学奖的道路。并为他铺垫了通向诺贝尔经济学奖的道路。1951年纳什又发年纳什又发表了第二篇题为表了第二篇题为“非合作博弈非合作博弈”(NonCooperativeGames,Annals of Mathematics1951)的论文。在此之前,他还撰的论文。在此之前,他还撰写了写了“讨价还价问题讨价还价

86、问题”。1958年财富杂志把纳什评为新年财富杂志把纳什评为新一代一代天才数学家中最出色的人物。也许是天妒英才,正当麻省理天才数学家中最出色的人物。也许是天妒英才,正当麻省理工学院准备提升他为正教授时,年方工学院准备提升他为正教授时,年方30岁的纳什得了严重的岁的纳什得了严重的“妄想型精神分裂症妄想型精神分裂症”,从此他从学术界销声匿迹,饱受精,从此他从学术界销声匿迹,饱受精神病的折磨长达神病的折磨长达30多年。多年。 数模博弈论 纳什的主要贡献是纳什的主要贡献是1950年和年和1951年发表的两篇关年发表的两篇关于非合作博弈论的重要论文,他的研究彻底改变了人们于非合作博弈论的重要论文,他的研究

87、彻底改变了人们对竞争和市场的看法。对竞争和市场的看法。1950年纳什发表的年纳什发表的“非合作对策非合作对策”博士论文提出了与诺伊曼的合作对策论相对立的观点。博士论文提出了与诺伊曼的合作对策论相对立的观点。纳什在论文中引入了著名的纳什在论文中引入了著名的“纳什均衡纳什均衡”理论,对有混理论,对有混合利益的竞争者之间的对抗进行了数学分析。他证明了合利益的竞争者之间的对抗进行了数学分析。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的

88、研究奠定了现代非合作博弈论的基石,在联系。纳什的研究奠定了现代非合作博弈论的基石,他是继冯他是继冯诺伊曼之后最伟大的博弈论大师之一,他提诺伊曼之后最伟大的博弈论大师之一,他提出的著名的纳什均衡的概念在非合作博弈理论中起着核出的著名的纳什均衡的概念在非合作博弈理论中起着核心作用。后续的研究者对博弈论的贡献,都是建立在这心作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。纳什均衡的提出和不断完善为博弈论广一概念之上的。纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。等领域奠定了坚

89、实的理论基础。 数模博弈论()、动态博弈理论的开创者()、动态博弈理论的开创者泽尔腾泽尔腾 泽尔腾泽尔腾(R.Selten)1930年年10月月10日出生于德国日出生于德国的布雷斯劳的布雷斯劳(二战后,此地归于波兰二战后,此地归于波兰),19511957年,他在法兰克福大学学习数学。年,他在法兰克福大学学习数学。1961年在年在马恩法兰克福大学获得了数学博士学位。马恩法兰克福大学获得了数学博士学位。19671968年,泽尔腾到加州大学伯克利分校做客座教授,年,泽尔腾到加州大学伯克利分校做客座教授,19691972年在柏林大学做经济学教授,而后在年在柏林大学做经济学教授,而后在比勒菲尔德大学工作

90、了比勒菲尔德大学工作了12年。年。1984年泽尔腾离开年泽尔腾离开比勒菲尔德大学,到波恩大学从教,致力于实验经比勒菲尔德大学,到波恩大学从教,致力于实验经济学的研究。济学的研究。数模博弈论泽尔腾的主要贡献是在纳什均衡的基础上深入研泽尔腾的主要贡献是在纳什均衡的基础上深入研究了动态博弈问题。泽尔腾通过研究发现,究了动态博弈问题。泽尔腾通过研究发现,“纳什均纳什均衡衡”概念在实际应用中存在缺陷。纳什均衡的缺陷是,概念在实际应用中存在缺陷。纳什均衡的缺陷是,一般情况下能够保证存在性,但不能保证唯一性。大一般情况下能够保证存在性,但不能保证唯一性。大多数情况下纳什均衡有多个,由此带来的问题就是,多数情

91、况下纳什均衡有多个,由此带来的问题就是,多个纳什均衡中究竟哪一个才是博弈的理性结局?泽多个纳什均衡中究竟哪一个才是博弈的理性结局?泽尔腾认为尔腾认为“纳什均衡纳什均衡”概念只适用于分析一些静态的概念只适用于分析一些静态的“重复性博弈重复性博弈”,而不适用于分析动态博弈问题。他,而不适用于分析动态博弈问题。他对对“纳什均衡纳什均衡”概念进行了精心的研究,先后提出了概念进行了精心的研究,先后提出了两个著名均衡新概念:子博弈完美均衡,颤抖手完美两个著名均衡新概念:子博弈完美均衡,颤抖手完美均衡。他采用均衡。他采用“逆向归纳法逆向归纳法”,在多个纳什均衡中剔,在多个纳什均衡中剔除了一些按照一定规则不合

92、理的均衡点,从而形成了除了一些按照一定规则不合理的均衡点,从而形成了纳什均衡的纳什均衡的“精炼精炼”概念,在扩展型博弈分析方面取概念,在扩展型博弈分析方面取得了重大成果。得了重大成果。数模博弈论()、不完全信息博弈理论的奠基者、不完全信息博弈理论的奠基者海萨尼海萨尼 约翰约翰海萨尼海萨尼(John CHarsanyi),美国人,由于受到纳,美国人,由于受到纳什成果的影响,从什成果的影响,从20世纪世纪50年代开始潜心于博弈论的研究。海年代开始潜心于博弈论的研究。海萨尼的研究成果非常丰富:萨尼的研究成果非常丰富:(1)在合作博弈论研究上,给出了在合作博弈论研究上,给出了合作博弈的通解合作博弈的通

93、解N人议价模型,建立了一个合作博弈论的人议价模型,建立了一个合作博弈论的非合作博弈模型;非合作博弈模型;(2)在不完全信息博弈研究上,提出了以类在不完全信息博弈研究上,提出了以类型为基础的不完全信息博弈建模方法,引入了贝叶斯技术求解型为基础的不完全信息博弈建模方法,引入了贝叶斯技术求解方法,对混合策略进行了重新解释,提出了基于随机变量的变方法,对混合策略进行了重新解释,提出了基于随机变量的变动收益博弈模型;动收益博弈模型;(3)在均衡选择研究上,与泽尔腾合作完成在均衡选择研究上,与泽尔腾合作完成了博弈论均衡选择的一般理论。了博弈论均衡选择的一般理论。 约翰约翰海萨尼通过多方面的研究将自己的思想

94、构成了一个海萨尼通过多方面的研究将自己的思想构成了一个完整的体系,他提出的不完全信息博弈思想及贝叶斯纳什均衡完整的体系,他提出的不完全信息博弈思想及贝叶斯纳什均衡概念,对博弈论和经济学产生了重大影响。概念,对博弈论和经济学产生了重大影响。数模博弈论(5)、米尔利斯、米尔利斯 詹姆斯詹姆斯亚历山大亚历山大米尔利斯米尔利斯(J.Y.Morlis),出生于,出生于1936年年7月月5日苏格兰柯库布里郡明尼加大。日苏格兰柯库布里郡明尼加大。1996年年10月月8日,日,由于对不对称信息条件下的激励经济理论做出了基础性贡献,由于对不对称信息条件下的激励经济理论做出了基础性贡献,与威廉与威廉维克里分享诺贝

95、尔经济学奖。维克里分享诺贝尔经济学奖。 米尔利斯对不对称信息经济学的贡献包括:在最优所得税米尔利斯对不对称信息经济学的贡献包括:在最优所得税机制设计问题上,探讨了政府在面临信息不完全的情况下如何机制设计问题上,探讨了政府在面临信息不完全的情况下如何去设计出一种去设计出一种“激励性相容激励性相容”的最优税收体制,提出了显示原的最优税收体制,提出了显示原则:解决激励问题的关键是要通过一种与个人利益相容的方式,则:解决激励问题的关键是要通过一种与个人利益相容的方式,引导所有人如实表露自己的信息;在最优契约设计问题上,以引导所有人如实表露自己的信息;在最优契约设计问题上,以“委托人一代理人方法委托人一

96、代理人方法”对道德危险问题进行了重新阐对道德危险问题进行了重新阐述,得出的结论是:为了使代理人有足够的激励去自动选择有述,得出的结论是:为了使代理人有足够的激励去自动选择有利于委托人的行动,就必须在合同的设计中让代理人也承担一利于委托人的行动,就必须在合同的设计中让代理人也承担一部分结果不确定的风险;在信号筛选理论方面,提出了区分部分结果不确定的风险;在信号筛选理论方面,提出了区分不同信号的不同信号的“斯彭斯一米尔利斯条件斯彭斯一米尔利斯条件”。数模博弈论第二部分、完全信息静态博弈第二部分、完全信息静态博弈 博弈的标准式表述 严格占优战略均衡 逐步剔除严格战略均衡 纳什均衡应用举例 混合战略纳

97、什均衡 纳什均衡的存在性 数模博弈论一、一、博弈的标准式表述与纳什均衡博弈的标准式表述与纳什均衡 本章重点介绍完全信息静态博弈,它是一种最基本本章重点介绍完全信息静态博弈,它是一种最基本的最简单的博弈。上一章给出了完全信息和静态博弈的的最简单的博弈。上一章给出了完全信息和静态博弈的概念,这里简要回顾一下。完全信息指的是博弈的每一概念,这里简要回顾一下。完全信息指的是博弈的每一个参与者对自己以及其他参与者的行动空间、收益函数个参与者对自己以及其他参与者的行动空间、收益函数等知识是完全了解的。静态博弈指的是博弈的参与者同等知识是完全了解的。静态博弈指的是博弈的参与者同时选择各自的行动,如果选择行动

98、有先后的话,那么后时选择各自的行动,如果选择行动有先后的话,那么后行动者也不知道先行动者采取了什么行动。博弈论入门行动者也不知道先行动者采取了什么行动。博弈论入门的两个最基本问题是:如何描述一个博弈问题和如何求的两个最基本问题是:如何描述一个博弈问题和如何求得博弈问题的解。本章对完全信息静态博弈的标准式表得博弈问题的解。本章对完全信息静态博弈的标准式表述、寻求均衡(博弈预测的结果)方法以及纳什均衡的述、寻求均衡(博弈预测的结果)方法以及纳什均衡的有关定义、理论与方法进行讨论。有关定义、理论与方法进行讨论。 数模博弈论(一)、博弈的标准式表述(一)、博弈的标准式表述 数模博弈论数模博弈论(二)、

99、严格占优战略均衡(二)、严格占优战略均衡 博弈分析的目的是预测博弈的均衡结果。简言之,博弈分析的目的是预测博弈的均衡结果。简言之,就是求解博弈问题。这里需要假定就是求解博弈问题。这里需要假定“参与者是理性的参与者是理性的”是共同知识。经济学对理性的描述是,在给定的约束条是共同知识。经济学对理性的描述是,在给定的约束条件下追求效用最大化。参与者在博弈过程中,在每一步件下追求效用最大化。参与者在博弈过程中,在每一步斟酌的取舍(选优剔劣)时,都应依据这个假定行事。斟酌的取舍(选优剔劣)时,都应依据这个假定行事。一般说来,由于每个参与者的收益是博弈中所有参与者一般说来,由于每个参与者的收益是博弈中所有

100、参与者所选战略的函数,因此,每个参与者的最优战略选择必所选战略的函数,因此,每个参与者的最优战略选择必须考虑所有其他参与者的战略选择。但在一些特殊的博须考虑所有其他参与者的战略选择。但在一些特殊的博弈中,一个参与者的最优战略可能不需要考虑其他参与弈中,一个参与者的最优战略可能不需要考虑其他参与者如何选择战略,就是说,不论其他参与者选择什么战者如何选择战略,就是说,不论其他参与者选择什么战略,该参与者有唯一一个最优战略,这个最优战略称为略,该参与者有唯一一个最优战略,这个最优战略称为严格占优战略。下面给出严格占优战略定义。严格占优战略。下面给出严格占优战略定义。 数模博弈论数模博弈论 显然,在一

101、个博弈问题中,如果所有参与者都有一显然,在一个博弈问题中,如果所有参与者都有一个严格占优战略,那么每一个理性的参与者谁也不会放个严格占优战略,那么每一个理性的参与者谁也不会放弃他的严格占优战略。这样,由全部严格占优战略就构弃他的严格占优战略。这样,由全部严格占优战略就构成博弈的解成博弈的解严格占优战略均衡。严格占优战略均衡。 数模博弈论 应该指出的是,严格占优战略只要求每个参与者是应该指出的是,严格占优战略只要求每个参与者是理性的,而并不要求每个参与者知道其他参与者是理性理性的,而并不要求每个参与者知道其他参与者是理性的(即不要求的(即不要求“理性理性”是共同知识)。这是因为,不论是共同知识)

102、。这是因为,不论知道与否,严格占优战略总是一个理性参与者的最佳选知道与否,严格占优战略总是一个理性参与者的最佳选择。择。 值得注意的是,囚徒困境博弈暴露了个人理性与团值得注意的是,囚徒困境博弈暴露了个人理性与团体理性的冲突问题。因为囚徒体理性的冲突问题。因为囚徒1与囚徒与囚徒2都选择沉默,都选择沉默,每人只判刑每人只判刑1个月,这显然要比(坦白,坦白)都判刑个月,这显然要比(坦白,坦白)都判刑6个月有利。(沉默,沉默)不是一个均衡,因为它不个月有利。(沉默,沉默)不是一个均衡,因为它不满足个人理性的要求。换个角度考虑,即使两个囚徒满足个人理性的要求。换个角度考虑,即使两个囚徒在被捕前订立了攻守

103、同盟(拒不坦白),这个同盟也在被捕前订立了攻守同盟(拒不坦白),这个同盟也没有用,因为没有人会严格遵守同盟协定(这时,只没有用,因为没有人会严格遵守同盟协定(这时,只要谁一坦白,他就立即获得释放)。要谁一坦白,他就立即获得释放)。 数模博弈论(三)、逐步剔除严格劣战略均衡(三)、逐步剔除严格劣战略均衡 寻求博弈问题的解的过程就是参与者选择战略的过寻求博弈问题的解的过程就是参与者选择战略的过程。选择有两种途径:选优与去劣。上面寻求严格占程。选择有两种途径:选优与去劣。上面寻求严格占优战略均衡走的就是选优的路子。下面介绍的逐步剔优战略均衡走的就是选优的路子。下面介绍的逐步剔除严格劣战略寻求均衡走的

104、就是去劣的路子。除严格劣战略寻求均衡走的就是去劣的路子。 数模博弈论研究图研究图21所示的一个博弈问题。所示的一个博弈问题。 数模博弈论 这样一来,参与者这样一来,参与者1就可以将图就可以将图21所示的博弈视所示的博弈视同为图同为图22所示的博弈。所示的博弈。 在图在图22中,对参与者中,对参与者1来说,战略来说,战略“下下”相对于战相对于战略略“上上”是严格劣战略(因为是严格劣战略(因为01,且且01)。于是,如)。于是,如果参与者果参与者1是理性的(并且参与者是理性的(并且参与者1知道参与者知道参与者2是理性是理性的,原博弈才能简化为图的,原博弈才能简化为图22),那么参与者),那么参与者

105、1就不会就不会选择选择“下下”。这时,如果参与者。这时,如果参与者2知道参与者知道参与者1是理性的,是理性的,并且参与者并且参与者2知道参与者知道参与者1知道参与者知道参与者2是理性的(只有是理性的(只有这样,参与者这样,参与者2知道原博弈已被简化为图知道原博弈已被简化为图22所示博弈)所示博弈),那么参与者,那么参与者2就可以把就可以把“下下”从参与者从参与者1的战略空间的战略空间S1中剔除。中剔除。 数模博弈论 这样一来,参与者这样一来,参与者2又可以进一步将图又可以进一步将图22所示所示博弈简化为图博弈简化为图23所示博弈所示博弈 数模博弈论数模博弈论 那么,图那么,图24的博弈有没有均

106、衡结果呢?后面的博弈有没有均衡结果呢?后面我们还会讨论。我们还会讨论。数模博弈论 另外,严格占优战略均衡和逐步剔除严格劣战略均另外,严格占优战略均衡和逐步剔除严格劣战略均衡对参与者理性的要求是不同的。前者只要每个参与衡对参与者理性的要求是不同的。前者只要每个参与者是理性的,而后者却要求理性是参与者的共同知识。者是理性的,而后者却要求理性是参与者的共同知识。只有在只有在“参与者参与者2是理性的,且参与者是理性的,且参与者1知道参与者知道参与者2是是理性的理性的”条件下,图条件下,图21的博弈才能简化为图的博弈才能简化为图22的的情形。一共用了三步剔除得到了结果。显然,参与者情形。一共用了三步剔除

107、得到了结果。显然,参与者的战略空间越大,剔除的步骤就越多,对共同知识的的战略空间越大,剔除的步骤就越多,对共同知识的要求就越严格。要求就越严格。数模博弈论数模博弈论定义定义 在标准式的博弈中,设在标准式的博弈中,设si和和si是参与者是参与者i的两的两个可行战略。若下式个可行战略。若下式 类似于运用逐步剔除严格劣战略去寻求一个均衡类似于运用逐步剔除严格劣战略去寻求一个均衡结果,自然想到运用逐步剔除劣势战略也是求解博弈结果,自然想到运用逐步剔除劣势战略也是求解博弈问题的一种方法。问题的一种方法。 数模博弈论考察下面图考察下面图25所示的博弈问题。所示的博弈问题。 数模博弈论(四)、纳什(四)、纳

108、什(Nash)均衡)均衡 纳什均衡是完全信息静态博弈的解的一般概念,它是对非纳什均衡是完全信息静态博弈的解的一般概念,它是对非常广泛博弈问题给出更加严格的结果。首先,许多不存在严格常广泛博弈问题给出更加严格的结果。首先,许多不存在严格占优战略均衡或逐步剔除严格劣战略均衡的博弈,却存在纳什占优战略均衡或逐步剔除严格劣战略均衡的博弈,却存在纳什均衡。其次,严格占优战略均衡一定就是博弈问题的惟一的纳均衡。其次,严格占优战略均衡一定就是博弈问题的惟一的纳什均衡。再者纳什均衡一定不会被逐步剔除严格劣战略所剔除。什均衡。再者纳什均衡一定不会被逐步剔除严格劣战略所剔除。可以这么说,没有任何一个战略组合严格优

109、于纳什均衡。可以这么说,没有任何一个战略组合严格优于纳什均衡。 为了理解纳什均衡的含义,设想博弈理论对一个为了理解纳什均衡的含义,设想博弈理论对一个n个参与者个参与者博弈中的每一个参与者选定的一个战略,预测的博弈结果为博弈中的每一个参与者选定的一个战略,预测的博弈结果为s*(s1*,si*,sn*)。其中,。其中,si*是理论上导出的参与者是理论上导出的参与者i的战略。的战略。首先,理论上确定的每个参与者要选择的战略必须是针对其他首先,理论上确定的每个参与者要选择的战略必须是针对其他参与者选择战略的参与者选择战略的最优反应最优反应。其次,遵循理论结果产生的效用。其次,遵循理论结果产生的效用不会

110、小于偏离理论结果时的效用,也就是没有参与者愿意单独不会小于偏离理论结果时的效用,也就是没有参与者愿意单独偏离理论给他选定的战略,这种理论导出的结果时一种偏离理论给他选定的战略,这种理论导出的结果时一种“战略战略相对稳定相对稳定”状态。我们就把这种状态称为一个纳什均衡。状态。我们就把这种状态称为一个纳什均衡。 数模博弈论数模博弈论 和纳什均衡的导出密切相关的是协议的理念。对给和纳什均衡的导出密切相关的是协议的理念。对给定的博弈,如果参与者之间要商定一个协议决定博弈定的博弈,如果参与者之间要商定一个协议决定博弈如何进行,那么一个有效的协议中的战略组织必须是如何进行,那么一个有效的协议中的战略组织必

111、须是纳什均衡的战略组合,否则至少有一个参与者会不遵纳什均衡的战略组合,否则至少有一个参与者会不遵循该协议。循该协议。 数模博弈论 运用上述定义中不等式(运用上述定义中不等式(NE)的条件,就可以检)的条件,就可以检查一个特定的战略组合是不是纳什均衡。比如,在囚查一个特定的战略组合是不是纳什均衡。比如,在囚徒困境中,对参与者徒困境中,对参与者1(囚徒(囚徒1)选)选s1*坦白,对参与坦白,对参与者者2(囚徒(囚徒2)选)选s2*坦白。坦白。 数模博弈论数模博弈论数模博弈论考察图考察图24所示的博弈。所示的博弈。 数模博弈论 从图从图26可以看出,一个单元中只有一个数值下可以看出,一个单元中只有一

112、个数值下面划了横线,表明只有一方的战略上针对另一方战略面划了横线,表明只有一方的战略上针对另一方战略的最优反应,而另一方的战略却表示针对对方战略的的最优反应,而另一方的战略却表示针对对方战略的最优反应。因此该单元对应的战略组合就不是双方同最优反应。因此该单元对应的战略组合就不是双方同时愿意接受的结果,因而也就构不成纳什均衡。时愿意接受的结果,因而也就构不成纳什均衡。数模博弈论 通过上面阐述,读者已经接触了各种博弈均衡的通过上面阐述,读者已经接触了各种博弈均衡的概念和寻求均衡结果的方法,现在着重分析一下它们概念和寻求均衡结果的方法,现在着重分析一下它们之间的关系。之间的关系。 (1) 每一个严格

113、占优战略均衡一定是纳什均衡,反之每一个严格占优战略均衡一定是纳什均衡,反之不然。不然。数模博弈论数模博弈论(2) 每一个逐步剔除严格占优战略均衡是纳什均衡,反每一个逐步剔除严格占优战略均衡是纳什均衡,反之不然。之不然。 这里就不作严格的论证了。回顾智猪争食博弈和这里就不作严格的论证了。回顾智猪争食博弈和图图21所示的博弈,对逐步剔除严格劣战略过程和划所示的博弈,对逐步剔除严格劣战略过程和划横线方法寻求纳什均衡的过程的比较,可以领会上述横线方法寻求纳什均衡的过程的比较,可以领会上述结论的含义。反例可以从图结论的含义。反例可以从图26所示博弈看出。所示博弈看出。s*(下下,右右)是纳什均衡,但该博

114、弈逐步剔除严格劣战略是纳什均衡,但该博弈逐步剔除严格劣战略却一步也不能施行。却一步也不能施行。数模博弈论(3) 如果战略组合是纳什均衡,那么它一定不会被逐如果战略组合是纳什均衡,那么它一定不会被逐步剔除严格劣战略剔除。步剔除严格劣战略剔除。 成立。成立。数模博弈论数模博弈论 在本章的最后,再介绍一个在本章的最后,再介绍一个20世纪世纪50年代出现的年代出现的又一个典型的博弈例子又一个典型的博弈例子性别战博弈。性别战博弈。 数模博弈论 这个例子得出的是:这个例子得出的是:(歌剧歌剧,歌剧歌剧)和和(拳击拳击,拳击拳击)都是纳什均都是纳什均衡。这个博弈既不存在严格的占优战略均衡,也不存在逐步剔衡。

115、这个博弈既不存在严格的占优战略均衡,也不存在逐步剔除严格劣战略均衡。并且对该博弈的两个纳什均衡(歌剧,歌除严格劣战略均衡。并且对该博弈的两个纳什均衡(歌剧,歌剧)和剧)和(拳击拳击,拳击拳击)不论实际实施哪一个均衡结果,总有一方感不论实际实施哪一个均衡结果,总有一方感到有点委屈。遇到这样一类博弈问题,纳什均衡用于预测博弈到有点委屈。遇到这样一类博弈问题,纳什均衡用于预测博弈将任何进行的作用就大大减弱了。将任何进行的作用就大大减弱了。数模博弈论二、二、 纳什均衡应用举例纳什均衡应用举例 本节集中研究分析经济学中几个博弈问题,这些也本节集中研究分析经济学中几个博弈问题,这些也是博弈论的经典之作。通

116、过对这些例题的模型的讨论,是博弈论的经典之作。通过对这些例题的模型的讨论,要达到两个目的:要达到两个目的:如何把一个实际问题的一般性描述如何把一个实际问题的一般性描述转化为一个博弈的标准式表述。转化为一个博弈的标准式表述。如何通过计算解出博如何通过计算解出博弈的纳什均衡。由此揭开博弈的纳什均衡在经济学领域弈的纳什均衡。由此揭开博弈的纳什均衡在经济学领域应用的序幕。注意到这些例题中的战略空间应用的序幕。注意到这些例题中的战略空间Si都是一个都是一个区间,战略区间,战略si都是在区间上取值的连续变量。实际上,都是在区间上取值的连续变量。实际上,第一章开始的海滩占位问题介绍属于这类情形。第一章开始的

117、海滩占位问题介绍属于这类情形。数模博弈论(一)、库诺特(一)、库诺特(Cournot)双寡头垄断竞争模型)双寡头垄断竞争模型数模博弈论数模博弈论 接下来就需要把企业接下来就需要把企业1、企业、企业2的收益表示为它自己的收益表示为它自己和另一企业所选战略的函数。假定企业的收益就是其利和另一企业所选战略的函数。假定企业的收益就是其利润额,这样在一般的两个参与者标准式博弈中,企业润额,这样在一般的两个参与者标准式博弈中,企业1和企业和企业2的收益函数就可表示为的收益函数就可表示为 . (2.2.1) 数模博弈论数模博弈论 .(2.2.2) 的解。的解。数模博弈论 利用微积分求极值的办法,对每个企业的

118、收益函利用微积分求极值的办法,对每个企业的收益函数求一阶导数并令其等于零,即可求出纳什均衡。数求一阶导数并令其等于零,即可求出纳什均衡。 . (2.2.3) 那么,要使产量成为纳什均衡,由式(那么,要使产量成为纳什均衡,由式(2.2.3)可知,)可知,两个企业的产量选择必须满足方程组两个企业的产量选择必须满足方程组 . (2.2.4) 数模博弈论解方程组(解方程组(2.2.4),得均衡解为),得均衡解为 这时,将上式代入式(这时,将上式代入式(2.2.1)。每个企业的纳什)。每个企业的纳什均衡利润为均衡利润为 还可以将双寡头垄断竞争与寡头垄断情况作一比还可以将双寡头垄断竞争与寡头垄断情况作一比

119、较。设寡头垄断企业的最优产量为较。设寡头垄断企业的最优产量为q*,这时最优化问,这时最优化问题是题是 数模博弈论数模博弈论. (2.2.5) 数模博弈论数模博弈论数模博弈论 求解库诺特模型的纳什均衡还有的三种方法,求解库诺特模型的纳什均衡还有的三种方法,即运用逐步剔除严格劣战略的方法。即运用逐步剔除严格劣战略的方法。 数模博弈论比较上面两式结果,就能得出比较上面两式结果,就能得出 对于企业对于企业2 来说,类似可导出来说,类似可导出 数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论(二)、伯川德(二)、伯川德(Bertrand)双寡头垄断竞争模型)双寡头垄断竞争

120、模型 下面介绍的仍然是双寡头垄断中两个企业相互竞争下面介绍的仍然是双寡头垄断中两个企业相互竞争的模型。伯川德(的模型。伯川德(1883)模型中两企业在竞争时选择的)模型中两企业在竞争时选择的是产品价格,而库诺特模型中选择的是产量。是产品价格,而库诺特模型中选择的是产量。 考虑企业考虑企业1和企业和企业2生产有差异的产品,它们为自己生产有差异的产品,它们为自己的产品选择的价格分别为的产品选择的价格分别为p1和和 p2。设消费者对企业产品。设消费者对企业产品的需求为的需求为数模博弈论 要寻找纳什均衡首先需要不其他转化为博弈的标准要寻找纳什均衡首先需要不其他转化为博弈的标准式表述。这时参与者仍为两个

121、企业。它们的战略空间可式表述。这时参与者仍为两个企业。它们的战略空间可以表示为以表示为S1S20,其中企业,其中企业i的一个特定战略的一个特定战略si时所选择的价格时所选择的价格pi0(i1,2)。)。数模博弈论解此方程组,得均衡解为解此方程组,得均衡解为数模博弈论(三)、(三)、最后要价仲裁模型最后要价仲裁模型较为重要的仲裁有两类:协议仲裁和最后较为重要的仲裁有两类:协议仲裁和最后要价仲裁。在最后要价仲裁中,争议双方要价仲裁。在最后要价仲裁中,争议双方各自就工资水平要价,仲裁人选择其中之各自就工资水平要价,仲裁人选择其中之一作为仲裁结果。这里介绍的是法伯一作为仲裁结果。这里介绍的是法伯(Fa

122、rber,1982)建立的最后要价仲裁模)建立的最后要价仲裁模型。型。数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论的解。的解。数模博弈论(2.2.6) 数模博弈论由上述方程组可得由上述方程组可得(2.2.7) 上式表明,双方要价的平均值一定等于仲裁人偏好上式表明,双方要价的平均值一定等于仲裁人偏好方案的中值。将(方案的中值。将(2.2.7)代入式()代入式(2.2.6)中任何一个)中任何一个方程,可得方程,可得 上式表示双方要价之差等于仲裁人偏好方案中值上式表示双方要价之差等于仲裁人偏好方案中值点概率密度的倒数。点概率密度的倒数。数模博弈论 为了更好地从直观理解这一静态结果,现在讨论一为

123、了更好地从直观理解这一静态结果,现在讨论一个具体的例子。设仲裁人的偏好方案服从均值为个具体的例子。设仲裁人的偏好方案服从均值为m,方,方差为差为2的正态分布,其概率密度函数为的正态分布,其概率密度函数为 因为正态分布是对称的,所以其中值等于均值因为正态分布是对称的,所以其中值等于均值m。由式(由式(2.2.7)可得)可得数模博弈论又由式(又由式(2.2.8)可知)可知于是,纳什均衡的要价为于是,纳什均衡的要价为和和 由此可见,双方的均衡要价以仲裁人偏好方案的由此可见,双方的均衡要价以仲裁人偏好方案的均值(即均值(即m)为中心对称,且要价之差随仲裁人偏好)为中心对称,且要价之差随仲裁人偏好方案的

124、离散程度(即方案的离散程度(即2)的加大而增大。)的加大而增大。数模博弈论数模博弈论(三)、公共地的悲剧(三)、公共地的悲剧 哈丁(哈丁(Hardin,1968)的研究公共地悲剧的论文)的研究公共地悲剧的论文曾引起非经济学者的广泛关注。早在曾引起非经济学者的广泛关注。早在16世纪,从休谟世纪,从休谟(Hume,1739)开始,包括政治、社会、经济学各方)开始,包括政治、社会、经济学各方面的学者已经认识到如果公民只关注个人福利,公共面的学者已经认识到如果公民只关注个人福利,公共物品就会出现短缺,并且公共资源也会过度使用。观物品就会出现短缺,并且公共资源也会过度使用。观察一下现今地球从陆地到海洋的

125、环境和资源的种种问察一下现今地球从陆地到海洋的环境和资源的种种问题,公共地悲剧模型揭示了事物的本质。题,公共地悲剧模型揭示了事物的本质。数模博弈论数模博弈论数模博弈论-(2.2.9) 数模博弈论也就是数模博弈论数模博弈论数模博弈论数模博弈论3 混合战略纳什均衡混合战略纳什均衡数模博弈论例一例一 猜硬币博弈猜硬币博弈 两个参与人手中各握有一枚硬币,每个人可以选择两个参与人手中各握有一枚硬币,每个人可以选择是正面向上还是背面向上,然后同时伸开手掌。如果两是正面向上还是背面向上,然后同时伸开手掌。如果两枚硬币全部正面向上或全部背面向上,那么参与人枚硬币全部正面向上或全部背面向上,那么参与人2赢赢走参

126、与人走参与人1的硬币;如果两个人的手中硬币一个正面向的硬币;如果两个人的手中硬币一个正面向上一个背面向上,那么参与人上一个背面向上,那么参与人1赢走参与人赢走参与人2的硬币。下的硬币。下表给出这个博弈的双变量收益矩阵。表给出这个博弈的双变量收益矩阵。数模博弈论 这个博弈通常称为两人零和博弈,就是在每一个这个博弈通常称为两人零和博弈,就是在每一个结局里一方所得即为另一方所失,即两个参与人的收结局里一方所得即为另一方所失,即两个参与人的收益之和恰好都等于零。用在双变量收益矩阵中划横线益之和恰好都等于零。用在双变量收益矩阵中划横线的方法,在这个博弈中找不到纳什均衡,也就是说没的方法,在这个博弈中找不

127、到纳什均衡,也就是说没有一个战略组合能够满足(有一个战略组合能够满足(NE)条件。)条件。数模博弈论例二例二 监督博弈监督博弈 用在双变量收益矩阵中划横线的方法,也找不到这用在双变量收益矩阵中划横线的方法,也找不到这个博弈的纳什均衡。个博弈的纳什均衡。 数模博弈论一、混合战略的概念一、混合战略的概念 上面列举的两个博弈,参与者在自己的战略空间中上面列举的两个博弈,参与者在自己的战略空间中都找不出最优反应战略组成纳什均衡的战略组合。这都找不出最优反应战略组成纳什均衡的战略组合。这两个博弈的一个明显的特点就是每个参与者都试图先两个博弈的一个明显的特点就是每个参与者都试图先猜中对方的战略,而每一个参

128、与者又都尽量不让对方猜中对方的战略,而每一个参与者又都尽量不让对方猜中对方的战略。类似的博弈问题在划拳、扑克比赛、猜中对方的战略。类似的博弈问题在划拳、扑克比赛、球赛、甚至战争等其他的竞技中也经常出现。在球赛、甚至战争等其他的竞技中也经常出现。在“剪剪刀、石头、布刀、石头、布”游戏中,一方能赢对方的前提是他能游戏中,一方能赢对方的前提是他能猜中对方会出什么手势。猜中对方会出什么手势。 数模博弈论 在博弈中,一旦每个参与者都在竭力猜测其他参在博弈中,一旦每个参与者都在竭力猜测其他参与者的战略选择,而不能通过收益函数做出最优反映,与者的战略选择,而不能通过收益函数做出最优反映,那么在这类博弈中,因

129、为最优行为是不确定的,所以那么在这类博弈中,因为最优行为是不确定的,所以就不存在纳什均衡(至少不存在就不存在纳什均衡(至少不存在2.1.4小节所定义的小节所定义的纳什均衡)。参与者为了不把自己选择战略的意图暴纳什均衡)。参与者为了不把自己选择战略的意图暴露给对方,一个办法就是从自己的战略空间中随机地露给对方,一个办法就是从自己的战略空间中随机地选择一个战略。混合战略指的就是参与者以一定的概选择一个战略。混合战略指的就是参与者以一定的概率去选择某种战略。这类博弈虽然在一次操作中有输率去选择某种战略。这类博弈虽然在一次操作中有输有赢,但将这个博弈多次重复进行,可以研究各个战有赢,但将这个博弈多次重

130、复进行,可以研究各个战略应赋予多大的概率,能获取最大的期望(平均)收略应赋予多大的概率,能获取最大的期望(平均)收益。益。 数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论二、二、混合战略纳什均衡混合战略纳什均衡 数模博弈论数模博弈论数模博弈论类似地,参与人类似地,参与人2的期望收益函数为的期望收益函数为数模博弈论数模博弈论数模博弈论数模博弈论 现在就可以运用上述定义来寻求猜硬币博弈的混现在就可以运用上述定义来寻求猜硬币博弈的混合战略纳什均衡。已知参与人合战略纳什均衡。已知参与人1 1 和参与人和参与人2 2的期望收益的期望收益函数,见式函数,见式(2.3.1)

131、(2.3.1)和式和式(2.3.2)(2.3.2),不等式(,不等式(2.3.52.3.5)和)和(2.3.62.3.6)等价于求最优化问题)等价于求最优化问题 的解。的解。 利用微积分求极值的方法,式(利用微积分求极值的方法,式(2.3.7)和式)和式(2.3.8)的一价微分条件为)的一价微分条件为数模博弈论下面给出混合战略纳什均衡的一般定义。下面给出混合战略纳什均衡的一般定义。数模博弈论的解。的解。数模博弈论数模博弈论 比如,在两人博弈中,由式(比如,在两人博弈中,由式(2.3.3)看出,对)看出,对参与者参与者1而言,式(而言,式(2.3.9)即为)即为数模博弈论数模博弈论所以有所以有对

132、参与人对参与人2也有类似的结果。也有类似的结果。数模博弈论 根据上述道理,混合战略纳什均衡定义也可以表根据上述道理,混合战略纳什均衡定义也可以表述如下述如下 数模博弈论数模博弈论同时,纳税人的期望收益函数为同时,纳税人的期望收益函数为数模博弈论用微积分求极值的方法,最优化的一阶微分条件为用微积分求极值的方法,最优化的一阶微分条件为解得解得数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论数模博弈论 利用两条最优反应对应曲线的交点,寻求两人博利用两条最优反应对应曲线的交点,寻求两人博弈的混合战略纳什均衡。例如,在猜硬币博弈中,对弈的混合战略纳什均衡。例如,在猜硬币博弈中,对参

133、与人参与人1来说,由最优化问题来说,由最优化问题 定义最优反应对应为定义最优反应对应为数模博弈论类似地对参与人来说,由归优化问题类似地对参与人来说,由归优化问题 定义最优反应为定义最优反应为数模博弈论数模博弈论 这样,尽管另这样,尽管另一个参与人知道他选一个参与人知道他选择某个特定特定的纯择某个特定特定的纯战略的概率是多少,战略的概率是多少,但仍然猜不透他实际但仍然猜不透他实际会选中哪个纯战略。会选中哪个纯战略。实际上,正是由于参实际上,正是由于参与人在几个或全部纯与人在几个或全部纯战略中的选择是无差战略中的选择是无差异的,才使他的行为异的,才使他的行为难以预测。如果一个难以预测。如果一个参与人严格偏好某个参与人严格偏好某个特写的纯战略,那么特写的纯战略,那么他的得为就会被另一他的得为就会被另一个参与人准确地猜透个参与人准确地猜透这样不会产生混合战这样不会产生混合战略纳么均衡了。略纳么均衡了。 数模博弈论

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号