《博弈模型数模》由会员分享,可在线阅读,更多相关《博弈模型数模(50页珍藏版)》请在金锄头文库上搜索。
1、数学建模之数学建模之 博弈模型博弈模型 宇宙间处处存在矛盾、冲突、争斗、合作、共生等现象,这宇宙间处处存在矛盾、冲突、争斗、合作、共生等现象,这些现象很很早就引起各类学者的重视。数学被认为是科学的语言,些现象很很早就引起各类学者的重视。数学被认为是科学的语言,能否用数学语言描述各种带有矛盾因素的模型或现象?能否用数学语言描述各种带有矛盾因素的模型或现象?o博弈论便是这样一种处理各类带有矛盾因素的博弈论便是这样一种处理各类带有矛盾因素的模型的数学工具模型的数学工具。 博弈论现在已被数学、经济学、社会学、军事学、生物学等专家广泛应用博弈论现在已被数学、经济学、社会学、军事学、生物学等专家广泛应用于
2、讨论各类带有冲突、矛盾、合作、竞争、进化等问题及相关模型之中。博于讨论各类带有冲突、矛盾、合作、竞争、进化等问题及相关模型之中。博弈论已成为人们分析复杂系统与作重大决策时的有力工具。弈论已成为人们分析复杂系统与作重大决策时的有力工具。一、博弈论基本概念一、博弈论基本概念世事纷争一棋局世事纷争一棋局o许多冲突模型在游戏中就存在,博弈论早期就是由研究国际象棋许多冲突模型在游戏中就存在,博弈论早期就是由研究国际象棋开始的,所以被命名为开始的,所以被命名为Game Theory。人们很快认识到此种理论可。人们很快认识到此种理论可用于经济、政治、军事等领域。用于经济、政治、军事等领域。o19441944
3、年冯年冯诺曼和奥诺曼和奥摩根斯特恩合著的摩根斯特恩合著的竞赛论与经济行为竞赛论与经济行为问世,总结问世,总结了初期研究成果,奠定了博弈论的基础。由于该理论主要讨论在复杂的矛了初期研究成果,奠定了博弈论的基础。由于该理论主要讨论在复杂的矛盾冲突等活动中,局中人(盾冲突等活动中,局中人(Player)采取何种合理的策略()采取何种合理的策略(strategy)而)而能处于能处于“优越优越”的地位,以便取得较好效益,所以将它译为博弈论。的地位,以便取得较好效益,所以将它译为博弈论。 博弈论(博弈论(Game theoryGame theory)可以被定义为是对)可以被定义为是对智能的智能的理性理性决
4、策者之间冲突与合决策者之间冲突与合作的数学模型的研究。作的数学模型的研究。 常见的游戏如棋类,两人对奕,此两人便称为局中人,他们各常见的游戏如棋类,两人对奕,此两人便称为局中人,他们各有一套棋路,或善于用马,或长于用炮。在每次轮到一方走子时,有一套棋路,或善于用马,或长于用炮。在每次轮到一方走子时,他可能有许多走法,这些走法依赖于当时棋局形势以及棋手想要达他可能有许多走法,这些走法依赖于当时棋局形势以及棋手想要达到的目的,以及他惯用的走法,从而形成他走棋的指导思想。对奕到的目的,以及他惯用的走法,从而形成他走棋的指导思想。对奕时指导棋手行动的思想便称为策略。对局终了可能有三种结局:甲时指导棋手
5、行动的思想便称为策略。对局终了可能有三种结局:甲胜;乙胜;和局。如果用数量表示各种结局,例如胜家赢得彩金若胜;乙胜;和局。如果用数量表示各种结局,例如胜家赢得彩金若干(设所得彩金由输家付给,则输家当然失去若干),和局时都不干(设所得彩金由输家付给,则输家当然失去若干),和局时都不能取得彩金,此种表示结局的数称为支付(能取得彩金,此种表示结局的数称为支付(payoff)。局中人、策)。局中人、策略、支付是博弈论中常见的基本概念略、支付是博弈论中常见的基本概念, ,下面我们将逐一介绍。下面我们将逐一介绍。 (1)参与者)参与者o参与者指的是一个博弈中的决策主体,通常又称为参与人或局中参与者指的是一
6、个博弈中的决策主体,通常又称为参与人或局中人。人。n博弈参与者集合一般表示为博弈参与者集合一般表示为 o参与者参加博弈的目的是通过合理选择自己的行动,以期取得最大化自己的收参与者参加博弈的目的是通过合理选择自己的行动,以期取得最大化自己的收益(或效用)水平。参与者可以是自然人,也可以是企业、团体、国家,甚至益(或效用)水平。参与者可以是自然人,也可以是企业、团体、国家,甚至是国家组成的集团(如欧盟、是国家组成的集团(如欧盟、OPECOPEC等)。对参与者而言,在博弈过程中,他必等)。对参与者而言,在博弈过程中,他必须有不同的行动可作应对选择。在博弈的结局中,他能知道或计算出各参与者须有不同的行
7、动可作应对选择。在博弈的结局中,他能知道或计算出各参与者不同的行动组合产生的效益(或效用)。不同的行动组合产生的效益(或效用)。(2)战略)战略o战略战略是参与者如何对其他参与者的行动作出反应的行动规则,它规定是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候该选择什么行动。或者说。战略是参与者参与者在什么时候该选择什么行动。或者说。战略是参与者“相机行相机行动方案动方案”。(3)收益函数)收益函数o在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定效在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定效用或期望效用。效用通常表现为博弈结果中输赢、得失、
8、盈亏。效用必用或期望效用。效用通常表现为博弈结果中输赢、得失、盈亏。效用必须能用数值刻画其大小。收益是博弈参与者真正关心的问题须能用数值刻画其大小。收益是博弈参与者真正关心的问题 。注释:注释:博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各选择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各选定一个战略形成的战略组合的函数。定一个战略形成的战略组合的函数。o在博弈论中,通常用在博弈论中,通常用ui表示参与者表示参与者i的收益,一个战略组合是,每个参
9、与者的收益,一个战略组合是,每个参与者的收益可以表示为的收益可以表示为 参与者、战略、收益函数是标准博弈的三要素。由前面我们对这三要素的分析,可以得到一个标准博弈的定义:o标准博弈的定义:标准博弈的定义:(4)博弈的解)博弈的解纳什均衡纳什均衡o注释:研究博弈问题就是建立博弈模型,求解博弈的纳什均衡,下面我们用实例来说明我们的理论及应用信息信息o信息指的是参与者在博弈过程中能了解到和观察到的知识。这些知识包括信息指的是参与者在博弈过程中能了解到和观察到的知识。这些知识包括“自然自然”的选择,其他参与者的特征和行动等。信息对参与者是至关重要的选择,其他参与者的特征和行动等。信息对参与者是至关重要
10、的,因为一个参与者在每一次进行决策之前,必须根据观察到的其他参与的,因为一个参与者在每一次进行决策之前,必须根据观察到的其他参与者的行动和了解的有关情况作出自己的最佳选择。者的行动和了解的有关情况作出自己的最佳选择。o由于信息内涵的不同,派生出各种有关信息的概念将博弈论划分成不同的由于信息内涵的不同,派生出各种有关信息的概念将博弈论划分成不同的类型,因此寻求博弈间的方法也不同。这里只就信息有关的两个基本的、类型,因此寻求博弈间的方法也不同。这里只就信息有关的两个基本的、重要的概念进行讨论。重要的概念进行讨论。o首先,关于首先,关于“共同知识共同知识”的概念。一个博弈问题所涉及的的概念。一个博弈
11、问题所涉及的“自然自然”的不同的不同选择、参与者的行动以及相应产生的效用(效果、收益)都是一种知识选择、参与者的行动以及相应产生的效用(效果、收益)都是一种知识(信息)。博弈论所谓的共同知识指的是(信息)。博弈论所谓的共同知识指的是“所有参与者知道,所有参与者所有参与者知道,所有参与者知道所有参与者知道,所有参与者知道所有参与者知道所有参与者知道知道所有参与者知道,所有参与者知道所有参与者知道所有参与者知道”的知识。的知识。 为了说明共同知识的重要性,我引用一个众所周知的寓言。故事为了说明共同知识的重要性,我引用一个众所周知的寓言。故事发生在一个村庄,村里有发生在一个村庄,村里有100对已婚夫
12、妇,他们都是地道的逻辑学家,对已婚夫妇,他们都是地道的逻辑学家,但也有一些多少有点奇特的社会风俗。每天晚上,村里的男人们都将但也有一些多少有点奇特的社会风俗。每天晚上,村里的男人们都将点起篝火,绕圈围坐举行一个会议,且每个人都谈论自己的妻子。在点起篝火,绕圈围坐举行一个会议,且每个人都谈论自己的妻子。在会议开始时,如果一个男人有理由认为他的妻子对他总是守贞的,那会议开始时,如果一个男人有理由认为他的妻子对他总是守贞的,那么他就对在坐的男人们赞扬她的美德。另一方面,如果在当前会议之么他就对在坐的男人们赞扬她的美德。另一方面,如果在当前会议之前的任何时间,只要他发现了他妻子不贞的证据,那他就会悲鸣
13、恸哭,前的任何时间,只要他发现了他妻子不贞的证据,那他就会悲鸣恸哭,并祈求神灵严厉地惩罚她。再则,如果一个妻子曾有不贞,那她和她并祈求神灵严厉地惩罚她。再则,如果一个妻子曾有不贞,那她和她的情人将会立即通知村里除她丈夫外所有的男人。所有这些传统都是的情人将会立即通知村里除她丈夫外所有的男人。所有这些传统都是村民们的共同知识。村民们的共同知识。 事实上,每个妻子都已对自己的丈夫不忠。于是,每个丈夫都事实上,每个妻子都已对自己的丈夫不忠。于是,每个丈夫都知道除自己的妻子外都是不贞的女人,而对自己的妻子每晚都要知道除自己的妻子外都是不贞的女人,而对自己的妻子每晚都要赞扬。赞扬。 这种状况持续了很多年
14、,直到一个传教徒走访到这个村庄。他坐这种状况持续了很多年,直到一个传教徒走访到这个村庄。他坐在髯火旁参加了一次会议并听到每个男人都赞扬自己的妻子之后,他在髯火旁参加了一次会议并听到每个男人都赞扬自己的妻子之后,他站到丈夫们围坐的圆中心,大声地说:站到丈夫们围坐的圆中心,大声地说:“这个村里有一个妻子已经不这个村里有一个妻子已经不贞了。贞了。”在此后的在此后的9999个晚上丈夫们继续开会并赞扬他们的妻子,但在个晚上丈夫们继续开会并赞扬他们的妻子,但在第第100100个晚上,他们全都悲鸣偷哭并祈求严厉地惩罚他们的妻子。个晚上,他们全都悲鸣偷哭并祈求严厉地惩罚他们的妻子。o 现在,让我们试问一下,这
15、个传教徒告诉了这些丈夫们他们所不知道现在,让我们试问一下,这个传教徒告诉了这些丈夫们他们所不知道的什么?每个丈夫都已经知道了的什么?每个丈夫都已经知道了9999个不贞的妻子,故这对任何人来说个不贞的妻子,故这对任何人来说都不是新闻。但都不是新闻。但“这个传教徒对所有男人做了一个声明这个传教徒对所有男人做了一个声明”是共同知识,是共同知识,从而这个传教徒所声明的内容,即有一个不贞的妻子,也就成了所有从而这个传教徒所声明的内容,即有一个不贞的妻子,也就成了所有男人中间的共同知识。在传教徒宣告之前,每个形如男人中间的共同知识。在传教徒宣告之前,每个形如“(每个丈夫知(每个丈夫知道)有一个不贞的妻子道
16、)有一个不贞的妻子”的判断对于的判断对于9999都是正确的,但对都是正确的,但对100100就不正就不正确了。确了。 其次,关于其次,关于“完全信息完全信息”的概念。完全信息是博弈论的概念。完全信息是博弈论非常重要的基本概念,有了上述的共同知识概念,这里就非常重要的基本概念,有了上述的共同知识概念,这里就可以给出完全信息的严格定义。完全信息指的是所有参与可以给出完全信息的严格定义。完全信息指的是所有参与者各自选择的行动的不同组合所决定的各参与者的收益对者各自选择的行动的不同组合所决定的各参与者的收益对所有参与者来说是共同知识。简单通俗地说,完全信息是所有参与者来说是共同知识。简单通俗地说,完全
17、信息是指每一个参与者对自己以及其他参与者的行动,以及各参指每一个参与者对自己以及其他参与者的行动,以及各参与者选择的行动组合产生的收益等知识有完全的了解。与者选择的行动组合产生的收益等知识有完全的了解。二、囚徒困境博弈模型分析二、囚徒困境博弈模型分析 两个共同作案的犯罪嫌疑人被捕,并受到指控。两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一个人招认犯罪,否则警方无充分证据将他除非至少一个人招认犯罪,否则警方无充分证据将他们按罪判刑。警方把他们关入不同的牢室,并对他们们按罪判刑。警方把他们关入不同的牢室,并对他们说明不同行动带来的后果。如果两人都采取沉默的抗说明不同行动带来的后果。如果两人都
18、采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱入狱1 1个月;如果双方都坦白,根据案情两人将被判入个月;如果双方都坦白,根据案情两人将被判入狱狱6 6个月;如果一个招供而另一个拒不坦白,招认者因个月;如果一个招供而另一个拒不坦白,招认者因有主动认罪立功表现将立即释放,而另一人将被判入有主动认罪立功表现将立即释放,而另一人将被判入狱狱9 9个月(所犯罪行判个月(所犯罪行判6 6个月,干扰司法加判个月,干扰司法加判3 3个月)。个月)。1 1、问题的提出、问题的提出这两个犯罪嫌疑这两个犯罪嫌疑人是坦白还是拒人是坦白还是拒不坦白呢?不坦白
19、呢?3 3、问题分析、问题分析o囚徒困境问题可以用图囚徒困境问题可以用图1 11 1所示的双变量矩阵的形式来描述。所示的双变量矩阵的形式来描述。注释:注释:在此博弈中,每个囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉默)。图在此博弈中,每个囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉默)。图1-11-1的矩阵中每一个的矩阵中每一个单元的两个数字表示一组特定的战略组合下两个囚犯的收益(或支付、效用,这里已经开始引用经济学的术单元的两个数字表示一组特定的战略组合下两个囚犯的收益(或支付、效用,这里已经开始引用经济学的术语了),其中第语了),其中第1 1个数字是囚徒个数字是囚徒1 1
20、(习惯上是位于矩阵横行上的参与者)的收益,第(习惯上是位于矩阵横行上的参与者)的收益,第2 2个数字是囚徒个数字是囚徒2 2(位于竖(位于竖行上的参与者)的收益。如果囚徒行上的参与者)的收益。如果囚徒1 1选择沉默,而囚徒选择沉默,而囚徒2 2选择坦白,那么囚徒选择坦白,那么囚徒1 1的收益是的收益是9 9(表示判刑(表示判刑9 9个月),个月),囚徒囚徒2 2的收益为的收益为0 0(表示马上释放)。(表示马上释放)。2 2、假设:、假设:两囚徒都是理性的和智能的。两囚徒都是理性的和智能的。4、模型建立模型建立o参与者集合:参与者集合:=囚徒囚徒1,囚徒,囚徒2o战略空间:战略空间:S1=S2
21、=坦白,沉默坦白,沉默u1(坦白坦白,坦白坦白) = u2(坦白坦白,坦白坦白)-6 ,u1(沉默沉默,坦白坦白)u2(沉默沉默,坦白坦白)=-9u1(坦白坦白,沉默沉默) u2(坦白坦白,沉默沉默)= 0 ,u1(沉默沉默,沉默沉默)u2(沉默沉默,沉默沉默)=-1o收益函数收益函数5 5、模型求解、模型求解6 6、结果分析、结果分析战略组合(沉默,沉默),即如果两个人都不坦白,各人只判刑一个战略组合(沉默,沉默),即如果两个人都不坦白,各人只判刑一个月,不是比战略组合(坦白,坦白)带来的各判刑月,不是比战略组合(坦白,坦白)带来的各判刑6 6个月要好吗?个月要好吗?注释:这正是囚徒困境的注
22、释:这正是囚徒困境的“困境困境”两个字的体现,两个字的体现,如果用经济学中的如果用经济学中的“有效有效”的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚徒问题的博弈解。这体现了个人利益和全体利益的矛盾。徒问题的博弈解。这体现了个人利益和全体利益的矛盾。7 7、模型的推广与应用、模型的推广与应用o与囚徒困境类似的博弈问题在经济、社会等领域有许许多多的版本。与囚徒困境类似的博弈问题在经济、社会等领域有许许多多的版本。应用应用1 1:A,B两个公司以高低两种价格向市场竞相销售同一种产品。两个公司以高低两种价格向市场竞相销
23、售同一种产品。注释:注释:双方协定以高价格垄断市场,可以使彼此获得满意的利润收益,至少要好于双方都以低价格出售产品的情形。但如果某双方协定以高价格垄断市场,可以使彼此获得满意的利润收益,至少要好于双方都以低价格出售产品的情形。但如果某一方坚持高价,而另一方为了独占市场却将产品以低价格推销,因为协定不被遵守时是不会受处罚,那么后者将获高盈一方坚持高价,而另一方为了独占市场却将产品以低价格推销,因为协定不被遵守时是不会受处罚,那么后者将获高盈利而前者将损失惨重。市场上商品的价格战,常常出现的结局一般是以低价格销售商品,消费者从中得到好处,如现在利而前者将损失惨重。市场上商品的价格战,常常出现的结局
24、一般是以低价格销售商品,消费者从中得到好处,如现在的通信三大运营商:移动、电信和联通,这种结果正是博弈论预测的合理结局,你们不妨自己设计一个类似于图的通信三大运营商:移动、电信和联通,这种结果正是博弈论预测的合理结局,你们不妨自己设计一个类似于图1-11-1的的A,BA,B公司的收益矩阵。公司的收益矩阵。应用应用2 2:军备竞赛问题军备竞赛问题注释:美苏冷战期间,两个超级大国构成博弈的两方,可供选择的战略是:扩军美苏冷战期间,两个超级大国构成博弈的两方,可供选择的战略是:扩军(增加军费运算)、裁军(减少军费运算)。如果双方都热衷于扩军,两国都要(增加军费运算)、裁军(减少军费运算)。如果双方都
25、热衷于扩军,两国都要为此付出高额军费(从社会福利角度来看这是一笔庞大的付收益)为此付出高额军费(从社会福利角度来看这是一笔庞大的付收益); ;如果双方都如果双方都选择裁军,则可省下这笔钱;如果一方面裁军而另一方面进行扩军,扩军的一方选择裁军,则可省下这笔钱;如果一方面裁军而另一方面进行扩军,扩军的一方到时候就会以武力相威胁甚至发动战争,这是,战争胜败双方的收益与支付将出到时候就会以武力相威胁甚至发动战争,这是,战争胜败双方的收益与支付将出现难以估量的差异。博弈论给出军备竞赛问题的是战略组合现难以估量的差异。博弈论给出军备竞赛问题的是战略组合( (扩军,扩军扩军,扩军) ),博弈,博弈理论预测双
26、方都扩军可以达到对抗中的相对稳定,这是一个符合现实的合理结局。理论预测双方都扩军可以达到对抗中的相对稳定,这是一个符合现实的合理结局。三、海滩占位博弈模型分析三、海滩占位博弈模型分析 甲乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格、相同的甲乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格、相同的质量向均匀分布在海滩上的众多游客(他们来此享受海水和阳光,进行日光浴质量向均匀分布在海滩上的众多游客(他们来此享受海水和阳光,进行日光浴或游泳活动)销售冷饮。既然是做生意,目的总是希望尽可能多赚点钱,甲乙或游泳活动)销售冷饮。既然是做生意,目的总是希望尽可能多赚点钱,甲乙两人又是在同一地
27、点做同样的生意,竞争就是不可避免的事情了。两人又是在同一地点做同样的生意,竞争就是不可避免的事情了。1 1、问题的提出、问题的提出这两个冷饮摊贩应该如这两个冷饮摊贩应该如何安置自己的摊位,才何安置自己的摊位,才能相安无事地做各自的能相安无事地做各自的生意呢?生意呢?3 3、建模、建模(1 1)参与者集合:)参与者集合:=甲,乙甲,乙(2 2)战略空间:)战略空间:S1=0,1/2,S2=1/2,1(3 3)收益函数)收益函数: :2 2、问题分析与问题分析与假设假设:(1 1)两摊贩都是理性的和智能的;两摊贩都是理性的和智能的;(2 2)游客总是到距离自己最近的摊位购买冷饮;)游客总是到距离自
28、己最近的摊位购买冷饮;(3 3)为了叙述方便,不妨将海滩长度标准化为)为了叙述方便,不妨将海滩长度标准化为1 1。对所有对所有xS10,1/2和和yS21/2,1都成立。都成立。 4 4、模型求解、模型求解5 5、结果分析与推广和应用、结果分析与推广和应用结果分析:结果分析:按通常的想法,如图按通常的想法,如图1-31-3,甲在,甲在1/41/4处设摊,乙在处设摊,乙在3/43/4处设摊,这样既处设摊,这样既方便了顾客,又照顾到甲乙二人各占约一半顾客的生意,可谓公平合理。方便了顾客,又照顾到甲乙二人各占约一半顾客的生意,可谓公平合理。问题不问题不是简单的解决了吗?是简单的解决了吗?注释:注释:
29、事情并不像想象的那么简单。甲乙二人做同样的生意,两人之间就存在竞争,这就构成了一个博弈问题。站在甲事情并不像想象的那么简单。甲乙二人做同样的生意,两人之间就存在竞争,这就构成了一个博弈问题。站在甲的角度考虑,只要手段合法,多揽一点顾客就可以多赚一点钱。基于这样的理性想法,甲就会将自己的摊位向右挪动到的角度考虑,只要手段合法,多揽一点顾客就可以多赚一点钱。基于这样的理性想法,甲就会将自己的摊位向右挪动到A A点(见图点(见图1 13 3)。这时,从)。这时,从0 0到到M M(这里(这里M M是是A A至至3/43/4处的中点)范围内的顾客都会去买甲的冷饮,甲就从乙的手里挖走一部处的中点)范围内
30、的顾客都会去买甲的冷饮,甲就从乙的手里挖走一部分顾客,即图分顾客,即图1 13 3中阴影所示的中阴影所示的1/21/2到到N N的那一部分。乙也是一个理性的生意人,他会估计到甲可能作出的动作,因此,的那一部分。乙也是一个理性的生意人,他会估计到甲可能作出的动作,因此,他也会将自己的摊位向左边移动。照此下去,最后的结果是甲乙二人都挤在一起,紧接着,在海滩的中点(他也会将自己的摊位向左边移动。照此下去,最后的结果是甲乙二人都挤在一起,紧接着,在海滩的中点(1/21/2处)做冷处)做冷饮生意。饮生意。 推广应用推广应用:同一城市的不同航空公司经营的飞往同一目的地的航班,常常出现起飞时刻几乎相同的:同
31、一城市的不同航空公司经营的飞往同一目的地的航班,常常出现起飞时刻几乎相同的现象。就是在文化娱乐方面,也能运用海滩占位的博弈结论予以解释。如果把电视中高雅艺术节目现象。就是在文化娱乐方面,也能运用海滩占位的博弈结论予以解释。如果把电视中高雅艺术节目与较低档的节目比作海滩的两端,那么众多的电视观众就可以看作是散布在海滩上的游客。电视台与较低档的节目比作海滩的两端,那么众多的电视观众就可以看作是散布在海滩上的游客。电视台常常将黄金时段的电视节目定位在中等档次,以提高收视率。常常将黄金时段的电视节目定位在中等档次,以提高收视率。四、智猪争食博弈四、智猪争食博弈1 1、问题的提出、问题的提出o猪圈里喂养
32、两头猪,一头大猪,一头小猪。猪圈的一猪圈里喂养两头猪,一头大猪,一头小猪。猪圈的一边有一个猪食槽,对面的一边装有控制开关。只要猪边有一个猪食槽,对面的一边装有控制开关。只要猪用鼻头去拱控制开关,就会一次有用鼻头去拱控制开关,就会一次有6 6个单位的饲料流个单位的饲料流进猪食槽。如果大猪和小猪都不去拱开关,那么它们进猪食槽。如果大猪和小猪都不去拱开关,那么它们都吃不到饲料。如果小猪去拱开关,那么等它跑到另都吃不到饲料。如果小猪去拱开关,那么等它跑到另一边的猪食槽时,大猪已将流出的饲料全部都吃光了。一边的猪食槽时,大猪已将流出的饲料全部都吃光了。如果大猪去拱开关,那么等它跑到猪食槽旁边,小猪如果大
33、猪去拱开关,那么等它跑到猪食槽旁边,小猪差不多已吃掉了差不多已吃掉了5 5个单位的饲料,结果大猪只能吃到个单位的饲料,结果大猪只能吃到1 1个单位的饲料。如果大猪、小猪一起去拱开关,再一个单位的饲料。如果大猪、小猪一起去拱开关,再一起跑去吃食,那么大猪可抢到起跑去吃食,那么大猪可抢到4 4个单位的饲料,小猪个单位的饲料,小猪也只能吃掉也只能吃掉2 2个单位的饲料。假定每拱一次开关需要个单位的饲料。假定每拱一次开关需要消耗消耗0.50.5个单位饲料的能量。个单位饲料的能量。大小猪分别是去大小猪分别是去拱还是不去拱开拱还是不去拱开关?关?2 2、分析与假设、建模、模型求解、分析与假设、建模、模型求
34、解 大猪和小猪长期在一起进食,上面所说的情况(信息、知识)已为它们所大猪和小猪长期在一起进食,上面所说的情况(信息、知识)已为它们所掌握。所以可假设掌握。所以可假设大小猪都是理性的和智能的。大小猪都是理性的和智能的。o仿照例一囚徒困境的情形,就可以画出如图仿照例一囚徒困境的情形,就可以画出如图1 14 4所示的双变量矩阵。所示的双变量矩阵。o仿照例一囚徒困境的情形,可以建立出该问题的博弈模型并求出其解。仿照例一囚徒困境的情形,可以建立出该问题的博弈模型并求出其解。智猪争食问题的博弈论解是战略组合(拱,不拱)智猪争食问题的博弈论解是战略组合(拱,不拱)注释:注释:在这个博弈中,大猪与小猪都有两种
35、战略选择:拱、不拱。在这个例子中可以发现,不论大猪选在这个博弈中,大猪与小猪都有两种战略选择:拱、不拱。在这个例子中可以发现,不论大猪选择拱还是不供,小猪的最优选择总是不拱。这是因为,如果大猪去拱开关,小猪不拱(等在猪食槽旁边)择拱还是不供,小猪的最优选择总是不拱。这是因为,如果大猪去拱开关,小猪不拱(等在猪食槽旁边)比拱后再跑回去争食要划算(比拱后再跑回去争食要划算(51.551.5);如果大猪不去拱开关,小猪不拱顶多都不得食,而去拱就要白白);如果大猪不去拱开关,小猪不拱顶多都不得食,而去拱就要白白消耗能量,不划算(消耗能量,不划算(0-0.50-0.5)。所以,不拱是小猪的占优)。所以,
36、不拱是小猪的占优战略。给定小猪总是选择不拱,大猪的战略。给定小猪总是选择不拱,大猪的最优选择总是拱。这样,智猪争食问题的博弈论解是战略组合(拱,不拱)。最优选择总是拱。这样,智猪争食问题的博弈论解是战略组合(拱,不拱)。3 3、结果分析与推广和应用、结果分析与推广和应用o比如股份公司中就有大股东和小股东之分。股东都有监督经理的职能,他比如股份公司中就有大股东和小股东之分。股东都有监督经理的职能,他们从监督中得到的收益并不一样。在监督成本相同的情况下,大股东从监们从监督中得到的收益并不一样。在监督成本相同的情况下,大股东从监督中得到的好处显然多于小股东。通常在股份公司里,总是由大股东担当督中得到
37、的好处显然多于小股东。通常在股份公司里,总是由大股东担当监督任务,而小股东则搭大股东的便车。监督任务,而小股东则搭大股东的便车。o股票市场上也有类似现象。一般大户总是重视搜集信息,积极进行行情分股票市场上也有类似现象。一般大户总是重视搜集信息,积极进行行情分析。对小户而言,跟大户是常见现象。析。对小户而言,跟大户是常见现象。o进行产品研究、开发以及新产品广告宣传时,对大企业而言,其资金实力进行产品研究、开发以及新产品广告宣传时,对大企业而言,其资金实力及可望的收益会使大企业有投资的积极性,而小企业往往会得不偿失。小及可望的收益会使大企业有投资的积极性,而小企业往往会得不偿失。小企业通常采取与大
38、企业建立协作生产或移植部分技术的做法。企业通常采取与大企业建立协作生产或移植部分技术的做法。智猪争食模型在社会经济领智猪争食模型在社会经济领域也可以找到许多实例。域也可以找到许多实例。知识的灵活应用知识的灵活应用五、库诺特双寡头垄断竞争模型五、库诺特双寡头垄断竞争模型这两个企业如何决策这两个企业如何决策产量才会得到最大利产量才会得到最大利润呢?润呢?1 1、问题的提出、问题的提出2 2、问题的分析与模型建立、问题的分析与模型建立o为了求出库诺特博弈中的解及纳什均衡,首先要将其转化为标准博弈。为了求出库诺特博弈中的解及纳什均衡,首先要将其转化为标准博弈。 (1 1)参与者集合)参与者集合:=企业
39、企业1,企业,企业2(2 2)战略空间:)战略空间:S1 S2 =0, +)(3 3)收益函数)收益函数: : 注释:注释:接下来就需要把企业接下来就需要把企业1 1、企业、企业2 2的收益表示为它自己和另一企业所选战略的函数。假定企业的收益就是其利润额,的收益表示为它自己和另一企业所选战略的函数。假定企业的收益就是其利润额,这样在一般的两个参与者标准式博弈中,企业这样在一般的两个参与者标准式博弈中,企业1 1和企业和企业2 2的收益函数就可表示为的收益函数就可表示为o纳什均衡定义不等式(纳什均衡定义不等式(NENE)的条件)的条件: :n均衡(均衡(q q1 1*,*,q q2 2*)*)对
40、应的最优化问题:对应的最优化问题: 解法一:微分法解法一:微分法3 3、模型求解、模型求解 注释:注释:利用微积分求极值的办法,对每个企业的收益函数求一阶导数并令其等于零,即可求出纳什均衡。利用微积分求极值的办法,对每个企业的收益函数求一阶导数并令其等于零,即可求出纳什均衡。 . (1) 注释:注释:那么,要使产量成为纳什均衡,由式(那么,要使产量成为纳什均衡,由式(1)可知,两个企业的产量选择必须满足方程组)可知,两个企业的产量选择必须满足方程组 . (2) o由此得:由此得:解方程组(解方程组(2),得),得均衡解均衡解为为 这时,将上式代入各自的这时,将上式代入各自的收益函数收益函数。每
41、个企业的纳什均衡。每个企业的纳什均衡利润为利润为 解法二:几何法解法二:几何法注释:注释:库诺特模型还可以用几何图形的方法找出均衡解。库诺特模型还可以用几何图形的方法找出均衡解。 . (3) o这两个函数称为该博弈最优反应函数。这两个函数称为该博弈最优反应函数。 图图1-51-5解法法三:运用逐步剔除严格劣战略的方法解法法三:运用逐步剔除严格劣战略的方法o首先证明对两个企业来说,产量首先证明对两个企业来说,产量q0(ac)/2严格优于其他任何更高的产量。严格优于其他任何更高的产量。 对企业对企业1 来说,如果它选择产量来说,如果它选择产量q1q0(ac)/2,而企业,而企业2 选择产量选择产量
42、q2,当当Qq0q2a时,企业时,企业1 的收益(利润)为的收益(利润)为 如果企业如果企业1选择产量选择产量q1= q0+x (x0),企业,企业2选择产量选择产量q2,当,当Q=q0+q2a时,时,企业企业1的利润为的利润为比较上面两式结果,就能得出比较上面两式结果,就能得出 对于企业对于企业2 来说,类似可导出来说,类似可导出 n第二步:已知上步的战略空间为第二步:已知上步的战略空间为得企业一第二次删除后剩下的战略空间得企业一第二次删除后剩下的战略空间 o第三步:第三步:得企业一第三次删除后剩下的战略空间得企业一第三次删除后剩下的战略空间 n第四步:已知上步的战略空间为第四步:已知上步的
43、战略空间为.n第第2k2k步:删除后剩下的战略空间为步:删除后剩下的战略空间为 得企业一第四次删除后剩下的战略空间为得企业一第四次删除后剩下的战略空间为 n第第2k+12k+1步:删除后剩下的战略空间为步:删除后剩下的战略空间为 4 4、结果分析、结果分析o下面将双寡头垄断竞争与寡头垄断情况作一比较。设寡头垄断企业的最优下面将双寡头垄断竞争与寡头垄断情况作一比较。设寡头垄断企业的最优产量为产量为q q* *,这时最优化问题是,这时最优化问题是注释:注释:但这样安排存在一个问题,就是每家企业都有动机偏离它。因为寡头垄断产量但这样安排存在一个问题,就是每家企业都有动机偏离它。因为寡头垄断产量q q
44、较低,相应的市场价格较低,相应的市场价格p p( (q q) )就比较就比较高,在这一价格下每家企业都会倾向于提高自己的产量,而不顾这种产量的增加会降低市场价格。这又出现了在囚徒高,在这一价格下每家企业都会倾向于提高自己的产量,而不顾这种产量的增加会降低市场价格。这又出现了在囚徒困境问题中的个人理性与团体理性冲突的现象。困境问题中的个人理性与团体理性冲突的现象。六、两个博弈论研究著名学者简介六、两个博弈论研究著名学者简介1、计算机之父、博弈论创始人、计算机之父、博弈论创始人冯冯诺伊曼诺伊曼 约翰约翰冯冯诺伊曼诺伊曼( (John Von Neumann,19031957),美籍匈牙利人。,美籍
45、匈牙利人。1921192319211923年在苏黎世大学学年在苏黎世大学学习。很快又在习。很快又在19261926年以优异的成绩获得了布达佩斯大学年以优异的成绩获得了布达佩斯大学数学博士学位,此时冯数学博士学位,此时冯诺伊曼年仅诺伊曼年仅2222岁。冯岁。冯诺伊曼诺伊曼是是2020世纪最优秀的数学家之一,因世纪最优秀的数学家之一,因19461946年发明电子计算年发明电子计算机而被西方人誉为机而被西方人誉为“计算机之父计算机之父”。19571957年年2 2月月8 8日在医日在医院逝世,享年院逝世,享年5353岁。岁。 o主要科学研究贡献主要科学研究贡献注释:冯诺伊曼从小就显示出数学天才,关于
46、他的童年有不少传说。大多数的传说都讲到冯诺伊曼自童年起在吸收知识和解题方面就具有惊人的速度。六岁时他能心算做八位数乘除法,八岁时掌握微积分,十二岁就读懂领会了波莱尔的大作函数论要义。冯诺依曼的第一篇论文是和菲克特合写的,是关于车比雪夫多项式求根法的菲叶定理推广,注明的日期是1922年,那时冯诺依曼还不满18岁。(1 1)、三项最重要的数学工作:)、三项最重要的数学工作: 在19301940年间,冯诺依曼在纯粹数学方面取得的成就更为集中,创作更趋于成熟,声誉也更高涨。后来在一张为国家科学院填的问答表中,冯诺依曼选择了量子理论的数学基础、算子环理论、各态遍历定理三项作为他最重要数学工作。(2 2)
47、、一般应用数学:)、一般应用数学: 1940年,是冯诺依曼科学生涯的一个转换点。在此之前,他是一位通晓物理学的登峰造极的纯粹数学家;此后则成了一位牢固掌握纯粹数学的出神入化的应用数学家。他开始关注当时把数学应用于物理领域去的最主要工具偏微分方程。研究同时他还不断创新,把非古典数学应用到两个新领域:对策论和电子计算机。(3)(3)、博弈论、博弈论 冯诺依曼不仅曾将自己的才能用于武器等研究,而且还用于社会研究。1928年,冯诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。由他创建的对策论,无疑是他在应用数学方面取得的最为令人羡慕的杰出成就。注释:注释:19441944年,冯年,冯诺依曼和
48、诺依曼和摩根摩根斯特思合著的斯特思合著的博弈论和经济行为博弈论和经济行为是这方面的奠基性著作。将二人博弈推广到是这方面的奠基性著作。将二人博弈推广到n n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。论文包含了博弈论的纯粹人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。论文包含了博弈论的纯粹数学形式的阐述以及对于实际应用的详细说明。这篇论文以及所作的与某些经济理论的基本问题的讨论,引起了对数学形式的阐述以及对于实际应用的详细说明。这篇论文以及所作的与某些经济理论的基本问题的讨论,引起了对经济行为和某些社会学问题的各种不同研究,时至今
49、日,这已是应用广泛、羽毛日益丰盛的一门学科。有些科学家经济行为和某些社会学问题的各种不同研究,时至今日,这已是应用广泛、羽毛日益丰盛的一门学科。有些科学家热情颂扬它可能是热情颂扬它可能是“2020世纪前半期最伟大的科学贡献之一世纪前半期最伟大的科学贡献之一”。(4)(4)、计算机、计算机o对冯诺依曼声望有所贡献的最后一个课题是电子计算机和自动化理论。1944年,诺伊曼参加原子弹的研制工作,该工作涉及到极为困难的计算。在对原子核反应过程的研究中,要对一个反应的传播做出“是”或“否”的回答。解决这一问题通常需要通过几十亿次的数学运算和逻辑指令,尽管最终的数据并不要求十分精确,但所有的中间运算过程均
50、不可缺少,且要尽可能保持准确。他所在的洛斯阿拉莫斯实验室为此聘用了一百多名女计算员,利用台式计算机从早到晚计算,还是远远不能满足需要。无穷无尽的数字和逻辑指令如同沙漠一样把人的智慧和精力吸尽。被大型计算所困扰的冯诺伊曼在一次极为偶然的机会中知道了ENIAC计算机的研制计划,从此他投身到计算机研制这一宏伟的事业中,建立了一生中最大的丰功伟绩。o逸闻逸闻 n一次,在一个数学聚会上,有一个年轻人兴冲冲的找到他,向他求教一个问一次,在一个数学聚会上,有一个年轻人兴冲冲的找到他,向他求教一个问题,他看了看就报出了正确答案。年轻人高兴地请求他告诉自己简便方法,并题,他看了看就报出了正确答案。年轻人高兴地请
51、求他告诉自己简便方法,并抱怨其他数学家用无穷级数求解的烦琐。冯抱怨其他数学家用无穷级数求解的烦琐。冯诺依曼却说道:诺依曼却说道:“你误会了,我你误会了,我正是用无穷级数求出的。正是用无穷级数求出的。”可见他拥有过人的心算能力。可见他拥有过人的心算能力。n据说有一天,冯据说有一天,冯诺依曼心神不定地被同事拉上了牌桌。一边打牌,一边还诺依曼心神不定地被同事拉上了牌桌。一边打牌,一边还在想他的课题,狼狈不堪地在想他的课题,狼狈不堪地“输掉输掉”了了1010元钱。这位同事也是数学家,突然心元钱。这位同事也是数学家,突然心生一计,想要捉弄一下他的朋友,于是用赢得的生一计,想要捉弄一下他的朋友,于是用赢得
52、的5 5元钱,购买了一本冯元钱,购买了一本冯诺依诺依曼撰写的曼撰写的博弈论和经济行为博弈论和经济行为,并把剩下的,并把剩下的5 5元贴在书的封面,以表明他元贴在书的封面,以表明他 “ “战胜战胜”了了“赌博经济理论家赌博经济理论家”,着实使冯,着实使冯诺依曼诺依曼“好没面子好没面子”。2、孤独的天才、孤独的天才约翰约翰.福布斯福布斯.纳什纳什n纳什纳什: :生于生于19281928年年6 6月月1313日。父亲是电子工程师与教师,日。父亲是电子工程师与教师,第一次世界大战第一次世界大战的老兵,当时在法国担任负责后勤工的老兵,当时在法国担任负责后勤工作的中尉。作的中尉。纳什纳什小时孤独内向,虽然
53、父母对他照顾有小时孤独内向,虽然父母对他照顾有加,但老师认为他不合群不善社交。加,但老师认为他不合群不善社交。美国美国数学家数学家,前,前麻省理工学院麻省理工学院助教,主要研究助教,主要研究博弈论博弈论、微分几何学微分几何学和和偏微分方程偏微分方程。他的理论被运用在市场经济、计算、演。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论。晚年化生物学、人工智能、会计、政策和军事理论。晚年为普林斯顿大学的资深研究数学家。为普林斯顿大学的资深研究数学家。19941994年,他和其年,他和其他两位博弈论学家约翰他两位博弈论学家约翰CC海萨尼和海萨尼和莱因哈德莱因哈德泽尔泽尔腾腾
54、共同获得了共同获得了诺贝尔经济学奖诺贝尔经济学奖。19501950年,纳什获得美年,纳什获得美国国普林斯顿大学普林斯顿大学的博士学位,他在那篇仅仅的博士学位,他在那篇仅仅2727页的博页的博士论文中提出了一个重要概念,也就是后来被称为士论文中提出了一个重要概念,也就是后来被称为“纳什均衡纳什均衡”的博弈理论。的博弈理论。n博弈论研究博弈论研究n纳什在上大学时就开始从事纯数学的博弈论研究,纳什在上大学时就开始从事纯数学的博弈论研究,19481948年进入普林斯顿大学后更是如鱼得水。他在年进入普林斯顿大学后更是如鱼得水。他在普林斯普林斯顿大学顿大学读博士时刚刚二十出头,但他的一篇关于读博士时刚刚二
55、十出头,但他的一篇关于非合作非合作博弈博弈的博士论文和其他相关文章,确立了他的博士论文和其他相关文章,确立了他博弈论博弈论大师大师的地位。在的地位。在2020世纪世纪5050年代末,他已是闻名世界的科学家年代末,他已是闻名世界的科学家了。特别是在经济博弈论领域,他做出了划时代的贡献,了。特别是在经济博弈论领域,他做出了划时代的贡献,是继是继冯冯诺依曼诺依曼之后最伟大的博弈论大师之一。他提出之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这的作用。后续的研究者对博弈论的
56、贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。科学等领域奠定了坚实的理论基础。 一个博弈收益图一个博弈收益图中心点是该博弈的纳什均衡中心点是该博弈的纳什均衡n获奖获奖 纳什获诺贝尔经济学奖纳什获诺贝尔经济学奖 n19581958年的年的FieldsFields奖,一个由于他的一些结果没有来得及奖,一个由于他的一些结果没有来得及发表而未能如愿的奖。发表而未能如愿的奖。n19941994年获得年获得诺贝尔
57、经济学奖诺贝尔经济学奖 注释:注释:正当他的事业如日中天的时候,正当他的事业如日中天的时候,3030岁的纳什得了严重的岁的纳什得了严重的精神分裂症精神分裂症。他的。他的妻子妻子艾利艾利西亚西亚麻省理工学院麻省理工学院物理系毕业生,表现出钢铁一般的意志:她挺过了物理系毕业生,表现出钢铁一般的意志:她挺过了丈夫被禁闭治疗、孤立无援的日子,走过了唯一儿子同样罹患精神分裂症的震惊丈夫被禁闭治疗、孤立无援的日子,走过了唯一儿子同样罹患精神分裂症的震惊与哀伤与哀伤漫长的半个世纪之后,她的耐心和毅力终于创下了了不起的奇迹:和漫长的半个世纪之后,她的耐心和毅力终于创下了了不起的奇迹:和她的儿子一样,纳什教授渐
58、渐康复,并在她的儿子一样,纳什教授渐渐康复,并在19941994年获得诺贝尔奖经济学奖。年获得诺贝尔奖经济学奖。 注释:注释:在研究领域里,在研究领域里,NashNash在代数簇理论,在代数簇理论,黎曼黎曼(RiemannianRiemannian)几何,抛物和)几何,抛物和椭圆椭圆型型方程上取得了一些突破。方程上取得了一些突破。19581958年他几乎因为在抛物和椭圆型方程里的工作获得年他几乎因为在抛物和椭圆型方程里的工作获得FieldsFields奖,但由于他的一些结果没有来得及发表而未能如愿。奖,但由于他的一些结果没有来得及发表而未能如愿。n传记电影传记电影n影片影片美丽心灵美丽心灵一举
59、获得一举获得8 8项项奥斯卡奥斯卡提名。提名。这部影片以这部影片以19941994年度诺贝尔经济学奖得主之一年度诺贝尔经济学奖得主之一小约翰小约翰纳什与他的(前)妻子艾莉西亚以及纳什与他的(前)妻子艾莉西亚以及普林斯顿的朋友、同事的真实感人的故事为题普林斯顿的朋友、同事的真实感人的故事为题材,艺术地重现了这个爱心呵护天才的传奇故材,艺术地重现了这个爱心呵护天才的传奇故事。事。注释:注释:20052005年年6 6月,约翰月,约翰纳什参加了诺贝尔北京论坛,并提纳什参加了诺贝尔北京论坛,并提出了中国必须平衡自己的增长和世界的增长。出了中国必须平衡自己的增长和世界的增长。20082008年约翰年约翰
60、纳纳什,什,1313日晚上在日晚上在青岛青岛接过了接过了青岛大学青岛大学校长校长徐建培徐建培授予他的青岛授予他的青岛大学大学名誉教授名誉教授的证书,以及刻有纳什英文名字的水晶印章。的证书,以及刻有纳什英文名字的水晶印章。o公共地的悲剧问题:公共地的悲剧问题:有一个关于牧民与草地的故事,说的是当村庄的草地向村民完全开放有一个关于牧民与草地的故事,说的是当村庄的草地向村民完全开放时,每一个村民都想多养一头牛,因为多养一头牛增加的收益大于其购养时,每一个村民都想多养一头牛,因为多养一头牛增加的收益大于其购养成本,是有利润的。尽管因为平均草量下降,增加一头牛可能使整个草地成本,是有利润的。尽管因为平均
61、草量下降,增加一头牛可能使整个草地的牛的单位收益下降。试问村民应该如何养羊才能使收益最大呢?的牛的单位收益下降。试问村民应该如何养羊才能使收益最大呢?练习题练习题o最后要价仲裁最后要价仲裁问题问题 假定参与争议的双方一方为企业,一方为工会,争议由工资而起。令企假定参与争议的双方一方为企业,一方为工会,争议由工资而起。令企业为参与者业为参与者1 1,工会为参与者,工会为参与者2 2,它们同时选择自己的战略,即开出自己希望,它们同时选择自己的战略,即开出自己希望的工资水平,仲裁人对工人的工资有一个理想值,仲裁人选择双方开出的工的工资水平,仲裁人对工人的工资有一个理想值,仲裁人选择双方开出的工资距理想值最近的作为仲裁结果。企业和工会应分别开出多少工资呢?资距理想值最近的作为仲裁结果。企业和工会应分别开出多少工资呢?