《北京工业大学选修《博弈论及其在管理中的应用》概念与模型(21个》由会员分享,可在线阅读,更多相关《北京工业大学选修《博弈论及其在管理中的应用》概念与模型(21个(18页珍藏版)》请在金锄头文库上搜索。
1、本科生博弈论及其在管理中的应用概念与模型答案1.叙述由两个人且策略集合为两个元素组成博弈的纳什均衡的定义。(20分)纳什均衡定义:用表示一个2人博弈,其中表示第博弈方的战略集合,表示第博弈方的得益函数,。(5分)如果由各个博弈方的各一个战略组成的某个战略组合中,任一博弈方的策略 ,都是对其余博弈方策略组合,的最佳对策,(10分)也即 对任意都成立, 且对任意都成立。则称 为博弈 的一个“纳什均衡”。(20分)2.两人博弈: 甲乙两人博弈,甲有U和D两种策略,乙有L和R两种策略,(1) 若甲采取U策略,乙采取L策略,则甲乙得益分别为a和b,记为:(a,b);(2) 若甲采取U策略,乙采取R策略,
2、则甲乙得益分别为c和d,记为:(c,d);(3) 若甲采取D策略,乙采取L策略,则甲乙得益分别为e和f,记为:(e,f);(4) 若甲采取D策略,乙采取R策略,则甲乙得益分别为g和h,记为:(g,h)。问:(i) (U,L)和(D,R)为纯策略纳什均衡的条件是什么?(ii) 在(i)的条件下求该问题的混合策略纳什均衡。(20分)解:两人博弈的得益矩阵如表1所示。表1 两人博弈的得益矩阵乙 LR甲 U(a, b)(c, d)D(e, f)(g, h)根据纯战略纳什均衡的定义可知,(i) (U,L)和(D,R)为纯策略纳什均衡的条件是, , 和; (1) (5分)(ii) 记甲以概率选择U,以概率
3、 选D,乙以概率选择L,以概率 选R, 其中,。记和分别表示甲和乙的期望收益,则 (10分)记为纳什均衡,则根据纳什均衡定义,得 (18分)混合策略纳什均衡是:甲以概率选择U,以概率 选D,乙以概率选择L,以概率 选R。 (20分)3.智猪博弈(Boxed Pigs Game)(20分)假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有10个单位的猪食进入猪食槽,供两头猪食用。两头猪面临两个策略的选择:自己去按按钮或等待另一头猪去按按钮。如果某一头猪做出自己去按按钮的选择,它必须付出如下代价:第一,它需要消耗相当于2个单位的成
4、本;第二,由于猪食槽远离按钮,它将比另一头猪后到猪食槽,从而减少吃食的数量。假定:若大猪先到(小猪按按钮),大猪将吃到9个单位的猪食,小猪只能吃到个单位的猪食;若小猪先到(大猪场按按钮),大猪将吃到6个单位的猪食,小猪吃到个单位的猪食;若两头猪同时按按钮,大猪吃到7个单位的猪食,小猪吃到个单位的猪食;若两头猪同时到(两头猪都选择等待),则两头猪都吃不到猪食。如表4-6所示,对应不同战略组合的支付水平,如两头猪同时按按钮,同时到达猪食槽,大猪吃到7个单位的猪食,小猪吃到个单位的猪食,扣除2个单位的成本,支付水平分别为5和1。其他情形可以类推。问题:两头猪如何选择各自的最优战略? 该模型的得益矩阵
5、如下表4-6所示。无论大猪选择按按钮或等待,小猪选择按按钮都比等待差,这样的战略称为小猪的一个“严格劣战略”,我们首先加以剔除。在剔除小猪按按钮这一选择后的新博弈中,小猪只有等待一个选择,而大猪则有两个可供选择的战略。表2 智猪博弈得益矩阵小猪 按按钮等待大猪 按按钮(5, 1)(4, 4)等待(9, -1)(0, 0)解:在大猪这两个可供选择的战略中,选择等待对大猪是一个严格劣战略,我们再剔除新博弈中大猪的严格劣策略(等待)。剩下的新博弈中只有小猪等待、大猪按按钮这一个可供选择的战略,即(按按钮,等待)是智猪博弈的最优均衡解,称为“重复剔除的占优战略均衡”。根据纳什均衡定义,它也是纳什均衡。
6、(20分)表3 猜硬币博弈得益矩阵猜硬币方4.猜硬币博弈盖硬币方正面 反面 -1, 1 1, -1 1, -1 -1, 1正面反面设博弈方1出正面和反面的概率分别为x 和1-x,博弈方2猜正面和反面的概率分别为y 和1-y,那么博弈方1出正面和反面的概率x和1-x,一定要使博弈方2猜正面的期望得益和猜反面的期望得益相等,即解得 , (18分)博弈方1的混合策略:以概率 分别出正面和反面。博弈方2的混合策略:以概率 分别猜正面和反面。(20分)5.两人定和博弈(Constant-Sum Game)表C D4:两人定和博弈AB 3,23,2 1,4 2,3 2,3 4,1假设 2 号选择C 的可能
7、性为p,选择D 的可能性为1-p,并且1 号选择A 的可能性为q,选择B 的可能性为1-q。如果在给定2 号的概率p 和1-p 之后, A 和B 两个选项所代表的抽彩对于1 号选手来说并非等优,那么1 号就应该确定地选择A 和B 中的一个选项。也就是说,当且仅当选A 的预期价值与选B 的预期值相等时(这些预期值由2 号选定的策略决定),1 号才会在A 和B 之间保持q 和1-q 的概率。对于图2 所示的博弈,2 号选手的方程是4p + 1(1-p)= p + 3(1-p),所以p =1/4。我们的1 号选手也是一样-他只有在2 号在选C 和选D 之间没有偏向时才会愿意给A 和B 一定的权重,所
8、以 q + 4(1-q)= 3q + 2(1-q),即q = 1/2。(20分)6.存在优势策略的两人零和博弈(Zero-Sum Game)2 表5:存在优势策略的两人零和博弈1CD1A(4, 1)(3, 2)B(2, 3) (1, 4)(A, D)是纳什均衡。(20分)7. 存在纳什均衡(Nash Equilibrium)的定和博弈表6:存在纳什均衡的定和博弈DEFA(8, 1)(3, 6)(1, 8)B(7, 2) (5, 4) (6, 3)C(2, 7)(4, 5)(9, 0)解:如果乙 选D,那么甲 最好选A;如果乙选择E,那么甲最好选B;如果乙选择F, 那么甲最好选C。如果甲选A,那
9、么乙最好选F;如果甲选择B,那么乙最好选E;如果甲选择C, 那么乙最好选D。一旦两人进入(B, E)这个状态,他们谁都不想单方面地选择其他行动。(B, E)是该博弈唯一的纳什均衡。(20分)8.鹰-鸽(Hawk-Dove)博弈(20分)(1) 参与人:争食的两只动物-动物1和动物2。 动物1和动物2的行动空间都是一样的,即:Ai=鹰,鸽, i=1,2 支付矩阵如下: 表7:存在纳什均衡(Nash Equilibrium)的定和博弈鹰鸽鹰(0, 0)(4, 1)鸽(1, 4) (3, 3) (2) 此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略纳什均衡和一个混合策略纳什
10、均衡。 解:两个纯策略纳什均衡是:(鹰,鸽)和(鸽,鹰)。混合策略纳什均衡是:动物1和动物2分别以50%的概率随机地选择鹰(象鹰一样行动)或者鸽(象鸽一样行动)。 纯策略纳什均衡可以用划线法或箭头法求解。混合策略纳什均衡则可根据无差异原则求解概率分布,即: 首先,动物1应该以q的概率选择鹰,以1-q的概率选择鸽,使得动物2在鹰或者鸽之间无差异,那么由4(1-q) = q +3(1-q) 得q*=50%; 其次,动物2应该以a的概率选择鹰,以1-a的概率选择鸽,使得动物1在鹰或者鸽之间无差异,那么由4(1-a) = a+ 3(1-a) 得a*=50%。 (3) 此博弈实际就是一个斗鸡博弈,在现实
11、生活许多现象都与此类似,如市场进入、前苏联与美国在世界各地争抢地盘等。 (20分)9.狩猎博弈(20分) 参与人是两个猎人,他们的行动是同时选择猎鹿或者猎兔。规则是:若两人同时猎鹿,则鹿被猎到且两人平均分配鹿的价值(10元);若两人同时猎兔,则每人各获得价值1元的兔;若一人猎兔而另一人猎鹿则兔被抓到但鹿跑掉。该博弈的得益矩阵见表8所示: 表8:狩猎博弈鹿兔鹿(5, 5)(0, 1)兔(1, 0) (1, 1)解:此博弈同样是一个完全信息静态博弈,参与人是两个猎人,他们的行动是选择猎鹿或者猎兔。该博弈纯策略纳什均衡为(鹿,鹿)和(兔,兔)。(5分)下面求混合策略纳什均衡,假设猎人1以概率选择猎鹿
12、,以概率选择猎兔,猎人2以概率选择猎鹿,以概率选择猎兔,则猎人1的得益为 (1)猎人2的得益为 (2) (12分)根据(1)和(2),可得 (16分)解得最优解 (18分)混合策略纳什均衡是:两个猎人均以概率选择猎鹿,以概率选择猎兔。(20分)10.库诺特寡头竞争模型 (20分) 某一市场上有n家企业,他们生产同一类产品用来满足该市场上顾客的需求;n家企业生产相同质量的产品;用代表企业i的生产批量,表示市场上总产品数,代表逆需求函数(P是市场出清价格,即n家企业生产的产品能全部销售),两企业的生产都无固定成本,企业i的成本函数记为,;n家企业同时决策各自产品的生产批量;n家企业对彼此的生产成本
13、相互了解(完全信息)。假设,,其中为常数。问题:(i)这n家企业如何决定各自产品的生产批量?(ii)假设,证明企业i的最优生产批量和最优利润是市场上企业数n的单调递减函数。解:(i)企业i的最优生产批量为, (1)(ii)企业i的最优利润为, (2)(ii)n家企业各自决策的最优生产批量之和 (3)(iv)企业i的最优利润是其边际成本的单调递减函数,是竞争对手边际成本的单调递增函数。 (v)假设,则企业i的最优生产批量是市场上企业数n的单调递减函数,企业i的最优利润是市场上企业数n的单调递减函数。(20分)11.产量决策模型(20分)某一市场上有3家企业,他们生产同一类产品用来满足该市场上顾客
14、的需求;3家企业生产相同质量的产品;用代表企业i的生产批量,表示市场上总产品数,代表逆需求函数(P是市场出清价格,即3家企业生产的产品能全部销售)。假设3家企业的生产都无固定成本,企业i的成本函数, ,;3家企业同时决策各自产品的生产批量;3家企业对彼此的生产成本相互了解(完全信息)。问题:(i)这3家企业如何决定各自产品的生产批量?他们获得的利润分别是多少?(ii) 如果这3家企业合并成一家企业,则合并后企业如何决定产品的生产批量?合并后企业获得的利润是多少?(iii)试对这3家企业合并前后两种情形下的生产批量和利润进行比较,比较结果给人们什么样的启示?解:(i)企业i的利润函数为:, (4)(2)两边对分别求一阶和二阶偏导数,得 (5)