博弈论基础复习

上传人:hs****ma 文档编号:512786466 上传时间:2023-04-21 格式:DOCX 页数:12 大小:21.76KB
返回 下载 相关 举报
博弈论基础复习_第1页
第1页 / 共12页
博弈论基础复习_第2页
第2页 / 共12页
博弈论基础复习_第3页
第3页 / 共12页
博弈论基础复习_第4页
第4页 / 共12页
博弈论基础复习_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《博弈论基础复习》由会员分享,可在线阅读,更多相关《博弈论基础复习(12页珍藏版)》请在金锄头文库上搜索。

1、博弈论基础复习大纲一、辨析题(2X5 = 10分)二、简答题(5X7 = 35分)1. 描述双人策略型(标准型)博弈的基本结构及其纳什均衡。你是如何理解纳什 均衡的?(1) 标准式博弈记为:G=S1, S2,,Sn; ul, u2,,un。其基本要素包括:局中人、策略(策略组合)、支付(支付函数)(2) 局中人:博弈的参与人i博弈的参与人集合I: El = 1, 2,n(3) 纯策略:指局中人在博弈中可以选择米用的彳丁动方案。每个局中人都有可 供其选择的多种策略,参与人i的纯策略siesi 参与人i的策略集(纯策略空间)为Si, i ei 策略组合:s= (s1, s2,,si,,sn) 策略

2、组合空间:S=XiSi(4) 支付(效用):每个局中人从各种策略组合中获得的收益,由于它是参与人 策略组合的函数,又称为支付函数每个参与人的支付函数记为ui(s)=ui(s1, s2,sn), siesi(5) Nash 均衡在博弈G= RPS(2) 2RT+S 或 2R2P囚徒困境反映个人最佳选择并非团体最佳选择,说明个人利益与社会 利益的冲突。3. 描述双人策略型博弈的纯策略和混合策略。(1)纯策略:指局中人在博弈中可以选择米用的彳丁动方案。每个局中人都有可 供其选择的多种策略,参与人i的纯策略siSi参与人i的策略集(纯策略空间)为Si, i ei策略组合:s= (s1, s2,,si,

3、,sn)策略组合空间:S=XiSi(2)混合策略混合策略:若参与人i有K个纯策略:Si= sil,,siK,则概率分布i=(i1,,iK)称为i的一个混合策略,这里ik= (sik)是i选择sik的概率,对于所有的 k=1, 2,,K,OW ikWl,工 k ik=1。纯策略为混合策略的一个特例。混合策略空间:参与人i的所有混合策略的集合,记为i混合策略组合空间:=Xi i4. 简要分析扩展型博弈(博弈树)的构成要素。博弈树的基本元素有:(1) 节点:xex,又称决策结,简称“结”(2) 枝:连结结点的连线(3) 信息集:一些节点的集合。在同一信息集中,局中人面临完全相同的决策 形势。(4)

4、结:包括: 初始结:博弈的起点。 决策结:参与人采取行动的时点。 终点结:博弈行动路径的终点。5. 什么是子博弈和子博弈精炼(完美)纳什均衡?什么是完美信息博弈?简析完 美信息博弈中逆向归纳法的求解思路。(1) 子博弈:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后 续结T(x)(包括终点结)组成,它满足: x是一个单结信息集,即h(x)=x; 对于所有的xeT(x),如果xeh(x),则xWT(x)。条件是指子博弈必须从一个单结信息集开始;条件说明子博弈的信息集和支付向量直接承自原博弈。这意味着子博弈不能切 割原博弈的信息集。同时,任何博弈是它自身的子博弈。(2) 子博弈精炼Nas

5、h均衡子博弈精炼(完美)纳什均衡:扩展式博弈的策略组合s*=(s1*, s2*,,sn*)是 一个子博弈精炼纳什均衡,如果:它是原博弈的纳什均衡;它在每一个子博 弈上给出纳什均衡。(3)完美信息博弈:一个博弈的所有信息集都是单结的。(4)完美信息博弈中逆向归纳法的求解思路:(画图解释好)假设只有两个阶段(参与人2在观察到参与人1的行动后再行动),当博弈进入第二阶段时,给定参与人1的选择a1WA1,则参与人2的决策是使:u2(a1, a2)我们用a2*=R2(a1)代表上述最优化问题的解(参与人2的反应函数)。由于参与人1知道参与人2在第二阶段的决策规则,参与人1在第一阶段的决策是:u1(a1,

6、 R2(a1)设其解为a1*,则该博弈的子博弈精炼纳什均衡是(a1*, R2(a1),均衡结果为(a1*, R2(a1*)。6. 理解完全信息动态博弈下的纯策略和行动。行动与策略(1)行动:是参与人在博弈的某个时点(某个信息集)的决策变量。行动组合:参与人的行动的有序集。(2)策略:是参与人在给定信息集情况下的行动规则,它规定参与人在什么时 候选择什么行动。在静态博弈中,策略和行动是等价的。在动态博弈中,策略在给定信息集下完整的行动方案,与行动是不同的。7. 什么是冷酷(触发)策略?谈谈你对重复博弈中冷酷策略的理解。(1)触发策略:如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取

7、不 合作策略。8. 描述双人不完全信息静态博弈的结构,并给出相应的静态贝叶斯均衡。博弈论中对不完全信息是通过类型来处理的,对此,你是如何理解的?(1) n人静态贝叶斯博弈的策略式表述G= A1,,An; pl,,pn; u1, un包括:(补充符号)P23 参与人的类型空间:1,n 条件概率:pl,pn 类型依存支付函数:ui(a1,an; i) 参与人i知道自己的类型i i,条件概率pi描述给定自己属于i的情况下,参与人i有关其他参与人类型-i-i的不确定性,ai( i) Ai(i)表示参与人i的类型为i时所选择的行动(即参与人的行动是类型依存的)。贝叶斯纳什均衡:n人不完全信息静态博弈G=

8、 A1,An; p1, pn; u1, un的纯策略贝叶斯纳什均衡是一个类型依存策略组合a*= (ai*( i), i=1,2,n。其中,ai*( i)满足:(自己补充)(2) 一般地,将一个参与人所拥有的所有私人信息称为他的类型。 由于大多数博弈中,参与人的特征由支付函数完全确定,因而一般将参 与人的支付函数等同于他的类型。 通常假定,参与人i只知道自己的类型,并且知道其他局中人的类型分 别为若干种可能类型中的一种,但不知道具体是哪一种,但他知道其他参与人类 型的概率分布。 通过引入“自然”这一虚拟局中人,将不完全信息博弈转换为不完美信 息博弈。 所有局中人的实际类型均来自于由“自然”根据类

9、型上的联合概率分布进彳丁的一种初始抽彩,局中人根据这种抽彩决定自己对其他局中人类型的王观判 断,由此进行实际博弈。9. 什么是后续博弈?简要分析完美贝叶斯均衡与后续博弈的关系。(1)后续博弈:将每个信息集开始的博弈的剩余部分称为后续博弈。(2)由于后续博弈之前的行动历史使得局中人可以修正自己对其他局中人类 型分布的先验信念,所以在进行后续博弈时,局中人是根据修正后的后验信念(依 贝叶斯法则修正)进行策略选择的。 完美(精炼)贝叶斯均衡要求在所有的后续博弈上也达到贝叶斯均衡。10. 什么是信号传递博弈?针对信号发送者有两种类型,简要分析信号博弈的结 构,并给出相应的分离均衡和混同均衡。(1)信号

10、发送者具有私人信息(类型e,由自然确定),先验概率分布p (e) 是公共信息。信号发送者在观察到其类型e后,在行动集合A1上选择行动al(发 送信号,即信号发送者选择类型依存的行动。信号接收者在观察到参与人1发出的信号al后,使用贝叶斯法则修正对参与人 1类型的判断,得到后验概率,然后选择行动,最大化其期望支付。P29(2)结构:(画图:p33)(3)11. 教育信号模型是怎样的?斯宾塞教育博弈模型说明了什么问题?12. 比较合作博弈和非合作博弈。(1) 合约强制力不同在合作博弈中,协议有外在力量保证强制执行;在非合作博弈中,协议没有 外在力量保证强制执行。如囚徒困境博弈(2) 研究重点不同:

11、非合作博弈的重点是个体,合作博弈研究的重点是群体,讨论何种联盟会形 成,联盟中的成员如何分配。(3) 用非合作博弈的框架来研究合作博弈:将达成合作的谈判过程和执行合作协议的强制过程纳入扩展式博弈中研究13. 理解联盟、特征函数、分配、简单博弈、核和核仁等概念及相关定理。(1) 联盟:局中人集合=1,2,3,I的任意一个非空子集S。P11合作博弈的一个分配:指对I个局中人来说,存在一个向量x=(x1,x2,xl),满 足: Exi=V() xi鼻V(i)条件说明各人分配的收益总和正好是所有局中人的最大总和收益; 条件说明从联盟中各人得到的收益不小于单独经营所得的收益。(2) 联盟型博弈:又称特征

12、函数型博弈,它对每一种可能联盟给出相应的联盟 总和收益,称为特征函数V( )o特征函数的超加性:对任意两个独立联盟S和T (S n T=),有V(S UT)鼻V(S)+V(T)。特征函数型博弈记为(,V)。14. 如何理解委托代理分析框架?举例说明在经济金融领域中有哪些委托代理问题。(1)但经济学上的委托-代理关系泛指任何一种涉及非对称信息的交易,交易中 有信息优势的一方称为代理人,另一方称为委托人。简单地说,知情者是代理人, 不知情者是委托人。这样定义背后隐含的假定是,知情者的私人信息(行动或知识)影响不知 情者的利益,或者说,不知情者不得不为知情者的行为承担风险。(2)代理人具有委托人不知

13、道的私人信息,通常可分为两类。一类是代理人可以采取委托人无法观察到的行动,即道德风险问题(隐蔽行动) 如:股东与经理;贿赂与非法回扣;基民与基金经理;保险中投保人投保后的不 作为 代理人具有委托人所没有的专业知识或私有信息,即逆向选择问题(隐蔽知 识):女如保险投保问题;柠檬市场(旧车市场) 此外,还有一类不可证实性问题:委托人和代理人知道同样的信息,但无法被 第三方证实。如:口头合同15. 什么是逆向选择?谈谈你对逆向选择的理解。举例说明它们在经济金融领域 中的应用。(1)逆向选择:是指由交易双方信息不对称和市场价格下降产生的劣质品驱逐 优质品,进而出现市场交易产品平均质量下降的现象。(2)

14、理解:逆向选择在生活中普遍存在,由于社会生活中,完全信息这个假定 并不符合实际,很难成立,于是由信息不对称引起的逆向选择到处可见。由于信 息可以看成一种生产要素,但在私有化的制度下,信息当然也被私有化。在信息 不对称的情况下,市场运行常常无效率,即我们所说的“市场失灵”导致优汰 劣胜。(3)例子:汽车保险业逆向选择随着个人购买家庭轿车的数量逐渐增多,汽车保险业务近年增长得很快。可 是由于车多路窄,新手又多,汽车交通事故比原来增加很多。这些购买了汽车保 险的人由于有了保险,开起车了跟开坦克似的,横冲直撞,反正汽车坏了有保 险公司负责修理。更有人经常酒后开车,把握不住;还有的是开车精力不集中, 甚至打瞌睡。结果就是汽车交通事故频繁发生,致使保险公司收取的保险费不够 赔付汽车修理公司的汽车修理费。两年下来,中原保险公司已经在汽车保险项目 上贝昔了几百万。16. 什么是道德风险?谈谈你对道德风险的理解

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号