博弈论重点

上传人:lil****ar 文档编号:281884802 上传时间:2022-04-25 格式:DOC 页数:5 大小:40KB
返回 下载 相关 举报
博弈论重点_第1页
第1页 / 共5页
博弈论重点_第2页
第2页 / 共5页
博弈论重点_第3页
第3页 / 共5页
博弈论重点_第4页
第4页 / 共5页
博弈论重点_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《博弈论重点》由会员分享,可在线阅读,更多相关《博弈论重点(5页珍藏版)》请在金锄头文库上搜索。

1、一、名词解释1、博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。3、关系图占优均衡 重复剔除占优均衡 纯战略纳什均衡 混合战略纳什均衡4、博弈均衡与一般均衡的区别一致性 : 均衡原则 利益最大化原则不一致性 : 信息不完全 个体理性与集体理性不完全一致5、非合作博弈理论完全信息静态博弈-纳什均衡 (纯策略纳什均衡 混合策略纳什均衡)完全信息动态博弈(序贯博弈 重复博弈)子博弈精炼纳什均衡不完全信息静态博弈-贝叶斯纳什均衡不完全信息动态博弈-精练贝叶斯纳什均衡6、非合作博弈的基本分类根据出招顺序分为:静态博弈和动态博弈。根据局中人信息的掌握情

2、况分为 (不)完全信息博弈 共同信息(不)完美信息博弈。历史信息7、静态博弈:同时决策或者同时行动的博弈属于静态博弈 田忌赛马、猜硬币、古诺模型8、动态博弈:先后或序贯决策或者行动的博弈属于动态博弈 弈棋、市场进入、领导追随型市场结构9、共同知识:各种对局情况下每个人的得益是多少 是所有局中人的共同知识10、完美信息博弈:如果在博弈进行过程中的每一时刻,面临决策或者行动的参与人,对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚,则称为完美信息博弈11、完全信息静态博弈 即各局中人同时决策,且所有局中人对各方得益都了解的博弈。完全信息静态博弈的几点特性同时出招,出招一次;知道博

3、弈结构与游戏规则(共同知识);不管是否沟通过,无法做出有约束力的 承诺(非合作)博弈分析的目的是预测均衡结果 12、非合作博弈的其他分类 根据局中人数量分单人博弈、两人博弈、多人博弈等。根据博弈中的策略分为:有限博弈、和无限博弈。根据得益分为:零和博弈、常和博弈、变和博弈。13、零和博弈:如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零,这个博弈就叫零和博弈;零和博弈是利益对抗程度最高的博弈14、非零和博弈:如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零,这个博弈就叫非零和博弈。15、常和博弈:如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数,这个

4、博弈就叫常和博弈;常和博弈也是利益对抗程度最高的博弈16、非常和博弈:如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数,这个博弈就叫非常和博弈17、有限博弈:每个博弈方的策略数都是有限的。18、无限博弈:至少有某些博弈方的策略有无限多个。19、占优战略:不管对手战略为何,该参与人可找到一最佳战略。或不管其它局中人选择什么战略,一局中人的某个战略给他带来的支付始终高于其它的战略. 囚徒的困境中的“坦白”20、占优战略均衡:在博弈G=N,(Si)iN,(Ui)iN中,如果对所有的参与人i,si*是他的占优战略,那么所有参与人选择的战略组合(s1*,sn*)成为该对策的占优战略均

5、衡。20、绝对劣势战略:不管其它局中人的战略如何变化,给一个局中人带来的收益总是比另一种战略给他带来的收益小的战略。21、重复剔除的占优均衡 首先找到某个参与人的劣战略(假定存在),把这个劣战略剔除掉,重新构造一个不包含已剔除战略的新的博弈,然后再剔除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 这个唯一剩下的战略组合就是这个博弈的均衡解,称为“重复剔除的占优均衡”22、战略组合 称为重复剔除的占优均衡,如果它是重复剔除劣战略后剩下的唯一战略组合。如果这种唯一战略组合是存在的,我们就说该博弈是重复剔除占优可解。23、纯战略 如果一个战略规定参与人在每一个

6、给定的信息情况下只选择一种特定的行动,称为纯战略 (单纯战略是混合战略的特例)24、混合战略 如果一个战略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合战略。原则:两博弈方不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性(采取随机决策);两博弈方选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风。25、最优混合战略:是指使期望效用函数最大的混合战略(给定对方的混合战略)26、NE的存在性:每个有限战略式博弈(参与人与战略数均为有限)都有纳什均衡存在,这均衡可能是混合战略均衡25、纳什均衡 是局中人战略选择上构成的

7、一种“僵局”,给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其战略选择。26、混合策略纳什均衡:包含混合战略的战略组合,构成纳什均衡27、纳什均衡的存在性 每个有限战略式博弈(参与人与战略数目均为有限)都有纳什均衡存在,这均衡有可能是混合战略均衡。28、纳什定理:在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。29、纳什均衡的多重性 纳什均衡不唯一,如性别战30、信息集: 博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集。该子集包括所有满足下列条件的决策结:(1)每一个决策结

8、都是同一参与人的决策结;(2)该参与人知道博弈进入该集合的的某个决策结,但不知道自己究竟处于哪一个决策结。30、博弈树的构成 结(决策结和终点结) 枝 信息集31、子博弈定义:在一个扩展型博弈中,如果一个博弈由它的一个决策结及其所有后续结构成,并满足:(1)起始结是一个单结的信息结;(2)子博弈保留了原博弈的所有结构,则称它为原博弈的一个子博弈(子博弈)。 注意:子博弈不能分割信息集。32、子博弈精炼纳什均衡定义: 在博弈G中,如果s*=(s1,sn)是G的一个纳什均衡,并且对所有可能的子博弈而言仍是一个纳什均衡,则称s*=(s1,sn)为一个子博弈精炼纳什均衡。 也就是说,组成精练纳什均衡的

9、战略必须在每一个子博弈中都是最优的。33、求解方法:逆推法逆向归纳法求解子博弈精炼纳什均衡的过程,实质是重复剔除劣战略过程在扩展式博弈上的扩展。从最后一个决策结开始依次剔除掉每个子博弈的劣战略,最后生存下来的战略构成精炼纳什均衡。如同重复剔除的占优均衡要求“所有参与人是理性的”是共同知识一样,用逆向归纳法求解均衡也要求“所有参与人是理性的”是共同知识。精髓是“向前展望,向后推理”。33、承诺行动-如果参与人在博弈前采取措施改变行动空间或支付函数,原来不可置信威胁就变得可置信,博弈的精炼均衡就会改变;将改变博弈结果而采取的措施称为“承诺行动”。34.完全承诺:承诺可以使某项行动完全没有可能。如破

10、釜沉舟、军事博弈35、不完全承诺,承诺只是增加了某个行动的成本而不是使该活动完全没有可能36、贴现因子:下一期的一单位支付在这一期的价值37、平均得益:如果一常数 作为重复博弈(有限次重复博弈或无限次重复博弈)各个阶段的利益,能产生与得益序列 相同的现在值,则 为 的平均值。37、个体理性得益:不管其他博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益。38、可实现得益:博弈中所有纯策略组合得益的加权平均数组。39、有限次重复博弈:如果G有唯一的纯策略纳什均衡解,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次,各博弈方在G(T

11、)中的总得益为在G中得益的T倍,平均每阶段得益等于原博弈G中的得益。40、无限次重复博弈:假设囚徒困境是一个阶段性博弈,并且是无限次重复博弈,那么任一个囚徒选择抵赖的条件是:0+d(-6)+d2(-6)+-1+d(-1)+d2(-1)+(d为贴现因子)或者-6d/(1-d)-1/(1-d),即 d1/6(即局中人具有足够的耐心),(抵赖、抵赖)(冷酷战略)是无限次囚徒博弈的一个子博弈精炼纳什均衡。41、触发策略冷酷战略: 博弈各方首先试探合作,一旦发觉对方不合作则也用不合作相报复,利用有后续阶段博弈的制约作用达成均衡的策略称为“触发策略”。42、 类型:类型是博弈方自己清楚而他人无法完全清楚的

12、私人内部信息、有关情况或数据等,包括策略空间、信息集、得益函数等43、 信号成本:为了得到某些有利于自己的信号而付出的成本,通常被称为“信号成本39、四个基本均衡概念之间的关系 子博弈精炼纳什均衡纳什均衡 精炼贝叶斯均衡 贝叶斯纳什均衡 不完全信息静态博弈中,精炼贝叶斯均衡=贝叶斯纳什均衡完全信息动态博弈中,精炼贝叶斯均衡=子博弈精炼纳什均衡完全信息静态博弈中,精炼贝叶斯均衡=纳什均衡39、不完全信息博弈也称为“贝叶斯博弈”,其中“不完全信息”指博弈中至少有一个博弈方不完全清楚其他某些博弈方的得益或者得益函数。39、不完全信息静态博弈=静态贝叶斯博弈:至少有一个参与人不知道其他参与人支付的静态

13、博弈。40完全信息动态博弈中子博弈精炼纳什均衡是对纳什均衡的一种“精炼”,剔除了纳什均衡中包含着“空洞威胁”的均衡。不完全信息动态博弈中 精炼贝叶斯纳什均衡 指剔除了贝叶斯纳什均衡中包含“空洞威胁”的均衡,是对贝叶斯纳什均衡的“精炼”。二、 简答题1、博弈论基本思想交互式影响下的理性行为的科学策略是为了获胜所需要的一种智力的技巧。它是对于如何最好地利用物体(物质)的技巧的一种算计。策略本质上涉及到与他人的相互影响。博弈论就是用来分析这样交互式的决策的。理性人假设。理性的行为指的是:明白自己的目的和偏好,同时了解自己行动的限制和约2、博弈均衡与一般均衡的区别一致性 : 均衡原则 利益最大化原则不

14、一致性 : 信息不完全 个体理性与集体理性不完全一致3、完全信息博弈与不完全信息博弈的区别按照大家是否清楚对局情况下每个局中人的得益。“各种对局情况下每个人的得益是多少” 是所有局中人的共同知识(common knowledge)。据“共同知识”的掌握分为完全信息与不完全信息博弈。4、 完美信息博弈与不完美信息博弈的区别是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻划。如果在博弈进行过程中的每一时刻,面临决策或者行动的参与人,对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚,则称为完美信息博弈;否则为不完美信息。5、 博弈论的基本要素

15、 参与人iN=1,2,n ; 战略,siSi(战略空间); 支付,ui=ui(si,s-i)。6、占优战略有三个性质:稳定性 唯一性 不普遍存在性7、占有策略那什均衡和纳什均衡的区别不管其他人选择什么策略,我的最优选择都是某一个固定的策略,也就是“以不变应万变”。那么这个固定的策略就是我的占优策略。如果每个参与人都有占优策略,那么这些占优策略的组合就是占优均衡。比如囚徒困境中,“招供”就是每个参与人的占优策略,(招供,招供)就是占优均衡。纳什均衡也是各参与人策略的组合。它的要求没有占优均衡这么强,它只要求在这个组合中,给定其他人的选择,我的这个选择是最优的,而不要求“不管其他人怎么选择,我的这个选择都是最优的”。他们俩的关系,说白了就是:占优均衡是一种特殊的纳什均衡。8、

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号