扩展型博弈和策略型博弈

上传人:mg****85 文档编号:49584803 上传时间:2018-07-31 格式:PPT 页数:13 大小:125KB
返回 下载 相关 举报
扩展型博弈和策略型博弈_第1页
第1页 / 共13页
扩展型博弈和策略型博弈_第2页
第2页 / 共13页
扩展型博弈和策略型博弈_第3页
第3页 / 共13页
扩展型博弈和策略型博弈_第4页
第4页 / 共13页
扩展型博弈和策略型博弈_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《扩展型博弈和策略型博弈》由会员分享,可在线阅读,更多相关《扩展型博弈和策略型博弈(13页珍藏版)》请在金锄头文库上搜索。

1、扩展型博弈和策略型博弈扩展性博弈和策略型博弈 一个简单例子 厂商1和2同时各自考虑是否引 进产品A和B(替代产品)。对这类产品的市 场需求情况如下:每阶段总需求量为20000或 6000, 概率各为0.4和0.6,如果两厂商同时生产 ,每个占一半市场销售额;完全垄断时价格为 12,双头垄断时价格为10,价格上调时需求弹 性极大,价格下调时需求弹性极小。厂商1的 固定成本是40000, 边际成本是5;厂商2的固定成 本是60000, 边际成本是3。扩展性博弈和策略型博弈 一个简单例子 厂商1和2同时各自考虑是否引 进产品A和B(替代产品)。对这类产品的市 场需求情况如下:每阶段总需求量为2000

2、0或 6000, 概率各为0.4和0.6,如果两厂商同时生产 ,每个占一半市场销售额;完全垄断时价格为 12,双头垄断时价格为10,价格上调时需求弹 性极大,价格下调时需求弹性极小。厂商1的 固定成本是40000, 边际成本是5;厂商2的固定成 本是60000, 边际成本是3。图I.4: 博弈树 (讲义)基本定义一个扩展型博弈包含一个局中人集I,一个节点集T,一 个有向线段集E,和一个赢得向量集V。每个有向线段的两个端点都是节点,依方向顺序一个叫 始点,一个叫终点。 如果从节点t始,经过一个接一个的有向线段可以连接到 节点t,就称t为t的后继点 (或t是t的先行点)。 每个节点或是一个或多个有

3、向线段的始点,并且/或者是 一个有向线段的终点。 不作为任何有向线段终点的节点叫做博弈始点,不作为 任何有向线段始点的节点叫做博弈终点。基本定义 将博弈始点通过一个接一个的有向线段连接到某个 博弈终点,就得到一条博弈路径。每个博弈终点附 上一个赢得向量,第i个分量表示局中人i的赢得。 节点集T可以划分为两两不相交的若干个子集:其中 每个局中人有一个,叫做他的决策节点集;自然界 有一个(如果信息不完全),叫做机会节点集;还 有一个子集包含所有的博弈 终点。 每个局中人的决策节点集可以进一步划分为若干个 两两不相交的信息集,每个信息集的节点用气球括 起来或者用虚线连在一起,表示该局中人决策时不 知

4、道自己在那个节点上。基本定义 从某局中人一个信息集的节点引出的每个有向线 段表示他的“一着”,选定一着表示他在同一个信 息集的所有节点选定同一个行动。 一个局中人在每一个信息集都选定一着,就选定 他的一个纯策略;即一个纯策略是一个完整的行 动计划。局中人i的纯策略集用Si表示。 每个局中人都选定一个纯策略,就构成一个策略 横断面s (strategy profile);这时可以算出博弈的一 个赢得向量或者一个期望赢得向量。全体纯策略 横断面的集合记为S。基本定义 不管博弈的动态过程,仅着眼于局中人,各人 的纯策略和赢得,就得到博弈的策略型I,S,V 。 一个策略横断面s*=(s*1,s*n)叫

5、做Nash均衡, 如果对每个局中人i, 他选定的策略s*i都是对所 有其它局中人选定的策略s*-i的最优回应: i(s*)i(s*|si), siSi, iI。 一个博弈不一定有纯策略Nash均衡;如果有, 则不一定唯一。二人策略型博弈Nash均衡的计算 可以按照定义找出所有的纯策略Nash均衡; 如果策略型博弈比较复杂,可以用策略间的“优 ”, “劣”关系化简,然后再寻找均衡。称i的一个 策略si劣于si (或si优于si),如果不管其他人选定 什么策略,si都比si使i得到更小的赢得。如果存 在一个si,它优于i的任何其他策略,就称si为i 的最优策略。显然,劣策略不可能构成Nash均 衡

6、。所以,寻找Nash均衡时可以把劣策略划掉 以简化策略型博弈。混合策略Nash均衡 当一个博弈没有纯策略Nash均衡时,人们考虑计 算所谓混合策略Nash均衡。 局中人的一个混合策略是指他按照某个概率分布 随机地选用各个纯策略;如果他有K个纯策略,那 么他的一个混合策略可以表示为i=(pi1,piK),其 中pik是他选用第k个纯策略的概率。 当局中人使用混合策略时,各人的期望赢得等于 他在每一个纯策略横断面上的赢得与该策略横断 面出现的概率的乘积之总和。为简便计,i的期望 赢得函数仍然用i表示。 混合策略Nash均衡 局中人i的全体混合策略的集合记为i;注意一个 纯策略也可以看作一个特殊的混

7、合策略。 如果每个局中人都选用一个混合策略,就得到一 个混合策略横断面。全体混合策略横断面的集合 记为。 一个混合策略横断面*=(*1, *n)叫做混合策略 Nash均衡,如果如果对每个局中人i, 他选定的混 合策略*i都是对所有其它局中人选定的混合策略 *-i的最优回应:i(*)i(*|i), *ii, iI。混合策略Nash均衡 Nash定理:任何有限的策略型博弈(局中人数 目有限,每人的纯策略数目有限)至少存在一 个混合策略Nash均衡(可能是纯策略Nash均衡 )。 一个博弈叫做有完整记忆的,如果每个局中人 不会忘记他知道的信息和他曾经选用的着。因 为有完整记忆的有限扩展型博弈都能化为有限 策略型博弈,所以Nash定理的结果也适用于有 完整记忆的有限扩展型博弈。混合策略Nash均衡 无区别原则:如果*=(*i,*-i)是个混合策略Nash 均衡并且i(*i,*-i) =M,那么对*i中局中人i以正 概率选用的每一个纯策略si都有i(si,*-i) =M。换句 话说, *-i使得局中人i对于他实际采用的每个纯策 略无区别。 根据无区别原则,通常可以求解一个利用优劣关 系简化后得到的KK双矩阵博弈。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号