一个策略通常被定义为意图实现一个具体目标的行动计划

资源描述

《一个策略通常被定义为意图实现一个具体目标的行动计划》由会员分享，可在线阅读，更多相关《一个策略通常被定义为意图实现一个具体目标的行动计划（13页珍藏版）》请在金锄头文库上搜索。

1、 1、合作博弈和非合作博弈合作博弈：也称正和博弈，参与人中至少有一人利益增加，同时其他参与人的利益不受损，重点是研究如何分配合作得到的利益。非合作博弈：包括零和博弈和负和博弈，研究人们在利益相互影响的局势中如何选择决策是自己的受益最大化。非合作博弈又分为:完全信息静态博弈（纳什均衡），完全信息动态博弈（子博弈精炼纳什均衡），不完全信息静态博弈（贝叶斯纳什均衡）,不完全信息动态博弈（精炼贝叶斯纳什均衡）2、静态博弈和动态博弈静态博弈：指在博弈中参与人同时选择行动，或是后行动者不知道先行动者采取了什么具体行动。动态博弈：指在博弈中，参与人的行动有先后顺序，且后行动者能观察到先行动者

2、所选择的行为。3、一个策略通常被定义为意图实现一个具体目标的行动计划。参与人 i 的一个纯策略是一个确定的行动计划。参与人的所有纯策略组成的集合标示为。纯策略剖面（组合）（a profile of pure strategies） =(1,2,)描述了一个由博弈中所有个参与人所选纯策略的一个具体的组合，其中对于所有的 =1,2, 4、标准式博弈正式的定义标准式博弈包括以下三个部分：参与人的一个有限集，N=1,2，n。纯策略集合的一个合集 1,2,。支付函数的集合， v1,v2, 其中每一个支付函数都将一个支付值赋予(1,2,)到选定策略的每一个组合上，也即函数 : 121的集合

3、，其中。5、解概念是分析和预测博弈的一种方法，我们先对参与人的行为和信念进行假设，根据假设将所有可能的结果分成“更有可能”和“不那么可能” 5. 2 均衡分析均衡是对于任意一个可以作为解概念预测之一而出现的策略剖面，是可能的预测，在一个博弈中可能有数个均衡预测。均衡分析所需假设：参与人是“理性的”：参与人选择其行动以最大化其支付，从而与博弈中体现的信念相一致。参与人是“智能的”：一个智能的人了解博弈的一切：行动、结果，以及所有参与人的偏好。共同知识：每个参与人是理性和智能的事实在博弈的所有参与人间是共同知识。-自执行（ self-enforcement）：解概念的任何预测（或均衡

4、）都必然是自执行的自执行的这一条件是我们分析的核心，也是非合作博弈理论的核心。我们将假设参与人是在以下意义上从事非合作行为的：每个参与人都能控制其自身的行动，只有在他发现一个行动能带给他更大利益时才会坚持这一行动。也就是说，如果一个策略剖面是一个均衡，我们要求给定其他人的选择之后每一个参与人对自己的选择总是满意的。你可能已经看出，在囚徒困境博弈中剖面（F，F）是自执行的：每个参与人对于选 F 都很满意。事实上，我们将会看到就均衡分析而言，这是一个非常稳健的结论。如果将博弈看成是对环境的一个完备描述的话，自执行均衡的条件是很自然的。如果还有一些外部的其他团体可以通过势力或禁令的运用来执行策略

5、剖面，那么这个我们在分析的博弈可能并没有对真正的环境给出充分的描述。在这种情况下，我们应该将第三方也作为一个参与人纳入到博弈模型中来，他也是具有可以执行的行动或策略的。 6、几种符号表达支付函数：把参与人从策略剖面中得到的支付标示为=(1,1,1,+1,)；也可表述为，支付函数为。v() =(,) (,) 除参与人 i 外其他参与人所选行动的一个特定策略组合： (1,1,1, +1,)121+1其中， =121+16、2、劣势策略定义：令和是参与人的两个可能策略。我们称严格劣于，如果对于其他参与人策略的任一可能的组合，参与人从中得到的支付总是严格小于从中得到的

6、支付。也就是说，对于所有的有： (,)(,) 我们用来表示严格劣于。理性参与人绝不会采取严格劣策略。 6、3 、占优策略严格占优策略：是的严格优势策略，如果的每一其他策略都严格劣于它，也即对于所有的和，有： ()(,)(,)在理性假设下，若博弈中存在严格占优策略，则参与人一定会选择该策略。严格占优策略均衡:策略剖面是严格优势（占优）策略均衡，如果对于所有的都是严格优势策略。7、1、重复剔除所需假设：理性假设和理性的共同知识假设。理性假设可以保证参与人不选择严格劣策略；而理性的共同知识可以使所有参与人忽略那些他们的对手不会采取的严格劣策略。这样参与人就能将博弈

7、限定在更小的策略组合上。而严格占优策略只需理性假设。7、2、严格纯劣策略的重复剔除（IESDS）：在以上两个假设条件下，我们会问“一个理性的人不会做什么” ，通过不断的剔除参与人的严格劣策略，最中得到博弈的解。8、1 、最优反应最优反应：策略是参与人针对其对手的策略的最优反应，如果 (,)(,) 一个相信其对手在采取某个策略的理性参与人总会针对选择一个最优反应。如果对于参与人来说是一个严格劣策略，那么它不可能是任一的最优反应。 8、2 命题：如果在一个有限的标准式博弈中，是一个严格优势策略均衡，或者如果它是 IESDS 剔除过程之后剩下的唯一结果，那么是的最优反应

8、。 8、3 信念和最优反应对应信念：参与人的一个信念就是关于其对手的策略的一个可能的剖面。给定一个参与人关于其对手策略的一个特定的信念，他将能够就该信念形成最优反应。最优反应可以是唯一的，如上述性别大战；有时最优反应策略不止一个。 8、4、可理性化有了关于信念以及参与人针对其信念的最优反应这些概念，很自然下一步就是允许参与人就针对其对手当持何种信念进行推理。这一推理必须考虑所有参与人的理性、关于理性的共同知识以及所有参与人都试图猜出其对手行为的事实。一个理性的参与人会只选择针对其对手的某一策略剖面的最优反应的那些策略。我们可以将所有那些绝不可能是最优反应的策略尽数剔除，从而得到一个

9、可能“更小”的简缩博弈，它只包含能够在原初博弈中作为最优反应的那些策略。我们可以一而再、再而三的使用这种推理，最终经过这个过程得以剩下的策略剖面的集合被称为可理性化策略集。9、1、纳什均衡定义：纯策略剖面是=(1,2,)一个纳什均衡，如果对于所有的，是一个最优反应，也即对于所有的和所有的有： (,)(,) 9、2 、严格优势、IESDS 、可理性化和纳什均衡结果之间的关系考虑一个策略剖面。如果具=(1,2,) 备以下三种情况之一，一个严格优势策略均衡， IESDS 过程之后所剩下的唯一结果，唯一的可理性化策略剖面，那么就是唯一的纳什均衡。 9、3、纳什均衡的条件如下

10、：每个参与人都根据其信念采取最优反应。参与人关于其对手的信念是正确的。第一个条件是理性的直接结果。第二个条件是非常严格的，也是对我们到目前为止所讨论条件的一个巨大的飞跃。第六章混合策略一、策略、信念和期望支付有限策略集连续策略集信念和混合策略期望支付二、混合策略纳什均衡举例：硬币匹配多重均衡：纯策略和混合策略三、再议 IESDS 和可理性化四、纳什存在性定理纳什存在性定理布劳沃尔不动点定理最优反应对应的合集角谷不动点定理 1、有限策略集 A、混合策略定义：令为参与人的有 =1,2, 限纯策略集。定义为的单形（simplex），它是定义在上所有概率分布

11、的集合。参与人的一个混合策略即一个的元素，因此是 =(1),(2),() 定义在上的一个概率分布，其中是参与人选择的 () 概率. 也就是说，参与人的一个混合策略是其纯策略上的一个概率分布。有限元素集（有限状态空间，在我们这里即）上的任一概率分布，必然满足以下两个条件： () -对于所有的，有， ()0 - 。()=1 也即，任一事件发生的概率必然是非负的，所有可能事件发生的概率之和必等于 1。要注意到，每个纯策略都是一个具有选择这个纯策略的概率为 1 的退化分布的混合策略，这个退化分布在其他所有纯策略上概率均为零。 B、支撑：给定参与人的混合策略，我们称纯

12、()策略是的支撑（ support），当且仅当它以正概 ()率出现，即。 ()0 比如说，在石头剪刀布博弈中，参与人可以以相同的概率来选择石头或布，而不选择剪刀。在这种情况下，而。那么我说，R 和 P 是 ()=()=0.5 ()=0的支撑，而 S 不是 C、连续策略集：令表示参与人的纯策略集，假设是一个区间。参与人的混合策略是一个累积分布函数，其中。如果是可微:0,1()=() ()的，其密度函数为，那么我们称当时() ()0是的支撑。 () D、混合策略的信念参与人的一个混合策略信念是由定义在其对手策略上的概率分布来给出。我们用来标示参与 ()人赋予其对手采取的概率。这样以来，参与人的一个信念就是其对手策略上的一个概率分布。 E、期望支付定义：当参与人选择纯策略，且其对手采取混合策

展开阅读全文

一个策略通常被定义为意图实现一个具体目标的行动计划

最新文档