博弈课件PART1b－金锄头文库

资源描述

《博弈课件PART1b》由会员分享，可在线阅读，更多相关《博弈课件PART1b（85页珍藏版）》请在金锄头文库上搜索。

1、博弈论的决策论基础,博弈论、理性和智能性,博弈论可以被定义为是对智能的理性决策者之间冲突与合作的数学模型的研究。理性的和智能的是博弈论的两个基本假设,博弈论、理性和智能性,如果一个决策者在追逐其目标时，能前后一致地作决策，则称他是理性的。基于决策论建立的博弈论，假定每个参与人的目标是追求个人支付值（效用值）的最大化。,期望效用的思想，可以追溯到(Bernoulli,1738) 著名的圣彼得堡悖论(St. Petersburg Paradox) 冯诺伊曼和摩根斯坦(1947)在一组公理化假设下，证明了一个理性的决策者，对于风险决策的选择，可以表示为一个期望效用的最大化（后面介绍）。,博弈论

2、、理性和智能性,一般说来，最大化期望效用支付与最大化期望货币支付并不必然相同当存在不确定时，需要指定不确定事件的概率测度。,博弈论、理性和智能性,博弈论、理性和智能性,智能的含义当我们像博弈论专家或社会科学家分析一个博弈时，就说博弈的参与人是智能的。,决策论的基本概念,博弈论的逻辑根源在于贝叶斯决策理论(Bayesian decision theory)。博弈论可以看成是决策论的推广（单人多人）,决策论的基本概念,如何用定量模型去描述人们的行为？决策论认为任何一个理性决策者的行为，应该都可以用一个能给出其对结果或确定性事件偏好的定量刻划的效用函数，以及能刻划起对所有相关未知因素的主观

3、概率分布(subjective probability distribution),不确定下的决策通常采用如下两个模型概率模型(probability model) 状态变量模型(state-variable model),决策论的基本概念,概率模型适用于描述风险结果(lotteries)具有明显客观概率的事件，这样的事件被称为客观未知事件。如耐特的风险(1921),决策论的基本概念,状态变量模型适于描述主观未知(subjective unknowns)事件，如未来的运动赛事结果或股市的未来行情，奈特的“不确定性”,决策论的基本概念,一些基本记号对于有限集Z，(Z)表示Z上的概率分布集

4、X决策者最终可能获得的确定性结局(PRIZES)所组成的集可能的状态组成的集，其中之一将是实际中的真实状态为简化计，假定X和均为有限集。,决策论的基本概念,风险结果(lotteries) 一个函数f 原像为(x, )，xX, f(x| )为非负实数，且对于每个 ,都有 xXf(x| )=1 这里的每个f(x| )应被理解为：若t是世界真实状态，则由风险结果f得到一个确定性结果（某个收益水平）x的客观概率为f(x| ) 令L为所有这样的风险结果组成的集合,决策论的基本概念,决策论的基本概念,Consider a situation in which a person will receive

5、, for i=1, 2, n, a reward ri with probability pi. This is denoted as the lottery (p1,r1; p2,r2;pn,rn),决策论的基本概念,A lottery is often represented by a tree each branch stands for a possible outcome of the lottery the number on each branch represents the probability that the outcome will occur Thus, the

6、lottery (1/4, 500; 3/4, 0) could be denoted by,决策论的基本概念,事件决策者关于世界真实状态可能拥有的信息被称为事件(event)，为真实状态空间的一个非空子集。用表示所有事件组成的集，即,决策论的基本概念,风险结果的比较对于L中的任意两个风险结果f和g，以及中的任一事件S，当且仅当，如果决策者知道了世界真实状态在S中，f至少和g一样好的时候，则表示为,决策论的基本概念,风险结果的比较进而，可以给出关系 S 和 S,决策论的基本概念,风险结果的比较可用，等相应代替，，即的某个状态被观察排除之前，对风险结果的偏好（先验偏好）。,决策

7、论的基本概念,风险结果的线性组合对于满足0a1的a和L中的任意两个风险结果f和g, af+(1-a)g是一个新的风险结果，其含义是 (af+(1-a)g)(x|t)=af(x|t)+(1-a)g(x|t),xX,t,决策论的基本概念,确定性结果的表示对于某个确定性结果x,令x表示一个总是得到x的一个确定性结局，即如下事实成立 x(y|t)=1, 若y=x x(y|t)=0, else ax+(1-a)y则表示分别以概率a和(1-a)获得结果x和y的风险结果。,决策论的基本概念,决策论的基本概念主观概率,Kormogorov的公理化概率定义 E是一个随机试验，S是E的样本空间，对E的每一个事

8、件A，对应有确定的实数p (A)。若有非负性 p (A) 0 规范性p (S) =1 可列可加性(不相容事件) 则称p (A)为事件A发生的概率。,决策论的基本概念主观概率,上述定义是以客观概率为研究背景的主观概率客观概率根据Savage (1954)的观点，主观概率是一种见解/信念 (belief) 是主观的与客观世界又有联系的博弈论、决策论的理论基础既有主观概率，又有客观概率。,决策论的基本概念主观概率,L. J. Savage(1961)提出了若干个令人信服的例子,决策论的基本概念主观概率,事例1：一位常饮牛奶加茶的妇女声称，她能区别出是牛奶还是茶先被倒进杯子的。对她进行了

9、10次这样的实验，结果都说对了。,决策论的基本概念主观概率,事例2：一位音乐家说，他可以由海顿或莫扎特的一页乐谱看出作者是海顿还是莫扎特。做了10次试验，每次都正确。,决策论的基本概念主观概率,事例3：一个喝醉了的朋友说，他可以预知一个质地均匀的硬币哪一面朝上，做了10次试验，每次他都正确。,决策论的基本概念主观概率,上述例子说明先验信息有时是很重要的，为主观概率理论的合理性提供實踐上的支持,决策论的基本概念主观概率,主客观概率的比较含义不同客观：系统固有的，是相同条件下重复实验频率极限主观：某主体对的信念记号不同客观 p 主观,决策论的基本概念主观概率,先验分布的设定尚未进行任何

10、实验或收集任何信息时，对的信念的数学表示是贝叶斯分析的需要参见有关运筹学或决策论专著，此处从略,决策论的基本概念效用函数,两类主要效用想法基数效用 (cardinal utility)和序数效用 (ordinal utility) Von Neumann & Morgenstern效用 /v-N-M效用,决策论的基本概念效用函数,效用函数的构造参见相关决策论书籍风险与效用风险的含义 Knight的定义日常用语的含义/重大损失的厌恶/：后果的损失严重；损失的可能性,决策论的基本概念效用函数,效用函数包含的内容对风险的态度风险厌恶 (risk averse):they prefe

11、r to obtain $ z with certainty than to receive the outcome of a lottery that yields $z on average 风险中性 (risk neutral):The player must be indifferent between receiving $k with certainty and any lottery whose expected value is $k. A player whose preferences have this property is said to be risk neutra

12、l. 风险追求 (risk seek, risk preferring),决策论的基本概念效用函数,对风险结果的偏好强度多属性效用理论,决策论的基本概念效用函数,1250,2500,U,决策论的公理系,一个理性决策者的偏好应该满足的一些基本性质，可用一组公理表示。这组公理由v Neumann& Morgernstein首先提出。对于L中的任意风险结果(e, f, g, h)，中的事件(S, T)，01之间的数a, b，有如下一组公理,决策论的公理系,公理1.1A 完备性式二者必有一个成立,决策论的公理系,公理1.1B 传递性如果则,决策论的公理系,公理1.2 相关性若 f( .

13、|t) = g (.|t), 任意的tS, 则 fS g 该公理表示的事实是，只有可能状态才是与决策者相关的,决策论的公理系,公理1.3 单调性若f Sh, 且0bS bf +(1-b)h 该公理表示：得到一个较好风险结果的概率总是越高越好。,决策论的公理系,公理1.4 连续性若则存在某个数（0-1区间），使得,决策论的公理系,公理1.5A 客观替代性若则,决策论的公理系,公理1.5B 严格客观替代性若则,决策论的公理系,公理1.6A 主观替代性若则,决策论的公理系,公理1.6B 严格主观替代性若则,决策论的公理系,公理1.7 利害性对于中的每个状态t, X中都存在确定

14、性结果y和z，使得 y tz 该公理表示对于不同的自然状态，必然有确定的结果不同（否则没有必要区分不同的状态）,决策论的公理系,公理1.8 状态中性对于中的任意两个状态r, t, 若f(.|r)=f(.|t)且g(.|r)=g(.|t)，又有则,期望效用最大化定理,上的一个条件概率函数p(t|S)为 p: （），使得,期望效用最大化定理,任一给定一个条件概率函数p(t|S)，可以写,给定条件概率函数p，任一效用函数u，以及风险结果f, 随机事件S，可表示如下条件期望效用,期望效用最大化定理,定理在公理1.1AB、1.21.4、1.5AB、1.6A和1.7同时满足条件下，存在一个效用函数

15、u: XR和一个条件概率函数p: （），使得,期望效用最大化定理,期望效用最大化定理的证明，参见文献2：1114 此外，效用函数在正线性变换下具有唯一性（在公理1.1AB1.7条件下）。,期望效用最大化定理,简例1 对于两个风险结果 (1/2, 0; 0, 1; 1/2, 5)和 (1/2, 0; 1/4, 1; 1/4 , 5) 如果决策者更加偏好前者，则可用v-N-M效用表示上述偏好关系比如，令u(0)=0, u(1)=1, u(5)=4 很容易验算这样定义的效用，满足风险结果偏好与期望效用的一致性,几个简例,简例2 (Preferences over lotteries) Suppo

16、se that there are three possible outcomes, and that in the outcome ai a decision-maker gains $ai, where a1 a2 a3. Suppose that the decision-makers preferences over the deterministic outcomes satisfy,几个简例,Her preferences over lotteries satisfy,Can her preferences be represented by an expected payoff function? If so, find a payoff function that works

展开阅读全文