决策理论与方法(物流)

上传人:豆浆 文档编号:752410 上传时间:2017-05-13 格式:DOC 页数:11 大小:38KB
返回 下载 相关 举报
决策理论与方法(物流)_第1页
第1页 / 共11页
决策理论与方法(物流)_第2页
第2页 / 共11页
决策理论与方法(物流)_第3页
第3页 / 共11页
决策理论与方法(物流)_第4页
第4页 / 共11页
决策理论与方法(物流)_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《决策理论与方法(物流)》由会员分享,可在线阅读,更多相关《决策理论与方法(物流)(11页珍藏版)》请在金锄头文库上搜索。

1、第二节 决策分析的分类及其基本原则 第二节 决策分析的分类及其基本原则 第三节 决策分析的步骤与追踪决策 第三节 决策分析的步骤与追踪决策 第三节 决策分析的步骤与追踪决策 第三节 决策分析的步骤与追踪决策 第四节 决策分析的定性与定量方法概述 本章小结决策分析是人们为了实现某一特定目标,根据主客观条件的可能性,提出各种可行方案,采用科学的方法对各方案进行比较、分析和评价,按照决策准则,从中筛选出最满意的方案,并加以实施的过程。它包括决策者、决策目标、决策方案、自然状态、决策结果和决策准则等几个基本要素。本章结合其要素对决策分析从不同角度进行了较为详细的分类。决策分析是一个包括分析问题、确定目

2、标、拟定方案、评价方案、实施方案直至目标实现的系统过程。在决策分析的过程中,我们应遵循如下基本原则:信息准全原则、效益原则、系统原则、科学原则、可行原则、选优原则、行动原则、反馈原则等。在方案实施的过程中,当主客观情况发生重大变化或原决策方案存在重大失误时,要进行追踪决策。要做好追踪决策应掌握其基本特征,如回溯分析、非零起点、双重优化、心理效应等。在决策分析的过程中,我们应采用定性分析与定量分析相结合的综合决策方法。这种方法对能够量化的指标建立起精确的数学模型,而且同时考虑不能量化的因素,是一种切合实际的较优的决策分析方法。 第二节 完全信息静态博弈 一、博弈的标准式表述 定义 7.1 在一个

3、 n 人博弈的标准式表述中,参与者的策略空间分别为 ,收益函数分别为 则 表示此博弈。 二、纳什均衡 定义 7.2 在博弈 中,如果策略组合 中任一博弈方 i 的策略 都是对其余博弈方的策略组合的最佳对策,也即: 对任意 都成立,则称 为 G 的一个“纳什均衡” 。 纳什均衡有强弱之分,以上是弱纳什均衡,也是最常用的纳什均衡概念,强纳什均衡是指每个博弈方对于对手的策略有唯一的最佳反应,即 为严格纳什均衡,当且仅当对所有 i,所有其他 ,均有: 三、两人有限零和博弈 (一)两人有限零和博弈模型 两人有限零和博弈是指只有两个局中人,每个局中人都有有限个可选择的策略,而且在任一局势中两个局中人得失之

4、和总是等于零。 第二节 完全信息静态博弈 如果我们用 和 表示两人有限零和博弈的两个局中人,并设他们的策略集分别为 , 。 局中人 的支付矩阵可记作: 根据局中人 的支付矩阵 A,结合博弈的一般式表述 ,我们可将这种博弈记作 。 (二)最优纯策略与纳什均衡 定义 7.3 对于博弈 ,如果 则称 分别为局中人 和 的最优纯策略,称局势( )为博弈 G 的鞍点,v 称博弈 的博弈值。 不难验证鞍点( )是博弈 的纳什均衡,鞍点又称纯策略纳什均衡。两人有限零和博弈存在的鞍点的充要条件是支付矩阵中存在一个元素 ,使对于一切 , ,总有: 第二节 完全信息静态博弈 (三)最优混合策略与纳什均衡 局中人只

5、能以一定的概率在其策略集中随机选择每个策略,这种在纯策略空间上的概率分布为混合策略。 设博弈 , , ,令 分别为局中人 和 在各自的策略集 和 中选择策略 和 的概率,则称 分别为局中人 和 的一个混合策略。称 为局中人 的期望获得, 为 的期望获得,而( )为博弈的混合局势。 又记 分别为局中人 和 的混合策略集合。 定义7.4 如果 则称 为局中人 和 的最优混合策略,称( )为 G 的最优混合局势,称 为博弈方 的期望所得。 最优混合局势 构成了混合意义上的纳什均衡,任何一方,单独背离这个局势,则它的期望所得将不会优于最优混合局势下的所得。 第二节 完全信息静态博弈 (四)最优混合策略

6、的求解方法 博弈 有混合意义下的解的充要条件是:存在 满足下列两个不等式组: (1) (2) 为了求解上述不等式组,可将它们变为线性规划而求出博弈 G 的最优混合策略。不妨设 (否则令 ,则 一定可大于零) 。令 ,则不等式组(1)等价于下面的线形规划: (3) 同理,令 ,问题(2)就变为线形规划(4): (4) 第二节 完全信息静态博弈 四、应用举例 图 7-4 市场进入阻挠博弈 例 7-3 市场进入阻扰博弈。一种市场上存在一个垄断企业,另一个企业希望进入这一市场,垄断者为了保持自己的地位需要对进入者进行阻挠。这种博弈中,进入者有两种策略可以选择:“进入”与“不进入” ;垄断者也有两种策略

7、:“容忍”与“反击” 。他们的支付函数用以下双变量矩阵表示(见图 7-4) 。 例 7-4 产量决策的古诺模型。古诺模型是博弈论中最经典的例子。古诺首先提出了这一模型。由于他采用了分析企业各自的最优反应函数从而形成均衡的思路,与纳什均衡非常相似,因此纳什均衡也称古诺一纳什均衡。它描述的是所谓厂商进行数量竞争的形势,以下是最常见的一种较为简化的版本。 生产同质产品的两个企业同时选择各自的产量 ,市场需求决定价格 。单位成本均为常数 c。求解其中的纳什均衡。 例 7-5 公共地悲剧模型。假设有 n 个人共同拥有的一个公共牧场,每个人要决定自己放牧羊的数目 ,总的羊数因此为 。购买和照看 1 只羊的

8、成本为常数 c。设每只羊的价值为 ,随着羊的增加,草地会越来越拥挤,食物也会更紧张,因此会造成羊的价值下降,另一方面,羊的供给增加也会造成羊的价值下降,求此博弈中的纳什均衡。 第三节 完全信息动态博弈 一、博弈的扩展式表述 在动态博弈中,参与人的行动有先后顺序,且后行动者在自己行动之前能观测到先行动者的行动且对各博弈方的策略空间及支付有充分的了解,我们称这种博弈为完全信息动态博弈。动态博弈有不同与静态博弈的特征,习惯于用扩展式来描述和分析动态博弈。 博弈的扩展式表述包括以下要素: (1)参与人集合; (2)行动次序,即参与人参与行动的次序; (3)收益,即参与人所采取行动的函数; (4)行动,

9、即轮到次序的参与人的选择; (5)信息集,它表示参与人在每次行动时所知道的信息; (6)每一个外生事件的概率分布。 二、多阶段可观察行动博弈与子博弈完美纳什均衡 多阶段可观察行动博弈,这种博弈有着多个“阶段” ,通常记为 k ,行动的历史通常记为 ,从而 (1)在每一个阶段 k,每一个参与人都知道所有行为情况,包括自然的行为以及过去各阶段所有参与人的行为 ; (2)在任一给定阶段中,每一个参与人最多只能行动一次; (3)阶段 k 的信息集不会提供有关这一阶段的任何信息。 由于这种博弈存在多个阶段,它与只有一个阶段的完全信息博弈有着本质的区别,因此如果我们仍用纳什均衡思想分析这种博弈问题就难免存

10、在局限性。泽尔滕(Selten,1965)提出了子博弈完美纳什均衡的思想。 泽尔滕子博弈完美纳什均衡是指在一个多阶段可观察的博弈中,由各博弈方的策略构成的一个策略组合,这个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡。 第三节 完全信息动态博弈 三、完美信息博弈与逆向归纳法 在多阶段可观察行动博弈中,如果我们对条件(2)稍加限制,即在任一给定阶段中,每一个参与人最多只能行动一次而且只有一个参与人采取行动,就得到完美信息博弈。 由于多阶段可观察行动博弈中,引入了子博弈完美纳什均衡的概念,借助这种概念的思想,多阶段可观察行动博弈通常采用逆向归纳法。 “逆向归纳法”这一思路是通过逆向归

11、纳的方法,先解决参与人在面临任何可能情况下的最终行为策略,然后逐步向前推导计算前一步最优选择。 逆向归纳法可以在任何完美信息下的多阶段博弈中应用,这一方法从最终阶段 k 在每一历史情况 下最优选择开始,即在给定历史情况 条件下,通过最大化参与人在面临历史情况 条件的收益确定其最优行动,从而向前推算到阶段 k-1,并确定这一阶段中采取行动的参与人的最优行为,只要给定阶段 中采取行动的参与人在历史情况 下将采取我们之前推导出来的最优行动即可。用这一方法不断地向前推算下去,直至初始阶段,这样我们就可以建立一个策略组合。 第四节 不完全信息静态博弈 一、概念 如果在一个博弈中,某些参与人不知道其他参与

12、人的收益,我们就说这个博弈是不完全信息博弈。 海萨尼(Harsanyi,19671968)首先给出了一种模拟和处理这一类不完全信息博弈的方法,即引入一个虚拟参与人“自然” , “自然”首先选择参与人 1 的类型(这里是他的成本) 。在这个转换博弈中,参与人 2 关于参与人 1 成本的不完全信息就变成了关于“自然”的行动的不完全信息,从而这个转换博弈可以用标准的技术来分析。 从不完全信息博弈到不完美信息博弈的转换如图 7-3 所示,这个图是首先由海萨尼给出的。N 代表“自然” , “自然”选择参与人 1 的类型。这里有一个标准假设,即所有参与人对自然行动的概率分布具有一致的判断。一旦采用这一假设

13、,我们就得到一个标准博弈,从而可以使用纳什均衡的概念。海萨尼的贝叶斯均衡(或贝叶斯纳什均衡)正是指不完美信息博弈的纳什均衡。 二、策略和类型 参与人的“类型”他的私人信息就是他的成本。在通常情况下,一个参与人的类型可能包括与其决策相关的任何私人信息。参与人的收益函数就相当于它的类型。 如果参与人的类型过于复杂,模型就可能很难处理,在实际运用中,通常假定参与人关于对手的判断完全由他自己的收益函数决定。 海萨尼考虑了更一般的情形。假定参与人的类型 取自某一客观概率分布 ,这里 属于某一空间 。简单起见,假定 存在有限个元素。 只能被参与人i 观察到。令 代表给定 是参与人 i 关于其他参与人类型

14、的条件概率。假定对于每一个 ,边际分布 是严格正的。 第四节 不完全信息静态博弈 我们通常把博弈的外生因素如策略空间、收益函数、可能类型、先验分布等视为共同知识。一般来说,这些策略空间都比较抽象,有些还包括如扩展式博弈中的相机行动策略。但在这里,为简单起见,我们假定策略空间 Si 是参与人 i 的(非相机)行动集。 可以用 代表类型为 的参与人 i的策略选择(可能是混合策略) 。如果参与人 i 知道其他参与人的策略 是其相应类型的函数,参与人 1 就可以用条件概率 来计算对应于每一个选择的期望效用从而找出最优反应策略 。 三、贝叶斯均衡 定义 7.4 在一个不完全信息博弈中,如果每一参与人 i 的类型 有限;且参与人类型的先验分布为

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 中学学案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号