胡松瀛数模讲义

上传人:wm****3 文档编号:42745955 上传时间:2018-06-03 格式:DOC 页数:70 大小:3.29MB
返回 下载 相关 举报
胡松瀛数模讲义_第1页
第1页 / 共70页
胡松瀛数模讲义_第2页
第2页 / 共70页
胡松瀛数模讲义_第3页
第3页 / 共70页
胡松瀛数模讲义_第4页
第4页 / 共70页
胡松瀛数模讲义_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《胡松瀛数模讲义》由会员分享,可在线阅读,更多相关《胡松瀛数模讲义(70页珍藏版)》请在金锄头文库上搜索。

1、1对策与决策模型对策与决策模型古人云:“世事如棋。 ”人生就像下棋一样,每天都要面对许多的对策与决策问题。有些是生活琐事的对策与决策,如要不要买你看中的一件商品;今天中午你点什么菜,喝什么酒?有些则可能是决定你命运的重大事情的对策与决策,如高考填志愿你该填什么学校,什么专业?许多人在竞争某一职位,你应当怎样做才能最好的表现自己,使自己脱颖而出?等等,等等。对策与决策问题都要求你面对几种方案做出选择,不同之处在于遇到对策问题时,你面对的是一个或几个与你一样可以可以选择行动方案的对手;而遇到决策问题时则不然,你面对的并非一些对手,而是将来会出现的几种可能结果,它们虽不会故意为难你(即不会和你博弈)

2、 ,但你一般却不知道究竟哪一种结果会真正出现。当然,两类问题也有一定的联系,不必分得过于清楚。例如,在某些情况下,如果我们把可能出现的若干种情况看成是竞争对手可以采取的几种策略,那么求解对策问题的方法也可以用来求解决策问题。对策问题对策问题对策论的思想早就有之,我国战国时期的“田忌赛马”就是一例。传说齐王欲与大将田忌赛马,双方约定每人挑选上、中、下三个等级的马个一匹进行比赛,每局赌局诶一千金。齐王同等级的马均比田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给他除了一个主意,让他用下等马对齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌两胜一败,反而赢得了一千金。2然而,对策论

3、作为一门真正独立的学科,其发展的历史却并不久远。1912 年,策墨罗利用集合论思想研究下棋,发表了题为关于集合论在象棋对策中的应用的论文。1928 年与 1937 年著名美籍匈牙利科学家冯.诺伊曼和摩根斯藤合著了对策论与经济行为一书。这些研究成果被公认为是对策论作为一门学科创立的标志,他们引进了严格的定义,构建了对策论的理论框架,使对策论研究走上了系统化、公理化的道路。1950 年,美国数学家纳什将冯.诺伊曼等人的合作对策理论发展到非合作对策情况,提出了纳什平衡点概念(纳什本人也因此而获得了诺贝尔经济学奖) 。此后,对策论围饶着纳什平衡点这一核心问题发展,又有了新的重大突破。对策问题的参与者为

4、利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。究竟什么是对策问题呢?让我们先来考察两个简单的实例。例例 1 (囚犯的困惑)警察同时逮捕了两人,并将他们分别关押在两处,逮捕的原因是他们持有大量伪币。警方怀疑他们伪造钱币,但尚未找到充分的证据,希望他们能自己供认。这两个人都知道:如果他们双方都不供认,将被以持有和使用大量伪币罪各判刑 18 个月;如果双方都供认伪造了钱币,将因伪造钱币罪各判刑 3 年;如果一方供认另一方不供认,则供认方将被从宽处理仅关押半年,但未供认一方将被判刑 7 年。将嫌疑犯、被判刑的几种可能情况AB如表一所示。3表表 一一嫌疑犯B供认不供

5、认嫌疑犯A供认不供认(3,3)(7,0.5)(0.5,7)(1.5,1.5)表中每对数字表示嫌疑犯、被判刑的年数。AB让我们来分析一下囚犯们会怎样决策。囚犯也许会这样想:A若招认了,我如果不招认会被判 7 年,但我也招认的话只有 3 年;B若不招认,我如果招认判刑只有半年,而不招认则被判刑 1.5 年。B也就是说,不论招认还是不招认,对来说,招认都比不招认要BA好。既然如此,除非是傻瓜,他肯定会采取招认的策略。同样道A理,如果不是傻瓜,他也会这样想,从而采取招认的策略。看来B这一案件的最终结果一定是,、均供认并各被判刑 3 年,不管AB他们真的有没有伪造钱币。由此可以看出,在这种情况下,过分的

6、强调了坦白从宽、抗拒从严,即使不使用刑罚,也完全有可能制造冤案,这就是为什么法律界人士要再三强调量刑时应当重事实、重证据的原因之一。在上面这个简单实例的分析中,我们其实已经先验地做了一条假设:“防人之心不可无” ,不管对方怎么做,我们的策略应当保证我不会成为牺牲品。例如,假如、都不招认,他们都只需服刑 1.5AB年(而不是 3 年) 。可是双方都会这样想,凭什么我要相信对方,有什么对东西能保证对方不会出卖我呢?4“囚徒的困惑”是一个很出名的实例,它之所以出名是因为它揭示了一种现象,即在自然状态下,动物(包括人)是趋利避害的。假如你将一批猴子关进笼子里并每天从中选出一只来杀掉,你只要稍加留意就会

7、发现,在你选猴子的时候,猴子们非常紧张,一动都不敢动生怕引起你的注意,而当你选中一只准备杀时,被选中的猴子拼命挣扎,其余的猴子却在笼子里幸灾乐祸的观望,可能庆幸自己未被选中。不少人认为,认总是利己的,只要不出伤害别人就算是好人了(经济学中将这种人称为“理性人” ) 。其实不然,如果不崇尚奉献精神,人人都事不关己高高挂起,人人都满足于当“理性人” ,就会对整个社会带来灾难,最后也一定会殃及作为社会一员的个人。例如,我们经常看到有消息报道,某处罪犯正在作案,旁观看热闹的人不少,却没有人挺身而出去加以制止(或只有很少的几个见义勇为者) ,大概就是因为事不关己吧。这些人和关在笼子里的猴子没有多大区别,

8、他们的举动其实在助长犯罪分子的威风,如果每一个人都能挺身而出,罪犯的气焰就不会这样嚣张了,敢于犯罪的人也就少了。例例 2 (商业竞争)两家生产相同产品的工厂在竞争市场,甲厂拟定了三套行动计划,乙厂拟定了四套行动计划,1231,。预测在甲厂采取方案,而乙厂采取方案时,甲已234ij两厂的市场盈利分别为(,) (注:前者为甲厂盈利,后者为ijij乙厂盈利) 。问两厂各应采取哪一种策略才能使本厂的盈利最大。在例 2 中,根据预测我们得到的其实是一个赢得“矩阵” (注:5我们给矩阵两字加了引号是因为,严格地讲,它并不是矩阵,因为其每一个元素是一个向量而不是一个数): ),(),(),(),(,(),(

9、343431312424212114141111babababababaALLL分析上面两个对策问题的实例,我们可以发现一些共同的规律。一、一、 对策问题的基本要素对策问题的基本要素给定一个对策问题的实例必须给定以下信息:(1)局中人。参加对策的各方被称为决策问题的局中人,一个对策问题可以包含两名局中人(如棋类比赛等) ,也可以包含多于两名局中人(如大多数商业中的竞争、 政治派别间的斗争等) 。每一局中人都必须拥有可供其选择并能影响最终结局的策略,在例 1 中,局中人是、两名疑犯,警方不是局中人。两名疑犯最终被如何AB判刑取决于他们各自采取的态度,警方不能为他们做出选择。(2)策略集合。局中人

10、能采取的可行方案称为策略,每一局中人存在着一个策略集合,而每一策略集合中至少要有两个策略,否则该局中人可从此对策问题中删去,因为对他来讲,不存在选择策略的余地。应当注意的是,所谓策略是指在整个竞争过程中对付他方的完整方法,而并非指竞争过程中某步所采取的具体局部办法。例如,下棋中的某一步只能看作一个完整策略的组成部分,而不能看成一个完整的策略。当然,有时可将它看成一个多阶段对策中的子对策。策略集合可以是有限集也可以是无限集。策略集合为有限6集时被称为有限对策,否则被称为无限对策。(3)赢得函数(或称支付函数) 。记局中人 的策略集合为。iiS当对策问题的各方都从各自的策略集合中选定了一个策略后,

11、各方采取的策略全体可用一个矢量表示,称之为一个纯局势(简称局势) 。例如,若一个对策问题中包含着、两名局中人,其策略集合分AB别为,。若选择策略,而选择策,1mASL,1nBSLAiB略,则就构成此策略的一个纯局势。显然,与一共可j),(jiASBS构成个纯局势,它们构成了表二。对策问题的全体纯局势构成nm的集合 称为此对策问题的局势集合。S表表 二二的策略B12jn1),(11),(21),(1j),(1n2),(12),(22),(2),(2ni),(1i),(2i),(ji),(niA的策略m),(1m),(2m),(jm),(nm对策的结果用矢量表示,称之为赢得函数。赢得函数是定义F在

12、局势集合 上的失值函数,对于 中的每一纯局势 ,指出了SSs)(sF每一局中人在此对策结果下应赢得(或支付)的值。综上所述,一个对策模型由局中人、策略集合喝赢得函数三部7分组成。记局中人集合为,对每一,有一策略集合, 2 , 1kILIi,当 中每一局中人 选定策略后得一个局势 ;将 代入赢得函数iSIiss,即得一矢量,其中为在局势 下局中人F)(,),()(1sFsFsFkL)(sFis的赢得(或支付) 。i本节讨论只有两名局中人的对策问题,即两人对策,其结果可以被推广到一般的对策模型中去。对于只有两名局中人的对策问题,其局势集合和赢得函数均可用表格表示。例如,表二就给出了一般两人对策问题

13、的局势集合喝赢得函数。二、二、 零和对策零和对策存在一类特特殊的对策问题。在这类对策问题中,当纯局势确定后,之所得恰为之所失,或之所失恰为之所得,即双方所得ABAB之和总为零,这样的对策问题被称为零和对策问题。在零和对策中,因,故只需指出其中一人的赢得值即可,此时,赢得函)()(21sFsF数可用真正的赢得矩阵来表示。例如若有中策略,有 种策略,AmBn赢得矩阵可写成mnmmnnnmaaaaaaaaaRLMMMLL212222111211的元素表示若选取策略 而选取策略 ,则之所得为nmRijaAiBjA(当时为为支付) 。ija0ija在有些两人对策的赢得表中,之所得并非明显为之所失,但AB

14、双方赢得数之和为一常数。例如在表三中,无论,怎样选取策AB略,双方赢得总和均为 10,此时,若将各人赢得数减去两人的平均8赢得数,即可将赢得表化为零和赢得表。表三中的对策在转化为零和对策后,具有赢得矩阵.R表表 三三局中人B1231(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)3(2,8)(6,4)(8,2)局中人A4(6,4)(4,6)(6,4)综上所述可知,要给定一个两人零和对策只需给出局中人,A的策略集合、及表示赢得值的赢得矩阵。当遇到零和对策BASBSR或可转化为零和对策的问题时,可用通常意义下的矩阵表示,否R则中的元素为一个两维矢量。故两人对策又被称为矩阵对策并RG可

15、简记为,RSSGBA例例 3 给定一个零和对策,其中,,RSSGBA,321AS,4321BS4321(1) 16100610182142230612 R321零和对策不存在合作基础,之所得即之所失,故在求解两人AB零和对策时只能根据利己原则。从中可以看出,若希望获得最RA9大盈利 30,需采取策略,但此时若采取策略,非但得不到1B4A30,反而会失去 22。此时任何一方都不应当抱有侥幸心理,根据利己原则,双方都应考虑到对方为了使自己能获得最大利益,都有使对手遭受最大损失的动机,为稳妥起见,应当从最坏的可能中去争取最好的结果。局中人采取策略,时,最坏的赢得结果A123分别为;2222,30, 6,12min210,18, 2 ,14min1016,10, 0 , 6min如果采取策略,无论采取什么策略,的赢得均不会少于 2.A2BA采取各方案的最大损失为B;146,14,12max20 , 2 , 6max3010,18,30max1616,10,22max而当,当采取策略时,其损失不会超过 2。注216,30, 2 ,14minB2意到在赢得矩阵中,2 即是所在行中的最小元素又是所在列中的最大元素。此时,只要双方不改变策略,任一局中人都不可能通过仅变换自己的策略来增大赢得或减小损失。我们称这样的局势为对策问题

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号