教育博弈论与知识管理1课件

资源描述

《教育博弈论与知识管理1课件》由会员分享，可在线阅读，更多相关《教育博弈论与知识管理1课件（71页珍藏版）》请在金锄头文库上搜索。

1、教育博弈论与知识管理教育博弈论与知识管理电话：电话：Email: 策略行为、囚徒困境策略行为、囚徒困境2013春选修课春选修课1教育博弈论与知识管理（1）博弈论与知识管理 “要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解” 保罗萨缪尔森2教育博弈论与知识管理（1）博弈论与知识管理现代博弈论简单发展史现代博弈论简单发展史o起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的博弈论与经济行为3教育博弈论与知识管理（1）2.博弈论的开山之作1943年，冯诺依曼和摩根斯顿发表博弈论和经济行为的一书，标标志志着着博博弈弈论论作作为为一一门门独独立立科科学学的的开开始始，也也标标志

2、志着着新新古古典典经经济济学学进进入入了了一一个个新新的的发发展展阶阶段。段。4教育博弈论与知识管理（1）博弈论与知识管理博弈论和诺贝尔经济学奖博弈论和诺贝尔经济学奖o1994：纳什（Nash）、海萨尼（J.Harsanyi）、泽尔腾（R.Selten）o1996莫里斯（James A.Mirrlees）和维克瑞（William Vickrey）纳什的基本贡献是证明了非合作博弈均衡解及其存在性，建立了作为博弈论基础的“纳什均衡”概念；海萨尼则把不完全信息纳入到博弈论方法体系中；泽尔腾的贡献在于将博弈论由静态向动态的扩展，建立了“子博弈精练纳什均衡”的概念。这两位经济学家的贡献集中于运用博弈论对

3、现实经济问题的解释。5教育博弈论与知识管理（1）博弈论与知识管理o2001：阿克洛夫（Akerlof）、斯宾塞（Spence）、斯蒂格利茨（Stiglitz）博弈论和诺贝尔经济学奖博弈论和诺贝尔经济学奖这三位作为不对称信息市场理论的奠基人被授予诺贝尔经济学奖，以表彰他们分别在柠檬品市场等不对称信息理论研究领域做出的基础性贡献。这些贡献发展了博弈论的方法体系，拓宽了其经济解释范围。o2002：弗农史密斯（Smith）o2005：奥曼（Aumann）、谢林（Schelling）贡献主要在于通过实验室实验来测试根据经济学理论而做出预测的未知或不确定性。是对以博弈论为基础构建的理论模型进行实证证伪工

4、作的一大创举。他们通过博弈理论分析增加了世人对合作与冲突的理解。其理论模型应用在解释社会中不同性质的冲突、贸易纠纷、价格之争以及寻求长期合作的模式等经济学和其他社会科学领域。6教育博弈论与知识管理（1）罗伊德沙普利（LloydS.Shapley），1923年6月2日生于美国麻省剑桥，是美国杰出的数学家和经济学家。毕业于普林斯顿大学与哈佛大学，任美国加州大学洛杉矶分校数学和经济学名誉教授，对数理经济学、特别是博弈论理论做出过杰出贡献，被很多专家认为是博弈论的具体化身。博弈论和诺贝尔经济学奖博弈论和诺贝尔经济学奖2012年他与艾文罗斯共同获诺贝尔经济学奖。艾文E罗斯（AlvinERoth，1951

5、年12月19日），美国经济学家，哈佛商学院担任经济及工商管理乔治冈德(GeorgeGund)教授。在博弈论、市场设计和实验经济学领域都曾作出重大贡献，代表作是：经济学中的实验室实验：六种观点。2012年10月15日，获得2012年诺贝尔经济学奖。7教育博弈论与知识管理（1）诺贝尔奖为何青睐博弈论“博弈论这门学科，应该说是为整个社会科学的研究方法提供了统一的研究范式。有专家指出，博弈论是世纪社会科学最重要的成果之一，可以和自然科学遗传基因双螺旋结构的阐释相媲美。”博弈论与知识管理8教育博弈论与知识管理（1）博弈论是深刻理解经济行为和社会问题的基础。按照年诺贝尔经济学奖得主阿玛蒂亚森的看法，博弈论

6、和社会选择理论是世纪社会科学最主要的成就。这两门学科创立的标志性事件分别是两本书的出版；后者应该是年阿罗的小册子社会选择与个人价值，而前者毫无疑问是年冯诺伊曼和摩根斯顿的鸿篇巨制博弈论与经济行为。博弈论与知识管理9教育博弈论与知识管理（1）现在博弈论已经成为整个社会科学特别是经济学的核心。萨缪尔森在他的经典教科书中曾引用过的短谚是：“你可以使鹦鹉成为训练有素的经济学家，所有必须要学的只是两个词，供给和需求”现在它们或许可换成“博弈”和“均衡”。当代著名博弈论学者迈尔森（）评价博弈论的创立改写了整个社会科学的理论基础。博弈论与知识管理10教育博弈论与知识管理（1）明言知识 (是什么、为什么)

7、主要是事实和原理的知识存于书本，可编码（逻辑性）、可传递(共享性)、可反思(批判性) 默会知识（怎么想、怎么做）本质上是理解力和领悟存于个人经验(个体性)、嵌入实践活动（情境性）教育实践智慧常常教育实践智慧常常“ “只可意会，不可言传只可意会，不可言传” ” M. Polany M. Polany ：“缄默的知识缄默的知识”(1956)(1956)，实践技能很难诉诸文字，科学，实践技能很难诉诸文字，科学智慧根源于默会的力量。智慧根源于默会的力量。OECDOECD（19961996）重点强调默会知识在新经济时代的）重点强调默会知识在新经济时代的特别重要意义。特别重要意义。知识的冰山模型（知识的

8、冰山模型（J.Brown,2000）博弈论是博大精深的。但是它同时也如漂浮在海里的冰山一样，虽然只有l8的部分露出来，但是它能为人欣赏的也正是这一部分。11教育博弈论与知识管理（1）博弈论一方面，海面下的理论体系既足以使书斋里的学者经年研究，并获得诺贝尔经济学奖；另一方面，露出水面的诸多形象生动的范式和策略，又可以使我们很简捷地获得生鲜活泼的思维工具，以最低的成本，成长事业、争取加薪、赢得尊重、获得爱情、体面生活。博弈论与知识管理12教育博弈论与知识管理（1）经济如局人生如棋博弈之道生活之常运用之妙存乎一心13教育博弈论与知识管理（1）博博弈弈论论是是研研究

9、究理理性性的的决决策策主主体体在在其其行行为为发发生生直直接接的的相相互互作作用用时时的的策策略略选选择择及及策策略略均衡的理论。均衡的理论。博博弈弈分分析析的的关关键键步步骤骤是是找找出出在在别别人人选选择择既既定定的的情情况况下下自自己己的的最最优优反反应应策策略略（给给自自己带来最大收益的策略）。己带来最大收益的策略）。一、博弈论研究对象一、博弈论研究对象博弈论基础博弈论基础14教育博弈论与知识管理（1）博弈论与知识管理二、博奕论的四大要素1、参与者2个或2个以上的参与人(player)。是博弈存在的一个必需条件，即不是一个人在一个毫无干扰的环境中做决策。2、资源和收益博弈要有参与各方争

10、夺的资源或收益(resourcespayoff)。资源指的不仅仅是自然资源，如矿山、石油、土地、水资源等还包括了各种社会资源，如人脉、信誉、学历、职位等。经济学的效用理论可以用来解释这个问题，凡是自己主观需要的就是资源；相反，主观不需要的对自己就不能构成资源。15教育博弈论与知识管理（1）3、策略指的是直接、实用地针对某一个具体问题所采取的应对方式。通俗地说，策略也称为计策，是博弈参与者所选择的手段方法。博弈论中的策略（strategy)，是先对局势和整体状况进行分析，确定局势特征，找出其中关键因素，为达到最重要的目标进行手段选择。由此可见，博弈论中的策略是牵一发而动全身的，直接对整个局势造成

11、重大影响。4、信息博弈参与者所拥有的关于某一博弈问题的所有相关信息(information)，就是个人或组织在一定的环境条件与既定的规则（信息）下，同时或先后，一次或是多次选择策略并实施，从而得到某种结果而形成博弈过程。博弈论与知识管理16教育博弈论与知识管理（1）三、博弈论模型或案例三、博弈论模型或案例博弈论一般是通过设计一些特殊博弈情景或实际发生的经典案例来说明某种博弈思想、方式，分析收益或支出，以及这种情形下的获得最大收益的应对策略，这些博弈情景和经典案例称为博弈模型或博弈案例。如：囚徒两难困境(prisonersdilemma)。博弈论与知识管理17教育博弈论与知识管理（1）博弈论与知

12、识管理囚徒两难困境囚徒两难困境(prisoners dilemma)19501950年年，担任斯坦福大学客座教授的数学家图克，担任斯坦福大学客座教授的数学家图克，给一些心理学家解释他正在研究的完全信息静态博弈给一些心理学家解释他正在研究的完全信息静态博弈问题，构造了囚徒困境模型。问题，构造了囚徒困境模型。图科根据当时美国媒体报道的一个刑事案件，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中失落的财物。然而，他们矢口抵赖曾杀过人，辩称是先发觉富翁被杀，然后只是随手牵羊偷了点儿东西。于是警方将两人隔绝，分别关在不同的房间

13、进行提审。由地方检察官和每一嫌犯独自交谈。检察官说，“由于你们的偷窃罪已有确凿的凭证，因而能够判你们三年徒刑。然而，我能够和你做个交易。如果你独自坦白杀人的罪恶，我只判你一年的囚禁，但你的同伙要被判十五年刑。如果你拒不坦白，而被同伙举报，那么你就将被判十五年刑，他只判一年的囚禁。然而，假使你们两人都坦白交代，那么，你们都要被判十年刑。”斯卡尔菲丝和那库尔斯该怎么办呢？ 18教育博弈论与知识管理（1）博弈的表述博弈树博弈一般有博弈树和矩阵式两种表述方式。博弈树是一种通过树状结构来描述博弈的表述方式。一个节点(称作决策节点)表示博弈进行中的每一个可能的状态。博弈从唯一一个初始节点开始，通过由参与者

14、决定的路径到达终端节点。此时博弈结束，参与者得到相应的收益。其中，每个非终端节点只属于一个参与者：参与者在该节点选择其可能的行动策略，每个可能的行动策略通过该节点到达另一个节点。博弈论与知识管理19教育博弈论与知识管理（1）博弈论与知识管理（-10-10，- -1010）（-1-1，- -1515）（-3-3，- -3 3）（-15-15，- -1 1）囚徒两难困境博弈树囚徒两难困境博弈树甲甲乙乙那库尔斯那库尔斯斯卡尔菲丝斯卡尔菲丝20教育博弈论与知识管理（1）博弈的表述矩阵式矩阵形式不用图形来描述博弈而是用矩阵来陈述博弈。矩阵是博弈论中用来描述两个人或多个参与人的策略和效用的最常用工具，又

15、被称为“收益矩阵”或“得益矩阵”。也称为标准式。矩阵式的表述方式，在识别严格优势策略和纳什均衡上更为便捷，但是却会丢失某些信息。博弈的标准形式的表述方式包括如下部分：每个参与者所有显然的和可能的策略，以及和与其相对应的收益。博弈论与知识管理21教育博弈论与知识管理（1）乙那库尔斯不坦白坦白甲斯卡尔菲丝不坦白 -3，-3 -15，-1 坦白 -1，-15 -10，-10 囚徒两难困境的矩阵表示囚徒两难困境的矩阵表示22教育博弈论与知识管理（1）博弈论与知识管理如图，在乙不坦白的情况下，如果甲坦白，如图，在乙不坦白的情况下，如果甲坦白，甲会被从轻处罚，只被判刑甲会被从轻处罚，只被判刑1年，乙被重判

16、年，乙被重判15年；年；如果甲也不坦白，由于证据不足，甲乙都只会被如果甲也不坦白，由于证据不足，甲乙都只会被判刑判刑3年。年。在乙坦白的情况下，如果甲也坦白，甲乙会在乙坦白的情况下，如果甲也坦白，甲乙会被判刑被判刑10年；如果甲不坦白，乙会被从轻处罚，年；如果甲不坦白，乙会被从轻处罚，只被判刑只被判刑1年，甲则被重判年，甲则被重判15年。年。可见，在乙不坦白的情况下，甲最好是坦白，可见，在乙不坦白的情况下，甲最好是坦白，从而可以被从轻处罚；在乙坦白的情况下，因为从而可以被从轻处罚；在乙坦白的情况下，因为被判刑被判刑10年总比年总比15年要好，甲最好也是坦白，年要好，甲最好也是坦白，所以甲会选

17、择坦白。所以甲会选择坦白。 23教育博弈论与知识管理（1）博弈论与知识管理同理，无论甲如何选择，乙的最好选择也同理，无论甲如何选择，乙的最好选择也是坦白。是坦白。结果双方都选择坦白结果双方都选择坦白，都被判刑，都被判刑10年。年。可见，我国公安机关可见，我国公安机关”坦白从宽，抗拒从严坦白从宽，抗拒从严“的心理攻势在大多数情况下都是可以奏效的。的心理攻势在大多数情况下都是可以奏效的。囚犯两难困境说明个人的理性可能导致集囚犯两难困境说明个人的理性可能导致集体结果的不妙。在现实社会中，人人都追求完体结果的不妙。在现实社会中，人人都追求完美反而可能会导致社会变得很糟糕。美反而可能会导致社会变得很糟糕

18、。24教育博弈论与知识管理（1）博弈论与知识管理占优策略占优策略o不管囚犯乙是选择坦白还是不坦白不管囚犯乙是选择坦白还是不坦白, , 囚犯甲都会选择坦白囚犯甲都会选择坦白! !o坦白是囚犯甲的占优策略坦白是囚犯甲的占优策略! !o占优策略（上策）占优策略（上策）不管对手做什么，对一个参与者都不管对手做什么，对一个参与者都能获得最高得益的策略。能获得最高得益的策略。乙不坦白坦白甲不坦白-3，-3-15，-1坦白坦白-1，-15-10，-1025教育博弈论与知识管理（1）博弈论与知识管理囚犯乙的占优策略囚犯乙的占优策略o不管囚犯甲是选择坦白还是不坦白不管囚犯甲是选择坦白还是不坦白, , 囚犯乙都

19、会选择坦白囚犯乙都会选择坦白! !o坦白是囚犯乙的占优策略坦白是囚犯乙的占优策略! !乙不坦白坦白甲不坦白-3，-3-15，-1坦白-1，-15-10，-1026教育博弈论与知识管理（1）博弈论与知识管理占优策略（上策）均衡占优策略（上策）均衡o不管囚犯乙是选择坦白还是不坦白不管囚犯乙是选择坦白还是不坦白, , 囚犯甲都会选择坦白囚犯甲都会选择坦白! !o不管囚犯甲是选择坦白还是不坦白不管囚犯甲是选择坦白还是不坦白, , 囚犯乙都会选择坦白囚犯乙都会选择坦白! !o坦白是囚犯甲和乙的占优策略坦白是囚犯甲和乙的占优策略! !o在博弈中，由局中人的上策构成的均衡称为在博弈中，由局中人的上策构成的

20、均衡称为占优策略占优策略（上策）均衡（上策）均衡乙不坦白坦白甲不坦白-3，-3-15，-1坦白-1，-15-10，-1027教育博弈论与知识管理（1）纳什均衡纳什均衡如果a*代表选手A在选手B选择b*时的最佳行动，而b*代表选手B在选手A选择a*时的最佳行动，那么，策略组合（a*,b*）就是2人博弈的均衡解。28教育博弈论与知识管理（1）博弈论教授的睿智1、两个平日优秀的学生因参加考试前周末的舞会，玩得尽兴而耽误返校复习考试，因而谎称返校路上汽车爆胎无法及时返校复习，电话申请缓考。博弈论教授爽快的同意了。博弈论与知识管理2、足智多谋的教授不知道缓考理由的真假，他既不能伤害诚实的学生的合理要求

21、，又不能不惩罚说谎的学生“诚信至上”。3、依照“囚徒困境”设局，两学生被分隔同时考试，第一张试卷30分，第二张试卷“请问周日大约几点，爆的哪只轮胎？”却占70分。29教育博弈论与知识管理（1）伍子胥“无中生有”把对方陷入困境伍子胥只身逃往吴国。在边关附近，被斥侯抓住了，要送他见楚王。博弈论与知识管理斥候斥候伍子胥伍子胥押送押送释放释放诬陷-10，-100，0不诬陷-10，80，0博弈博弈收益收益矩阵矩阵伍子胥急中生智，说：“楚王抓我是想要得到我的宝珠（利用信息不对称）。我将在楚王面前说你夺了我的宝珠，并吞到肚里了。楚王一定会剖开你的肚子，寻找宝珠。”斥候信以为真，非常恐惧，赶紧把伍子胥放了，

22、伍子胥终于逃出了楚国。利用信息不对称，利用信息不对称，无中生有，设置无中生有，设置“囚徒困境囚徒困境”30教育博弈论与知识管理（1）利用“公有信息”把对方“套牢”嘉庆年间，某甲在乡试中考取第一名，其同学某乙颇为嫉妒，于是揭发某甲试卷引录禁书天盖楼的文字。主考官大惊，怒问某甲：“天盖楼乃是禁书，你可知道？”博弈论与知识管理某甲从容回答：“学生读书太少，天盖楼闻所未闻。”主考官又问：“那你的试卷中为什么引录禁书文字？”某甲反问：“大人如何得知学生卷中引录禁书文字，难道您亲自拿禁书核对过？”主考官连连摆手：“既然是禁书，本官自然未见过。本官如此问你，只是因为你的同学某乙举告。”某甲即刻表示愿与某乙对

23、质。主考官传某乙到场。某甲质问道：“你说我的试卷中抄录禁书天盖楼文字，根据何在？天盖楼既然是禁书，你为什么会如此熟悉？”某乙吓的脸色苍白。31教育博弈论与知识管理（1）素质教育的博弈论分析素质教育的博弈论分析每周学时数每周学时数平均每天家庭作业量（小时）平均每天家庭作业量（小时）403小学高年级学生018200617132初中生062113051421博弈论与知识管理中小学生每周学时数及家庭作业量中小学生每周学时数及家庭作业量从上表不难看出，中小学生特别是初中生的学习负担是非常沉重的，初中生中有32.5%的学生每周学习时间超过了40小时，如果再加上家庭作业量，比例远不只于此。32教育博弈论与知

24、识管理（1）博弈论与知识管理素质教育的博弈论分析素质教育的博弈论分析中小学生每周学时数与家庭作业量之和中小学生每周学时数与家庭作业量之和每周学时数与家庭作业量之和每周学时数与家庭作业量之和60小学高年级学生2131850初中生0391612本表的数据更令人担忧，中小学生中，周学习时间超过40小时的比例高达77%，初中学生更是高达92.5%！如此长时间的学习，不仅不利于中小学生身心成长，也不是学习知识的有效办法。33教育博弈论与知识管理（1）博弈论与知识管理素质教育的博弈论分析素质教育的博弈论分析每周请家教小时数每周请家教小时数平均每天额外作业量（小时）平均每天额外作业量（小时）053小学高年级

25、学生641711191720初中生211423161752中小学生每周家教小时数及额外作业量中小学生每周家教小时数及额外作业量34教育博弈论与知识管理（1）博弈论与知识管理素质教育的博弈论分析素质教育的博弈论分析学校 A（减负）B（不减负）学校I A（减负）6，6-1，9B（不减负）9，-14，4两学校的减负博弈收益矩阵两学校的减负博弈收益矩阵假设，减负有正收益2，升学率高有正收益9，升学率维持不变时有正收益4，不减负的收益为0，升学率下降的收益为-3。如果两个学校都选择减负，既不影响升学率又可减负，每个学校的收益都为2+4=6；两个都选择不减负其收益都是4；如果一个选择减负一个选择不减负，那

26、选择减负的收益为2+（-3）=-1，而选择不减负的收益为9。升学率=升入上一层次的学生数/毕业或参加考试的学生总数。不管减负与否，上式右边的分子和分母都是不会改变的。35教育博弈论与知识管理（1）学校为什么这样选择呢？因为升学率是学校的“命根子”：要招到好的学生，靠升学率；学校的拨款，与升学率相关；教师的奖金，与升学率相关。实际上，升学率高的学校，往往能进入一个良性循环：因为升学率高，能够招到质量高的生源，质量高的生源又为升学率提供了保障。而且，升学率高的学校还可以收取高的择校费等。反之，升学率低的学校往往进入一个恶性循环。由于政府规定小学和初中就近入学，导致升学率高的学校附近的房地产的价格都

27、大幅上升。在市民的眼中，学校的好坏与升学率是联系在一起的。博弈论与知识管理素质教育的博弈论分析素质教育的博弈论分析36教育博弈论与知识管理（1）博弈论与知识管理素质教育的博弈论分析素质教育的博弈论分析家庭B 请家教不请家教家庭A 请家教3，38，-1不请家教-1，86，6家教博弈收益矩阵家教博弈收益矩阵假设给孩子减负的收益为2，花钱请家教的收益为-1，考上好学校的收益为9，考不上好学校的收益为-3，维持原来升学状况（即指大家都请家教或都不请家教的情况）为4。都不请家教时，每个家庭的收益为2+4=6；大家都请家教时，每个家庭的收益为-1+4=3；而一个请家教一个不请家教时，请家教的得到收益-1+

28、9=8，不请家教的得到收益-3+2=-1。37教育博弈论与知识管理（1）家庭A会这样考虑，如果我请家教，家庭B不请家教，那么，虽然我花了点钱，但我的孩子升学的可能性提高了，而家庭B的孩子升学的可能性降低了，不仅如此，我的孩子还有可能上更好的学校；如果我请家教，家庭B也请家教，那我除了花点钱，也没有耽误孩子升学；反过来，假设我不请家教，如果家庭B也不请，那倒没什么，怕就怕人家请了，那我的孩子就要吃亏了，到时候考不上重点学校不说，也许连一般的学校都考不上。所以，我要请家教。同样的道理，家庭B也是这样考虑的。于是，大家都请家教。结果不止是多花了钱，素质教育的目的根本就实现不了。现实就是这样的，搞素质

29、教育的结果，是让中学教主科的老师得了利，课堂上讲的东西少了，要改的作业少了，这些工作转移到了课后。关键是，课后做这些工作的报酬比课堂上做要高得多。博弈论与知识管理38教育博弈论与知识管理（1）博弈论与知识管理案例分析1、彩电价格大战彩电价格联盟的破产策略低价高价低价0，03，-1高价-1，31，1伯特兰德寡头垄断（同质产品，价格竞争）海信长虹上策均衡上策均衡39教育博弈论与知识管理（1）博弈论与知识管理2、朗讯中国“贿赂门”事件o案例分析o对于任何进入中国市场的跨国公司而言，都面临着囚徒困境。行贿还是不行贿的问题o不行贿，项目获得与否跟实力有关o如果大家都行贿，最终结果是根据实力和行贿的额度而

30、定o实力相当，不行贿各有50机会o如果一方行贿一方不行贿，行贿者胜出40教育博弈论与知识管理（1）博弈论与知识管理o那么，这种情况下，企业如何选择？o每个企业必须考虑对手的行为o最终的结果就是大家都行贿o行贿之风的危害甚大o一方面影响政府官员、政治家及机构的决策和行为o另一方面，影响到消费者对市场的信心o因为企业要么降低标准，要么冒着失去业务的风险o这种情况下，提高行贿的成本，反行贿法41教育博弈论与知识管理（1）博弈论与知识管理3、广告战o厂商A和B销售相互竞争的产品，并正在决定是否采取广告计划。各个厂商会受到竞争者的决定的影响。其报酬矩阵为下表。其中的数字表示A、B厂商的利润。o各个厂商应

31、该选择什么策略？厂商B做广告不做广告厂商A做广告10，515，0不做广告6，810，2上策均衡：两个厂商都选择做广告上策均衡：两个厂商都选择做广告42教育博弈论与知识管理（1）博弈论与知识管理4、公共地悲剧、公共地悲剧l英国人哈定于1968年科学：十八世纪以前，苏格兰地区大量草地，由于属公共资源导致过度放牧，致使草地消失，生态破坏43教育博弈论与知识管理（1）博弈论与知识管理甲乙两个牧民，假设养2只羊，每只羊可带来价值100元，养3只羊每只羊可带来价值60元，养4只羊每只羊可带来价值40元，每个牧民可决定养1只还是2只。牧民乙1只2只牧民甲1只100，10060，1202只120，6080，8

32、044教育博弈论与知识管理（1）博弈论与知识管理o5、公共产品的供给如果大家都出钱兴办公用事业，所有人的福利都会增加。问题是，如果我出钱你不出钱，我得不偿失，而如果你出钱我不出钱，我就可以占你的便宜。所以每个人的最优选择都是“不出钱”，结果使所有人的福利都得不到提高。o6、军备竞赛两国都不搞军备竞赛，都把资源用于民用，两国福利都变好。但由于都怕受威胁而大搞军备竞赛，结果两国福利都变得更糟。o7、经济改革经济改革要付出成本（包括风险），而改革的成果大家享受，结果是，尽管人人都认为改革好，却很难有人真正去改革，大家只好在都不满意的体制下继续生活下去。o8、抢劫者抢东西时乘客为什么不反抗？ 4

33、5教育博弈论与知识管理（1）博弈论与知识管理斯特恩巴赫是费城的一个家庭保健医生，她很奇怪为什么辉瑞公司（Pfizer）的五位不同推销员重复上门到她的诊所推销同样的止痛药Betra及Celebrex。她在贮藏室里一个像冰箱大的柜子里已装满了Bextra和Celebrex，她说，“众多的推销员重复同样的产品，没有任何新意，实在是离奇。” 长达十年的招聘狂潮使制药业的推销员人数增加到90000，为原来人数的三倍。制药业人士笃信：只要推销员与医生推销一种药越频繁，医生越有可能多开此药。据统计，2003年制药业在推销员工上花费为120多亿美元，在药物广告上花费为27.6亿美元。根据联邦政府的报告，美

34、国国内在处方药上的支出激增14%，达到1，610亿美元。专栏制药公司的销售大战（摘自华尔街日报）BetraBetra辉瑞推销员止痛药医生2003年美国制药业推销员工与药物广告花费（单位：亿美元）46教育博弈论与知识管理（1）博弈论与知识管理专栏制药公司的销售大战（摘自华尔街日报）（续）尽管如此，没有任何一家制药商愿意第一个单方面裁军。葛兰素史克公司（GlaxoSmithKline）的推销员队伍是如此壮大：它只需要七天就可以联系到美国80%以上的医生。“这有必要吗？”葛兰素史克的CEO加涅尔说：“应该说是没有必要，但是如果我的竞争对手能而我做不到，我们就处于劣势。这的确是以最坏可能的方式进行的

35、军备竞赛。” “拥有众多的推销员不是竞争优势的源泉”，默克公司的主席和CEO吉尔马丁补充说。他说制药商通过发现新药来获得优势。然而，默克公司2001年起在美国已增加了1500名推销员，使得总数达到约7000人。既然谁都知道拥有众多的推销员并不是竞争优势的源泉，那为什么各家制药公司的推销员仍然在不断膨胀呢？引自周林，商业战略决策：博弈论的应用47教育博弈论与知识管理（1）囚徒困境的启示囚徒困境的启示“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们

36、必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。48教育博弈论与知识管理（1）“纳什均衡”对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。国富论中有这样一句名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。49教育博弈论与知识管理（1）从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的

37、基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。50教育博弈论与知识管理（1）博弈论与知识管理关键点：o寻找占优策略检查一下你是否存在占优策略，如果有，就选择占优策略o站在对手的位置上思考问题如果你没有占优策略，那么从你对手角度考虑博弈。如果对手有占优策略，预期他将按占优策略行动51教育博弈论与知识管理（1）博弈论与知识管理囚徒困境的现实意义：个体理性与集体理性的冲突导致“囚徒两难困境”的主要原因利己主义，个

38、体理性。52教育博弈论与知识管理（1）麦吉的礼物麦吉的礼物欧亨利麦吉的礼物描述的这样一个爱情故事。新婚不久的妻子和丈夫，很是穷困潦倒。除了妻子那一头美丽的金色长发，丈夫那一只祖传的金怀表，便再也没有什么东西可以让他们引以为傲了。虽然生活很累很苦，他们却彼此相爱至深。每个人关心对方都胜过关心自己。为了促进对方的利益，他们愿意奉献和牺牲自己的一切。明天就是圣诞节了，小两口都是身无余钱。为了让对方感受到自己的爱和生活的惬意，每个人还是悄悄的准备一份礼物给对方。博弈论与知识管理丈夫卖掉了心爱的怀表，买了一套漂亮发卡，去配妻子那一头金色长发。妻子剪掉心爱的长发，拿去卖钱，为丈夫的怀表买了表链和表袋。

39、53教育博弈论与知识管理（1）最后，到了交换礼物的时刻，他们无可奈何地发现，自己如此珍视的东西，对方已作为礼物的代价而出卖了。花了惨痛代价换回的东西，竟成了无用之物。出于无私爱心的利他主义行为，结果却使得双方的利益同时受损。欧亨利在小说中写道：“聪明的人，送礼自然也很聪明。大约都是用自己有余的物事，来交换送礼的好处。然而，我讲的这个平平淡淡的故事里，两个住公寓的傻孩子，却是笨到极点，彼此为了对方，白白牺牲了他们屋檐下最珍贵的财富。”从这段文字看，欧亨利似乎并不认为这小两口是理性的。且让我们暂时抛开爱情的温馨，单从利益的角度来解读。我们假定，他们每个人，有一个“毫不利己，专门利人”的偏好系统，毫

40、不考虑自身利益，专门谋求别人的幸福。博弈论与知识管理54教育博弈论与知识管理（1）这样，个人选择付出还是不付出，只看对方能不能得益，与自己是否受损无关。以这样的偏好来衡量，最好的结果自然是自己付出而对方不付出，对方收益增大；次好的结果是大家都不付出，对方不得益也不牺牲；再次的结果是大家都付出；最坏的结果是别人付出而自己不付出，靠牺牲别人来使自己得益。我们不妨可用数字来代表个人对这四种结果的评价：第一种结果给3分，第二种结果给2分，第三种结果给1分，最后那种给0分。博弈论与知识管理不难看出，无论对方选择付出，还是选择不付出，个人自己的最佳选择都是付出。然而这并不是对大家都有利的选择。事实上，大

41、家都选择不付出，明显优于大家都选择付出的境况，这就达到了上文提到的纳什均衡。55教育博弈论与知识管理（1）背叛博弈论与知识管理合合作作56教育博弈论与知识管理（1）囚徒困境的三个问题1、两个参与者之间的博弈，多个呢？人质困境，竞争劫持2、先发制人，还是后发跟随？枪手博弈，轮盘赌，3、单次博弈，如果多次重复博弈呢？爱克斯罗德实验，道德的力量（猴子实验）博弈论与知识管理57教育博弈论与知识管理（1）人质困境人质困境1956年2月14日苏共第二十次代表大会在莫斯科召开。24日，大会闭幕。这天深夜，赫鲁晓夫突然向大会代表们作了关于个人崇拜及其后果的报告(即所谓秘密报告)，系统揭露和批评斯大林的重大错

42、误，要求肃清个人崇拜在各个领域的流毒。报告一出，顿时在国内外引起了强烈反响。由于赫鲁晓夫曾是斯大林非常信任的人，很多人心里都有个疑问：你既然知道他的错误，为什么在斯大林生前和掌权的时候，你不提出意见而要在今天才放“马后炮”呢?博弈论与知识管理58教育博弈论与知识管理（1）后来，赫鲁晓夫又就这个话题侃侃而谈，有人从听众席里传来一张纸条，上面写着：当时你在哪里?可以想像，当时赫鲁晓夫是何等尴尬和难堪，回答必然要自暴其短，而如果不答，把纸条丢到一边，只会表明自己怯阵而丧失威信。赫鲁跷夫想了想，大声念出了纸条的内容。然后喊到：“写这张纸条的人，请你马上从座位上站起来，并走到台上。”台下鸦雀无声。赫鲁晓

43、夫再重复了一遍，台下仍然是一片死寂，投有人敢动弹一下。赫鲁晓夫于是淡淡地说：“好吧，就让我告诉你，当时我就坐在你现在所坐的那个位置上。”博弈论与知识管理人质困境人质困境59教育博弈论与知识管理（1）现实生活中，人质困境比比皆是：1、两个歹徒，劫持一车旅客无法沟通协调统一行动，没有第一个反抗者（观望）；最佳处理方式：短信报警2、束手无策的旅游团三个迟归游客，众目睽睽下点菜吃饭，胁迫其他团员等候两小时。“当年一个日本鬼子能管中国一个县”3、德国牧师马丁尼莫勒说：希特勒镇压共产主义者迫害犹太人解散商业工会迫害天主教徒镇压新教徒。明哲保身，最终成为受害者。博弈论与知识管理人质困境人质困境60教育博弈论

44、与知识管理（1）竞争劫持竞争劫持1、美国费城西区的两个互为竞争敌手的商店纽约廉价品商店、美国廉价品商店。轮番降价竞争，暗藏密道相同；兄弟俩价格大战既促销，又阻止其他竞争者介入。2、纽约立体音响商店“疯狂艾迪”的口号：我们不会积压产品。我们的价格是最低的、我们的价格是疯狂的保证如此。竞争对手纽瓦克&刘易斯的策略：终生低价保证，差价双倍赔偿，结果形成心照不宣的价格联盟。并利用无知的消费者扮演了价格联盟的执法侦探。博弈论与知识管理61教育博弈论与知识管理（1）博弈论与知识管理三个火枪手三个火枪手甲（甲（40%40%）乙：乙：60%60%丙（丙（80%80%）同时开枪乙乙枪枪法法比比甲甲好好，对对我

45、我威威胁胁大大，先干掉他先干掉他丙丙枪枪法法最最好好，先先干干掉掉他他，下下轮再收拾甲轮再收拾甲丙丙枪枪法法最最好好，比比乙乙更更有有威威胁胁，趁乱先干掉他趁乱先干掉他存活几率存活几率甲甲100% 乙乙20% 丙丙24%62教育博弈论与知识管理（1）博弈论与知识管理三个火枪手三个火枪手甲（甲（40%40%）乙：乙：60%60%丙（丙（80%80%）轮流开枪二轮乙乙枪枪法法比比甲甲好好，对对我我威威胁胁大大，先干掉他先干掉他丙丙枪枪法法最最好好，先先干干掉掉他他，下下轮再收拾甲轮再收拾甲空空开开一一枪枪，乙乙、丙丙将将对对决决，下下轮还有机会轮还有机会二轮后存活几率二轮后存活几率甲甲75

46、.52% 乙乙10.08% 丙丙12.67%63教育博弈论与知识管理（1）轮轮盘盘赌赌巴里（策略思维的作者之一）参加剑桥大学的五月舞会，轮盘赌的胜者将免费获得下一年度舞会的入场券。最后一轮，巴里赢得700筹码，独占鳌头；第二名是一女生拥有300筹码。博弈论与知识管理如果巴里采取跟随策略，模仿女生的做法同样把300压在其选的位置上，那么无论输赢，都能保证他领先对方400筹码。女生获胜的唯一机会：1、巴里先下注，2、她与巴里押相反的颜色。两人对决不具备囚徒困境的信息不对称条件。但巴里应选择跟随策略，而不能迷失目标。64教育博弈论与知识管理（1）重复博弈重复博弈1) 假定重复10次，而且局中人

47、知道这些次数，合作的解要从最后一局来说明：每一轮的优超策略都是欺骗。2)如果博弈反复无限次数，或许值得合作：针锋相对（tit-for-tat）策略或一报还一报。65教育博弈论与知识管理（1）博弈论与知识管理密歇根大学的爱克斯罗德教授首先邀请全世界的学者递交自认为最优的策略程序，然后将这些策略相互之间交替进行不特定次数的“重复囚徒博弈”，根据最终排名来判定优劣。计算机模拟计算机模拟无限重复博弈无限重复博弈第一轮第一轮1414个程序之个程序之间的竞赛，有八个是间的竞赛，有八个是“善意的善意的”，这些永远不，这些永远不会背叛的善意程序，轻会背叛的善意程序，轻易地赢了易地赢了6 6个非善意的个非善意的

48、程序。结果显示，程序。结果显示，“一一报还一报报还一报” 的简单策的简单策略获得第一略获得第一。第二轮竞赛结果表明，第二轮竞赛结果表明，在在6363个程序的前个程序的前1515名里，名里，只有第只有第8 8名哈灵顿程序名哈灵顿程序是是“有限善意的有限善意的”；在；在最后最后1515名中只有名中只有1 1个总个总是合作的程序是是合作的程序是“善意善意的的”，夺魁的仍然是一，夺魁的仍然是一报还一报策略。报还一报策略。66教育博弈论与知识管理（1）博弈论与知识管理计算机模拟计算机模拟无限重复博弈无限重复博弈第一步合作，此后每一步都重复对方上一步的行动：合作或背叛。如此简单的程序之所以反复获胜，是因

49、为它奉行了以其人之道还治其人之身的原则，并且用以下五个特征最有效地鼓励其他程序同它长期合作。善良善良可激怒可激怒宽容宽容简单简单不妒忌不妒忌坚持永坚持永远不首远不首先背叛先背叛对方。对方。开始总开始总是选择是选择合作。合作。如果对方如果对方出现背叛，出现背叛，能够及时能够及时识别并采识别并采取报复行取报复行动。绝不动。绝不宽恕。宽恕。不因一次不因一次背叛，而背叛，而永久怀恨永久怀恨报复。对报复。对方改过自方改过自新，可以新，可以既往不咎。既往不咎。逻辑思路逻辑思路清晰，易清晰，易于识别，于识别，能让对方能让对方较短时间较短时间内辨别其内辨别其策略所在。策略所在。不耍小聪不耍小聪明，不占明，不

50、占对方便宜，对方便宜，不妒忌对不妒忌对方成功，方成功，不和对方不和对方争强好胜。争强好胜。67教育博弈论与知识管理（1）以直报怨的人生哲学1、夜半熟睡的教授对女邻居无理的回应。女邻居半夜电话：“麻烦你管一下你的狗，不要再让他叫了。”第二天半夜两点，教授打电话给女邻居：“夫人，昨天我忘记告诉你，我们家没有养狗。”2、北京“机场到九华山庄绕路的高额出租费”以色列美国教授打出租的遭遇。3、上海出租司机商量绕路高架桥省时间，绕路费用的分担。博弈论与知识管理68教育博弈论与知识管理（1）道德的约束道德的约束道德也是对某些不合作行动的惩罚机制。这种机制的出现使得人类从囚徒困境中走出来。道德感自然地使得人们

51、对不道德的或不正义的行为谴责或者对不道德的人采取不合作，从而使得不道德的人遭受损失。这样，社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道德、正义或非正义的观念，就自动对行为产生了调节作用。但是在日常生活的交际中，单纯依靠对手的道德自律来达成合作是不保险的。针对这个问题我们可以通过对道德因素的考虑，对博弈策略进行相应的调整把交际变成长期的、多边的，从而形成诚实守信的动力与压力。博弈论与知识管理69教育博弈论与知识管理（1）猴子实验道德的起源博弈论与知识管理70教育博弈论与知识管理（1）囚徒两难困境的深度思考囚徒两难困境的深度思考1、为什麽结果对整体而言是最差的？产生这种结果的原因？如何破解？如何应用？甲乙两囚犯整体受益是三种情况：分别是3+3=6、15+1=16、10+10=20年徒刑。信任、信息沟通（日常沟通、现时沟通）、惩罚机制、道德约束等的重要性。2、通过“囚徒两难困境”得出何结论？“背叛”是收益的；近期利益，远期利益；直接利益，间接利益；信誉、关系的收益考虑。博弈论与知识管理71教育博弈论与知识管理（1）

展开阅读全文

教育博弈论与知识管理1课件

最新文档