博弈论的一些论文

上传人:j****9 文档编号:45998546 上传时间:2018-06-20 格式:DOC 页数:9 大小:52.50KB
返回 下载 相关 举报
博弈论的一些论文_第1页
第1页 / 共9页
博弈论的一些论文_第2页
第2页 / 共9页
博弈论的一些论文_第3页
第3页 / 共9页
博弈论的一些论文_第4页
第4页 / 共9页
博弈论的一些论文_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《博弈论的一些论文》由会员分享,可在线阅读,更多相关《博弈论的一些论文(9页珍藏版)》请在金锄头文库上搜索。

1、他们在机制设计理论方面的开拓性工作,机制设计理论为博弈论的运用搭建了一个更加广阔 的平台,同时与经济政策的关系也更为密切。至此,共有 13 位经济学家和数学家与诺贝尔经 济学 奖结下不解之缘。 那么博弈论为什么能在经济学领域产生如此巨大的影响呢?又何以在经济分析中独辟蹊径, 形成了能与(随机)一般均衡理论相对立的另一种经济学研究范式?这恐怕还得益于博弈论的 起 源和其中蕴含的策略思维。博弈论从本质上讲是一种游戏理论,在给定游戏的特定规则(信 息结 构)下,游戏参与人要想赢得游戏就必须对其他参与人的心理和可能采取的行动进行反复揣 摩,并 据此决定和调整自己的行为,这就是制定策略或对策的过程。为此

2、,/博弈论 0 一般也称为/对 策 论 0 或/游戏理论 0。加之博弈论的游戏情节一般也源于人们的真实生活,是生活环境的抽象 和概 念化,因此,博弈的结果不仅仅是游戏胜败的表现,而且更是生活哲理的凝结,它为人们深刻理 解和 准确把握各类社会经济现象提供了一份独特的视角,同时对制定社会规则和经济政策具有现 实的 指导意义。 本文试图从一些常见的实例介绍和展示博弈论中策略思维的演进过程,这些实例都是我们能 在生活中观察到的,并且假设读者已经具备一定的博弈论和拍卖理论的基础知识。 一、/囚徒困境 0:合作还是不合作考虑这样一种情形,小偷甲和乙联手作案,私入民宅被警方逮住,但未获证据。警方将两人 分

3、别置于两所房间分开审讯。若一人招供但另一人不招,则招供者立即释放,不招供者判入狱 10 年; 若二人都招供则各判刑 8 年;若两人都不招供则因未获证据但私入民宅而各拘留 1 年(见表 1)。试问甲和乙应该如何抉择自己的行为?理性行为人的想法是这样的:对甲来说,无论乙是选择 /招 0 还是/不招 0,选择/招 0 都会比选择/不招 0 来得更好。因此,/不招 0 是相对于/招 0 的严 格劣 策略,所以,甲会选择/招 0。同理,根据对称性,乙也会选择/招 0,于是纳什均衡解便是甲乙两人 都 招供,各判 8 年。这个例子表明,运用/剔除严格劣策略 0 的方法可以找到问题的均衡解。虽 然甲 乙两人都

4、选择/不招 0 是集体最优的,但是这个结果不会出现,或者说,甲乙双方都存在偏离这 一结 果的激励,个体理性与集体理性之间存在着冲突。假设从两人都不招供出发,只要其中一人变 卦, 他就能谋取更多的利益。为此,即便甲乙两人都有不招供的约定在先,这样的约定也只能是/ 不可 置信的承诺 0 而已,故而纳什均衡解具有内在稳定性。表 1 囚徒困境博弈支付矩阵招供不招供 招供-8, -8 0, -10 不招供-10, 0 -1, -1表 2 修路博弈支付矩阵 修不修 修 1, 1 -1, 3 不修 3, -1 0, 0下面我们让模型活动起来,也就是说,考虑甲乙两人刑满释放后重新作案,却又被警方逮住, 重 复

5、上述过程,以此往复。这样的情形称为重复博弈,重复博弈的每次博弈称作阶段博弈。分析 阶段 博弈和分析一次性博弈的情形十分类似,理性行为人在行动前,依旧会根据各种方案收益与成 本的 比较,作出最优选择。但不可忽略的是,行为人过去的行为信息将作为共同知识影响行为人当 下的 决策。在囚徒困境的重复博弈中,有两种著名的策略,一种叫/冷酷 0 策略(grim strategy),另一 种叫 /针锋相对 0 策略(tic-for-tac strategy)。所谓/冷酷 0 策略是指对于事先两人均不招供的攻守 同盟, 一旦有人招供,则对方在以后的任一阶段博弈中,都将选择招供,以示对对方违约的惩罚,对方 也将

6、丧失改正错误的机会;而/针锋相对 0 策略是指行为人在本阶段选择对方前一阶段的行为选 择,相 )36) #上海经济研究# 2010 年第 1 期 创新,开发新产品,而中小企业是小猪,它们不会进行大规模的技术创新,而是采取/跟随策 略 0,等待大企业的新产品形成新的市场后,仿制大企业的新产品展开销售。 三、拍卖机制:不对称信息下的买与卖在/囚徒困境 0 和/智猪博弈 0 中,参与人的信息是公开且对称的,或者说参与人之间不存在 不 对称信息,但是在更多的情形下,参与人之间的信息不是公开的,市场上的尔虞我诈往往无法 避免。 以拍卖市场为例,考虑一件古董需要拍卖,有许多人参加竞争性拍卖。这件古董在每个

7、买主心 中有 一个估价。但是,卖主不知道买主的估价,买主当然也不会老老实实地将其对古董的估价告诉 卖 主,不同买主之间也不知道互相之间的估价。因此,有关标的和竞标的信息都是不对称的。假 定采 用/英式拍卖 0,买主们轮流出价,直到开出最高价的买主拿走古董并支付这个价格。但遗憾的 是, 如果按这种拍卖方法,古董并不能按买主心中的最高的估价卖出。比如,当买主中的最高估价 为 10 万元,第二高估价为 8 万元时,当估价最高的买主开出 9 万元时,便可买走其估价为 10 万元 的古董而只支付 9 万元。由于这是公开竞价,所以会出现围标问题,即买主们合谋压价。为了避 免围 标,一种常用的方法是/一级密

8、封价格拍卖法 0,买主每人将其开出的价格写入一个信封,密封 后交 给卖主。卖主拆开所有信封,将古董卖给信封中出价最高的人,并要求支付这个价格。但是/ 一级 密封价格拍卖法 0 却不能诱使买主按照其真实估价进行出价,这是因为,买主总可以报一个略 低于 其真实估价的价格获得标的物,从而赚取其中差价。 经济学家维克瑞发明的/二级密封价格拍卖法 0,既可避免围标,又可诱使买主们报出真实估 价。他的方法是这样的,先要求每个买主将出价写入一个信封,密封后交给卖主,卖主拆开信 封后 宣布将古董卖给出价最高的人,但只需支付开出的第二高的价格。譬如,出价最高的为 10 万 元,第 二高的为 8 万元,古董就卖给

9、开出 10 万元的人,但他只需支付给卖主 8 万元。对每个买主来 说,他 不知道其他买主的估价,但给定其他买主的估价,他一旦获胜,支付的第二高的价格是固定的, 不会 随他开出的价格而改变;但他开出的价格愈高,获胜的可能就愈大;但是,他不能开出比他的价 值估 价更高的价格。因为一旦存在别的人开出的价格比他的价值估价还要高,当他获胜时,就必须 以高 出他的价值估价的价格购买古董,对他来说是得不偿失的。所以,每个人都会如实地按心中的 估价 开出价格。如果所有人的估价是一样的,古董就以真实的最高价值卖出。维克瑞拍卖法可以 诱使 买主说出真话,因而这种方法也被成为维克瑞机制。上世纪七十年代美国联邦政府运

10、用维克 瑞招 标法进行公共工程招标,为联邦政府节省了大笔开支。 到目前为止,经济学家对拍卖机制的研究获得了丰硕而卓越的成果,不仅形成了以/英式拍 卖 0、/荷兰式拍卖 0、/一级密封价格拍卖法 0 和/二级密封价格拍卖法 0 等四种拍卖方式为 核心的 基础理论,并围绕不同的拍卖方式探讨和比较投标者及卖主的收益,而且还在投标者风险厌恶、 投 标者之间具有共同信息、非对称估价分布,以及存在由非对称估价分布导致的二级交易市场 (resale)的情况下探讨和比较上述问题,从而颠覆了基础理论的前提假设,特别是对二级交易市 场 的研究,对解释我国经济转轨过程中国有企业的资产流失现象具有重要的启示意义。在市

11、场 及之 设计方面,一种富有想象力的研究思路是,假定存在某种特殊的/机器 0 可以通过支付规则和 分配 规则来直接替代参与人报价策略函数的生成过程,当然参与人的报价也都必须遵循博弈论对 理性 经济人的假定,也就是说,策略函数的生成结果总是可以被预期的,那么这样的/机器 0 就能使得人 类本身变得更加单纯,策略被一组规则替代,或者说,最优策略就是按市场规则行事,从这个意 义上 讲,一个好的市场经济就是要不仅要让好人做好事,而且还要让坏人也做好事。政府的职责就 在于 为民众提供一系列激励相容约束下的好的市场机制,比如能始终确保投标者说实话(truth- telling) 的 VCG 机制,以及能同

12、时满足效率、激励相容及预算平衡(budgetbalance)的 AGV 机制,后者 在各 )38) #上海经济研究# 2010 年第 1 期 /冷酷 0 策略,/针锋相对 0 策略允许行为人存在违约的激励,因而它不会是精炼均衡。模型表 明合作潜在地具有/囚徒困境 0 的逻辑结构,因而我们可借此分析日常生活中的许多合作与不 合作 现象。 政府提供公共品便是极好的一例。设想有两户相邻的住户,需要一条好路从居住地通往公路。修一条路的成本为 4,每个住户能从修好的路上获利为 3。如果两家住户共同出资联合修路, 并平 均分摊修路成本,则每家住户获得净利为 1;当只有一家住户单独出资修路时,修路者获利为-

13、1, /搭便车 0 者,即不出资但仍可以使用修好的路的另一住户获利为 3(不考虑产权问题)(见第 36 页 表 2)。通过/剔除严格劣策略 0 方法,可以得到,两家住户都不会出资修路。为了解决这条新 路的 建设问题,需要政府强制性地分别向每家征税 2 单位,然后投入 4 单位资金修路,并使两家住 户都 得到 1 单位的利益。这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修 建的原 因。同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,而私人投资的 积极性 一般都不高。 /囚徒困境 0 重复博弈还能用来解释企业(或者银行和企业)之间的合作问题。当一次性违约 的收益大于

14、失信所必须付出的代价时,企业就存在偏离合同规定行事的激励。这种内生的激 励表 明,/损人利己 0 也是行为人的理性选择。如果企业之间致力于长期合作,就应当设法改变合 作机 制,降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外,一种行之有效的方 法便 是采取/冷酷 0 策略,以提高失信成本。然而传统博弈论对理性的极端认识又束缚了它对解释 现实 的能力,随着对供应链、企业联盟、虚拟企业和关系银行等中间性组织研究的不断深入,研究 的重心 逐步从对行为的约束转移到对关系契约的规范上,聚焦那些在合作中起关键作用的、可自我 实施(sel-f enforcement)的隐性契约。 二、智猪博弈:

15、创新还是模仿/囚徒困境 0 中参与人地位是对等的,如果参与人地位不对等,又会发生怎样的情况的呢?假 设猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的 食槽 中就会有 10 单位的猪食进槽,但按一下按钮会耗去相当于 2 单位猪食的成本。如果大猪按 钮取 食,小猪在一旁等待,则大猪能吃到 9 单位食物而小猪仅能吃到 1 单位食物;如果两猪同时按 钮取 食,则大猪吃 7 单位,小猪吃 3 单位食物;如果小猪按钮取食,大猪在一旁等待,则大猪吃 6 单位 而 小猪吃 4 单位食物(见表 3)。这个博弈没有/剔除劣策略均衡 0,因为大猪没有劣策略。但是, 小猪 的劣策略是

16、/按 0,因为无论大猪作何选择,小猪选择/等待 0 是比选择/按 0 更好一些的策略。 所 以,小猪会剔除/按 0,而选择/等待 0;大猪知道小猪会选择/等待 0,从而自己的最优选择是/按 0, 所以纳什均衡解就是(按,等待)。表 3 智猪博弈支付矩阵小猪 大猪 按等待 按 5, 1 4, 4 等待 9, -1 0, 0在现实经济生活中,有许多/智猪博弈 0 的例子,它反映的是一种参与人地位不对等的博弈 结 构,这种不对等可以是参与人拥有的信息和支付函数,也可以是参与人所采取的策略和行动。 比如 在股票市场上,大户是大猪,他们进行技术分析,收集信息、预测股价走势,而大量散户就是小 猪,他 们几乎不花成本去进行技术分析,而是跟着大户(基金) 的投资策略进行股票买卖,这就是股票市场上著名的 /散户跟大户 0 现象。在股份公司中,大股东是大猪,他 们收集信息、监督经理,拥有决定经理任免的投票权,而 小股东是小猪,他们不直接花精力去监督经理,投票权重 也往往无足轻重,但他们却可以从大股东

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号