综合i类与ii类理性人的博弈策略

资源描述

《综合i类与ii类理性人的博弈策略》由会员分享，可在线阅读，更多相关《综合i类与ii类理性人的博弈策略（15页珍藏版）》请在金锄头文库上搜索。

1、综合I类与II类理性人的博弈策略两人零和博弈作为较归整的形式，在博弈论的早期研究中已经得到的深入讨论。本文引入了类理性与类理性的概念，认为现实博弈中的参与人往往既可能从类理性的角度采取战略，也可能是从类理性人的角度出发，因此，构造了一个综合了类和类理性特征的支付矩阵，通过对一些常见的非零和博弈实例进行讨论，认为这一模型可以解决战略选择的不确定性问题。但本文没有对此进行严格的数学证明。在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征,即总是寻求自身的最大化利益，选择能使个人利益最大化的策略。在计算收益的时候，使用的是个人所得。这是一个“绝对量”，而现实中，也存在着另外一种

2、情况，也就是参与者之间除了考虑自己的所得之外，也很关心对方的所得，并比较相互间的差异，采取使“相对”所得最大化的策略。我们不妨把以追求相对所得最大化的行为人称为II类理性人，并从博弈论的角度对他们的行为模式进行研究。具有II类理性特征的现象在很多方面都有存在。比如，我们在人际交往中确实会碰到一些“损人利己”的人，也会见到“损人不利己”的人，从我们观点看来，他们是非理性的，但是进行换位思考就会发现，其实他们的行事原则是相对来说，总要让自己占便宜或者自己吃得亏比对方少，至于别人是否会吃亏，不是他们考虑的因素，这也是一种“理性”行为，也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种

3、不公平,并从自己的角度出发进行策略选择。在激烈的市场角逐中，竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地，希望对手先被淘汰而自己会坚持到最后。如果做不到这点，也要最大程度地削弱对手力量，使其一蹶不振而不会对自己再构成威胁。这种商场竞争，并期望自己能笑到最后的思维，也是“理性”的。有研究表明，国际关系中这样的II类理性的例子更不少见。这些虽然是比较极端的例子，现实生活中，更多的可能是，每个人或组织都会考虑自己的所得，并期望自己的所得比别人的大。关键是对两种所得在考虑时的权数是随情况不同而变化的。如果否定在策略选择中的II类理性因素，可能会对一些现象无法解释。尽管从道德角度讲

4、不值得提倡，而且从价值评判上总是受到谴责,但作为一种存在的现象,仍然有必要加以研究。但本文从II类理性个体的博弈战略开始，并过渡到一个综合了I类和II类理性行为的博弈模型，对例中设计的参与人的战略选择，只进行经济学分析而不做道义上的衡量。当博弈参与者是II类理性人时,此时收益矩阵的取值有一定的规律。假设两个参与人甲和乙都是II类理性人时，对比在I类理性的得益矩阵(图)乙S1 S2甲 S1 (m1,n1) (m2,n2)S2 (m3,n3) (m4,n4)图类理性参与人收益矩阵类理性参与人的得益矩阵如下图所示：乙S1 S2甲 S1 (m1-n1,n1-m1) (m2-n2,n2-m2)S2 (m

5、3-n3,n3-m3) (m4-n4,n4-m4)图类理性参与人收益矩阵很明显，在类理性参与人进行的博弈里，在每一个战略组合下，双方的得益之和必为零，此时的博弈具有零和的性质。这就是早期博弈论中重点研究的二人零和博弈的情形,在1910年1930年间,作为绝对竞争的形式,零和博弈被认为是博弈理论中的主要形态得到了深入的研究。而且对零和博弈的研究成果成为了现代博弈理论中很多新理论的基础概念。作为一个练习，我们把常见博弈模型改为零和博弈情形，来看相应的结果会是怎样的。一般认为，零和博弈是一种常和博弈，而最普遍意义下的博弈情形是非常和的。例1囚犯困境甲，乙涉嫌同谋犯罪，分别在两个房间被提审。提审官预先

6、向两人交代政策：如果他们都承认犯罪事实，各判刑10年；如果两人都否认，双方都无罪释放；如果一方认罪一方抵赖，认罪方获500元奖励，抵赖方被判15年。在非零和博弈情形下的支付矩阵如下：乙承认抵赖甲承认 (-10,-10) (5,-15)抵赖 (-15,5) (0,0)图3纳什均衡策略是（承认，承认），如果甲乙两人是II类理性人，他们的相应支付矩阵就变成了：乙承认抵赖甲承认 (0,0) (20,-20)抵赖 (-20,20) (0,0)图4可以看出，纳什均衡策略还是（承认，承认）。例2春节前夕，某小镇上两个商铺甲和乙同时看到一个赚钱机会：去城里贩一批鞭炮回来卖，购货款加上运输费共5000元，

7、如果没有竞争对手，这批货在小镇上能卖6000元；但如果另一家商铺也同时在小镇上卖鞭炮，价格下跌使得这批鞭炮只能卖4000元。对于甲乙都是I类理性人而言，有支付矩阵：乙进货不进货甲进货 (-1000,-1000) (1000,0)不进货 (0,1000) (0,0)图5（不进货，进货）和（进货，不进货）为纳什均衡策略。但是问题在于，甲乙双方同时行动，而互相不知道对方采取的行动。如果甲乙都是II类理性人，那么情况会变成：乙进货不进货甲进货 (0,0) (1000,-1000)不进货 (-1000,1000) (0,0)图6此时的纳什均衡策略就是（进货，进货）。例3利己与利他甲乙作为I类理性

8、人，其支付矩阵为乙利己利他甲利己 (1,1) (4,0)利他 (0,4) (3,3)图7纳什均衡是（利己，利己）；甲乙作为II类理性人，其支付矩阵转化为：乙利己利他甲利己 (0,0) (4,-4)利他 (-4,4) (0,0)图8纳什均衡仍然是（利己，利己）。例4智猪博弈一头大猪和一头小猪被关在同一个猪圈里。猪圈的一头安装着一个特制的按键，另一头安装着一个食槽。但一头猪按下按键时，会有10单位的食物进入槽中，但按键的猪会付出2单位的成本；如果大猪先到食槽，则小猪只能吃到1单位的残羹剩饭；但若小猪先到的话，则它能吃到4单位的食物。若两猪同时到，则小猪可吃到3单位的食物。如果按照I类理性，

9、有支付矩阵：小猪按键等待大猪按键 (5,1) (4,4)等待 (9,-1) (0,0)图9纳什均衡策略是（按键，等待）。在II类理性下，重写支付矩阵为：小猪按键等待大猪按键 (4,-4) (0,0)等待 (10,-10) (0,0)图10纳什均衡是（按键，等待）和（等待，等待）。有趣的是，此时小猪一定会选择等待（占优战略），而大猪无论怎么做，都是一无所获！最终结果是两头猪都会饿死。在这种情况下，两头猪的结局似乎和“布里丹的饥饿的驴”有共同点，后者因为面对同样两堆干草不能做出选择而饿死。在智猪博弈里，小猪认为自己的结果只能是损失或者既无损失又无所得，这时它会选择后者，而将责任推给大猪。现

10、实中，不大可能出现两猪都饿死的结果，因为大猪最终会明白，与其被饿死还不如去按键，此时自己会得到4单位的食物；而小猪也会因为大猪作出这样的选择，而同样得到4单位的食物。例5性别战两个恋人，男方想看拳击，女方想看芭蕾。如果需要的话，他们会牺牲自己的爱好而迁就对方。有下面的支付矩阵：女拳击芭蕾男拳击 (2,1) (0,0)芭蕾 (0,0) (1,2)图11纳什均衡是（拳击，拳击）和（芭蕾，芭蕾）。将支付矩阵做个变换：女拳击芭蕾男拳击 (1,-1) (0,0)芭蕾 (0,0) (-1,1)图12那么，（拳击，芭蕾）就是纳什均衡策略。例6斗鸡博弈两个人举着火棍从独木桥两端向中间前进，每个人都有两

11、种战略：前进或退下阵来。若两人都继续前进，则两败俱伤；如果一方前进，另一方退下来，前进者取得胜利，退后者丢了面子；若两人都退了下来，则都丢了面子。支付矩阵如下：A进退B 进 (-3,-3) (2,0)退 (0,2) (0,0)图13纳什均衡策略是（进，退）和（退，进）；按II类理性对支付矩阵进行变换后得：A进退B 进 (0,0) (2,-2)退 (-2,2) (0,0)图14纳什均衡策略是（进，进）。在上面的讨论中，可以看到，在例2中，对于I类理性参与人，（不进货，进货）和（进货，不进货）都是纳什均衡策略，采取哪个战略要取决于对方的行动，在一次静态博弈中是很难在行动之初就了解到对方的战略的，因此存在选择上的不确定性。在智猪博弈中，对于II类理性参与人而言，不能根据支付矩阵决定出大猪的战略，如何才能避免在选择时出现这样的不确定状态呢？有必要考虑某种混合战略。一般来讲，博弈的每个参与者在某些时间会按I类理性人行为模式行事，而有时又会采用II类理性人模式行事。不妨将这种组合看成是决定于概率p和q。这时候，假设甲遵循I类理性的概率是p，那么他是II类理性人的概率就是1-p,乙遵循I类理性的概率是q，相应他是II类理性人的概率是1-q。这时我们也可以构造出一种混合战略，得到支付矩阵：乙

展开阅读全文