耶鲁大学公开课博弈论笔记(博弈论24讲)

资源描述

《耶鲁大学公开课博弈论笔记(博弈论24讲)》由会员分享，可在线阅读，更多相关《耶鲁大学公开课博弈论笔记(博弈论24讲)（9页珍藏版）》请在金锄头文库上搜索。

1、博弈论作业（博弈论博弈论作业（博弈论 24 讲）讲）数应专业数应专业一、一、 1、理性人：指代这一类人，他们只关心自己的利益。 2、如果选择 a 的结果严格优于 b，那么就说 a 相对于 b 来说是一个严格优势策略。结论：不要选择严格略施策略。 3、理性人的理性选择造成了次优的结果 4、举例：囚徒困境、宿舍卫生打扫问题、企业打价格战等 5、协和谬误收益很重要， “如欲得之，必先知之” 6、要学会换位思考，站在别人的立场上看别人会怎么做，在考虑自己受益的同时，要注意别人会怎么选择二、二、 1、打渔问题、全球气候变暖与碳排放问题 2、博弈的要素：参与人、策略集合、收益 3、

2、如果策略 a 严格劣于策略 b，那么不管他人怎么选择，b 总是更好的选择 4、军队的入侵与防卫问题 5、所有人都从 1 到 100 中选个数字，最接近所有人选的数字的均值的 2/3 者为胜，这个数字是多少呢？作为理性人，每个人都会选择 67（100*2/3）以下的数，进一步假设你的对手也是理性的，你会选择 45（100*4/9）以下的数依据哲学观点，如果大家都是理性程度相当的，那么最后数字将为 1，然而结果却是 9，这说明博弈的复杂性 6、共同知识与相互知识的区别三、三、 1、利用迭代剔除法领悟中间选民问题 2、迭代剔除法就是严格下策反复消去法，不断地把劣势策略剔除出去，最

3、后只剩下相对优势的策略 3、中间选民问题就是，在两党制中，政党表述施政纲领要吸引位于中间位置的选民，他们认为在选举中处于中间标度可以吸引左右两边的选民，并以此获得胜利。 4、中间选民问题理论成立的条件是有两个参与人；政治立场能使选民相信。 5、由此延伸出来的还有加油站选址问题，两家加油站不是在不同的路口选址，而是在不确定哪个位置较佳的时候会选在同一处，这也是“中间选民定理”的凸显 6、在迭代剔除法不能运用时，比如说该博弈中博弈方 1 和 2 均没有严格下策，可以用二维坐标系画出选择策略之后的收益分布四、四、 1、罚点球：一个经过模型简化的点球模型：罚球者可以选择左路，中路

4、，右路 3 种路线去踢点球，门将可以选择向左扑救或者向右扑救（门将没有傻站着不动的 option）。罚球者的收益很容易理解出来，其结论是，无论什么时候，罚球者向中路踢都不是一个最优的选择。（当门将向左扑的概率大于 50%时，球员向右踢比较好；反正同理）。将其推广： 2、不要选择一个在任何“信念”(belief)下都不是最优策略的策略。 3、这里的信念(原文是 belief)并不是指门将会向左扑或者向右扑，而是指概率。我的理解是对中庸之道的批判。所以本例中，虽然罚球者的 3 种策略里没有劣势策略，不过还是可以用以上原则剔除掉一个策略。 4、上述模型忽略的 2 个地方，一名

5、惯用右脚的球员，他向左踢和向右踢的准确率是不同的（踢过球的童鞋们都有这种体会，右脚球员从左侧进攻射门的舒适度比从右侧射门要好很多）。门将可以选择在中路(TO BE CONTINUED) 五、五、 1、纳什均衡（简称 NE）定义 2、学习 NE 的动机：不为当时做出的决定后悔，因为已经采取了最佳策略。 3、任何参与人都严格不会改变策略，改变策略严格不会使参与人获得增益。 4、其他参与人不改变行为的前提下，自己改变行为并没有任何好处。 5、严格劣势永远不是最佳策略，最佳策略才可以出现 NE。 6、博弈会朝着趋向于一个均衡的方向自然发展，结果不断趋向一个 NE 7、较劣的不投

6、资均衡相当于较优的 NE 处于帕累托劣势 8、协调之所以能达成在于他不同于囚徒困境，它没有去说服人们采取一个严格劣势策略。六、六、 1、举一个例子“一起看电影” ，它的博弈学名叫“性别大战” ，属于协调博弈，但是不同的参与人偏爱不同 2、古诺的双寡头模型，讲的是同一个市场中只有两家公司互相竞争，该博弈介于完全竞争和垄断的两种极端情况之中，所以使得该博弈变得很有趣，在该博弈中参与人是：两家公司，策略是：生产同质商品的产量，q1、q2 表示策略，生产成本；c*q，边际成本实常数 c，市场价格：p=a-b*（q1+q2），可以画出需求曲线，收益：u1=p*q1-c*q1，垄断产量：

7、（a-c）/2b完全竞争产出：（a-c）/b古诺产出：（a-c）/3b 3、它与合伙人博弈及投资博弈都不同，它不是策略互补博弈，而是策略替代博弈，就是我的策略实施的越多，你的策略就实施的越少 4、有没有使市场利润达到最大化的双方的产量？当第一家公司产量为垄断产量时或第二家公司产量为垄断产量时，市场利润达到最大化 5、当两家公司得产量为（a-c）/3b 时，此时整个行业的总产出为 2*（a-c）/3b，而完全竞争产量为（a-c）/b，，垄断产量为 a-c）/2b，所以古诺产出介于两者之间。七、七、 1、介绍了伯川德模型，该博弈中参与人：生产相同的产品的两个公司，成本是固定

8、的边际成本，生产 1 个单位产品消耗成本 c策略：定价，该例中用 1 p代表公司 1 的价格，用 2 p代表公司 2 的价格，注意此处不同于前面课程用 s 来表示参与人的策略， 2、家庭作业，介绍了线性城市模型，一个路贯穿城市，两个公司分别坐落在 0、1 点，消费者 y 到公司 1 的距离为 y，到公司 2 的距离为 1-y，假设每个消费者买且只买一个产品。消费者会选择对他而言总成本最小的例如：在 y 点的消费者，如果从公司 1 购买则他们支付 2 1 pTy，产品的价格 1 p，和交通成本 2 Ty；到公司 2 购买则需要支付 2 1 1pTy，交通成本以距离的平方的速

9、率增长。 3、候选人选民模型，首先做出一些假设，假设选民在线上平均分布，候选人数目不固定，候选人不能选择他们的政治立场，每个选民都是一个潜在的候选人，且选民会将选票投给离他最近的候选人。在该博弈中参与人：选民策略：是否参选（选民将选票给与最近的候选人，得票最多者当选，平局掷硬币）收益：获胜赢得奖励 B，参选付出成本 C，且 B2C；若选民不参选获胜者的立场距离该选民越远，则该选民将承受越重的负面效应，若该选民在线上 X 点，获胜者在 Y 点，则承担X Y的成本，两点间距离的负向效应，也就是对方当选后给未参选的选民造成郁闷程度。八、八、 1、原有左派 1 人和右派

10、 1 人两派系，原本各占一半优势，如果左派又出现一个候选人，则左派将失去优势，右派获胜反之，右派出现新的候选人，亦可同理分析； 2、原有极左、极右两人进行较量各占一半优势时，如果新进候选人持中立态度，则他/她有可能会成为获胜者； 3、如果两个候选人极左、极右，则会出现新的候选人； 4、种族隔离：大个子、矮个子选择居所问题：至少有三个纳什均衡存在，是大个子住甲城，矮个子住乙城，是大个子住乙城，矮个子住甲城，混居且甲乙两成各占一半人口。其中为稳定均横，为弱均衡；还有可能会出现一个均衡，那就是所有人选择了甲城/乙城，后被重新随机分配，这样的结果会趋于混居。 5、一些看似不起眼的

11、博弈规则可能是很重要的条件，有可能在短时间内说明问题，尤其在建模过程中不可忽视之 6、不可轻易的根据可观察的东西来武断的下定义，比如说不能因为看到种族隔离，就认为人们喜欢种族隔离，它的存在可能与个人的偏好无关 7、石头剪刀布游戏没有纯策略纳什均衡，在玩家双方均以（1/3,1/3,1/3）的混合策略选择时，才会出现唯一的纳什均衡九、九、 1、混合策略的收益就是每个纯策略预期收益的加权平均值，该加权平均值一定位于混合策略所包含的纯策略预期收益之间 2、如果一个混合策略是你的最优策略，那么该策略中的所有纯策略本身也都是最佳策略 3、一个混合策略（P1* ，P2* ， Pn*），

12、是一个混合策略 NE，当且仅当对任意参与人i，在面对 P-i* 时他的混合策略 Pi* ，是该参与人的 BR 4、混合策略在网球比赛中的应用：本博弈不存在纯策略纳什均衡如果 V 的混合策略均衡是纳什均衡，则策略 L 与 R 的预期收益相等，类似的，如果 S 的混合策略均衡是纳什均衡，则策略 l 与 r 的预期收益相等混合策略纳什均衡 NE：V（0.7,0.3）S（0.6,0.4）如果 S 防左的概率大于 0.6，那么 V的 BR 是把球打向右侧如果 S 防左的概率小于 0.6，那么 V的 BR 是把球打向左侧十、十、 1、我们只需考虑改选纯策略是否严格有利即可，如果不存在改选纯

13、策略的严格有利改变，那么也就不存在改选混合策略的严格有利改变 2、不存在改变纯策略的严格有利改变，则任何一个纯策略的收益都与混合策略的收益相等 3、例子apple picking摘苹果 Yale Rep and see play耶鲁剧院去看戏性别大战税收问题纳税人的收益：对均衡纳税意愿有影响，决定着纳税人的混合策略是审计员的收益，不改变审计员的收益，当然也就不会改变纳税人的均衡混合策略。十一、十一、 1、进化论（Evolution）博弈论对生物学的重大影响，尤其在动物行为学中把基因看成策略，把遗传适应性当做收益，好的策略使种群不断壮大，即有适合基因的个体会繁衍，带

14、有不适合基因的个体会灭绝。将动物的行为（策略）看做是天生，而不是自由选择简化模型，专注于种内竞争，通过双人对称博弈来进行研究，很大的种群，采取的策略与生俱来，对其进行随机配对。即采取相对成功策略的个体数量会增长，相反则会减少。不存在基因的重新分配。结论：自然选择的进化结果是很糟的如果一个策略是严格劣势策略，那么它就不是 ES 2、一个经济学案例：假设市场中存在这样的公司，这些公司并不关心什么策略能最大化利润，什么策略能尽可能降低成本，它们可能毫无科学根据地选择策略，在竞争激励的市场环境下，只有那些成本较低但利润颇丰适应环境的公司才能得以生存下来。公司倒闭和基因灭绝

15、道理是类似的。十二、十二、 1、判定 ES 的方法：第一检验，对称NE（a，a）第二检验，是否是严格NE？（a，a）不是严格 NE 第三检验，a 在偏移时的收益 2、社会传统的进化（靠左行车还是靠右行车）可以有多种进化稳定的社会传统存在；社会没有绝对的高效率，习惯没有必要一样好 3、自然界中混合均衡的两个解释基因本身是随机的稳定混合也意味着在 ES 中，以这种比例稳定存在 4、鹰鸽之争十三、十三、 1、帽子里的钱 2、顺序博弈参与人 2 在作出决定之前知道参与人 1 的决策，且参与人 1 知道这种情况。关键问题是作出预测，沿着树形图向下看，站在后行动参与人的立场上思

16、考，看下级参与人会有什么动机，找到他们的 BR，再根据树形图倒回来。即向树的分枝看，然后在回到树的主干上来 3、逆向归纳法 4、希望得到一个更好的结果，某种动机却阻止我们达成更好的结局，称之为道德风险。典型的道德风险：选择限制项目的规模，或者说贷款额度，通过降低规模来降低被骗的风险。 5、承诺（commitment）减少可选策略而改变其他人的行为，改变不了其他人的行为则毫无意义。十四、十四、 1、介绍了斯塔克伯格模型，探寻是先下手为强，还是等其他决策者决策后再决策更有优势，然后采用逆向归纳法来解决，得出结论，在斯塔克伯格模型下，厂家 1 不需要知道厂家 2 的产量也能有理由超过古诺产量继续生产， ,因为这可以迫使对手减产，对厂家 1 是有利的，并且通过分析可以得出厂家 1 的利润将会高于古诺模型中的利润（双方取到纳什均衡解），而厂家 2 的利润将会低于古诺模型下取得的利润，还知道总生产量会上升，（视频中通过纯数学方法证明了上面所讨论的结论）。 2、举了 nbc 和梅铎两

展开阅读全文