耶鲁大学公开课博弈论笔记(博弈论24讲)

上传人:小** 文档编号:89255699 上传时间:2019-05-22 格式:PDF 页数:9 大小:885.32KB
返回 下载 相关 举报
耶鲁大学公开课博弈论笔记(博弈论24讲)_第1页
第1页 / 共9页
耶鲁大学公开课博弈论笔记(博弈论24讲)_第2页
第2页 / 共9页
耶鲁大学公开课博弈论笔记(博弈论24讲)_第3页
第3页 / 共9页
耶鲁大学公开课博弈论笔记(博弈论24讲)_第4页
第4页 / 共9页
耶鲁大学公开课博弈论笔记(博弈论24讲)_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《耶鲁大学公开课博弈论笔记(博弈论24讲)》由会员分享,可在线阅读,更多相关《耶鲁大学公开课博弈论笔记(博弈论24讲)(9页珍藏版)》请在金锄头文库上搜索。

1、博弈论作业(博弈论博弈论作业(博弈论 24 讲)讲)数应专业数应专业 一、一、 1、 理性人:指代这一类人,他们只关心自己的利益。 2、 如果选择 a 的结果严格优于 b,那么就说 a 相对于 b 来说是一个严格优势策略。结论: 不要选择严格略施策略。 3、 理性人的理性选择造成了次优的结果 4、 举例:囚徒困境、宿舍卫生打扫问题、企业打价格战等 5、 协和谬误收益很重要, “如欲得之,必先知之” 6、 要学会换位思考,站在别人的立场上看别人会怎么做,在考虑自己受益的同时,要注 意别人会怎么选择 二、二、 1、 打渔问题、全球气候变暖与碳排放问题 2、 博弈的要素:参与人、策略集合、收益 3、

2、 如果策略 a 严格劣于策略 b,那么不管他人怎么选择,b 总是更好的选择 4、 军队的入侵与防卫问题 5、 所有人都从 1 到 100 中选个数字,最接近所有人选的数字的均值的 2/3 者为胜,这个数 字是多少呢?作为理性人,每个人都会选择 67(100*2/3)以下的数,进一步假设你的 对手也是理性的,你会选择 45(100*4/9)以下的数依据哲学观点,如果大家都是 理性程度相当的,那么最后数字将为 1,然而结果却是 9,这说明博弈的复杂性 6、 共同知识与相互知识的区别 三、三、 1、 利用迭代剔除法领悟中间选民问题 2、 迭代剔除法就是严格下策反复消去法,不断地把劣势策略剔除出去,最

3、后只剩下相对 优势的策略 3、 中间选民问题就是,在两党制中,政党表述施政纲领要吸引位于中间位置的选民,他 们认为在选举中处于中间标度可以吸引左右两边的选民,并以此获得胜利。 4、 中间选民问题理论成立的条件是有两个参与人;政治立场能使选民相信。 5、 由此延伸出来的还有加油站选址问题,两家加油站不是在不同的路口选址,而是在不 确定哪个位置较佳的时候会选在同一处,这也是“中间选民定理”的凸显 6、 在迭代剔除法不能运用时,比如说该博弈中博弈方 1 和 2 均没有严格下策,可以用二 维坐标系画出选择策略之后的收益分布 四、四、 1、 罚点球: 一个经过模型简化的点球模型:罚球者可以选择左路,中路

4、,右路 3 种路线去踢点球,门 将可以选择向左扑救或者向右扑救(门将没有傻站着不动的 option) 。罚球者的收益很容易 理解出来,其结论是,无论什么时候,罚球者向中路踢都不是一个最优的选择。 (当门将向 左扑的概率大于 50%时,球员向右踢比较好;反正同理) 。将其推广: 2、 不要选择一个在任何“信念”(belief)下都不是最优策略的策略。 3、 这里的信念(原文是 belief)并不是指门将会向左扑或者向右扑,而是指概率。我的理 解是对中庸之道的批判。所以本例中,虽然罚球者的 3 种策略里没有劣势策略,不过还是可 以用以上原则剔除掉一个策略。 4、 上述模型忽略的 2 个地方, 一名

5、惯用右脚的球员, 他向左踢和向右踢的准确率是不同的 (踢过球的童鞋们都有这 种体会,右脚球员从左侧进攻射门的舒适度比从右侧射门要好很多) 。 门将可以选择在中路(TO BE CONTINUED) 五、五、 1、 纳什均衡(简称 NE)定义 2、 学习 NE 的动机:不为当时做出的决定后悔,因为已经采取了最佳策略。 3、 任何参与人都严格不会改变策略,改变策略严格不会使参与人获得增益。 4、 其他参与人不改变行为的前提下,自己改变行为并没有任何好处。 5、 严格劣势永远不是最佳策略,最佳策略才可以出现 NE。 6、 博弈会朝着趋向于一个均衡的方向自然发展,结果不断趋向一个 NE 7、 较劣的不投

6、资均衡相当于较优的 NE 处于帕累托劣势 8、 协调之所以能达成在于他不同于囚徒困境,它没有去说服人们采取一个严格劣势策略。 六、六、 1、举一个例子“一起看电影” ,它的博弈学名叫“性别大战” ,属于协调博弈,但是不同的 参与人偏爱不同 2、 古诺的双寡头模型,讲的是同一个市场中只有两家公司互相竞争,该博弈介于完全竞 争和垄断的两种极端情况之中,所以使得该博弈变得很有趣,在该博弈中参与人是:两 家公司,策略是:生产同质商品的产量,q1、q2 表示策略,生产成本;c*q,边际成本 实常数 c,市场价格:p=a-b*(q1+q2) ,可以画出需求曲线,收益:u1=p*q1-c*q1, 垄断产量:

7、 (a-c)/2b完全竞争产出: (a-c)/b古诺产出: (a-c)/3b 3、 它与合伙人博弈及投资博弈都不同,它不是策略互补博弈,而是策略替代博弈,就是我 的策略实施的越多,你的策略就实施的越少 4、 有没有使市场利润达到最大化的双方的产量?当第一家公司产量为垄断产量时或第二 家公司产量为垄断产量时,市场利润达到最大化 5、 当两家公司得产量为(a-c)/3b 时,此时整个行业的总产出为 2*(a-c)/3b,而完全竞 争产量为(a-c)/b, ,垄断产量为 a-c)/2b,所以古诺产出介于两者之间。 七、七、 1、 介绍了伯川德模型,该博弈中参与人:生产相同的产品的两个公司,成本是固定

8、的边际 成本,生产 1 个单位产品消耗成本 c策略:定价,该例中用 1 p代表公司 1 的价格, 用 2 p代表公司 2 的价格,注意此处不同于前面课程用 s 来表示参与人的策略, 2、 家庭作业,介绍了线性城市模型,一个路贯穿城市,两个公司分别坐落在 0、1 点, 消 费者 y 到公司 1 的距离为 y,到公司 2 的距离为 1-y,假设每个消费者买且只买一个 产品。消费者会选择对他而言总成本最小的 例如:在 y 点的消费者,如果从公司 1 购买则他们支付 2 1 pTy,产品的价格 1 p, 和交通成本 2 Ty; 到公司 2 购买则需要支付 2 1 1pTy, 交通成本以距离的平方的 速

9、率增长。 3、 候选人选民模型,首先做出一些假设,假设选民在线上平均分布,候选人数目不固定, 候选人不能选择他们的政治立场, 每个选民都是一个潜在的候选人, 且选民会将选票投 给离他最近的候选人。在该博弈中 参与人:选民策略:是否参选(选民将选票给与 最近的候选人,得票最多者当选,平局掷硬币)收益:获胜赢得奖励 B,参选付出成 本 C,且 B2C; 若选民不参选获胜者的立场距离该选民越远,则该选民将承受越重的负面效应,若 该选民在线上 X 点, 获胜者在 Y 点, 则承担X Y的成本, 两点间距离的负向效应, 也就是对方当选后给未参选的选民造成郁闷程度。 八、八、 1、 原有左派 1 人和右派

10、 1 人两派系,原本各占一半优势,如果左派又出现一个候选人, 则 左派将失去优势,右派获胜反之,右派出现新的候选人,亦可同理分析; 2、 原有极左、极右两人进行较量各占一半优势时,如果新进候选人持中立态度,则他/她 有可能会成为获胜者; 3、 如果两个候选人极左、极右,则会出现新的候选人; 4、 种族隔离: 大个子、矮个子选择居所问题:至少有三个纳什均衡存在,是大个子住甲城,矮个子 住乙城,是大个子住乙城,矮个子住甲城,混居且甲乙两成各占一半人口。其中为 稳定均横,为弱均衡;还有可能会出现一个均衡,那就是所有人选择了甲城/乙城,后被 重新随机分配,这样的结果会趋于混居。 5、 一些看似不起眼的

11、博弈规则可能是很重要的条件,有可能在短时间内说明问题,尤其在 建模过程中不可忽视之 6、 不可轻易的根据可观察的东西来武断的下定义,比如说不能因为看到种族隔离,就认为 人们喜欢种族隔离,它的存在可能与个人的偏好无关 7、石头剪刀布游戏没有纯策略纳什均衡,在玩家双方均以 (1/3,1/3,1/3)的混合策略选择时,才会出现唯一的纳什均衡 九、九、 1、 混合策略的收益就是每个纯策略预期收益的加权平均值, 该加权平均值一定位于混合策 略所包含的纯策略预期收益之间 2、 如果一个混合策略是你的最优策略,那么该策略中的所有纯策略本身也都是最佳策略 3、 一个混合策略(P1* ,P2* , Pn*) ,

12、是一个混合策略 NE,当且仅当对任意 参与人i,在面对 P-i* 时他的混合策略 Pi* ,是该参与人的 BR 4、混合策略在网球比赛中的应用: 本博弈不存在纯策略纳什均衡 如果 V 的混合策略均衡是纳什均衡,则策略 L 与 R 的预期收益相等,类似的,如果 S 的混合策略均衡是纳什均衡,则策略 l 与 r 的预期收益相等 混合策略纳什均衡 NE:V(0.7,0.3)S(0.6,0.4) 如果 S 防左的概率大于 0.6,那么 V的 BR 是把球打向右侧 如果 S 防左的概率小于 0.6,那么 V的 BR 是把球打向左侧 十、十、 1、 我们只需考虑改选纯策略是否严格有利即可,如果不存在改选纯

13、策略的严格有利改变, 那么也就不存在改选混合策略的严格有利改变 2、 不存在改变纯策略的严格有利改变,则任何一个纯策略的收益都与混合策略 的收益相等 3、 例子apple picking摘苹果 Yale Rep and see play耶鲁剧院去看戏 性别大战 税收问题 纳税人的收益:对均衡纳税意愿有影响,决定着纳税人的混合策略是 审计员的收益, 不改变审计员的收益, 当然也就不会改变纳税人的均衡混合策略。 十一、十一、 1、 进化论(Evolution) 博弈论对生物学的重大影响,尤其在动物行为学中 把基因看成策略,把遗传适应性当做收益,好的策略使种群不断壮大,即有适合基因的 个体会繁衍,带

14、有不适合基因的个体会灭绝。 将动物的行为(策略)看做是天生,而不是自由选择 简化模型,专注于种内竞争,通过双人对称博弈来进行研究,很大的种群,采取的策略 与生俱来,对其进行随机配对。即采取相对成功策略的个体数量会增长,相反则会减少。 不 存在基因的重新分配。 结论: 自然选择的进化结果是很糟的 如果一个策略是严格劣势策略,那么它就不是 ES 2、 一个经济学案例: 假设市场中存在这样的公司, 这些公司并不关心什么策略能最大化利润, 什么策略能尽 可能降低成本,它们可能毫无科学根据地选择策略,在竞争激励的市场环境下,只有那些成 本较低但利润颇丰适应环境的公司才能得以生存下来。 公司倒闭和基因灭绝

15、道理是类似的。 十二、十二、 1、判定 ES 的方法: 第一检验,对称NE(a,a) 第二检验,是否是严格NE?(a,a)不是严格 NE 第三检验,a 在偏移时的收益 2、 社会传统的进化(靠左行车还是靠右行车) 可以有多种进化稳定的社会传统存在;社会没有绝对的高效率,习惯没有必要一样好 3、 自然界中混合均衡的两个解释 基因本身是随机的 稳定混合也意味着在 ES 中,以这种比例稳定存在 4、 鹰鸽之争 十三、十三、 1、 帽子里的钱 2、 顺序博弈 参与人 2 在作出决定之前知道参与人 1 的决策,且参与人 1 知道这种情况。 关键问题是作出预测,沿着树形图向下看,站在后行动参与人的立场上思

16、考,看下级 参与人会有什么动机,找到他们的 BR,再根据树形图倒回来。即向树的分枝看,然后在回 到树的主干上来 3、 逆向归纳法 4、 希望得到一个更好的结果,某种动机却阻止我们达成更好的结局,称之为道德风险。 典型的道德风险:选择限制项目的规模,或者说贷款额度,通过降低规模来降低被骗 的风险。 5、 承诺(commitment)减少可选策略而改变其他人的行为,改变不了其他人的行为则 毫无意义。 十四、十四、 1、 介绍了斯塔克伯格模型, 探寻是先下手为强, 还是等其他决策者决策后再决策更有优势, 然后采用逆向归纳法来解决,得出结论,在斯塔克伯格模型下,厂家 1 不需要知道厂家 2 的产量也能有理由超过古诺产量继续生产, ,因为这可以迫使对手减产, 对厂家 1 是有 利的, 并且通过分析可以得出厂家 1 的利润将会高于古诺模型中的利润(双方取到纳 什均衡解) ,而厂家 2 的利润将会低于古诺模型下取得的利润,还知道总生产量会上升, (视频中通过纯数学方法证明了上面所讨论的结论) 。 2、 举了 nbc 和梅铎两

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号