学科课程教师培训班第7章

资源描述

《学科课程教师培训班第7章》由会员分享，可在线阅读，更多相关《学科课程教师培训班第7章（48页珍藏版）》请在金锄头文库上搜索。

1、进化博弈论基本概念简介,（对应教材第7章）,回顾上一讲（博弈论基础）,博弈参与者（player）策略（strategy）收益，回报（payoff）收益矩阵形象地描述一个博弈的结构在博弈论的分析中（决定很可能会采取的策略）从每个人的角度，不是要考虑如何战胜对方，而是基于对对方行为的预测，自己如何收益尽可能大。双方都如此态度。纯策略、混合策略（在可选纯策略集合上的一个概率分布）,立刻可能想到的(例),P1(p,q) = ? P2(p,q) = ?,均衡（纳什均衡）博弈的趋势,均衡：互为最佳应对的策略组纳什均衡定理：在考虑混合策略条件下，任何有限参与人、有限纯策略的博弈都存在均衡一

2、般来讲，找到均衡是很困难的，但在某些限定条件下可能有系统化方法例如，双人双（纯）策略检查四个策略组合是否为纯策略均衡利用无差异原理试求混合策略均衡,若（1）为空，则（2）一定有；若（1）不空，（2）也可能有,囚徒困境（协调）博弈的特征模式,双人双策略对称均衡出现在双方采用某一种相同的策略对应社会最优的策略组不是均衡，因为参与人之一有动机改变策略,鹰鸽博弈的特征模式,双人双策略对称均衡出现在双方采用不同的策略,双人双策略对称博弈均衡的一般条件,若（S, S）是均衡，a,b,c,d之间的关系？若（S, T）是均衡，？若（T, S）是均衡，？若（T, T）是均衡，？,ac,c

3、a, bd,经常会用到“期望”的概念,一个随机的行为，会有多种（以两种为例）可能的结果（r1, r2），分别对应一个概率（p1, p2），p1+p2=1 则这个行为的结果期望就是 p1r1 + p2r2 概率常常用“比率”和“占比”来近似混合策略的收益：在纯策略集合上按概率分布选择的收益期望,进化博弈论：用博弈论语言讨论生物进化现象,人们发现某些生物进化的过程（物竞天择，适者生存）也体现出博弈的某些关键特征（纳什均衡不一定是社会最优）,博弈与进化博弈若干概念的一种对比理解,博弈，纯策略确定性策略，直接对应的收益博弈，混合策略概率性策略，收益期望进化博弈，纯策略对于个体：确定性策略

4、，直接收益对于群体（策略）：适应性其中个体与其他个体随机相遇的收益期望进化博弈，混合策略对于个体：概率性策略，收益期望对于群体（策略）：适应性其中个体与其他个体随机相遇的收益期望,均衡,稳定性,进化博弈的由来,进化论的主要观点生物体的遗传基因在很大程度上决定了它的外部特征（行为方式等），因而决定了它是否能够适应给定的环境。生物体对环境适应性的基本表征是其繁殖能力，较强的生物体往往会繁衍较多的后代，于是该物种在生物总体中的占比增加。一个物种的成功进化取决于它其中的个体和其他个体（同种或者不同种）的互动（竞争）结果。,进化博弈的由来,1960s，从博弈论视角来解释生物进化论由基因决

5、定的生物特征及行为可类比为博弈中的策略（尽管一般情况下不能选择）；将生物的适应性（的提高）类比为它的收益。 J. M. Smith和G. R. Price，提出“进化稳定”的概念，标志着进化博弈论的诞生。 John M. Smith. On Evolution. Edinburgh University Press, 1972 J. M. Smith and G. R. Price, The Logic of Animal Conflict, Nature, 246, 15-18, 1973.,生物适应性与种群变异,例子：体态大小的进化博弈考虑一种甲虫种群假设每只甲虫对给定环境的适应能力

6、取决于它是否可以发现食物从获得的食物中有多少能转换为生物适应性设想一个特定的突变基因出现，使得有该基因的甲虫体型变大（或变小）。因此，甲虫便分成两个不同的种群小甲虫和大甲虫。,问：在竞争中代代繁衍，其中一种甲虫会灭绝吗？,生物适应性与新陈代谢,对于大甲虫，维持基本的新陈代谢实际上要比较困难些需要吃较多的食物才能维持较大的体态；即同样数量的食物，小甲虫从中可获得较多的收益（适应性）。直观结论是：大体态变异基因使适应性减弱，会繁衍得越来越少，最后灭绝（被淘汰）。然而事实真的是这样吗？,互动（竞争）与生物适应性,当两只甲虫为食物争夺时，可能的情形有：如果它们大小相同，它们会平分同样的

7、食物当一只大甲虫和一只小甲虫争夺食物，则大甲虫会得到大多数的食物对于同样的食物量，大甲虫在适应性上得到的益处要少，因为所得到的食物中有一部分要转化用来维持它们消耗较高的新陈代谢,食物,争夺,随机相遇,适应性,收益矩阵,每只甲虫从争夺到的一定量食物中获得的生物适应性（不是食物量），可看成是双人博弈中的收益。随机碰到的一只甲虫有两种可能：大或小。将这可能性看成“策略”，假设有：,与经典的博弈比较,每只甲虫的策略都是由遗传基因硬性决定的 “策略选择”的概念在此是缺失的因此以策略选择为基础的纳什均衡思想在此没有直接的对应但人们发展出一个平行的概念 “进化稳定策略” 一个生物种群，能够抵御外来

8、入侵（入侵者会在进化过程中消亡）,进化稳定策略,一个策略（基因）称为是进化稳定的，若当整个群体都采取这个策略时，其他采用不同策略的小规模 “入侵”群体经过多代遗传后最终会消亡。这里的基本思想也可用于讨论人们的社会行为形式化定义一种生物体的适应性是指它与一个随机遇到的生物体互动（竞争）得到的收益期望称“策略T在x程度上（以x水平）入侵策略S”，指的是在总体中有x占比的生物体采用策略T，1-x占比采用策略S；其中0x1。若存在一个小正数y，当任何其他策略T以任何xy水平入侵策略S时，采用策略S的个体的适应性严格高于采取策略T的个体，则称策略S是进化稳定的，evolutionarily s

9、table。,考察小体态是否进化稳定策略,考虑一个小正数x1，总体中有x占比的个体使用策略“大体态” ，有1-x占比的个体使用策略“小体态”。（甲虫们随机相遇争夺食物）一只小甲虫的收益期望是 5(1-x)+1x = 5-4x 一只大甲虫的收益期望是 8(1-x)+3x = 8-5x 可见，不存在y，使得xy时小甲虫的期望收益超过大甲虫。因此，策略“小体态”不是进化稳定的。,(1-x),x,体态博弈中的进化稳定策略：考察大体态,考虑一个很小的正数x1，总体中有x占比为小体态，1-x占比甲虫为大体态。大甲虫收益期望是 8x + 3(1-x) = 3 + 5x 小甲虫收益期望是 5x + (1-

10、x) = 1 + 4x 大甲虫的收益期望总是超过小甲虫的，所以，“大体态”是一个进化稳定策略。,(1-x),x,进化博弈中的“军备竞赛”,生物学家认为在自然界中存在具有囚徒困境结构的进化博弈现象例如：树木高矮的竞争；植物根系的竞争例子：病毒之间的进化博弈（Nature，1999）噬菌体6病毒。这种病毒感染细胞，而且产生自我复制（繁殖）所需的化学产物。它的一种基因变异体称为噬菌体H2，自身繁殖能力较弱，但能够利用6的化学产物，于是当和病毒噬菌体6同时存在时，噬菌体H2 在适应性方面便有明显优势。,具有类似囚徒困境博弈的结构：病毒有两种：6和H2（对应两个进化策略）在一个纯6种群中，病

11、毒行为收益（自我复制的能力）会优于纯H2种群的病毒；但是，当病毒H2与6同时存在时，H2的收益会比较高，甚至高于纯6种群情形。因此，H2是进化稳定的，6不是。结果就是，一旦6种群中出现了少量变异H2，则H2病毒会越来越多，6越来越少换句话说，H2成功入侵了6,病毒进化博弈的收益矩阵,生物学家测量了两种病毒在不同条件下复制行为的相对速率（体现适应性）,理性的选择与进化的力量有相似的取向！,进化稳定策略的一般描述,如何用a，b，c，d写出S是进化稳定的条件？设对于一个很小的正数x c(1-x)+ dx 结论：在双人双策略的对称博弈中，若(i)ac或(ii)a=c且bd，则S是进化稳定的。

12、（注意“x很小”在其中的作用）,(x),(1-x),考虑双人对称博弈形态,在双人双策略的对称博弈中，若(i) ac，或(ii) a=c且bd，则S是进化稳定的。这意味着：为了使S成为一个进化稳定策略，用策略S应对策略S的回报不能小于用策略T来应对策略S取得的回报。若策略S和T在应对策略S时的收益相等。为了保证S是一个进化稳定策略，采取策略S应对策略T的收益要严格大于采取策略T应对策略T的收益。,进化稳定策略与纳什均衡？,博弈纳什均衡（互为最佳应对策略组）进化博弈进化稳定策略,给定一个收益矩阵，我们可以讨论是否存在纳什均衡，也可以讨论哪个策略是进化稳定的 - 基于各自的定义,如果能建立

13、起这两个概念的某种关系，则有可能让我们从对一个的认识直接得到对另一个的认识。,进化稳定策略与纳什均衡的关系,S是进化稳定的条件： (i) ac，或 (ii) a=c且bd (S,S)是纳什均衡的条件：ac 因此，若策略S是进化稳定的，则(S,S)一定是一个纳什均衡。反之不一定成立。,例子：猎鹿博弈,猎鹿，猎兔都是进化稳定的因此（猎鹿, 猎鹿）和（猎兔, 猎兔）也都是纳什均衡,例子：另一种猎鹿博弈,猎鹿不是进化稳定的，尽管（猎鹿, 猎鹿）是纳什均衡。猎兔是进化稳定的，于是（猎兔, 猎兔）此时也是纳什均衡。,进化稳定策略和严格纳什均衡,在一个策略选择中，若每个参与人使用的都是唯一的最佳应对策略

14、（即严格最佳应对），则称这个最佳应对策略组是一个严格纳什均衡。不难看到：如果（S,S）是一个严格纳什均衡（即ac），则S是进化稳定的。反之不一定成立。,并不是总有进化稳定策略,例子：鹰鸽博弈可以从定义验证：D，H都不是进化稳定的。这也可从（D，D）和（H，H）都不是纳什均衡直接推出,在生活中，极端主义是很难长存的,怎么办？,进化稳定混合策略,一种生物个体，由其基因决定，按照概率分布（p,1-p）随机采用两个策略S和T之一。想像有一群这样的个体，在互动中繁衍突然，其中出现了一种变异：概率变为q 设变异种群在总体中初始占比x（很小），问：原来的种群是进化稳定的吗？也就是，在互动中，p

15、种群能比q种群更具适应能力，从而能抑制q种群的蔓延吗？若是，则称p是进化稳定混合策略,下面，我们先来看两个采用不同混合策略的生物体相遇互动时的收益期望（p, q的函数）然后再看根据在总体中的占比，两种生物体随机相遇所导致的收益期望（x, p, q 的函数）讨论最后这两个期望的大小，判断是否进化稳定,进化混合策略下的收益,第一种（p策略者）遇到第二种 V(p, q) = pqa + p(1-q)b + (1-p)qc + (1-p)(1-q)d 第二种（q策略者）遇到第一种 V(q, p) = qpa + q(1-p)b + (1-q)pc + (1-q)(1-p)d 也可以写出同种相遇的

16、收益V(p,p), V(q,q),两个采用不同混合策略者相遇的收益,下面看两个群体的个体间互动的情形，设第二种是入侵者，占比x,第一种p占比1-x,第二种q占比x,第一种与第一种相遇，两者收益都是V(p,p) 第一种与第二种相遇，前者收益V(p,q)，后者收益V(q,p) 第二种与第二种相遇，两者收益都是V(q,q),此时，个体随机相遇的可能有,如何讨论群体？群体占比的设定给出了个体相遇的概率,相遇的概率及其所导致的收益期望,第一种（初始种群，p） E1(x,p,q)= (1-x)V(p,p) + xV(p,q) 第二种（变异种群，q） E2(x,p,q)= (1-x)V(q,p) + xV(q,q),在种群混杂情况下不同种群中一个个体的平均收益,p是一个进化稳定混合策略的判据：,存在y，对任意x E2(x,p,q),(1-x)V(p,p) + xV(p,q) (1-x)V(q,p) + xV(q,q),判定进化稳定混合策略的一个要点,存在y，对任意xy

展开阅读全文

学科课程教师培训班第7章

最新文档