不完全信息动态博弈

资源描述

《不完全信息动态博弈》由会员分享，可在线阅读，更多相关《不完全信息动态博弈（61页珍藏版）》请在金锄头文库上搜索。

1、POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE

2、POWERPOINT TEMPLATE 第五章第五章不完全信息动态博弈不完全信息动态博弈v在不完全信息动态博弈中，至少有一个博弈参与者对博弈在不完全信息动态博弈中，至少有一个博弈参与者对博弈的结构、博弈参与者类型、博弈收益等信息不完全了解。的结构、博弈参与者类型、博弈收益等信息不完全了解。v博弈参与者的行动存在先后顺序。博弈参与者的行动存在先后顺序。v与不完全信息静态博弈类似，可以通过海萨尼转换将不完与不完全信息静态博弈类似，可以通过海萨尼转换将不完全信息动态博弈转化为完全但不完美信息动态博弈。全信息动态博弈转化为完全但不完美信息动态博弈。一、波音与空客博弈的基本假设一、波音与空客博弈的基本假

3、设v假设波音公司先于空中客车公司进入市场。假设波音公司先于空中客车公司进入市场。v波音公司可能是一个波音公司可能是一个“有先发优势有先发优势”的公司，也可能是一个的公司，也可能是一个“无先发优势无先发优势”的公司。的公司。v波音公司波音公司“有先发优势有先发优势”时，其成本函数为：时，其成本函数为：C(q1) = q1。v波音公司波音公司“无先发优势无先发优势”时，其成本函数为：时，其成本函数为：C(q1) = 2q1。v空中客车公司的生产函数没有不确定性。空中客车公司的生产函数没有不确定性。v空中客车公司的生产函数为：空中客车公司的生产函数为：C(q2) = 2q2。v空中客车公司进入市场需

4、要付出一个额外的固定成本。空中客车公司进入市场需要付出一个额外的固定成本。v假设国际市场飞机需求函数为：假设国际市场飞机需求函数为：P = 10 Qv其中：其中：Q = q1 + q2。v波音公司和空中客车公司的行动存在先后顺序。波音公司和空中客车公司的行动存在先后顺序。v波音公司先进入市场，空中客车公司后进入市场。波音公司先进入市场，空中客车公司后进入市场。v波音公司和空中客车公司都明确知道空中客车公司的生产函数。波音公司和空中客车公司都明确知道空中客车公司的生产函数。v波音公司明确知道自己的生产函数，但空中客车公司不知道波波音公司明确知道自己的生产函数，但空中客车公司不知道波音公司的生产函

5、数。存在不完全信息。音公司的生产函数。存在不完全信息。v所以，这个博弈是一个不完全信息动态博弈。所以，这个博弈是一个不完全信息动态博弈。专栏：专栏：“先发优势先发优势”与与“规模经济规模经济”v传统经济学理论建立在完全竞争市场和规模报酬不变的前提下。传统经济学理论建立在完全竞争市场和规模报酬不变的前提下。v在传统经济学理论中，完全竞争条件下企业利润为零，并且企在传统经济学理论中，完全竞争条件下企业利润为零，并且企业的利润与企业进入市场的时间先后没有必然联系。业的利润与企业进入市场的时间先后没有必然联系。v在在 20 世纪世纪 50 年代以后，伴随着机械化大生产的迅猛发展，年代以后，伴随着机械化

6、大生产的迅猛发展，企业生产过程中企业生产过程中“规模经济规模经济”（Economy of Scale）特征）特征越发明显。生产规模越大，企业生产成本越低。越发明显。生产规模越大，企业生产成本越低。v规模经济的生产模式催生不完全竞争的市场结构。规模经济的生产模式催生不完全竞争的市场结构。v具有规模经济生产特征的企业越做越大，逐渐在市场中占据一具有规模经济生产特征的企业越做越大，逐渐在市场中占据一定垄断地位，进而打破完全竞争的市场结构，产生垄断竞争、定垄断地位，进而打破完全竞争的市场结构，产生垄断竞争、寡头、甚至垄断等不完全竞争的市场结构模式。寡头、甚至垄断等不完全竞争的市场结构模式。v在规模经济

7、和不完全竞争市场结构下，先进入市场的企业具有在规模经济和不完全竞争市场结构下，先进入市场的企业具有垄断优势。垄断优势。v先进入的企业可以利用规模经济原理扩大规模，降低成本。先进入的企业可以利用规模经济原理扩大规模，降低成本。v后进入的企业在发展之初，规模小、生产成本高，较难与已经后进入的企业在发展之初，规模小、生产成本高，较难与已经具备一定规模的先发企业进行抗衡。具备一定规模的先发企业进行抗衡。v即：先进入的企业即：先进入的企业“有先发优势有先发优势”。v如果先进入的企业没有充分利用自身的便利条件，未建立起自如果先进入的企业没有充分利用自身的便利条件，未建立起自身的竞争优势，那么当后来者进入市

8、场时，两家企业在将在同身的竞争优势，那么当后来者进入市场时，两家企业在将在同一个起跑线上进行竞争。一个起跑线上进行竞争。v在此种情况下，先进入市场的企业常被称为在此种情况下，先进入市场的企业常被称为“无先发优势无先发优势”。内部规模经济内部规模经济学习曲线与先发优势学习曲线与先发优势二、博弈过程二、博弈过程v波音公司先行动。波音公司先行动。v当波音公司选择产量时，可以视波音公司为一个垄断者。当波音公司选择产量时，可以视波音公司为一个垄断者。v当空中客车进行决策时，如果空中客车公司选择当空中客车进行决策时，如果空中客车公司选择“进入进入”，那么波音公司和空中客车公司在市场中进行寡头博弈。，那么波

9、音公司和空中客车公司在市场中进行寡头博弈。v假设寡头博弈遵从古诺寡头博弈的模式。假设寡头博弈遵从古诺寡头博弈的模式。1波音公司的决策依据波音公司的决策依据v波音公司通过选择产量最大化自己的利润。波音公司通过选择产量最大化自己的利润。v首先行动的波音公司如果是一个首先行动的波音公司如果是一个“有先发优势有先发优势”的公司的公司n均衡产量为：均衡产量为：4.5n均衡利润为：均衡利润为：20.25v首先行动的波音公司如果是一个首先行动的波音公司如果是一个“无先发优势无先发优势”的公司的公司n均衡产量为：均衡产量为：4n均衡利润为：均衡利润为：162空中客车公司的决策依据空中客车公司的决策依据v当轮到

10、空中客车公司行动时，如果空中客车公司选择当轮到空中客车公司行动时，如果空中客车公司选择“不进入不进入”，那么波音公司将继续自己在市场中的垄断地位。，那么波音公司将继续自己在市场中的垄断地位。v如果空中客车公司选择如果空中客车公司选择“进入进入”，那么空中客车公司将和波音，那么空中客车公司将和波音公司在市场上进行古诺寡头博弈。公司在市场上进行古诺寡头博弈。v寡头博弈下寡头博弈下v首先行动的波音公司如果是一个首先行动的波音公司如果是一个“有先发优势有先发优势”的公司的公司n产量：产量：q1 = 10/3; q2 = 7/3；利润：；利润：1 = 100/9； 1 = -5/9。v首先行动的波音公司

11、如果是一个首先行动的波音公司如果是一个“无先发优势无先发优势”的公司的公司n产量：产量：q1 = 8/3; q2 = 8/3；利润：；利润：1 = 64/9； 1 = 10/9。v如果波音公司是一个如果波音公司是一个“有先发优势有先发优势”的公司，那么空中客车公的公司，那么空中客车公司与波音公司在市场上进行古诺寡头竞争时，空中客车公司的司与波音公司在市场上进行古诺寡头竞争时，空中客车公司的利润为负。利润为负。v如果波音公司是一个如果波音公司是一个“无先发优势无先发优势”的公司，那么空中客车公的公司，那么空中客车公司与波音公司在市场上进行古诺寡头竞争时，空中客车公司的司与波音公司在市场上进行古诺

12、寡头竞争时，空中客车公司的利润为正。也就是说：利润为正。也就是说：v当波音公司是一个当波音公司是一个“有先发优势有先发优势”的公司时，空中客车公司将的公司时，空中客车公司将选择选择“进入进入”；v当波音公司是一个当波音公司是一个“无先发优势无先发优势”的公司时，空中客车公司将的公司时，空中客车公司将选择选择“不进入不进入”。三、先验信念与策略互动三、先验信念与策略互动v由于空中客车公司并不知道波音公司的成本函数，因此空中客由于空中客车公司并不知道波音公司的成本函数，因此空中客车公司只能根据自己的先验信念进行决策选择。车公司只能根据自己的先验信念进行决策选择。v先行动的波音公司可以通过自己传递的

13、信息影响空中客车公司先行动的波音公司可以通过自己传递的信息影响空中客车公司的信念。的信念。v空中客车公司先验的认为波音公司为空中客车公司先验的认为波音公司为“有先发优势有先发优势”的公司的的公司的概率为概率为 p，波音公司为，波音公司为“无先发优势无先发优势”的公司的概率为的公司的概率为 1 p。v当当 p 2/3 时，空中客车公司选择时，空中客车公司选择“不进入不进入”。v作为先行动的波音公司，可以通过自己的行为改变空中客车公作为先行动的波音公司，可以通过自己的行为改变空中客车公司的信念。司的信念。v具体说来，先行动的波音公司作为市场中的垄断者，如果波音具体说来，先行动的波音公司作为市场中的

14、垄断者，如果波音公司已经建立起公司已经建立起“先发优势先发优势”，那么波音公司选择，那么波音公司选择 p = 5.5可可以最大化自己的垄断利润。以最大化自己的垄断利润。v如果波音公司如果波音公司“无先发优势无先发优势”，那么波音公司选择，那么波音公司选择 P = 6 可以可以最大化自己的垄断利润。最大化自己的垄断利润。v波音公司会考虑自己的定价传递给空中客车公司的信息。波音公司会考虑自己的定价传递给空中客车公司的信息。v如果波音公司把价格定在如果波音公司把价格定在 P = 6 的水平，那么等价于告诉空中的水平，那么等价于告诉空中客车公司：波音公司是一个客车公司：波音公司是一个“无先发优势无先发

15、优势”的公司。的公司。v当轮到空中客车公司进行决策时，空中客车公司一定会选择当轮到空中客车公司进行决策时，空中客车公司一定会选择“进入进入”。v空中客车公司的进入会攫取部分原本属于波音公司的垄断利润。空中客车公司的进入会攫取部分原本属于波音公司的垄断利润。v波音公司理想的结果是通过自己传递的信息，让空中客车公司波音公司理想的结果是通过自己传递的信息，让空中客车公司“知难而退知难而退”，不进入市场。，不进入市场。v即使波音公司是一个即使波音公司是一个“无先发优势无先发优势”的公司，它也有动机把自的公司，它也有动机把自己伪装成一个己伪装成一个“有先发优势有先发优势”的公司，从而改变空中客车公司的公

16、司，从而改变空中客车公司的信念，将空中客车公司排挤在市场之外。的信念，将空中客车公司排挤在市场之外。阶阶段段特点特点情形情形利利润润情况情况阶阶段段1市市场场中中只只有有波波音音公公司司一家企一家企业业波波音音公公司司为为“有有先先发发优优势势”的公司的公司波音公司：波音公司：20.25波波音音公公司司为为“无无先先发发优优势势”的公司的公司波音公司：波音公司：16阶阶段段2空空中中客客车车公公司司选选择择“进进入入”：市市场场中中有有波波音音公公司司和和空空中中客客车车两两家家公公司司波波音音公公司司为为“有有先先发发优优势势”的公司的公司波音公司：波音公司：100/9空中客空中客车车公司：

17、公司：-5/9波波音音公公司司为为“无无先先发发优优势势”的公司的公司波音公司：波音公司：64/9空中客空中客车车公司：公司：10/9空空中中客客车车公公司司选选择择“不不进进入入”波波音音公公司司为为“有有先先发发优优势势”的公司的公司波音公司：波音公司：20.25空中客空中客车车公司：公司：0波波音音公公司司为为“无无先先发发优优势势”的公司的公司波音公司：波音公司：16空中客空中客车车公司：公司：0不同情况下波音公司和空中客车公司的利润情况不同情况下波音公司和空中客车公司的利润情况v当空中客车公司没有观察到波音公司的定价策略时，空中客车当空中客车公司没有观察到波音公司的定价策略时，空中客

18、车公司有一个先验信念。公司有一个先验信念。v当博弈开始后，空中客车公司可以观察到先行动的波音公司的当博弈开始后，空中客车公司可以观察到先行动的波音公司的定价策略，但观察不到波音公司的成本函数。定价策略，但观察不到波音公司的成本函数。v根据波音公司的定价策略，空中客车公司会修正自己的先验信根据波音公司的定价策略，空中客车公司会修正自己的先验信念，产生后验概率。念，产生后验概率。v空中客车公司如何根据观察到的波音公司价格的策略修改自己空中客车公司如何根据观察到的波音公司价格的策略修改自己的先验信念呢？的先验信念呢？v“后行动的博弈参与者怎样根据观察到的信息修改自己的先验概后行动的博弈参与者怎样根据

19、观察到的信息修改自己的先验概率，得到后验概率。率，得到后验概率。”这是贝叶斯统计的一个经典问题：这是贝叶斯统计的一个经典问题：第二节第二节先验概率与后验概率先验概率与后验概率v在贝叶斯统计中，人们根据历史以及经验对某随机事件概在贝叶斯统计中，人们根据历史以及经验对某随机事件概率分布的先验信念称为先验概率。率分布的先验信念称为先验概率。v先验概率形成后，根据之后得到信息对先验概率进行修正，先验概率形成后，根据之后得到信息对先验概率进行修正，得到后验概率。得到后验概率。v贝叶斯公式是连接先验概率和后验概率的桥梁。贝叶斯公式是连接先验概率和后验概率的桥梁。一、贝叶斯公式一、贝叶斯公式v贝叶斯公式（

20、逆概公式）：设试验贝叶斯公式（逆概公式）：设试验 E 的的样本空间为的的样本空间为。事件事件 A1,A2,An 构成样本空间构成样本空间的一个划分（或构成的一个划分（或构成一个完备事件组），且一个完备事件组），且 P(Ai) 0，（，（i = 1,2,n）则对任意一个事件则对任意一个事件 B（P(B) 0），有：），有：二、贝叶斯公式应用实例二、贝叶斯公式应用实例v某公司考虑从某公司考虑从 F 大学招聘毕业生。大学招聘毕业生。v经理甲认为：经理甲认为：F 大学的毕业生为大学的毕业生为“高能力高能力”的概率为的概率为 0.9，为，为“低能力低能力”的概率为的概率为 0.1。v经理乙认为：经理

21、乙认为：F 大学的毕业生为大学的毕业生为“高能力高能力”的概率为的概率为 0.7，为，为“低能力低能力”的概率为的概率为 0.3。v人事主管先验概率：经理甲正确的概率为人事主管先验概率：经理甲正确的概率为 0.4，经理乙正确的，经理乙正确的概率为概率为 0.6。v该公司人力主管决定尝试着先招聘该公司人力主管决定尝试着先招聘 5 个个 F 大学的毕业生，通过大学的毕业生，通过观察这观察这 5 个毕业生的实际能力，对自己的先验概率进行修正。个毕业生的实际能力，对自己的先验概率进行修正。v如果招聘来的如果招聘来的 5 个个 F 大学的毕业生都是大学的毕业生都是“高能力高能力”的。这时，的。这时，该公

22、司人力资源主管如何修正其先验概率？该公司人力资源主管如何修正其先验概率？v定义事件定义事件 A1 和和 A2nA1 = F大学毕业生大学毕业生“高能力高能力”的概率为的概率为 0.9，“低能力低能力”的概率为的概率为 0.1。nA2 = F大学毕业生大学毕业生“高能力高能力”的概率为的概率为 0.7，“低能力低能力”的概率为的概率为 0.3。v公司人力主管的先验概率为：公司人力主管的先验概率为：P(A1) = 0.4, P(A2) = 0.6v定义事件定义事件 B = 招聘了招聘了 5 个个 F大学的学生，都是大学的学生，都是“高能力高能力”v需要求解需要求解 P(A1/B) 和和 P(A2/

23、B)v根据：根据：v根据贝叶斯公式，得到：根据贝叶斯公式，得到：v公司人力主管将自己的信念进行了调整，调整后的信念为：公司人力主管将自己的信念进行了调整，调整后的信念为：2先验概率的再修正先验概率的再修正v假设该公司人力主管决定再进行一次试验假设该公司人力主管决定再进行一次试验。v该公司又从该公司又从 F 大学招聘了大学招聘了 10 名毕业生。名毕业生。v经过一段时间的观察，发现这经过一段时间的观察，发现这 10 名毕业生中，有名毕业生中，有 9 名是名是“高高能力能力”，有，有 1 名是低能力。名是低能力。v定义事件定义事件 C = 招聘了招聘了 10 个个 F 大学的学生，有大学的学生，

24、有 9 个是个是“高能高能力力”，1 个是个是“低能力低能力”。v根据贝叶斯公式，求解后验概率根据贝叶斯公式，求解后验概率v需要求解需要求解 P(A1/C) 和和 P(A2/C)v定义事件定义事件 A1 和和 A2nA1 = F大学毕业生大学毕业生“高能力高能力”的概率为的概率为 0.9，“低能力低能力”的概率为的概率为 0.1。nA2 = F大学毕业生大学毕业生“高能力高能力”的概率为的概率为 0.7，“低能力低能力”的概率为的概率为 0.3。v公司人力主管的先验概率为：公司人力主管的先验概率为：P(A1) = 0.7, P(A2) = 0.3v根据贝叶斯公式根据贝叶斯公式v公司人力主管将自

25、己的信念再次进行了调整。公司人力主管将自己的信念再次进行了调整。三、不断累积的经验对信念的影响三、不断累积的经验对信念的影响v新增加的信息，也可能导致人力主管向另一个方向调整信念新增加的信息，也可能导致人力主管向另一个方向调整信念。v假设该公司从假设该公司从 F 大学招聘了大学招聘了 5 名毕业生。名毕业生。v经过一段时间的观察，发现这经过一段时间的观察，发现这 5 名毕业生都是低能力。名毕业生都是低能力。v定义事件定义事件 B = 招聘了招聘了 5 个个 F 大学的学生，都是大学的学生，都是 “低能力低能力”。v根据贝叶斯公式，求解后验概率根据贝叶斯公式，求解后验概率v不完全信息动态博弈中

26、，博弈参与者在博弈开始前具备先验信念。不完全信息动态博弈中，博弈参与者在博弈开始前具备先验信念。v当博弈开始后，后行动的博弈参与者观察到先行动博弈参与者的当博弈开始后，后行动的博弈参与者观察到先行动博弈参与者的部分信息。根据观察到的信息，后行动的博弈参与者会修正自己部分信息。根据观察到的信息，后行动的博弈参与者会修正自己的先验概率，得到后验概率。的先验概率，得到后验概率。v先行动的博弈参与者知道自己透露的信息会影响后行动博弈参与先行动的博弈参与者知道自己透露的信息会影响后行动博弈参与者的信念。者的信念。v因此，先行动的博弈参与者在透露信息时，也要经过深思熟虑、因此，先行动的博弈参与者在透露信息

27、时，也要经过深思熟虑、理性权衡，尽可能让自己透露的信息能诱导后行动者形成有利于理性权衡，尽可能让自己透露的信息能诱导后行动者形成有利于先行动者的信念。先行动者的信念。第三节第三节不完全信息动态博弈的均衡不完全信息动态博弈的均衡v与不完全信息静态博弈类似，可以通过海萨尼转换将一个不完全与不完全信息静态博弈类似，可以通过海萨尼转换将一个不完全信息动态博弈写成博弈树的表达形式。信息动态博弈写成博弈树的表达形式。v一、均衡概述一、均衡概述v考虑这样一个简单的不完全信息动态博弈：考虑这样一个简单的不完全信息动态博弈：v两名博弈参与者两名博弈参与者 1 和和 2。v博弈参与者博弈参与者 1 先行动，博弈

28、参与者先行动，博弈参与者 2 后行动。后行动。v参与者参与者 1 可能选择策略可能选择策略 L，也可能选择策略，也可能选择策略 R。v后行动的参与者后行动的参与者 2 不知道参与者不知道参与者 1 的策略选择。的策略选择。v后行动的参与者后行动的参与者 2 具备关于参与者具备关于参与者 1 选择的先验信念。选择的先验信念。v参与者参与者 2 认为参与者认为参与者 1 选择策略选择策略 L 的概率为的概率为 p，选择策略，选择策略 R 的概率为的概率为 1 - p。v参与者参与者2有两个策略可以选择：有两个策略可以选择：U 和和 V。参与者参与者2策略策略U策略策略V参与者参与者1策略策略L（2

29、，3）（0，1）策略策略R（1，4）（0，2）v参与者参与者 2 的两个节点位于一个信息集内。的两个节点位于一个信息集内。v与完全信息动态博弈不同，这里假设参与者与完全信息动态博弈不同，这里假设参与者 2具有先验信念。具有先验信念。v根据参与者根据参与者 2 的先验信念，参与者的先验信念，参与者 2 选择策略选择策略 U 的预期收益为：的预期收益为：v参与者参与者 2 选择策略选择策略 V 的预期收益为：的预期收益为：v容易得到：对于任意的容易得到：对于任意的 0 = p = 1，参与者，参与者 2 选择策略选择策略 U的收益都高于选择策略的收益都高于选择策略 V 的收益。的收益。 v参与者参

30、与者 2 会选择策略会选择策略 U。v参与者参与者 1 预期到参与者预期到参与者 2 的选择逻辑，参与者的选择逻辑，参与者 1 会选择策略会选择策略 L。v博弈的均衡是（博弈的均衡是（L，U）。）。v不完全信息动态博弈的均衡应具备两个特点。不完全信息动态博弈的均衡应具备两个特点。v特点特点 1：博弈参与者在每个博弈节点上都有一个主观信念：博弈参与者在每个博弈节点上都有一个主观信念n如果某个博弈参与者的信息集为单点信息集，那么可以认为如果某个博弈参与者的信息集为单点信息集，那么可以认为该信息集上的博弈参与者赋予此博弈节点的主观概率为该信息集上的博弈参与者赋予此博弈节点的主观概率为 1。v特点特点

31、2：均衡必须满足序贯理性（：均衡必须满足序贯理性（Sequentially Rational）。）。n序贯理性指：在博弈的每个信息集上，博弈参与者的决策都序贯理性指：在博弈的每个信息集上，博弈参与者的决策都是最优的。是最优的。二、精炼贝叶斯纳什均衡二、精炼贝叶斯纳什均衡v完全信息动态博弈中完全信息动态博弈中n子博弈精炼纳什均衡是对纳什均衡的一种子博弈精炼纳什均衡是对纳什均衡的一种“精炼精炼”，n剔除了纳什均衡中包含着剔除了纳什均衡中包含着“空洞威胁空洞威胁”的均衡。的均衡。v不完全信息动态博弈中不完全信息动态博弈中n精炼贝叶斯纳什均衡（精炼贝叶斯纳什均衡（Perfect Bayesian Na

32、sh Equilibrium）指剔除了贝叶斯纳什均衡中包含）指剔除了贝叶斯纳什均衡中包含“空洞威胁空洞威胁”的的均衡，均衡，n是对贝叶斯纳什均衡的是对贝叶斯纳什均衡的“精炼精炼”。1精炼贝叶斯纳什均衡实例精炼贝叶斯纳什均衡实例包含包含“空洞威胁空洞威胁”的博弈的博弈v博弈参与者博弈参与者 1 有三个策略：有三个策略：L、R 和和 M。v当参与者当参与者 1 选择策略选择策略 M 时，博弈结束。参与者时，博弈结束。参与者 1 获得收益获得收益 1，参与者参与者 2 获得收益获得收益 10。v当参与者当参与者 1 选择策略选择策略 L 或者策略或者策略 R 时，轮到参与者时，轮到参与者 2 进行策

33、进行策略选择。略选择。v参与者参与者 2 能观察到参与者能观察到参与者 1 没有选择策略没有选择策略 M，但参与者，但参与者 2 不知不知道参与者道参与者 1 究竟选择了策略究竟选择了策略 L 还是选择了策略还是选择了策略 R。v此博弈不存在子博弈。此博弈不存在子博弈。v根据根据“划横线法划横线法”求解博弈的纳什均衡。求解博弈的纳什均衡。v博弈有两个纳什均衡：（博弈有两个纳什均衡：（L，U）和（）和（M，V）。）。v纳什均衡仅考虑在均衡处的情况，而不考虑通往均衡的路径。纳什均衡仅考虑在均衡处的情况，而不考虑通往均衡的路径。v（M，V）虽然是纳什均衡，但在实际博弈中，没有通往这个纳）虽然是纳什均

34、衡，但在实际博弈中，没有通往这个纳什均衡的路径。什均衡的路径。参与者参与者2策略策略U策略策略V参与者参与者1策略策略L（2，3）（0，1）策略策略R（1，4）（0，2）策略策略M（1，10）（1，10）v博弈参与者博弈参与者 1 先行动，但参与者先行动，但参与者 1 在选择自己的策略时，会考在选择自己的策略时，会考虑自己的策略对博弈参与者虑自己的策略对博弈参与者 2 决策的影响。决策的影响。v如果参与者如果参与者 1 没有选择策略没有选择策略 M，那么参与者，那么参与者 2 会根据自己的主会根据自己的主观信念以及收益情况选择自己的策略。可以证明：参与者观信念以及收益情况选择自己的策略。可以证

35、明：参与者 2 必然必然会选择策略会选择策略 U。v理性的参与者理性的参与者 1 可以预期到：如果自己不选策略可以预期到：如果自己不选策略 M，而是选择，而是选择策略策略 L 或者策略或者策略 R，那么参与者，那么参与者 2 必然选择策略必然选择策略 U。v在这种序贯理性条件下，参与者在这种序贯理性条件下，参与者 1 会选择策略会选择策略 L，参与者，参与者 1 得得到收益到收益 2，参与者，参与者 2 得到收益得到收益 3。v如果参与者如果参与者 1 选择策略选择策略 M，那么参与者，那么参与者 1 仅能得到收益仅能得到收益 1。v所以先行动参与者所以先行动参与者 1 不会选择策略不会选择策

36、略 M。v尽管参与者尽管参与者 2 不知道参与者不知道参与者 1 选择了策略选择了策略 L 还是策略还是策略 R，但参，但参与者与者 2 必然会选择策略必然会选择策略 U。v所以，作为一个动态博弈，博弈路径必然是：参与者所以，作为一个动态博弈，博弈路径必然是：参与者 1 选择策略选择策略 L，参与者，参与者 2 选择策略选择策略 U。v博弈参与者博弈参与者 2 最希望看到的结果是：参与者最希望看到的结果是：参与者 1 选择策略选择策略 M，从，从而博弈结束。在这种情况下参与者而博弈结束。在这种情况下参与者 2 可以获得收益可以获得收益 10。但是，。但是，怎样才能让参与者怎样才能让参与者 1

37、选择策略选择策略 M 呢？呢？2不可置信的威胁不可置信的威胁v参与者参与者 2 如果放出这样的威胁：如果放出这样的威胁：“如果参与者如果参与者 1 没有选择策没有选择策略略 M，而是选择了策略，而是选择了策略 L 或策略或策略 R，那么参与者，那么参与者 2 必然选择必然选择策略策略 V”。v参与者参与者 2 的这种威胁如果成立，那么不管参与者的这种威胁如果成立，那么不管参与者 1 选择策略选择策略 L 还是策略还是策略 R，参与者，参与者 1 的收益都只有的收益都只有 0。如果选择策略。如果选择策略 M，参与者，参与者 1 可以得到收益可以得到收益 1。v如果参与者如果参与者 2 的威胁是可

38、置信的，那么参与者的威胁是可置信的，那么参与者 1 就会选择策就会选择策略略 M，得到收益，得到收益 1。参与者。参与者 2 得到收益得到收益 10。v然而，参与者然而，参与者 2 的这种威胁是不可置信的威胁。的这种威胁是不可置信的威胁。v参与者参与者 1 知道，如果自己没有选择策略知道，如果自己没有选择策略 M，那么参与者，那么参与者 2 会放弃威胁，理性的选择策略会放弃威胁，理性的选择策略 U。v博弈均衡为（博弈均衡为（L，U）。）。v参与者参与者 1 得到收益得到收益 2，高于选择策略，高于选择策略 M 的收益的收益 1。v参与者参与者 2 怎样将这种空洞的威胁变成可置信的威胁呢？怎样将

39、这种空洞的威胁变成可置信的威胁呢？3可置信的威胁可置信的威胁v如果参与者如果参与者 2 找到一个具有法律约束力的公正机构，并作出承找到一个具有法律约束力的公正机构，并作出承诺：如果参与者诺：如果参与者 1 没有选择策略没有选择策略 M，那么参与者，那么参与者 2 如果选择如果选择策略策略 U，则捐给出，则捐给出10，口说无凭，立字为据。，口说无凭，立字为据。v在这种情况下，博弈的收益就相应发生了变化。在这种情况下，博弈的收益就相应发生了变化。v容易得到：参与者容易得到：参与者 2 选择策略选择策略 U 的收益都低于选择策略的收益都低于选择策略 V 的收的收益。参与者益。参与者 2 会选择策略会

40、选择策略 V。v根据序贯理性原则，参与者根据序贯理性原则，参与者 1 预期到参与者预期到参与者 2 必然选择策略必然选择策略 V。v如果参与者如果参与者 1 选择了策略选择了策略 L 或者策略或者策略 R，那么参与者，那么参与者 1 只能得只能得到收益到收益 0。v如果参与者如果参与者 1 选择策略选择策略 M，会得到收益，会得到收益 1。 v因此理性的参与者因此理性的参与者 1 会选择策略会选择策略 M。博弈的均衡为：。博弈的均衡为：(M，V)。v因此，当参与者因此，当参与者 2 将自己将自己“必然选择策略必然选择策略 V”的威胁变为可置信的威胁变为可置信的威胁时，参与者的威胁时，参与者 1

41、会选择策略会选择策略 M 而不是策略而不是策略 L。v博弈只有一个纳什均衡：（博弈只有一个纳什均衡：（M，V）。）。v这个纳什均衡也是一个精炼贝叶斯纳什均衡。这个纳什均衡也是一个精炼贝叶斯纳什均衡。参与者参与者2策略策略U策略策略V参与者参与者1策略策略L（2，-7）（0，1）策略策略R（1，-6）（0，2）策略策略M（1，10）（1，10）“可置信威胁可置信威胁”下的策略型表达方式下的策略型表达方式第四节第四节不完全信息动态博弈的应用不完全信息动态博弈的应用v在不完全信息动态博弈中，一个重要的研究领域是：怎样有效在不完全信息动态博弈中，一个重要的研究领域是：怎样有效传递信号（传递信号（S

42、ignal）以及存在信号传递条件下的博弈均衡。）以及存在信号传递条件下的博弈均衡。v迈克尔迈克尔斯宾塞（斯宾塞（Michael Spence）教授研究了劳动力市场）教授研究了劳动力市场上的不完全信息、信号传递及均衡问题，为信息经济学的发展上的不完全信息、信号传递及均衡问题，为信息经济学的发展奠定了重要基础。奠定了重要基础。v一、劳动力市场信号博弈概述一、劳动力市场信号博弈概述v在劳动力市场中，雇主不能在招聘时明确知道应聘者的能力。在劳动力市场中，雇主不能在招聘时明确知道应聘者的能力。v即使被录用者已在工作岗位上时，雇主也往往无法立即获知劳即使被录用者已在工作岗位上时，雇主也往往无法立即获知劳

43、动者的真实能力。动者的真实能力。v雇主不可能随意解聘一个已经得到雇佣合同的员工。雇主不可能随意解聘一个已经得到雇佣合同的员工。v劳动力市场可以看作是一个具备不对称信息特征的投资市场。劳动力市场可以看作是一个具备不对称信息特征的投资市场。v雇主虽然观察不到劳动者的能力，但是能够观察到劳动者的外雇主虽然观察不到劳动者的能力，但是能够观察到劳动者的外部特征。如：性别、年龄、种族、受教育程度等。部特征。如：性别、年龄、种族、受教育程度等。v雇主可以通过观察劳动者的外部特征来形成对劳动者实际能力雇主可以通过观察劳动者的外部特征来形成对劳动者实际能力的主观信念。的主观信念。v像性别、年龄、种族这些不受劳动

44、者本身控制的特征，通常被像性别、年龄、种族这些不受劳动者本身控制的特征，通常被称为称为“指标（指标（Indices）”，只有劳动者能自我控制的特征：，只有劳动者能自我控制的特征：如受教育程度，才被称为如受教育程度，才被称为“信号（信号（Signal）”。v劳动者可以通过向雇主传递信号，还改变雇主的主观信念。劳动者可以通过向雇主传递信号，还改变雇主的主观信念。v通常说来，劳动者的受教育程度越到，雇主认为其是高能力的通常说来，劳动者的受教育程度越到，雇主认为其是高能力的劳动者的概率越大。劳动者的概率越大。v因此，劳动者的受教育程度是一个信号。因此，劳动者的受教育程度是一个信号。v劳动者的受教育程度

45、越高，劳动者得到雇佣的可能性越大。劳动者的受教育程度越高，劳动者得到雇佣的可能性越大。v如果拿到高学历不需要成本，则所有的劳动者都会选择高学历。如果拿到高学历不需要成本，则所有的劳动者都会选择高学历。v实际上，受教育需要付出成本：体力、脑力和时间等。实际上，受教育需要付出成本：体力、脑力和时间等。v为了得到某些有利于自己的信号而付出的成本，通常被称为为了得到某些有利于自己的信号而付出的成本，通常被称为“信号成本（信号成本（Signaling Cost）”。v假设劳动者取得高学历的成本和他的能力负相关：能力越高的假设劳动者取得高学历的成本和他的能力负相关：能力越高的劳动者获得高学历所需付出的成本

46、越低；能力越低的劳动者获劳动者获得高学历所需付出的成本越低；能力越低的劳动者获得高学历所需付出的成本越高。得高学历所需付出的成本越高。v由于劳动者获得高教育水平需要付出成本，即由于劳动者获得高教育水平需要付出成本，即“信号成本信号成本”，因此劳动者在决定自己接受多少年教育时，会考虑因此劳动者在决定自己接受多少年教育时，会考虑“多接受一多接受一年教育年教育”所带来的收益和所要付出的成本的相对大小。所带来的收益和所要付出的成本的相对大小。v在均衡处，应满足边际收益等于边际成本。这就是在均衡处，应满足边际收益等于边际成本。这就是“劳动者的劳动者的信号决策信号决策”过程。过程。劳动力市场和信号传递劳动

47、力市场和信号传递v虽然雇主认为：受教育程度越高，劳动者为高能力劳动者的概虽然雇主认为：受教育程度越高，劳动者为高能力劳动者的概率越大。率越大。v但是究竟受教育程度和能力之间是怎样的量化关系呢？但是究竟受教育程度和能力之间是怎样的量化关系呢？v雇主会根据以往的经验不断修正自己的判断。雇主会根据以往的经验不断修正自己的判断。v如果以往雇佣的高学历劳动者都是高能力、低学历劳动者都是如果以往雇佣的高学历劳动者都是高能力、低学历劳动者都是低能力，那么雇主会认为受教育程度和能力之间存在很强的相低能力，那么雇主会认为受教育程度和能力之间存在很强的相关性。反之，如果雇主以往雇佣的高学历劳动者能力并不高、关性。

48、反之，如果雇主以往雇佣的高学历劳动者能力并不高、低学历劳动者能力并不低，那么雇主就会逐渐认为受教育程度低学历劳动者能力并不低，那么雇主就会逐渐认为受教育程度和能力之间不存在很强的相关性。和能力之间不存在很强的相关性。v如果雇主认为受教育程度和能力之间存在很强的相关性，那么如果雇主认为受教育程度和能力之间存在很强的相关性，那么雇主就会更倾向于招聘那些高学历的劳动者，并更愿意为高学雇主就会更倾向于招聘那些高学历的劳动者，并更愿意为高学历的劳动者支付高工资。历的劳动者支付高工资。v反之，如果雇主认为受教育程度和能力之间不存在很强的相关反之，如果雇主认为受教育程度和能力之间不存在很强的相关性，那么雇主

49、可能并不愿意为高学历的劳动者提供太高的工资。性，那么雇主可能并不愿意为高学历的劳动者提供太高的工资。v雇主的信念对雇主的信念对“劳动者的信号决策劳动者的信号决策”也会产生影响。也会产生影响。v如果劳动者预期到雇主愿意为高学历的劳动者支付高工资，那如果劳动者预期到雇主愿意为高学历的劳动者支付高工资，那么劳动者就更有可能增加自己的受教育程度。反之，劳动者增么劳动者就更有可能增加自己的受教育程度。反之，劳动者增加自己受教育程度的热情会减少。加自己受教育程度的热情会减少。二、数理模型二、数理模型v可以通过一个简单的数理模型考察不完全信息劳动力市场的博可以通过一个简单的数理模型考察不完全信息劳动力市场的

50、博弈过程和均衡。弈过程和均衡。v假设劳动人口中有两种劳动者：低能力的和高能力的。假设劳动人口中有两种劳动者：低能力的和高能力的。v低能力的劳动者的边际产值为低能力的劳动者的边际产值为 1；高能力的劳动者的边际产值；高能力的劳动者的边际产值为为 2。v低能力劳动者占劳动者总人数的比例为：低能力劳动者占劳动者总人数的比例为：q1，高能力劳动者占，高能力劳动者占劳动者总人数的比例为：劳动者总人数的比例为：1 q1。v劳动者的受教育年数用劳动者的受教育年数用 y 表示。低能力的劳动者要想获得表示。低能力的劳动者要想获得 y 年年教育经历需要付出的成本为教育经历需要付出的成本为 y；高能力的劳动者要想获

51、得；高能力的劳动者要想获得 y 年年教育经历需要付出的成本为教育经历需要付出的成本为 y/2。v假设雇主的主观信念为：如果劳动者的受教育年数大于等于一假设雇主的主观信念为：如果劳动者的受教育年数大于等于一个临界值个临界值 y*，那么雇主将按照高能力劳动者的边际产值给该，那么雇主将按照高能力劳动者的边际产值给该劳动者付工资。劳动者付工资。v如果劳动者的受教育年数小于该临界值如果劳动者的受教育年数小于该临界值 y*，那么雇主将按照低，那么雇主将按照低能力劳动者的边际产值给该劳动者付工资。能力劳动者的边际产值给该劳动者付工资。v因此，雇主付给劳动者的工资因此，雇主付给劳动者的工资 w 与劳动者的受教

52、育程度与劳动者的受教育程度 y 有有关。关。v劳动者的受教育年限只可能是两种：劳动者的受教育年限只可能是两种：0年或者年或者 y* 年。年。v雇主应该选择一个合适的雇主应该选择一个合适的 y*，使得低能力的劳动者选择的受教，使得低能力的劳动者选择的受教育年限为育年限为0、高能力劳动者选择的受教育年限为、高能力劳动者选择的受教育年限为 y*。v这样的这样的 y* 能够使得雇主正确的将高能力劳动者和低能力劳动能够使得雇主正确的将高能力劳动者和低能力劳动者区分开，能够正确地按照劳动者的边际产值给劳动者付工资。者区分开，能够正确地按照劳动者的边际产值给劳动者付工资。v这样的机制满足自我确认（这样的机制

53、满足自我确认（Self-Confirming）的特征。）的特征。v求解求解 y* 的过程就是求解信号均衡（的过程就是求解信号均衡（Signal Equilibriam）的过程。的过程。三、博弈均衡三、博弈均衡v当当 1 y* 2 时时n低能力的劳动者选择的受教育年限为低能力的劳动者选择的受教育年限为 0，n高能力的劳动者选择的受教育年限为高能力的劳动者选择的受教育年限为 y*。v不同能力的劳动者选择的受教育年限不同。这样的均衡被称为不同能力的劳动者选择的受教育年限不同。这样的均衡被称为分离均衡（分离均衡（Separating Equilibrium）。）。v当当时时 y* 2 时时n不管是低

54、能力的劳动者还是高能力的劳动者都会选择受教育程度为不管是低能力的劳动者还是高能力的劳动者都会选择受教育程度为 0。v不同能力的劳动者选择的受教育年限相同。这样的均衡被称为不同能力的劳动者选择的受教育年限相同。这样的均衡被称为混同均衡（混同均衡（Pooling Equilibrium）专栏：迈克尔专栏：迈克尔斯宾塞简介斯宾塞简介v迈克尔迈克尔斯宾塞教授斯宾塞教授 1943 年出生于美国，年出生于美国，1962-1966 年年就读于普林斯顿大学，获得哲学学士学位。就读于普林斯顿大学，获得哲学学士学位。v1968年获牛津大学数学硕士学位，年获牛津大学数学硕士学位，1972年获哈佛大学经济学年获哈

55、佛大学经济学博士学位。博士学位。v斯宾塞曾供职于斯坦福大学、哈佛大学等，并曾任哈佛大学商斯宾塞曾供职于斯坦福大学、哈佛大学等，并曾任哈佛大学商学院院长、国家科技及经济政策研究委员会主席等职。学院院长、国家科技及经济政策研究委员会主席等职。v斯宾塞主要研究的是具有不完全信息的市场中各决策主体的经斯宾塞主要研究的是具有不完全信息的市场中各决策主体的经济行为。济行为。v在不完全信息市场中，往往存在逆向选择（在不完全信息市场中，往往存在逆向选择（Adverse Choice / Adverse Selection）。）。v在劳动力市场中，存在高能力的劳动者和低能力的劳动者。在劳动力市场中，存在高能力的

56、劳动者和低能力的劳动者。v如果信息是完全的，那么高能力的劳动者将得到高工资、低能力如果信息是完全的，那么高能力的劳动者将得到高工资、低能力的劳动者将得到低工资。的劳动者将得到低工资。v但招聘方并不能直接观察到应聘者的能力。因此，每个应聘者都但招聘方并不能直接观察到应聘者的能力。因此，每个应聘者都会宣称自己是高能力的。会宣称自己是高能力的。v作为真正的高能力的劳动者，为了使自己区别于低能力的劳动者，作为真正的高能力的劳动者，为了使自己区别于低能力的劳动者，有必要向招聘者传递一些低能力的劳动者所无法传递的信号。有必要向招聘者传递一些低能力的劳动者所无法传递的信号。v由于在不完全信息博弈和信号传递方

57、面的突出贡献，迈克尔由于在不完全信息博弈和信号传递方面的突出贡献，迈克尔斯斯宾塞教授获得了宾塞教授获得了 2001 年度诺贝尔经济学奖。年度诺贝尔经济学奖。第五节第五节补充阅读补充阅读v一、不完全信息动态博弈的要素一、不完全信息动态博弈的要素v假设博弈有假设博弈有 n 个参与者。参与者用个参与者。参与者用 i 表示，表示，i = 1,2,nv每个博弈参与者都有自己的策略空间。每个博弈参与者都有自己的策略空间。v博弈参与者可能是多种类型中的一种。博弈参与者可能是多种类型中的一种。v参与者参与者 i 明确知道自己的类型，但其他博弈参与者不知道参与者明确知道自己的类型，但其他博弈参与者不知道参与

58、者 i 的类型，但知道参与者的类型，但知道参与者 i 的类型空间的概率分布。的类型空间的概率分布。v博弈参与者对其他博弈参与者具有先验信念。在博弈过程中，博博弈参与者对其他博弈参与者具有先验信念。在博弈过程中，博弈参与者会修正自己的先验信念，得到后验概率。弈参与者会修正自己的先验信念，得到后验概率。v博弈的收益函数为共同知识（博弈的收益函数为共同知识（Common Knowledge）。）。二、贝叶斯统计方法图示二、贝叶斯统计方法图示贝叶斯统计方法图示贝叶斯统计方法图示三、精练贝叶斯纳什均衡满足的条件三、精练贝叶斯纳什均衡满足的条件v在精练贝叶斯纳什均衡中，每个博弈参与者的策略，都必在精练贝叶

59、斯纳什均衡中，每个博弈参与者的策略，都必须满足两个条件：须满足两个条件：v第一：给定其他博弈参与者的策略和参与者的后验概率，第一：给定其他博弈参与者的策略和参与者的后验概率，参与者在精练贝叶斯纳什均衡处的策略都是最大化自身预参与者在精练贝叶斯纳什均衡处的策略都是最大化自身预期收益的策略。期收益的策略。v第二：任意参与者的后验概率都是根据先验概率、进而通第二：任意参与者的后验概率都是根据先验概率、进而通过贝叶斯公式计算得到。过贝叶斯公式计算得到。本章小结本章小结v在不完全信息动态博弈中，至少有部分博弈参与者对博弈的结构、在不完全信息动态博弈中，至少有部分博弈参与者对博弈的结构、博弈参与者类型、博

60、弈收益等信息不完全了解。博弈参与者类型、博弈收益等信息不完全了解。v博弈参与者的行动存在先后顺序。博弈参与者的行动存在先后顺序。v可通过海萨尼转换将不完全信息动态博弈转化为完全但不完美信可通过海萨尼转换将不完全信息动态博弈转化为完全但不完美信息动态博弈。息动态博弈。v对不完全信息动态博弈均衡的求解，需要用到贝叶斯公式。对不完全信息动态博弈均衡的求解，需要用到贝叶斯公式。v贝叶斯统计的主要思路是：根据先验概率和数据信息，利用贝叶贝叶斯统计的主要思路是：根据先验概率和数据信息，利用贝叶斯公式得到后验概率。随着信息量的增加，不断修正主观概率值。斯公式得到后验概率。随着信息量的增加，不断修正主观概率值

61、。v今天的主观概率值既是过去主观概率值的后验概率，也是未来主今天的主观概率值既是过去主观概率值的后验概率，也是未来主观概率值的先验概率。观概率值的先验概率。v在精练贝叶斯纳什均衡中，各博弈参与者均最大化自己的期望效在精练贝叶斯纳什均衡中，各博弈参与者均最大化自己的期望效用，同时满足序贯理性。用，同时满足序贯理性。v不完全信息动态博弈的主要应用之一是信号博弈。不完全信息动态博弈的主要应用之一是信号博弈。v在劳动力市场中，雇主无法得知应聘者的能力，只能根据应聘者在劳动力市场中，雇主无法得知应聘者的能力，只能根据应聘者的特征指标和信号进行决策。的特征指标和信号进行决策。v应聘者按照自身净收益最大化的原则，决策自己发出的信号。应聘者按照自身净收益最大化的原则，决策自己发出的信号。v在信号博弈均衡处，雇主和应聘者之间需要能够自我确认。在信号博弈均衡处，雇主和应聘者之间需要能够自我确认。习题习题

展开阅读全文

不完全信息动态博弈

最新文档