赛局理论与策略行为

上传人:飞*** 文档编号:51731216 上传时间:2018-08-16 格式:PPT 页数:29 大小:2.31MB
返回 下载 相关 举报
赛局理论与策略行为_第1页
第1页 / 共29页
赛局理论与策略行为_第2页
第2页 / 共29页
赛局理论与策略行为_第3页
第3页 / 共29页
赛局理论与策略行为_第4页
第4页 / 共29页
赛局理论与策略行为_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《赛局理论与策略行为》由会员分享,可在线阅读,更多相关《赛局理论与策略行为(29页珍藏版)》请在金锄头文库上搜索。

1、 賽局理論與策略行為 10n賽局理論是個體經濟學的分支。探討聰明又自 利的人如何在策略性布局中採取行動及與對手 互動。在木馬屠城記的例子中,帕拉米狄斯和 奧德修斯是賽局中的參賽者。帕拉米狄斯使奧 德修斯必須付出很高的代價才能圓謊,他靠著 提高奧德修斯圓謊的代價,而改變奧德修斯的 行為,使他露出破綻。因此,他不得不加入希 臘的軍隊去攻打特洛伊。不幸地是,雖然希臘 人打敗了特洛伊,但一切都被神諭料中,奧德 修斯漂泊在外二十年才回到妻兒身邊。 10-2 同時行動賽局10-4 策略行動10-3 依序行動賽局n 章節內容10-5 重複賽局10-1 賽局理論的元素和分類10-1 賽局理論的元素和分類n19

2、44 年,馮紐曼教授 (J. Von Neumann) 和 摩根斯坦教授 (O. Morgenstern) 共同發表賽 局理論與經濟行為,書中探討廠商間策略性行 為。 n任何賽局都有三個基本元素 (basic element): 1. 參賽者 (players) 和遊戲規則 (rules) 2. 策略 (strategies) 3. 報酬 (payoffs)10-1 賽局理論的元素和分類n在現實生活中,廠商與廠商之間的互動情境並 不一定相同,因此有許多不同類型的賽局出現 。1. 同時行動賽局或依序行動賽局 同時行動賽局 (simultaneous moves game) 是 指參賽者之間同時行

3、動。 依序行動賽局 (sequential moves game) 是指, 一位參賽者會比另一位參賽者先採取行動。 10-1 賽局理論的元素和分類2. 合作賽局與非合作賽局 合作賽局 (cooperative game) 是指參賽者的協 議具有強制性。如果缺乏強制力,參賽者以自 己的利益為準則而採取行動,則稱為非合作賽 局 (noncooperative game)。3. 零和賽局與非零和賽局 零和賽局 (zero-sum game) 是指參賽者一方的 勝利是另一方的損失。 非零和賽局 (nonzero-sum game) 是指參賽者 的利益可以共享。10-2 同時行動賽局n單次同時行動:賽局

4、兩個或兩個以上的參賽者 同時間做單獨一次的決策。 肯德基 廣告不廣告麥 當 勞廣 告肯德基有3千萬元 利潤肯德基有2千萬元 利潤不 廣 告肯德基有5千萬元 利潤肯德基有4千萬元 利潤麥當勞 有3千萬元利潤麥當勞 有4千萬元利潤麥當勞 有2千萬元利潤麥當勞 有4千萬元利潤10-2 同時行動賽局n聶徐均衡(Nash equilibrium) 是指,在其它 參賽者策略選定情況下,每個參賽者選擇 報酬最高的策略。假設肯德基決定打廣告,麥當勞的最佳策 略是打廣告。假設麥當勞決定打廣告,肯 德基的最佳策略是打廣告。各家速食業者 的聶徐均衡策略是做廣告。 10-2 同時行動賽局n囚犯兩難 春嬌 承認搶劫否認

5、搶劫志 明承 認 搶 劫春嬌獲判5年春嬌獲判20年否 認 搶 劫春嬌獲判0年春嬌獲判2年志明獲判5年志明獲判0年志明獲判20年志明獲判2年10-2 同時行動賽局n囚犯兩難志明與春嬌的最佳策略還是承認,兩個人都坦 承犯案,雙雙被判刑 5 年。這個結果並不是最 好的結局。 對兩人最好的結果應該是,兩人都抵死不認帳 ,只會各判 2 年。這正是經濟學裡最有趣的現 象:理性的個人會追求自己的最大利益,可是 所做的事反而對自己不利。貪婪也未必能為自 己帶來好處。 10-2 同時行動賽局n優勢策略 (dominant strategy) 是指不管對手的 選擇為何,參賽者會選擇對自己最有利的策略。 在囚犯兩難

6、的例子,志明的優勢策略就是承認搶 劫。 n劣勢策略 (dominated strategy) 是優勢策略的相 反,它是指不論對手的策略為何,當參賽者有另 外一個策略能夠帶來更高的策略時,此一策略即 為劣勢策略。 若參賽者只有兩個策略,其中一個是優勢策略, 另一個必定是劣勢策略。 10-2 同時行動賽局n在這個賽局中,沒有一個參賽者有優勢策略。 對每位參賽者而言,低價都是劣勢策略。赤坂拉麵 高價中價低價樂 山 娘高 價607035中 價36 5035低 價36 3025607035365035366025赤坂拉麵 高價中價樂 山 娘高 價6070中 價36 5070603650a.a.樂山娘和赤

7、坂的拉麵賽局樂山娘和赤坂的拉麵賽局b.b.刪除刪除劣勢策略後的拉麵賽局劣勢策略後的拉麵賽局10-2 同時行動賽局n在某些賽局中,會有超過一個以上的聶徐均衡。 一個多重均衡的典型例子是膽小鬼賽局。 奕迅 突然轉向不轉向霆 鋒突 然 轉 向0 10不 轉 向 10 200 1010 2010-2 同時行動賽局n膽小鬼賽局有四個特色。1. 每個參賽者都有一個強硬的策略和一 個軟弱的策略。2. 在只有兩個策略的賽局中,均衡時只有一 個參賽者是膽小鬼。3. 每位參賽者都偏好別人是膽小鬼的均衡。4. 雙方均採取強硬態度是最壞的結果。 10-3 依序行動賽局n在依序行動賽局中,一位參賽者比另一位參賽 者先採

8、取行動。每次行動時,第二位參賽者會 考慮第一位行動者所採取的策略,也會考慮目 前的行動如何影響對手及自己未來的行動。 Avinash Dixit 與 Barry J. Nalebuff 在Thinking Strategically寫道:It takes a clever carpenter to turn a tree into a table; a clever strategist knows how to turn a table into a tree.句中的 tree 指的是賽局樹 (依序行動賽局),而 table 是報酬矩陣 (同時行動賽局)。 10-3 依序行動賽局n咖啡連鎖店

9、:依序行動賽局 頂新星 巴 克星 巴 克小規模大規模和解價格戰和解價格戰頂新的報酬星巴克的報酬 42011681021210-3 依序行動賽局n反推法 (backward induction) 可以用來求解 依序行動賽局。倒推法是從思考所有最後可能 結果,找出參賽者在各分支的最適決策,然後 順著賽局樹的尾端反推到起始點。1. 假設頂新選擇大規模,星巴克的最適策 略是進行價格戰。2. 假設頂新選擇小規模,星巴克的最適策 略是達成和解。 10-3 依序行動賽局n從星巴克的最適反應,來確認頂新從每個策略 所得到的最大利潤。1. 在星巴克最適策略已知情形下,若頂新選擇 小規模進入,其利潤為 4 百萬元

10、。2. 在星巴克最適策略已知情形下,若頂新選擇 大規模進入,其利潤為 2 百萬元。 n依序行動賽局的聶徐均衡是頂新選擇小規模 而星巴克選擇和解。頂新的利潤是 4 百萬元,而星巴克的利潤是 2 千萬元。 10-3 依序行動賽局在依序行動賽局中,廠商的決策問題與時間有 關:星巴克能夠看到頂新的決策,而頂新會依 賴星巴克的理性反應。因此,頂新能夠藉由自 己選擇小規模的進入市場,迫使星巴克的最佳 反應是達成和解。在同時行動賽局中,星巴克無法事先得知頂新 的決定,因而無法逼迫星巴克達成和解。 10-4 策略行動n策略行動 (strategic moves) 是你在賽局中先採取 行動改變競爭對手的行動和規

11、則,以作出對自己 有利的選擇。策略行動最重要的特色是特意限制 自己的選擇自由。 n策略行動會改變原來賽局的規則,製造出一個兩 階段的賽局。其中第二階段是原來的賽局,而第 一階段的行動引導參賽者在第二階段的行動。 n要讓策略行動順利運作,它必須是可信且無法轉 向。 10-4 策略行動n一般說來,策略行動分成三類:承諾、威脅和保證。 這三種策略行動的目的是企圖改變第二階段的結果, 以得到對自己有利的選擇。威脅 (threat) 是指,如果 你不跟我合作,我將懲罰你。n這場賽局中,美國的 優勢策略是開放 市場,而日本的優勢 策略是封閉市場 。日本 開 放封 閉美 國開 放3 4封 閉124 32 1

12、10-4 策略行動n若美國選擇反應規則 (response rule) 是如果你封 閉市場,我們也封閉市場, 威脅的策略行動使賽局變成 兩階段賽局。美 國日 本封閉開放日本 開 放封 閉 開 放3 4封 閉124 32 1美國的報酬 日本的報酬 124310-4 策略行動若美國使用威脅的手段,即美國第一個行動,在第二 個階段只有日本有自由選擇權。利用反推法,我們可 以得到面對日本的策略,美國可能報酬為:a. 若日本封閉,美國的最適反應也是封閉,則美國報 酬為 1,日本報酬為 2。b. 若日本開放,美國的最適反應也是開放,則美國報 酬為 4,日本報酬為 3。 n面對美國的可能報酬,日本的最適策略

13、為開放市 場,且美國可以得到最高的報酬 4。 10-4 策略行動n承諾(commitment)是指,如果你的行動符合我的 意願,我會獎勵你。例如膽小鬼賽局:限制行動 ,選擇的承諾。奕迅 突然轉向不轉向 突然 轉向0 10不轉 向-10-20霆 鋒0-1010-20霆 鋒奕迅 突然轉向不轉向 不轉 向-10-20霆 鋒10-2010-4 策略行動n當執行威脅的策略行動對你比較有利時,稱 此警告 (warning)。當執行承諾的策略行動對 你比較有利時,稱為保證 (assurance)。 n拉麵賽局:保證 樂 山 娘高價中價赤坂拉麵 高 價中 價 高 價60 70中 價3650樂 山 娘60367

14、050樂山娘 赤坂拉麵 60607036赤 坂 拉 麵不保證保 證10-4 策略行動n如果赤坂拉麵不做任何保證,賽局的均衡 是雙方都採取中價策略,這並不是最好的 結果。n如果赤坂拉麵做可信的保證,樂山娘在第 二階段是先行,所以赤坂拉麵採取高價策 略是最佳反應。 10-5 重複賽局n參賽者之間行動和報酬一再地持續稱為,重覆 賽局 (repeated game)。 赤坂拉麵 高 價中 價樂 山 娘高 價60 70中 價36506036705010-5 重複賽局n有限次的重覆賽局 在有限次的重覆賽局,聶徐均衡為兩家店都採 中價策略,利潤各為 50。n無限次重覆賽局 1. 在重覆賽局中,參賽者的策略會受前一回合 結果的影響,稱為觸發策略(trigger strategy) 。10-5 重複賽局2. 以牙還牙策略 (tit-for-tat strategy):對手合 作,你就合作;對手欺騙,你就欺騙。 3. 嚴格反制策略 (grim trigger strategy):對手 作弊一次,將使你在接下來的賽局都選擇不合 作的策略。n總之,重覆賽局中採取以牙還牙策略的聶徐均 衡為:兩家店都採取高價策略,赤坂拉麵 和樂山娘的利潤都是 60。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号