赛局理论与策略行为

资源描述

《赛局理论与策略行为》由会员分享，可在线阅读，更多相关《赛局理论与策略行为（29页珍藏版）》请在金锄头文库上搜索。

1、賽局理論與策略行為 10n賽局理論是個體經濟學的分支。探討聰明又自利的人如何在策略性布局中採取行動及與對手互動。在木馬屠城記的例子中，帕拉米狄斯和奧德修斯是賽局中的參賽者。帕拉米狄斯使奧德修斯必須付出很高的代價才能圓謊，他靠著提高奧德修斯圓謊的代價，而改變奧德修斯的行為，使他露出破綻。因此，他不得不加入希臘的軍隊去攻打特洛伊。不幸地是，雖然希臘人打敗了特洛伊，但一切都被神諭料中，奧德修斯漂泊在外二十年才回到妻兒身邊。 10-2 同時行動賽局10-4 策略行動10-3 依序行動賽局n 章節內容10-5 重複賽局10-1 賽局理論的元素和分類10-1 賽局理論的元素和分類n19

2、44 年，馮紐曼教授 (J. Von Neumann) 和摩根斯坦教授 (O. Morgenstern) 共同發表賽局理論與經濟行為，書中探討廠商間策略性行為。 n任何賽局都有三個基本元素 (basic element)： 1. 參賽者 (players) 和遊戲規則 (rules) 2. 策略 (strategies) 3. 報酬 (payoffs)10-1 賽局理論的元素和分類n在現實生活中，廠商與廠商之間的互動情境並不一定相同，因此有許多不同類型的賽局出現。1. 同時行動賽局或依序行動賽局同時行動賽局 (simultaneous moves game) 是指參賽者之間同時行

3、動。依序行動賽局 (sequential moves game) 是指，一位參賽者會比另一位參賽者先採取行動。 10-1 賽局理論的元素和分類2. 合作賽局與非合作賽局合作賽局 (cooperative game) 是指參賽者的協議具有強制性。如果缺乏強制力，參賽者以自己的利益為準則而採取行動，則稱為非合作賽局 (noncooperative game)。3. 零和賽局與非零和賽局零和賽局 (zero-sum game) 是指參賽者一方的勝利是另一方的損失。非零和賽局 (nonzero-sum game) 是指參賽者的利益可以共享。10-2 同時行動賽局n單次同時行動：賽局

4、兩個或兩個以上的參賽者同時間做單獨一次的決策。肯德基廣告不廣告麥當勞廣告肯德基有3千萬元利潤肯德基有2千萬元利潤不廣告肯德基有5千萬元利潤肯德基有4千萬元利潤麥當勞有3千萬元利潤麥當勞有4千萬元利潤麥當勞有2千萬元利潤麥當勞有4千萬元利潤10-2 同時行動賽局n聶徐均衡(Nash equilibrium) 是指，在其它參賽者策略選定情況下，每個參賽者選擇報酬最高的策略。假設肯德基決定打廣告，麥當勞的最佳策略是打廣告。假設麥當勞決定打廣告，肯德基的最佳策略是打廣告。各家速食業者的聶徐均衡策略是做廣告。 10-2 同時行動賽局n囚犯兩難春嬌承認搶劫否認

5、搶劫志明承認搶劫春嬌獲判5年春嬌獲判20年否認搶劫春嬌獲判0年春嬌獲判2年志明獲判5年志明獲判0年志明獲判20年志明獲判2年10-2 同時行動賽局n囚犯兩難志明與春嬌的最佳策略還是承認，兩個人都坦承犯案，雙雙被判刑 5 年。這個結果並不是最好的結局。對兩人最好的結果應該是，兩人都抵死不認帳，只會各判 2 年。這正是經濟學裡最有趣的現象：理性的個人會追求自己的最大利益，可是所做的事反而對自己不利。貪婪也未必能為自己帶來好處。 10-2 同時行動賽局n優勢策略 (dominant strategy) 是指不管對手的選擇為何，參賽者會選擇對自己最有利的策略。在囚犯兩難

6、的例子，志明的優勢策略就是承認搶劫。 n劣勢策略 (dominated strategy) 是優勢策略的相反，它是指不論對手的策略為何，當參賽者有另外一個策略能夠帶來更高的策略時，此一策略即為劣勢策略。若參賽者只有兩個策略，其中一個是優勢策略，另一個必定是劣勢策略。 10-2 同時行動賽局n在這個賽局中，沒有一個參賽者有優勢策略。對每位參賽者而言，低價都是劣勢策略。赤坂拉麵高價中價低價樂山娘高價607035中價36 5035低價36 3025607035365035366025赤坂拉麵高價中價樂山娘高價6070中價36 5070603650a.a.樂山娘和赤

7、坂的拉麵賽局樂山娘和赤坂的拉麵賽局b.b.刪除刪除劣勢策略後的拉麵賽局劣勢策略後的拉麵賽局10-2 同時行動賽局n在某些賽局中，會有超過一個以上的聶徐均衡。一個多重均衡的典型例子是膽小鬼賽局。奕迅突然轉向不轉向霆鋒突然轉向0 10不轉向 10 200 1010 2010-2 同時行動賽局n膽小鬼賽局有四個特色。1. 每個參賽者都有一個強硬的策略和一個軟弱的策略。2. 在只有兩個策略的賽局中，均衡時只有一個參賽者是膽小鬼。3. 每位參賽者都偏好別人是膽小鬼的均衡。4. 雙方均採取強硬態度是最壞的結果。 10-3 依序行動賽局n在依序行動賽局中，一位參賽者比另一位參賽者先採

8、取行動。每次行動時，第二位參賽者會考慮第一位行動者所採取的策略，也會考慮目前的行動如何影響對手及自己未來的行動。 Avinash Dixit 與 Barry J. Nalebuff 在Thinking Strategically寫道：It takes a clever carpenter to turn a tree into a table; a clever strategist knows how to turn a table into a tree.句中的 tree 指的是賽局樹 (依序行動賽局)，而 table 是報酬矩陣 (同時行動賽局)。 10-3 依序行動賽局n咖啡連鎖店

9、：依序行動賽局頂新星巴克星巴克小規模大規模和解價格戰和解價格戰頂新的報酬星巴克的報酬 42011681021210-3 依序行動賽局n反推法 (backward induction) 可以用來求解依序行動賽局。倒推法是從思考所有最後可能結果，找出參賽者在各分支的最適決策，然後順著賽局樹的尾端反推到起始點。1. 假設頂新選擇大規模，星巴克的最適策略是進行價格戰。2. 假設頂新選擇小規模，星巴克的最適策略是達成和解。 10-3 依序行動賽局n從星巴克的最適反應，來確認頂新從每個策略所得到的最大利潤。1. 在星巴克最適策略已知情形下，若頂新選擇小規模進入，其利潤為 4 百萬元

10、。2. 在星巴克最適策略已知情形下，若頂新選擇大規模進入，其利潤為 2 百萬元。 n依序行動賽局的聶徐均衡是頂新選擇小規模而星巴克選擇和解。頂新的利潤是 4 百萬元，而星巴克的利潤是 2 千萬元。 10-3 依序行動賽局在依序行動賽局中，廠商的決策問題與時間有關：星巴克能夠看到頂新的決策，而頂新會依賴星巴克的理性反應。因此，頂新能夠藉由自己選擇小規模的進入市場，迫使星巴克的最佳反應是達成和解。在同時行動賽局中，星巴克無法事先得知頂新的決定，因而無法逼迫星巴克達成和解。 10-4 策略行動n策略行動 (strategic moves) 是你在賽局中先採取行動改變競爭對手的行動和規

11、則，以作出對自己有利的選擇。策略行動最重要的特色是特意限制自己的選擇自由。 n策略行動會改變原來賽局的規則，製造出一個兩階段的賽局。其中第二階段是原來的賽局，而第一階段的行動引導參賽者在第二階段的行動。 n要讓策略行動順利運作，它必須是可信且無法轉向。 10-4 策略行動n一般說來，策略行動分成三類：承諾、威脅和保證。這三種策略行動的目的是企圖改變第二階段的結果，以得到對自己有利的選擇。威脅 (threat) 是指，如果你不跟我合作，我將懲罰你。n這場賽局中，美國的優勢策略是開放市場，而日本的優勢策略是封閉市場。日本開放封閉美國開放3 4封閉124 32 1

12、10-4 策略行動n若美國選擇反應規則 (response rule) 是如果你封閉市場，我們也封閉市場，威脅的策略行動使賽局變成兩階段賽局。美國日本封閉開放日本開放封閉開放3 4封閉124 32 1美國的報酬日本的報酬 124310-4 策略行動若美國使用威脅的手段，即美國第一個行動，在第二個階段只有日本有自由選擇權。利用反推法，我們可以得到面對日本的策略，美國可能報酬為：a. 若日本封閉，美國的最適反應也是封閉，則美國報酬為 1，日本報酬為 2。b. 若日本開放，美國的最適反應也是開放，則美國報酬為 4，日本報酬為 3。 n面對美國的可能報酬，日本的最適策略

13、為開放市場，且美國可以得到最高的報酬 4。 10-4 策略行動n承諾(commitment)是指，如果你的行動符合我的意願，我會獎勵你。例如膽小鬼賽局：限制行動，選擇的承諾。奕迅突然轉向不轉向突然轉向0 10不轉向-10-20霆鋒0-1010-20霆鋒奕迅突然轉向不轉向不轉向-10-20霆鋒10-2010-4 策略行動n當執行威脅的策略行動對你比較有利時，稱此警告 (warning)。當執行承諾的策略行動對你比較有利時，稱為保證 (assurance)。 n拉麵賽局：保證樂山娘高價中價赤坂拉麵高價中價高價60 70中價3650樂山娘60367

14、050樂山娘赤坂拉麵 60607036赤坂拉麵不保證保證10-4 策略行動n如果赤坂拉麵不做任何保證，賽局的均衡是雙方都採取中價策略，這並不是最好的結果。n如果赤坂拉麵做可信的保證，樂山娘在第二階段是先行，所以赤坂拉麵採取高價策略是最佳反應。 10-5 重複賽局n參賽者之間行動和報酬一再地持續稱為，重覆賽局 (repeated game)。赤坂拉麵高價中價樂山娘高價60 70中價36506036705010-5 重複賽局n有限次的重覆賽局在有限次的重覆賽局，聶徐均衡為兩家店都採中價策略，利潤各為 50。n無限次重覆賽局 1. 在重覆賽局中，參賽者的策略會受前一回合結果的影響，稱為觸發策略(trigger strategy) 。10-5 重複賽局2. 以牙還牙策略 (tit-for-tat strategy)：對手合作，你就合作；對手欺騙，你就欺騙。 3. 嚴格反制策略 (grim trigger strategy)：對手作弊一次，將使你在接下來的賽局都選擇不合作的策略。n總之，重覆賽局中採取以牙還牙策略的聶徐均衡為：兩家店都採取高價策略，赤坂拉麵和樂山娘的利潤都是 60。

展开阅读全文