賽局模型建立

第三章研究方法

第三節賽局模型建立

本研究主要是利用賽局分析中國與美國在南海競合策略，此兩大強國為賽局中互動的兩各個體，依照賽局理論分類互動關係建立靜態賽局模式運用與動態賽局模式，並建構的是一個策略形式及擴展形式賽局。

一、靜態賽局分析

吳正光(2012)賽局開始時，參賽者的策略是同時出現，彼此間的互動

訊息完全知道，稱這個賽局是靜態賽局，通常這種賽局以矩陣表示參賽者的策略互動關係。

利用納許均衡，我們可以求得靜態賽局的均衡解，同時，亦可得知此靜態賽局會產生「囚徒的困境」；此中所指之「困境」，簡單地說，乃參與賽局兩人同時做選擇，個別之選擇彼此間互不影響，亦即我的選擇不會影響對方之選擇，反之亦然；不管對方怎麼做，選擇背叛(Defence, D) 都會得到較合作(Cooperation,C)好的結果，此意味您應該選擇背叛（韓慧林與王貴民，2009）。

表3-1 所列為對稱 2×2 矩陣策略型賽局模式，可得出四種互動情形:

一、(C,C):Player1 與 Player2 皆採合作的策略，其雙方報酬為(C1,C2)。

二、(C,D):Player1 採取合作策略，Player2 採取背叛策略，其雙方報酬為 (C1,D2)

三、(D,C): Player1 採取背叛策略，Player2 採取合作策略。其雙方報酬為

(D1,C2)

四、(D,D):Player1 與 Player2 皆採背叛的策略，其雙方報酬為(D1,D2)。

表中定好 4 個報酬的偏好程度後，賽局有以下關係

「D1C2>C1C2>D1D2>C1D2」意味著參賽者認為 D1C2 結果優於 C1C2、

C1C2 結果優於 D1D2、D1D2 結果優於 C1D2，而這樣的賽局亦就是「囚徒困境」(Poundstone，2012)。

表3-1 策略形式賽局

Player2

Player1

C D

C ^Ⅰ C1 C2 ^Ⅱ C1 D2

D ^Ⅲ D1 C2 ^Ⅳ D1 D2

若運用於兩個囚徒隔離偵訊時，對兩個人最好之情況是雙方都否認犯行(C1,C2)，但因為隔離審問，囚徒會推想對方一旦承認(認罪協商)，

而自己卻堅持否認，反而倒楣(C1,D2)；相反地，自己承認(認罪協商)，

而對方卻堅持否認，那麼自己就佔了便宜(D1,C2)；萬一對方也承認，結果也不算是最壞(D1,D2)此亦為納許均衡。

本研究即以「囚徒困境」賽局模型為起點，導入中、美在南海競合博奕之中。

二、動態賽局分析

(一)完全信息動態賽局：子賽局完美納許均衡

在動態競爭下，參與者出招則有先後之別，往往在觀察到對手的動作之後，才決定自己的動作，競爭者之間形成動態的互動現象，A看到C 上一次出手的策略，C同樣觀察A上一次出手的策略，依此訂定下一回合

的行動，策略交錯影響構成一個極為豐富的動態關聯；從賽局分析的方便程度來看，擴展式表述適合討論動態賽局。

擴展式新穎之處在使用賽局樹(game tree)，包括3種要素：

1.誰是參賽者(以環節圓圈表示)

2.何時可以行動、行動時選擇的策略(以枝幹直線表示)、參賽者行動時的資訊集合(以環節圓圈的集合表示)

3.對應參賽者所有可能選取的策略，各參賽者所得到的報酬(放在賽局樹末端的括弧內)。

賽局樹的表示方法中，就像樹只有一個根，出發點都只有一個；再用環節圓圈表示參賽者可採行的時點，每個環節可伸出數個枝幹來表示該參賽者可採行的策略；而在最終枝幹末掛上與序列策略相應的報酬。

以「進入嚇阻」Ⅰ模型說明之²²： A百貨公司考慮準備進入某地區市場，A百貨公司與C百貨公司間，有先行者與跟隨者的關係，C公司會考

22. 本例引自《經理人月刊》編輯部 2007 年。

量要不要率先採取什麼策略嚇阻A公司成立；或者，靜觀A公司出什麼招，

再決定自己要採取什麼措施，A、C公司間的策略應該動態地相互調整。

A公司如果成立，C公司以合作策略應，C公司可以賺到50億，A公司只能賺到10億；C公司若採取競爭策略，則C公司只能賺30億，但會造成新公司賠10億，所以C公司可能藉此企圖造成新公司的損失以為嚇阻，讓 A公司斷絕進入的念頭；另一方面，A公司若不成立，C公司成為市場的獨占廠商，不論採取合作或競爭策略，都會賺100億。

其一是A公司成立，C公司採取合作，各賺10億與50億；另一個則嚇阻成功，A公司決定不成立，C公司採取競爭策略，仍獨占市場，賺100 百億。但因為同時存在兩個納許均衡(進入、合作)的策略組合可能會成為

真實發生的均衡，則嚇阻策略就未必有效。以上「進入嚇阻」Ⅰ賽局以賽賽局樹表示如圖3-2:

圖3-2 「進入嚇阻」Ⅰ賽局樹

資料來源：賽局高手-全方位策略與運用 2002；本研究繪製子賽局

子賽局是在擴展式賽局中分出來的一支小樹，這小樹枝同樣有分支及節點，參賽者及其可以選擇的策略構成的一個子賽局。

藉由賽局樹找出合理策略的手法稱為逆向歸納法，這程方法是從距離賽局終點最近的決策點開始，依序找出參賽者所選擇的合理決策;由於決策是從結論反推回去，因此稱為逆向歸納法。

在圖3-2賽樹中， C公司的決策點有2種，選上方決策點選「合作」

則報酬是50億；反之選「競爭」則報酬是30億，C公司合理的選擇是「合作」，這樣可得報酬是50億，以紅色粗線表示所採子賽局最適策略；C公司接著選下方決策點，在A公司不進入的狀況，A、C公司的損益是相同。

A公司判斷C公司會在A公司進入後採取「合作」以維持最佳利益，

那麼A公司在進入與不進入兩者間選擇，進入則賺10億，不進入則毫無利潤；當然選擇進入市場，也以紅色粗線表示，依靠這些箭頭找到一個「合理」的均衡，它不但是納許均衡，也是一個具「完美特性」的均衡。換言之，透過從最後的子賽局往前倒推的「逆向歸納法」(backward induction)，

得到唯一的均衡：A公司進入市場，C公司維持合作。至於C公司競爭的威脅，只是空洞的威脅。

這樣由各個子賽局逆推尋找最適反應，就得到了「子賽局完美均衡」

(Subgame Perfect Nash Equilibrium，SPNE)，²³子賽局完美均衡一般是動

23. 薛爾頓(1965)通過對動態賽局的分析完善那許均衡的概念，定義了「子賽局完美納許均衡」。

態賽局納許均衡的子集合，較納許均衡更精煉，特別是均衡太多的時候，

子賽局完美均衡可以帶來更多的預測能力。只有放進動態賽局中才能檢驗威脅到底是不是可信的威脅。

納許均衡在到達均衡後，任一參賽者都沒有誘因偏離這個均衡策略，

子賽局完美均衡是一組策略(A公司進入、C公司合作)，不但是整個賽局的納許均衡，而且也是各個子賽局的納許均衡。

同時，可以用逆向歸納法向前解出唯一均衡，紅色路徑方向很清楚顯示策略選擇，當真正的子賽局出現的時候，可能會減少均衡數目。 (二)不完全信息動態賽局：完美貝氏均衡

張維迎(2001)對應不完全信息動態賽局的均衡概念是「完美貝氏均衡」

24，完美貝氏均衡的要點在於參賽者所觀察到他人行為來修正自己的信念 (主觀機率)，並由此選擇自己的策略，而修正過程使用貝氏定理²⁵；具體而言，完美貝氏均衡是參賽者策略和信念的結合；亦是Selten(1965)完全訊息動態賽局子賽局完美納許均衡與Harsanyi(1967-1968) 不完全訊息靜態賽局貝氏納許均衡的結合。

Harsanyi(1967-1968) 引入一個虛擬的參與人－自然(nature)，將不完

全信息轉換為不完美信息賽局的標準方法，自然在賽局的開始選擇包括參與者的策空間、資訊集、報酬等將參賽者擁有所有信息，稱為類型(type)，

24. 不完全信息動態賽局的均衡概念是「完美貝氏均衡」對此作出主要貢獻有 Selten,1975、Kreps and Wilson,1982 及 Fudenberg and Tirole,1991。

根據這樣定義；在「進入嚇阻」Ⅱ模型中，以N意指自然為起點，C公司在訊息集合中不知道A公司進入者是那種類型，只知道A公司進入者有可能有P的機率強悍類型，(1- P)機率是溫和類型，而A公司進入者亦可能知道(C公司定價策略)或不知道(C公司定價策略) ，彼此不明強弱情況下，C 公司遇到A公司是溫和類型，當採取合作策略可獲得報酬是50億，採取競爭策略報酬從50億降到30億，A公司同樣受傷害，報酬從10億到賠10億；

倘若C公司遇到A公司是強悍類型，損害則難以估計，以X表示，X小於30，

圖3-3中，交錯又含多個要素的資訊集合型態，是不完全訊息賽局的特色。

圖3-3 「進入嚇阻」Ⅱ賽局樹

資料來源：賽局高手-全方位策略與運用 2002；本研究繪製

就如本研究賽局，美國因資訊不足而低估中國捍衛南海島礁主權的決心，中國亦可能誤判美國為保障國家利益及安全協防菲、越及南海對美國國家利益的能力（陳佩修與謝明勳，2016）；因此，本研究即以完全

信息動態賽局-子賽局完美納許均衡、不完全信息動態賽局-完美貝氏均衡，

導入中、美在南海競合博奕之中。

在文檔中運用賽局理論探討中、美南海競合策略之研究: 兼論我國太平島安全 (頁 58-66)

第三章 研究方法

第三節 賽局模型建立

第三章研究方法

第三節賽局模型建立