因為短期的「不合作賽局」，將難以導向「合作」的結果

(1)

第二章理論基礎

第一節賽局理論與囚徒困境

壹、賽局理論

賽局理論是『策略性思考』的系統性知識，是屬於『理性選擇分析』的研究途徑，透過策略推估尋求自己的最大勝算或利益，從競爭中求生存，雖然接受人們自利的動機，但對價格機能發揮完全作用的環境和條件提出質疑。賽局理論預設最少有兩位認知的理性決策者，

而賽局的基本要素包括：玩家 (players) 、行動 (actions) 、訊息 (informations)、策略(strategies)、利得(payoffs)、結果(outcomes)、均衡 (equilibria)。玩家、行動與結果共同被指定為遊戲規則，而且模型建構者的目的，是使用這些遊戲規則來決定均衡。（黃東煬、陳立譯，2006：

177）

賽局理論植基於衝突雙方，透過溝通進行長期互動，可說是一套

「動態的獎懲策略」。如果套用到「國際關係」上，以「善意」回應「善意」之外，也要適當運用籌碼，發出「意向清楚」的「可信威脅」。因為短期的「不合作賽局」，將難以導向「合作」的結果。也就是在本文第五章中所討論的，以有限重複囚徒困境參賽者容易選擇背叛策略。

因為他們不會有下一次的賽局，也不會遭致報復。所以只有在無限重複囚徒困境賽局中才會有『合作』的可能出現。

在互動過程中，適時「互釋善意」尤其重要，而善意的「起始」

更是最終能否導向「合作」的基礎。在國際衝突和戰略，加強防禦力並不足以阻嚇別國進攻，要有反擊力才有用，因為不會反擊，對攻方造成損傷有限，例如：北韓發展核彈就是出於這種考慮。賽局理論是在目標衝突下，建構各行動者間策略互動模型的一種有效方式。賽局

(2)

理論的優點，在於他的精簡性 (parsimony) 與抽象層次 (level of abstraction)。（黃東煬、陳立譯，2006：178）因為賽局理論是以嚴謹且明確的人類行為理論為基礎，這項理論藉由經驗的累積產生相關的假設，解釋並預測對手的行為並做出最適的策略。

賽局理論的目的，也就是試圖將行為者之間戰略上的互動予以形塑化、簡單化，進而找出一套標準化的互動模式，而其中的囚徒困境的賽局模型，正是具有現實主義要義的一種典範。(高德源譯，2002：

25)。在賽局理論中，最簡單的模型結構至少要包含兩位理性的參賽者，他們彼此互動，互動的策略有二，合作與背叛。

賽局表現的方式，通常以 2×2(two by two)的方式展現，每個 2×

2(two by two)的賽局會有四種結果，以表 2-1 表示簡略說明囚徒困境，

有兩個行動者都是獨立理性的，都嘗試極大化自身的利益。每位行動者都於選項中二擇一其行動，分別為合作與背叛。

表 2-1 廣義的 2*2 賽局 CC

R，R

DC

T，S CD

S，T

DD

P，P

資料來源：本表摘自（高德源譯，2002：26）

說明：R＝『獎賞』（CC，也就是二位者都採取合作態度）

T＝『引誘』（DC，先引誘對方採取合作，再以背叛回應之。）

S＝『受騙』（CD，本身採取合作，被另一行為者背叛）

P＝『處罰』（DD，二位行為者皆採取敵對背叛）

合作策略以 C(cooperate)表示，而背叛策略以 D(defect)表示。

這項賽局是非合作性的（non-cooperative）（具約束力的協議是禁止

(3)

的），每個行動者選擇一項行動，而且是同時做選擇的。而這兩位行動者對賽局結果的偏好順序被假設為：DC＞CC＞DD＞CD。

賽局的種類很多，諸如懦夫賽局、獵鹿賽局、和諧賽局、僵局賽局、囚徒困境、恃強凌弱賽局等。而其中囚徒困境(The Prisoner’s Dilemma)、懦夫賽局、獵鹿賽局向來引起許多學者的關注，正是因為利益均霑要能夠實現，合作是必須的但絕對不是自動達成的。以下簡介兩種國際戰略上常常用到的賽局類型，分別為懦夫賽局（又可成為小雞賽局）及囚徒困境賽局，而囚徒困境賽局將會在稍後的章節作更詳細的敘述：

一、懦夫賽局的簡單介紹

懦夫賽局又稱小雞賽局（Chicken Game），他最著名的例子：1950 年代有兩個年輕人，他們相約決鬥，分別在街道兩側對向行駛，如果將車子偏向避免車禍的人就是『懦夫』，直衝的人是『勇士』，獲得勝利。但雙方都採取『直衝』的策略，將會發生車禍，兩敗俱傷。

表 2-2 懦夫賽局報酬表

中國

偏向（懦夫）不偏向（勇士）

偏向（懦夫）（0，0）（-1，1）

日本不偏向（勇士）（1，-1）（-2，-2）

資料來源：作者製繪。

說明：偏好順序為：1>0>-1>-2

在懦夫賽局中，對參賽者最好的結果，當然是對方偏向，自己成為勇士，但也不希望自己出車禍。所以在『勇士』與『懦夫』這兩個極端間，雙方都是懦夫的結果，比自己都是懦夫還強。懦夫賽

(4)

局中，每一個參賽者都有一個『強硬』的策略和一個『軟弱』的策略。在此賽局中有兩個純粹那許均衡，每一均衡中，會有一位參賽者會選擇偏向成為『懦夫』。每位參賽者會偏好對方是『懦夫』。也都知道雙方都採取『強硬』的策略後果會非常糟糕。（藍兆杰、徐偉傑、陳宜君譯，2002：109）

在表 2-2 中雙方如果都選擇偏向，雖然都成為懦夫，但下場都不若兩者都選擇強硬的直衝下場來的損失慘重。（-1，1）及（1，-1）

皆為純粹那許均衡，因為都是雙方都想達到的目標，所以兩者都想設法影響結果，為了達到這個偏好，他想讓對方確信自己是有決心也會執行『直衝』這個策略，企圖嚇阻對手，但在此方面也有相當大的風險，因為當對方也同樣意圖實行嚇阻時，兩車同時直衝，即便及時轉向，但有時轉向時已經距離太近，所以也免不了『擦搶走火』翻車了。

二、囚徒困境賽局的簡單介紹

最早是由 Duncan R. Luce 和 Howard Raiffa 發展出來，他主要的內容是說，有兩個犯人共同犯下一件案子而被警察逮捕，但必須犯人承認犯罪才能定其罪刑。警察將其隔離偵訊並告知犯人認罪條件，如果一方認罪，一方不認罪，認罪者將被釋放，而不認罪的人將被判 20 年。但若兩人皆不認罪，則將被判一年。若兩人皆認罪，

則將判為十年。在表 2-3 中，以下數字代表偏好順序為 3>2>1>0。2 表示雙方皆不認罪，被判刑一年。3 代表其中一方認罪被釋放，而另一方被判刑 20 年。1 代表兩人皆承認，皆被判 10 年。（藍兆杰、徐偉傑、陳宜君譯，2002：265）

(5)

表 2-3 囚徒困境賽局報酬表

A

不認罪認罪

不認罪（2，2）（0，3）

B 認罪（3，0）（1，1）

資料來源：（藍兆杰、徐偉傑、陳宜君譯，2002：264）

在囚徒困境中，每位參賽者都有優勢策略，但均衡（即參賽者皆採取優勢策略）的報酬比參賽者採取劣勢策略所得到的報酬還低，如何使囚犯放棄自私自利的背叛並選擇採取合作，解決的辦法便是重複的賽局。

貳、囚徒困境賽局

一次式(one-shot)的囚徒困境賽局的結果是（D,D）（即敵對、背叛）。因為不管他的對手選擇合作或是背叛（優勢策略），總是能藉由背叛取得最大利益，而且沒有一位行動者能夠藉由改變策略且產生新的結果，來改善他們的情境（那許均衡）（黃東煬、陳立譯，2006：

121）囚徒困境之所以讓人覺得特別是，儘管(D,D)是一種均衡的結果，沒有具備任何行動者應該要將他改變的動機，然而這項結果並非帕雷托最適境界。另外一種結果，則是兩位行動者偏好(C,C)(即合作) 甚於(D,D)（因為 CC＞DD）。

囚徒困境的難題在於雙方若不以符合本身最佳利益的策略行動而追求合作、共同開發，雙方都會得到最佳利益。總上所述，如果只是一次式的囚徒困境賽局，兩國或是兩位行動者，他們所採取的策略就是保護自己的對抗策略，但若是無限重複囚徒困境賽局，便會為了更長遠的利益著想選擇互相合作，而不是僅僅看著眼前的利益。就如同我國選舉的諺語『選舉是一時的，朋友是永遠的』。

(6)

囚犯困境是說遊戲雙方可能合作也可能不合作，但真實世界既競爭又合作的常態，證明個人以自我利益為出發最後結局，可能是「雙贏」或「雙輸」。在每個囚犯困境的賽局中，都會有合作策略及欺騙策略。警察審訊囚犯採取抗拒從嚴、坦白從寬的策略，因囚犯被隔離時，多害怕對方招了而自己沒招時會使自己刑責加重，對方則無罪開釋，結果囚犯雙方最後皆採取認罪策略而雙雙被關進牢裡。納許以此證明人性在被隔離的限制因素下，產生的各謀自己利益的謀略，形成

「囚犯困境」現象，反而造成雙輸的局面。（巫和懋、夏珍，2002：

24）這點應用到國際談判，雙輸或雙贏是決定在兩方能否掌握充分資訊，瞭解敵情及有沒有溝通互信基礎。

「納許（Nash）平衡」中雙贏、雙輸一線之隔，更加提醒競爭者相互間必須培養相互信賴、溝通、合作的重要。納許均衡的定義為『一組互為最適反應的組合』，到達均衡時『任一參賽者均無誘因單方面偏離此均衡』。這種賽局雖然每個賽局參賽者有一種優勢的策略

（dominant strategy）可以在抵抗對方可能的反制策略下，使自己可獲得最大得益（best pay-off），可是如果雙方皆採取劣勢的（dominated）

妥協策略，則每一方都可以獲得對基本生存較好的利益（ better pay-off）。

在此賽局中，每位參賽者都有其優勢策略(背叛)，但均衡的報酬要比參賽著採用劣勢策略為低，囚犯可以找出比均衡更好的結果，但卻很難放棄均衡，因為他們要考慮賽局中對方可能的自私自利的欺騙、背叛，且讓他們彼此合作以達到互利的結果，所以在囚犯困境中，

反而採取劣勢策略（合作）會比較好。

(7)

一、有限重複囚徒困境賽局

著名的的囚犯困境解是重複賽局，重複賽局可分為有限重複及無限重複。有限重複賽局是已經可以預知在何時結束，而既然知道何時結束。那麼在最後一回合，他就很容易演變為一次式的囚徒困境賽局，所以參賽者會在最後一回合選擇背叛的機率會很大。在有限重複賽局中，可以利用適當的條件策略來達成合作，例如以牙還牙策略(Tit-for-Tat)或殘忍策略(grim strategy)；不論何種情況，合作的現值超過欺騙的現值時，才有合作的可能。困境也可以用懲罰來解決，藉由改變背叛者的報酬來達到懲罰的目的。（藍兆杰、徐偉傑、

陳宜君譯，2002：276）

在有限重複囚徒困境中是短期的合作或競爭關係，所以運用在許多長期反覆國際關係上，適用性略顯不足。因為在短期的合作或競爭關係中，很難以懲罰或其他機智來處罰背叛者，也難以形成穩固或具有默契的合作關係。也就是說只有在長期關係中，理性者為了顧及未來的利益或安全，並兼顧未來的局勢變化，使用懲罰機制或穩定合作關係才會對其有用

二、無限重複囚徒困境賽局

『人情留一線，日後好見面』、『冤家路窄』這二句話是日常生活中常可以聽見，也可表現出無限重複囚徒困境之所以形成的原因。無限重複囚徒困境就是指理性行為者與對手在合作與競爭的關係中基於長期的關係著眼未來或目前的利益，其在為促成合作所制訂的懲罰機制較容易實行，合作關係也較易達到。在這種關係中，

每一次的賽局或對談，理性行為者都會『不要把話說死了』、『不要把路走絕了』，保留適度的彈性，留待下一回合作為談判的籌碼，也

(8)

因為如此，行為者的行為選擇與賽局的結果會更加複雜許多。國際關係更是如此，因牽涉到巨大的國家利益，行為者更是謹言慎行。

以東海油田爭議為例，迄今舉行了三輪對話，目前都尚無共識。中日雙方多是以表態、放話或示威蓄積談判籌碼、試探對方的態度。

在任何重複賽局，參賽者的策略會參考前一回合來決定這一回合要採行什麼樣的策略，而上一回合如果採背叛或被背叛，會有一段懲罰期，也會採取不合作的態度來回應對手的背叛。在賽局中最常使用的觸發策略有殘忍策略以及以牙還牙策略。殘忍策略是指與對手合作，直到對手背叛你，而你在剩下的賽局背叛對手。以牙還牙策略則是指，對手採合作策略就一樣也採合作策略。而對手採取背叛策略而你也在下一回合背叛他。所以欺騙期要多長，依對手背叛時間而定。殘忍策略及以牙還牙策略不同之處是在，殘忍策略一旦被背叛就不會再原諒對方。（藍兆杰、徐偉傑、陳宜君譯，2002：

257）

三、其他賽局應用時的基本觀念

（一）那許均衡(Nash equilibrium)

那許均衡是由那許(John Nash)為了解決非合作賽局所建立的方法，那許均衡中，如果其他參賽者的選擇是已知的，每位參賽者所使用的策略是面對他人的最佳策略。而且當參賽者看到別人的行動後，他也不會改變他原來的行動就是那許均衡，如果還想改變，就不是那許均衡。

在同時行動賽局的那許均衡，參賽者可以有純粹策略(pure strategy)或混合策略(mixed strategy)。純粹策略指的是參賽者的非隨機行動，每項行動決定都是確定的。而另一種混合策略就是隨

(9)

機行動，是依特定比例隨機選取的策略。例如：剪刀、石頭、布，

這是三個純粹策略同時也是確定的。但當玩猜拳遊戲時，隨機選擇這三個策略時，便是混合策略。（藍兆杰、徐偉傑、陳宜君譯，2002：

82）

（二）子賽局完全均衡(subgame perfect equilibrium)

用反推法找出來的均衡子賽局完全均衡，他是一組完整的行動策略，使得在賽局樹的每一節點，也就是從每一點延伸出來的子賽局，參賽者所採取的延續策略是最佳的。也就是說，就是在整個賽局樹的任何一個節點，子賽局完全均衡要求在大賽局中的每個子賽局，參賽者的策略都能夠成那許均衡。（藍兆杰、徐偉傑、陳宜君譯，

2002：195）

（三）反推法(rollback)

反推法(rollback)又稱逆向歸納法(backward induction)為在動態賽局中，從最後一個階段的賽局行為分析，循序反向推論回前一個階段，直到最前面的階段也就是起始點的分析方法。反推法的邏輯是，假設行為者是理性的，他所做的每一行為都是最適策略，在每一個階段所做的行為都是考慮到後一個階段所做的行為。反推法會消除不合理的策略、不可信的威脅與承諾。

子賽局完全均衡是反推法的結果，反推法的運用可以找出唯一一組的子賽局完全均衡，反推法的使用是參賽者沿賽局樹逆行，去除不符合理性的行為，最後選擇的行動便是子賽局完全均衡。（藍兆杰、徐偉傑、陳宜君譯，2002：195-196）

(10)

參、小結

在賽局運用上以中日東海油田爭議為例，假定中日都願捐棄成見，展開合作。但即使採取合作，後續的工作也是工程浩大，例如：

決定共同開發的話，誰來執行探勘、誰開採、如何分配？對方會不會背叛欺瞞，多採油量？而分別開採的話，如何分配油田範圍也是令人頭痛的課題。但無論分開或是共同開採，都免不了涉及合作及背叛，

就可以用賽局理論的模型來藉此簡化國際關係。如採取合作，兩國可以在極短的時間內，商討開採細節，獲得油源，避免戰爭等不確定風險，但多了他人分享相對的也減少過內可以使用的油量。但不採取合作，用拖延或戰爭的方式，可能的結果式全有或全無，除了輸掉時間，

採取拖延對於油源的利用及開採，對中國與日本目前需油孔急的態勢都是一大損失。雖有學者說即使要訴諸國際法庭，中國獲勝的機會還是相當的大。但以現實觀點來看，興訟時間曠日廢時且耗費人力、物力資源勢必難以估算，況事涉兩強國錯綜複雜之國際關係，其中之角力及牽涉的第三國（如：美國、台灣、韓國）範圍甚廣，所以興訟對中日兩國益處不一定大。

兩國自 2004 年 5 月中日東海油田之爭逐漸浮上台面，兩國的至今經過三輪對話，仍未有任何共識，而其間雙方小動作不斷，互相探測對方底線也不斷的拋出新議題，來藉此看出對方的真正意向與忍受程度。

中日東海油氣田爭議雖有衝突，但緊張火爆程度與當初古巴飛彈相比，危急程度並沒那麼高。因為常在對方踩線後中日雙方的官員都會適時的出來踩一下煞車，所以兩國在東海事件處理上，雖偶爾拉高對峙態勢，但很快的在某些事件或對話中，緊張的情勢又會趨緩。現階段中日還處於在『叫陣』的情況下，僅在拉開陣勢、蓄積籌碼，做

(11)

好談判準備。

表 2-4 中日東海油田爭議以囚徒困境賽局呈現表中國

合作不合作

合作（2，2）（0，3）

日本

不合作（3，0）（1，1）

資料來源：作者製繪

說明：1.3、2、1、0，數字僅代表偏好。

2.3>2>1>0，代表偏好的順序。

表 2-4 所示是以有限囚徒困境賽局的展示，假設兩國願意共同開發東海，他們共同分得的油量為（2，2），但如中國不合作，而日本採取合作。中國所得的利益為 3，日本為 0。但假使兩國都採取不合作的態度，那結果很有可能是兩敗俱傷（1，1）。在此賽局中參賽者優勢策略是背叛，因為他們要預防賽局中對方可能的欺騙、背叛，所以必須採取合作以達到互利的結果，所以在囚犯困境中，有時採取劣勢策略合作會比優勢策略好。

但促成雙方的合作之後，就必須訂定『以牙還牙』等懲罰的機制來避免『背叛』的行為產生。因為國家是理性行為者，為了做出最適策略避免犯錯，做出決策前他必須衡量自身的能力及影響因素，也必須考量對方是否真能誠實的履約。

(12)

第二節現實主義與囚徒困境

壹、現實主義

一、現實主義的源起：現實主義所強調的是，政治因受到人性弱點所影響，同時在缺乏一個國際政府的情況下，所受到的種種限制之下如何自處。（高德源譯，7）根據現實主義學者的看法，所謂人性其根本要義便是『利己的』，Machiavelli 也曾指出，在政治之中『我們必須承認所有人類都是邪惡的，而當機會來到時人類絕對會利用時機發洩其隱藏在心中的邪惡』。（現實主義與國際關係，2002：7）

現實主義也源自於國際無政府狀態下的政治需求，正由於缺乏一個國際政府，所以『叢林法則仍相當盛行』（高德源譯，2002：9）而這種由自利主義與無政府狀態下所產生的互動，導致權利在國際關係中，扮演著極為重要的角色。

現實主義即是囚徒困境，現實主義被視為一套關於國際關係核心特質的理論，在國際無政府狀態下排除了任何走向合作之強制性協定的可能，也就是說沒有制約性很強的協定，即便雙方皆有強烈的合作動機，在現實主義的說法下，國際關係仍被視為危險的、

衝突性強的。為了說明另一種國際關係，除了囚徒困境之外，學者 John Hertz 首先提出『安全困境』（security dilemma）（高德源譯 2002：

30），之所以形成此種困境，主要是因為許多國家採取更多提升自我安全的措施，會降低其他國家的安全。此外現實主義若以囚徒困境的形式出現，則不需要假設有人性的存在，因為在缺乏國際政府的社會中，無政府的狀態下難免會有少數無恥、背叛的行為存在，若一昧遵守承諾的國家，很可能淪為不顧道義的國家的犧牲品。

(13)

二、現實主義中的囚徒困境

囚徒困境是現實主義的其中一個典範，在這個途徑下國家被視為單一行為者，會理性地計算每一步的行動。而現實主義另一流派—

權力平衡理論，在於國家會選擇平衡其他行為者，而不是選擇依附強權。（高德源譯，2002：23）與之前所談到的安全困境賽局頗有異曲同工之妙。在這個說法下很多國家之間的國際關係可以套用囚徒困境理論，每一個國家都必須要時時注意與其他國家之間的相對力量大小，因為其他國家所擁有的力量，特別是強權國家的力量，都是一種威脅。（高德源譯，2002：23）尤其日本政府的外交政策常瀰漫濃濃的現實主義，隨著國力的變遷日本與中國所採取的依附或是平衡便有所不同。現實主義學者 Waltz 認為由於政治行為者持著，『失敗並不會讓他們的安全陷入危險境地之中』的觀念，因此會比較傾向於選擇『跳上領先候選人的花車』或著是與剛剛獲得勝利贏家站在同一陣線上，（高德源譯，2002：23）。因當某國家選邊表態時，

去依附某一個強權霸國，通常也預告了全世界甚至強權的對手，你是他的附庸，很容易便會招致攻擊甚或被依附國的入侵，成為強權手上的獵物。當然還是有些國家願意承擔投靠失敗的風險。以當今國際情勢觀之，弱國反而會選擇『平衡』其他強權國家的力量，而不是直接選擇投靠強權國。以東協諸國為例，現階段最好的選擇便是遊走於中國與日本甚或美國之間，保持中立誰也不得罪，這樣一來在國際事務上，東協也可以掌握自己的主導權。

在現實主義中無政府狀態之下，一個逐漸強大的國家，尤其是想要尋求全球霸權地位的國家，在其他強權國家的眼中，他並不是利益的來源，而是未來潛在的敵人。（高德源譯，2002：215）所以這些國家之間，難免也會因利益而背叛友邦，反目成仇。這正可以

(14)

解釋中國與日本地理位置相近，兩國關係卻遠遠不如美國與日本。

這種疏離的態勢在中國崛起後更加明顯。因為日本要制衡中國的力量維持自身的利益，除了壯大本身外也選擇與美國靠攏，美國也樂得藉由日本插手東亞情事，使美國維持世界強權之地位。相對於中俄、中印聯手道理亦然，除了資源共享、經濟共生外，也有抵抗美日的弦外之音，而在這樣的情形下，國與國的關係也很容易形成安全困境。

現實主義下的囚徒困境塑造了一種無政府狀態的環境，環境下的行為者若採取合作行為，則他們可以得到較高的利益，也正因為畏懼遭到背叛而心存恐懼，所以會依照理性而選擇競爭的對策。（高德源譯，2002：275）在現實的囚徒困境中行為者之所以未受到背叛的誘惑，是因為假設『只玩一次』就結束，在現實的狀況下重複賽局比較容易產生，當行為者發現這個賽局只是無止盡的關係中的其中一環，參賽者比較不會斷然冒著往後的風險去選擇背叛，寧可伴隨著未來合作利益的價值觀，而選擇合作而不是背叛策略。更仔細的說，國家之間之所以選擇合作策略，是著眼於未來長遠的合作關係，而非僅僅目前的利益。

以東海油田爭議為例，日本在現實主義的驅使下，斷不能坐視中國獲取大量油源。在油源缺乏的今日，誰擁有油源，誰掌握的資源最多，中國全拿了，相對而言日本的國力也等同削減，唯有去搶餅吃，不管分大分小，至少都有得吃，更何況日本之意不只是吃小餅，中國當然也了然於胸。

(15)

貳、現實環境中的霸權與囚徒困境一、霸權國與囚徒困境

賽局中的每一行動者都具有一個優勢策略 (a dominant strategy)。和諧賽局的行動者總是保持合作，而囚徒困境或僵局的行動者總是選擇背叛。霸權國對抗囚徒困境或僵局行動者，所產生的均衡結果往往不是合作策略，因為有一些行動者會剝削霸權國的合作行為。所以在霸權國的囚徒困境賽局中，真正的問題是如何刺激其他行動者將策略由背叛轉為合作。（黃東煬、陳立譯，2006：122）

解決的方式，便是霸權者要對背叛者施加處罰，而且這個處罰是可信任的或是提供正面的附加支付來促使這種轉變。不論是前者會是後者，他們所想欲達到的，都是將對手國背叛的策略改為合作。而霸權國是使用自身的權利來改變對手國的喜好順序，最終期待是改變賽局本身。

二、一報還一報—現實主義中的囚徒困境

一次賽局中，行為者通常選擇的是背叛策略，才能獲取有利於己的最大利益。但在真實情況下行為者之間（或國與國間）通常會再度交鋒，不斷出招。所以重複的賽局是比較符合現實的狀況。

如果我們假設賽局是無限期且重複發生的，那麼在這些條件下，基於理性預期，相互合作才是最具有理性的，合作（C,C）是均衡狀況。（黃東煬、陳立譯，2006：185）。因為合作的出現，是基於行為者知道也預期為來會再度碰面，也因對未來的考量就會影響現在的行動。但是未來發生的高回合率不過是賽局中合作出現的必要而非充分條件，理由是因為未來的所獲得的意義通常會被打折扣，

會低於現在的價值（黃東煬、陳立譯，2006：185）。所以合作策略

(16)

要能夠奏效，必須要是這些未來預期的利在整體的利益的計算要大，足夠使對手國放棄背叛的策略。

第三節危機邊緣政策與安全困境

壹、危機邊緣政策

一、危機邊緣政策的意函

危機邊緣政策就是一種把對手帶到最大危險的臨界點，並以此迫是對手退縮的策略。要能提出「可信的威脅」，製造出一個「災難邊緣」，再加上一些不可控制的風險，且必須存在有條理的帶領雙方同時脫離災難邊緣的辦法。危機邊緣政策的概念就是策略行動，威脅是一種反應的規則。不論是威脅與被威脅的任一方，都相對的必須要付出代價，例如：威脅失誤的風險，也就是說在進行危機邊緣政策，也要善用風險管理，即便會發生失去控制的風險，也盡可能要保持在預期之內的風險範圍。所以在使用危機邊緣策略時要事先規劃，只能讓情況在某種範圍內失去控制。危機邊緣政策就是要設計及部屬這樣的可能威脅；這包含了預期中的失去控制。（藍兆杰、

徐偉傑、陳宜君譯，2002：482）如同本文中所要探討的中日東海油田爭議，從 2005 年 4 月日本批準帝國石油開採及同年 9 月初中國派遣 5 艘船艦巡視東海等都是參賽者在面對不動稱的訊息，無非不是在試探對方的底線，提升危機程度試探對方的想法及忍受程度。

危機邊緣政策要能夠奏效，首先必備要素是威脅與反應，此種威脅是必須具有可信度，但又不一定要執行的，畢竟非到萬不得已執行威脅，所帶來的後果對於雙方利不一定大於弊，所以危機邊緣政策的目的，不在於實現威脅，而是將威脅當作工具，提升危機程度，將對手帶到剃刀邊緣，迫使對手放棄或投降，來達成自身的目

(17)

的。有條件的先行動，例如威脅與保證稱做反應率，是設計來制止對手的行動以保留現況或強求對手的行動以改變現況。威脅有互相傷害的可能性，但假使成功就不需要付出代價，如果一個策略利用威脅僅只是製造災難的風險，就可以視為危機邊緣政策。

危機邊緣政策的實踐就是相互危害風險之逐漸升高(gradual escalation of the risk of mutual harm)，可以被想像為現實生活中的懦夫賽局(chicken in real time)（藍兆杰、徐偉傑、陳宜君譯，2002：450），兩個年輕人各開著一部車，迎著對方而來，他們只有兩種選擇直衝或對偏向，兩者皆直衝的話無可避免會造成傷害，當然他們也可以選擇偏向來避免車禍。在現實生活中們可以在任何時間點選擇偏向，但需要有足夠時間，我們選擇偏向的確可以避掉車禍，但時間不夠，迫近的時候偏向不一定能躲開車禍。當兩車對開，雙方都是在試對方的底線，當忍受度不高的就會偏向了。但無論如何這樣都會存在一種風險及兩車都要等到距離相近時才會偏向，那麼始終還會相撞，而有擦槍走火的風險。

在危機邊緣政策中，每個危機、威脅都是隱含承諾的，即是如果達到或做成某種讓步，危機便會解除，所以在實行危機邊緣政策要有『反向操作』的能力，即是立即開始降低風險，並且很快將風險由此狀況抽離，不然對手將無法從讓步中得到好處。（藍兆杰、徐偉傑、陳宜君譯，2002：452）危機邊緣政策需要一方的參賽者減少對賽局結果的控制，而又不能完全失去控制。這必須建立一個具有風險的威脅，此威脅既要大到足以有效或強迫對方，又要小到令自己承受這個威脅。

危機邊緣政策的實行，是要掌握適度的風險，一方面要讓事件在某種程度上失去控制，因為在事件發生後才會有足夠的自由採取

(18)

威脅的行動，才能維持威脅的可信度。再來必須要對事情有充分的控制，以避免風險太多連自己都無法控制。這種『要控制失去控制的情況』因為牽涉到複雜的判斷差異、訊息散播與實施命令的困難，

會讓單純的威脅變的危險，但也因這些力量使戰爭有風險，讓危機邊緣政策變的可信。所以真正的難題不是如何讓情況失去控制，而是如何達到控制失去控制的情況。（藍兆杰、徐偉傑、陳宜君譯，

2002：444）危機邊緣政策是將逐漸升高之危害風險加於己方與敵方的策略，而行動者（即威脅者）無法完全控制有害結果的發生與否。

二、以賽局樹說明東海油氣爭議中危機邊緣政策使用

在東海油田爭議中鑑於不對稱訊息，中國與日本分別出招，一來想表達自己的立場，二來想測試對方的容忍度及真實態度，但都還沒到戰爭一觸即發的態勢。東海油氣田始終是一個爭議性極高的區域，

蘊含著油源及高度的戰略地位，處理的不好很容易便會發生戰爭。目前東海油田事件雖未走到這一步，但依中日降如冰點的關係，劍拔弩張的態勢，在不斷試探對方底線下兩國走向使用危機邊緣政策甚或引發戰爭當然有其可能性。

以東海油田爭議來說，中國近年來積極開拓海內外油源，對於東海發現豐富的油源並開始進行開發與鑽探，在亟欲鞏固自身利益的日本自然不能坐視不理，且以『安全困境』來說，對手的提升自我保護措施，相對便是貶低自己的安全，兩相權衡之下日本勢必出招。東海不若陸地，海域的劃分本身便是一項極大的爭議，東海油田爭議若以有限重複囚徒困境或單次囚徒困境來看，要找到解套的方式有其困難性。但如果要以囚徒困境中解決賽局的方式也不是說不可能，以在重複賽局中，他國為了長遠的合作關係著想，也會因顧忌對方而多少會

(19)

承擔一些風險。所以當行為者簽訂一個相互合作的協定，並且可以制定特定的機制來強制執行這個合作協定，那麼或許可以降低被友邦背叛的風險，而達到相互合作的可能。（高德源譯，2002：29）如此一來，

要在兩難的困境中找到解決的方法就不是完全沒有可能性了。

是以賽局樹分析，國際關係間為重複賽局，一來一往的出招，都會影響到下次的出招策略。試用圖 2-1 威脅時的中日東海油田爭議賽局樹說明，中國開發油源，日本感受威脅，他必須出招來抵制或表示自身的不滿，來拖延對手時間或迫使對手中國正視甚或接受談判。而在圖 2-2 威脅時的中日油田爭議賽局樹，2005 年 4 月 13 日日本核准帝國石油試採，挑戰中國底線，中國深受威脅於同年 9 月 9 日派遣五艘船艦，巡視東海，宣示與警告意味濃厚。此時日方能做的便是溝通，

或是拒絕威脅、對峙，升高危機程度。

未威脅中國

威脅溝通日本

對峙或戰爭

圖 2-1 中國威脅時的東海油田爭議賽局樹

資料來源：作者參考（藍兆杰、徐偉傑、陳宜君譯，2002：445）

製繪

所以在使用危機邊緣政策時，首先要確認雙方的利益及該處境中不確定的特質，並能指出雙方為升高相互危害風險所使用的策略，且這個策略是能發揮功用並是可以讓本身所能承受的。

(20)

未威脅---中國逕行開採日本

威脅溝通中國

對峙或戰爭

圖 2-2 日本威脅時的東海油田爭議賽局樹

製繪

貳、危機邊緣政策的成功條件

圖 2-3 中，假設我們將東海油田所引發的戰爭風險為 q，那麼不論日本或中國，我們都可以計算出大概的最佳策略。以圖 2-3 來解釋，

在黑色部分的左方與右下方，分別為 p=2/5 與 p=1/2，當 P<0.42，為有效狀況。而當 P>0.42 時，為可接受狀況。中國或日本都不知道這些邊界的準確位置，所以他必定會從下方的位置開始探索，也就是黑色區會是他的起使位置。此時，座標（p,q）位於黑色區接近底部的某處。

行為者並不知道確實的位置，可能不斷的試探，所以他不確定 p 值為何。所以在此點上的威脅是安全的，但相對來說也缺乏有效性。所以行為者會開始升高威脅，也就是垂直的將（p,q）向上移。若情勢依舊安全，且缺乏有效性，決策者將會再度慢慢提高威脅。（藍兆杰、徐偉傑、陳宜君譯，2002：449）持續下去，他最後會到達黑色區域的邊界，

至於是那個邊界，便要根據 p 值來決定。

(21)

q1 兩個條件都達到的區域上極限 (可接受性條件) 。

0.6 低極限 t(有效的條件)

探索區域

0.3 0.4 0.42 0.5 1 p

圖 2-3 危機邊緣政策的成功條件

製繪。

然後必定會產生兩種狀況。第一種狀況下，威脅嚴重到足以制止日本或中國，這種情況會發生在 p 值小於關鍵性的 P=0.42。我們可以在以下圖中找出這種移動是超出綠色區域的部分，而進入威脅能同時滿足有效狀況與可接受狀況的區域。（藍兆杰、徐偉傑、陳宜君譯，

2002：450）

在這種情況下，對手國中國或著是日本就必須要讓步。第二種情況下，行為者的測試將自己推向可接受狀況的上方 M，也就是說超出自己所能承擔的風險，失去能夠控制的狀況，這樣行為者就必須要讓步，

對手國就會獲勝。所以當行為者在慢慢提高風險時，他必須要從對手國的態度、行為找出一些線索，讓他更加準確的預測 p 值，也就不會發生無法控制的狀況出現，盡量降低威脅所應承擔的風險。

參、安全困境（security dilemma）

一、安全困境的意函

根據傳統現實主義以國家為中心的思維，國家就是安全的主體，

因此安全的目標就是要如何確保國家安全，以對抗外來的威脅；由於國際體系是無政府的狀態下，國家想要尋求自保就必須仰賴軍事力量

(22)

在這樣的架構下，安全的程度是以國家之間的相對軍事力量來衡量的。所以鄰近國家提升軍備的情形下，自己就相對顯得弱勢而出現了安全危機。

安全困境是指國家與國家間的競爭關係，當一個國家提升軍備，

讓自己越來越安全，他的安全鞏固是對手國威脅所在，而這種動作，

也勢必引起對手相同的反應，也會因此增加軍備，於是兩者將陷入永無止境的軍備競賽。安全困境是一種國際常態，因為國際關係常常是處於無政府狀態，兩國會呈現軍備競賽，也是因為沒有一個更強壯、

更中道的力量去作裁判。安全困境的存在就是因為對對手的意圖有很大的不確定而且無可解決。例如：在東海爭議中，中國就不是很確定日本增加軍備是用來防禦日本本身或是東海爭議或者根本想攻打中國，就如同日本對於中國增加軍事預算是否會危及自己的利益或只是單純的防禦而已。因為中日結構性的困境（歷史的問題難解），使得兩國關係本來就有其脆弱性，會產生安全困境有幾個原因，除了國家之間普遍的不安全感外，再來就是國家之間產生利益的糾葛。

安全困境之所以為「困境」，是因為國家追求安全的目的到最後，

會變質成一種非理性的平衡追求，然而探求其根本，對於國家安全的維護，雙方似乎都不需要擁有這麼高度的軍力以對抗之。

作為一個正在上升的大國，中國日益擴展的國家利益與相對有限的利益保衛手段之間存在突出的矛盾。中國迫切需要強化利益保衛手段；但是單純從增強實力著手，難免使其他國家產生疑慮，結果是引發軍備競賽。軍備競賽越劇烈，各方越無法得到真正的安全。所以中國與日本要實現和平發展，必須擺脫這種安全困境。

(23)

二、安全困境的解決之道

安全困境不能完全解決只能緩解，因為國家就如同人性一般，沒有不自利的人，大同世界很難出現在真實的國際關係上。緩解之道在於如建立信任機制、元首高層對話管道、雙邊或多邊的安全性議題合作等。而雙邊或多邊的安全性議題合作更可以使區域內國家共同合作建構安全環境，從中建立如國際規範、國際秩序與國際統合等範疇，

增加國家間的互信，減輕安全之威脅感，降低或消除國家的安全困境，

從而因規範與機制的制約而增加破壞現狀或侵略的成本。例如聯合國的集體安全制度即藉由制度性的架構，透過國際合作與強權協調方式，建構普遍性維持國際和平與安全的國家行為規範。

由於東亞在歷史上缺乏有關安全議題的合作傳統，以及東亞區域安全的複雜性，因此亞太安全多邊合作機制的建立應該是有相當的困難，因為目前的亞太多邊安全對話機制，並未發展到能夠面對較為犀利的議題（如：領土爭議），仍只停留在經貿合作等軟性交流議題等，

尚未能處理立即的危機事件。

東亞缺乏出現如美國般甚孚眾望的警察國家，就連如中、日兩國亦未有獨霸亞洲的實力，前者尚為發展中國家未來勢力雖不容小覷，

但目前仍在發展自身經濟階段，也難服於日本。日本本身奉行脫亞入歐，早與亞洲各國有漸行漸遠之勢，加上侵略國的歷史更令鄰國對其戒懼不已，充其量中日兩國僅能說在亞洲互有影響力，也祇能做到保護自己、制衡對方而已。中日實力相當在關係冷淡下很容易形成安全困境，而假使形成的成因將在於沒有適當力量去平衡，加上互信基礎薄弱，又有領土主權爭議及歷史問題紛擾、美日同盟問題、元首之間的對話與交流嘎然停止及在雙方軍事武力提高下等等因素交相影響，

東海油田爭議事件只是壓死駱駝的一根稻草。在很多因素的催化及現

(24)

實主義的作祟，中日很可能將形成了安全困境，進而影響到東亞區域安全，如果局勢真的惡化，這並不是美國或中日兩國所要的結果。

因 為短期的「不合作賽局」，將難以導向「合作」的結果

因為短期的「不合作賽局」，將難以導向「合作」的結果