• 沒有找到結果。

因 為短期的「不合作賽局」,將難以導向「合作」的結果

N/A
N/A
Protected

Academic year: 2021

Share "因 為短期的「不合作賽局」,將難以導向「合作」的結果"

Copied!
24
0
0

加載中.... (立即查看全文)

全文

(1)

第二章 理論基礎

第一節 賽局理論與囚徒困境

壹、賽局理論

賽局理論是『策略性思考』的系統性知識,是屬於『理性選擇分 析』的研究途徑,透過策略推估尋求自己的最大勝算或利益,從競爭 中求生存,雖然接受人們自利的動機,但對價格機能發揮完全作用的 環境和條件提出質疑。賽局理論預設最少有兩位認知的理性決策者,

而 賽 局 的 基 本 要 素 包 括 : 玩 家 (players) 、 行 動 (actions) 、 訊 息 (informations)、策略(strategies)、利得(payoffs)、結果(outcomes)、均衡 (equilibria)。玩家、行動與結果共同被指定為遊戲規則,而且模型建構 者的目的,是使用這些遊戲規則來決定均衡。(黃東煬、陳立譯,2006:

177)

賽局理論植基於衝突雙方,透過溝通進行長期互動,可說是一套

「動態的獎懲策略」。如果套用到「國際關係」上,以「善意」回應「善 意」之外,也要適當運用籌碼,發出「意向清楚」的「可信威脅」。因 為短期的「不合作賽局」,將難以導向「合作」的結果。也就是在本文 第五章中所討論的,以有限重複囚徒困境參賽者容易選擇背叛策略。

因為他們不會有下一次的賽局,也不會遭致報復。所以只有在無限重 複囚徒困境賽局中才會有『合作』的可能出現。

在互動過程中,適時「互釋善意」尤其重要,而善意的「起始」

更是最終能否導向「合作」的基礎。在國際衝突和戰略,加強防禦力 並不足以阻嚇別國進攻,要有反擊力才有用,因為不會反擊,對攻方 造成損傷有限,例如:北韓發展核彈就是出於這種考慮。賽局理論是 在目標衝突下,建構各行動者間策略互動模型的一種有效方式。賽局

(2)

理 論 的 優 點 , 在 於 他 的 精 簡 性 (parsimony) 與 抽 象 層 次 (level of abstraction)。(黃東煬、陳立譯,2006:178)因為賽局理論是以嚴謹且 明確的人類行為理論為基礎,這項理論藉由經驗的累積產生相關的假 設,解釋並預測對手的行為並做出最適的策略。

賽局理論的目的,也就是試圖將行為者之間戰略上的互動予以形 塑化、簡單化,進而找出一套標準化的互動模式,而其中的囚徒困境 的賽局模型,正是具有現實主義要義的一種典範。(高德源譯,2002:

25)。在賽局理論中,最簡單的模型結構至少要包含兩位理性的參賽 者,他們彼此互動,互動的策略有二,合作與背叛。

賽局表現的方式,通常以 2×2(two by two)的方式展現,每個 2×

2(two by two)的賽局會有四種結果,以表 2-1 表示簡略說明囚徒困境,

有兩個行動者都是獨立理性的,都嘗試極大化自身的利益。每位行動 者都於選項中二擇一其行動,分別為合作與背叛。

表 2-1 廣義的 2*2 賽局 CC

R,R

DC

T,S CD

S,T

DD

P,P

資料來源:本表摘自(高德源譯,2002:26)

說明:R=『獎賞』(CC,也就是二位者都採取合作態度)

T=『引誘』(DC,先引誘對方採取合作,再以背叛回應之。)

S=『受騙』(CD,本身採取合作,被另一行為者背叛)

P=『處罰』(DD,二位行為者皆採取敵對背叛)

合作策略以 C(cooperate)表示,而背叛策略以 D(defect)表示。

這項賽局是非合作性的(non-cooperative)(具約束力的協議是禁止

(3)

的),每個行動者選擇一項行動,而且是同時做選擇的。而這兩位行動 者對賽局結果的偏好順序被假設為:DC>CC>DD>CD。

賽局的種類很多,諸如懦夫賽局、獵鹿賽局、和諧賽局、僵局賽 局、囚徒困境、恃強凌弱賽局等。而其中囚徒困境(The Prisoner’s Dilemma)、懦夫賽局、獵鹿賽局向來引起許多學者的關注,正是因為 利益均霑要能夠實現,合作是必須的但絕對不是自動達成的。以下簡 介兩種國際戰略上常常用到的賽局類型,分別為懦夫賽局(又可成為 小雞賽局)及囚徒困境賽局,而囚徒困境賽局將會在稍後的章節作更 詳細的敘述:

一、懦夫賽局的簡單介紹

懦夫賽局又稱小雞賽局(Chicken Game),他最著名的例子:1950 年代有兩個年輕人,他們相約決鬥,分別在街道兩側對向行駛,如 果將車子偏向避免車禍的人就是『懦夫』,直衝的人是『勇士』,獲 得勝利。但雙方都採取『直衝』的策略,將會發生車禍,兩敗俱傷。

表 2-2 懦夫賽局報酬表

中國

偏向(懦夫) 不偏向(勇士)

偏向(懦夫) (0,0) (-1,1)

日本 不偏向(勇士) (1,-1) (-2,-2)

資料來源:作者製繪。

說明:偏好順序為:1>0>-1>-2

在懦夫賽局中,對參賽者最好的結果,當然是對方偏向,自己 成為勇士,但也不希望自己出車禍。所以在『勇士』與『懦夫』這 兩個極端間,雙方都是懦夫的結果,比自己都是懦夫還強。懦夫賽

(4)

局中,每一個參賽者都有一個『強硬』的策略和一個『軟弱』的策 略。在此賽局中有兩個純粹那許均衡,每一均衡中,會有一位參賽 者會選擇偏向成為『懦夫』。每位參賽者會偏好對方是『懦夫』。也 都知道雙方都採取『強硬』的策略後果會非常糟糕。(藍兆杰、徐偉 傑、陳宜君譯,2002:109)

在表 2-2 中雙方如果都選擇偏向,雖然都成為懦夫,但下場都 不若兩者都選擇強硬的直衝下場來的損失慘重。(-1,1)及(1,-1)

皆為純粹那許均衡,因為都是雙方都想達到的目標,所以兩者都想 設法影響結果,為了達到這個偏好,他想讓對方確信自己是有決心 也會執行『直衝』這個策略,企圖嚇阻對手,但在此方面也有相當 大的風險,因為當對方也同樣意圖實行嚇阻時,兩車同時直衝,即 便及時轉向,但有時轉向時已經距離太近,所以也免不了『擦搶走 火』翻車了。

二、囚徒困境賽局的簡單介紹

最早是由 Duncan R. Luce 和 Howard Raiffa 發展出來,他主要的 內容是說,有兩個犯人共同犯下一件案子而被警察逮捕,但必須犯 人承認犯罪才能定其罪刑。警察將其隔離偵訊並告知犯人認罪條 件,如果一方認罪,一方不認罪,認罪者將被釋放,而不認罪的人 將被判 20 年。但若兩人皆不認罪,則將被判一年。若兩人皆認罪,

則將判為十年。在表 2-3 中,以下數字代表偏好順序為 3>2>1>0。2 表示雙方皆不認罪,被判刑一年。3 代表其中一方認罪被釋放,而另 一方被判刑 20 年。1 代表兩人皆承認,皆被判 10 年。(藍兆杰、徐 偉傑、陳宜君譯,2002:265)

(5)

表 2-3 囚徒困境賽局報酬表

A

不認罪 認罪

不認罪 (2,2) (0,3)

B 認罪 (3,0) (1,1)

資料來源:(藍兆杰、徐偉傑、陳宜君譯,2002:264)

在囚徒困境中,每位參賽者都有優勢策略,但均衡(即參賽者 皆採取優勢策略)的報酬比參賽者採取劣勢策略所得到的報酬還 低,如何使囚犯放棄自私自利的背叛並選擇採取合作,解決的辦法 便是重複的賽局。

貳、囚徒困境賽局

一次式(one-shot)的囚徒困境賽局的結果是(D,D)(即敵對、背 叛)。因為不管他的對手選擇合作或是背叛(優勢策略),總是能藉由 背叛取得最大利益,而且沒有一位行動者能夠藉由改變策略且產生新 的結果,來改善他們的情境(那許均衡)(黃東煬、陳立譯,2006:

121)囚徒困境之所以讓人覺得特別是,儘管(D,D)是一種均衡的結 果,沒有具備任何行動者應該要將他改變的動機,然而這項結果並非 帕雷托最適境界。另外一種結果,則是兩位行動者偏好(C,C)(即合作) 甚於(D,D)(因為 CC>DD)

囚徒困境的難題在於雙方若不以符合本身最佳利益的策略行動 而追求合作、共同開發,雙方都會得到最佳利益。總上所述,如果只 是一次式的囚徒困境賽局,兩國或是兩位行動者,他們所採取的策略 就是保護自己的對抗策略,但若是無限重複囚徒困境賽局,便會為了 更長遠的利益著想選擇互相合作,而不是僅僅看著眼前的利益。就如 同我國選舉的諺語『選舉是一時的,朋友是永遠的』。

(6)

囚犯困境是說遊戲雙方可能合作也可能不合作,但真實世界既競 爭又合作的常態,證明個人以自我利益為出發最後結局,可能是「雙 贏」或「雙輸」。在每個囚犯困境的賽局中,都會有合作策略及欺騙 策略。警察審訊囚犯採取抗拒從嚴、坦白從寬的策略,因囚犯被隔離 時,多害怕對方招了而自己沒招時會使自己刑責加重,對方則無罪開 釋,結果囚犯雙方最後皆採取認罪策略而雙雙被關進牢裡。納許以此 證明人性在被隔離的限制因素下,產生的各謀自己利益的謀略,形成

「囚犯困境」現象,反而造成雙輸的局面。(巫和懋、夏珍,2002:

24)這點應用到國際談判,雙輸或雙贏是決定在兩方能否掌握充分資 訊,瞭解敵情及有沒有溝通互信基礎。

「納許(Nash)平衡」中雙贏、雙輸一線之隔,更加提醒競爭者 相互間必須培養相互信賴、溝通、合作的重要。納許均衡的定義為『一 組互為最適反應的組合』,到達均衡時『任一參賽者均無誘因單方面 偏離此均衡』。這種賽局雖然每個賽局參賽者有一種優勢的策略

(dominant strategy)可以在抵抗對方可能的反制策略下,使自己可獲 得最大得益(best pay-off),可是如果雙方皆採取劣勢的(dominated)

妥 協 策 略 , 則 每 一 方 都 可 以 獲 得 對 基 本 生 存 較 好 的 利 益 ( better pay-off)

在此賽局中,每位參賽者都有其優勢策略(背叛),但均衡的報酬 要比參賽著採用劣勢策略為低,囚犯可以找出比均衡更好的結果,但 卻很難放棄均衡,因為他們要考慮賽局中對方可能的自私自利的欺 騙、背叛,且讓他們彼此合作以達到互利的結果,所以在囚犯困境中,

反而採取劣勢策略(合作)會比較好。

(7)

一、有限重複囚徒困境賽局

著名的的囚犯困境解是重複賽局,重複賽局可分為有限重複及 無限重複。有限重複賽局是已經可以預知在何時結束,而既然知道 何時結束。那麼在最後一回合,他就很容易演變為一次式的囚徒困 境賽局,所以參賽者會在最後一回合選擇背叛的機率會很大。在有 限重複賽局中,可以利用適當的條件策略來達成合作,例如以牙還 牙策略(Tit-for-Tat)或殘忍策略(grim strategy);不論何種情況,合作的 現值超過欺騙的現值時,才有合作的可能。困境也可以用懲罰來解 決,藉由改變背叛者的報酬來達到懲罰的目的。(藍兆杰、徐偉傑、

陳宜君譯,2002:276)

在有限重複囚徒困境中是短期的合作或競爭關係,所以運用在 許多長期反覆國際關係上,適用性略顯不足。因為在短期的合作或 競爭關係中,很難以懲罰或其他機智來處罰背叛者,也難以形成穩 固或具有默契的合作關係。也就是說只有在長期關係中,理性者為 了顧及未來的利益或安全,並兼顧未來的局勢變化,使用懲罰機制 或穩定合作關係才會對其有用

二、無限重複囚徒困境賽局

『人情留一線,日後好見面』、『冤家路窄』這二句話是日常生 活中常可以聽見,也可表現出無限重複囚徒困境之所以形成的原 因。無限重複囚徒困境就是指理性行為者與對手在合作與競爭的關 係中基於長期的關係著眼未來或目前的利益,其在為促成合作所制 訂的懲罰機制較容易實行,合作關係也較易達到。在這種關係中,

每一次的賽局或對談,理性行為者都會『不要把話說死了』、『不要 把路走絕了』,保留適度的彈性,留待下一回合作為談判的籌碼,也

(8)

因為如此,行為者的行為選擇與賽局的結果會更加複雜許多。國際 關係更是如此,因牽涉到巨大的國家利益,行為者更是謹言慎行。

以東海油田爭議為例,迄今舉行了三輪對話,目前都尚無共識。中 日雙方多是以表態、放話或示威蓄積談判籌碼、試探對方的態度。

在任何重複賽局,參賽者的策略會參考前一回合來決定這一回 合要採行什麼樣的策略,而上一回合如果採背叛或被背叛,會有一 段懲罰期,也會採取不合作的態度來回應對手的背叛。在賽局中最 常使用的觸發策略有殘忍策略以及以牙還牙策略。殘忍策略是指與 對手合作,直到對手背叛你,而你在剩下的賽局背叛對手。以牙還 牙策略則是指,對手採合作策略就一樣也採合作策略。而對手採取 背叛策略而你也在下一回合背叛他。所以欺騙期要多長,依對手背 叛時間而定。殘忍策略及以牙還牙策略不同之處是在,殘忍策略一 旦被背叛就不會再原諒對方。(藍兆杰、徐偉傑、陳宜君譯,2002:

257)

三、其他賽局應用時的基本觀念

(一)那許均衡(Nash equilibrium)

那許均衡是由那許(John Nash)為了解決非合作賽局所建立的方 法,那許均衡中,如果其他參賽者的選擇是已知的,每位參賽者所 使用的策略是面對他人的最佳策略。而且當參賽者看到別人的行動 後,他也不會改變他原來的行動就是那許均衡,如果還想改變,就 不是那許均衡。

在同時行動賽局的那許均衡,參賽者可以有純粹策略(pure strategy)或混合策略(mixed strategy)。純粹策略指的是參賽者的 非隨機行動,每項行動決定都是確定的。而另一種混合策略就是隨

(9)

機行動,是依特定比例隨機選取的策略。例如:剪刀、石頭、布,

這是三個純粹策略同時也是確定的。但當玩猜拳遊戲時,隨機選擇 這三個策略時,便是混合策略。(藍兆杰、徐偉傑、陳宜君譯,2002:

82)

(二)子賽局完全均衡(subgame perfect equilibrium)

用反推法找出來的均衡子賽局完全均衡,他是一組完整的行動 策略,使得在賽局樹的每一節點,也就是從每一點延伸出來的子賽 局,參賽者所採取的延續策略是最佳的。也就是說,就是在整個賽 局樹的任何一個節點,子賽局完全均衡要求在大賽局中的每個子賽 局,參賽者的策略都能夠成那許均衡。(藍兆杰、徐偉傑、陳宜君譯,

2002:195)

(三)反推法(rollback)

反推法(rollback)又稱逆向歸納法(backward induction)為在動態 賽局中,從最後一個階段的賽局行為分析,循序反向推論回前一個 階段,直到最前面的階段也就是起始點的分析方法。反推法的邏輯 是,假設行為者是理性的,他所做的每一行為都是最適策略,在每 一個階段所做的行為都是考慮到後一個階段所做的行為。反推法會 消除不合理的策略、不可信的威脅與承諾。

子賽局完全均衡是反推法的結果,反推法的運用可以找出唯一 一組的子賽局完全均衡,反推法的使用是參賽者沿賽局樹逆行,去 除不符合理性的行為,最後選擇的行動便是子賽局完全均衡。(藍兆 杰、徐偉傑、陳宜君譯,2002:195-196)

(10)

參、小結

在賽局運用上以中日東海油田爭議為例,假定中日都願捐棄成 見,展開合作。但即使採取合作,後續的工作也是工程浩大,例如:

決定共同開發的話,誰來執行探勘、誰開採、如何分配?對方會不會 背叛欺瞞,多採油量?而分別開採的話,如何分配油田範圍也是令人 頭痛的課題。但無論分開或是共同開採,都免不了涉及合作及背叛,

就可以用賽局理論的模型來藉此簡化國際關係。如採取合作,兩國可 以在極短的時間內,商討開採細節,獲得油源,避免戰爭等不確定風 險,但多了他人分享相對的也減少過內可以使用的油量。但不採取合 作,用拖延或戰爭的方式,可能的結果式全有或全無,除了輸掉時間,

採取拖延對於油源的利用及開採,對中國與日本目前需油孔急的態勢 都是一大損失。雖有學者說即使要訴諸國際法庭,中國獲勝的機會還 是相當的大。但以現實觀點來看,興訟時間曠日廢時且耗費人力、物 力資源勢必難以估算,況事涉兩強國錯綜複雜之國際關係,其中之角 力及牽涉的第三國(如:美國、台灣、韓國)範圍甚廣,所以興訟對 中日兩國益處不一定大。

兩國自 2004 年 5 月中日東海油田之爭逐漸浮上台面,兩國的至 今經過三輪對話,仍未有任何共識,而其間雙方小動作不斷,互相探 測對方底線也不斷的拋出新議題,來藉此看出對方的真正意向與忍受 程度。

中日東海油氣田爭議雖有衝突,但緊張火爆程度與當初古巴飛彈 相比,危急程度並沒那麼高。因為常在對方踩線後中日雙方的官員都 會適時的出來踩一下煞車,所以兩國在東海事件處理上,雖偶爾拉高 對峙態勢,但很快的在某些事件或對話中,緊張的情勢又會趨緩。現 階段中日還處於在『叫陣』的情況下,僅在拉開陣勢、蓄積籌碼,做

(11)

好談判準備。

表 2-4 中日東海油田爭議以囚徒困境賽局呈現表 中國

合作 不合作

合作 (2,2) (0,3)

日本

不合作 (3,0) (1,1)

資料來源:作者製繪

說明:1.3、2、1、0,數字僅代表偏好。

2.3>2>1>0,代表偏好的順序。

表 2-4 所示是以有限囚徒困境賽局的展示,假設兩國願意共同開 發東海,他們共同分得的油量為(2,2),但如中國不合作,而日本採 取合作。中國所得的利益為 3,日本為 0。但假使兩國都採取不合作的 態度,那結果很有可能是兩敗俱傷(1,1)。在此賽局中參賽者優勢策 略是背叛,因為他們要預防賽局中對方可能的欺騙、背叛,所以必須 採取合作以達到互利的結果,所以在囚犯困境中,有時採取劣勢策略 合作會比優勢策略好。

但促成雙方的合作之後,就必須訂定『以牙還牙』等懲罰的機制 來避免『背叛』的行為產生。因為國家是理性行為者,為了做出最適 策略避免犯錯,做出決策前他必須衡量自身的能力及影響因素,也必 須考量對方是否真能誠實的履約。

(12)

第二節 現實主義與囚徒困境

壹、現實主義

一、現實主義的源起:現實主義所強調的是,政治因受到人性弱點 所影響,同時在缺乏一個國際政府的情況下,所受到的種種限制之 下如何自處。(高德源譯,7)根據現實主義學者的看法,所謂人性 其根本要義便是『利己的』,Machiavelli 也曾指出,在政治之中『我 們必須承認所有人類都是邪惡的,而當機會來到時人類絕對會利用 時機發洩其隱藏在心中的邪惡』。(現實主義與國際關係,2002:7)

現實主義也源自於國際無政府狀態下的政治需求,正由於缺乏一個 國際政府,所以『叢林法則仍相當盛行』(高德源譯,2002:9)而 這種由自利主義與無政府狀態下所產生的互動,導致權利在國際關 係中,扮演著極為重要的角色。

現實主義即是囚徒困境,現實主義被視為一套關於國際關係 核心特質的理論,在國際無政府狀態下排除了任何走向合作之強制 性協定的可能,也就是說沒有制約性很強的協定,即便雙方皆有強 烈的合作動機,在現實主義的說法下,國際關係仍被視為危險的、

衝突性強的。為了說明另一種國際關係,除了囚徒困境之外,學者 John Hertz 首先提出『安全困境』(security dilemma)(高德源譯 2002:

30),之所以形成此種困境,主要是因為許多國家採取更多提升自我 安全的措施,會降低其他國家的安全。此外現實主義若以囚徒困境 的形式出現,則不需要假設有人性的存在,因為在缺乏國際政府的 社會中,無政府的狀態下難免會有少數無恥、背叛的行為存在,若 一昧遵守承諾的國家,很可能淪為不顧道義的國家的犧牲品。

(13)

二、現實主義中的囚徒困境

囚徒困境是現實主義的其中一個典範,在這個途徑下國家被視 為單一行為者,會理性地計算每一步的行動。而現實主義另一流派—

權力平衡理論,在於國家會選擇平衡其他行為者,而不是選擇依附 強權。(高德源譯,2002:23)與之前所談到的安全困境賽局頗有異 曲同工之妙。在這個說法下很多國家之間的國際關係可以套用囚徒 困境理論,每一個國家都必須要時時注意與其他國家之間的相對力 量大小,因為其他國家所擁有的力量,特別是強權國家的力量,都 是一種威脅。(高德源譯,2002:23)尤其日本政府的外交政策常瀰 漫濃濃的現實主義,隨著國力的變遷日本與中國所採取的依附或是 平衡便有所不同。現實主義學者 Waltz 認為由於政治行為者持著,『失 敗並不會讓他們的安全陷入危險境地之中』的觀念,因此會比較傾 向於選擇『跳上領先候選人的花車』或著是與剛剛獲得勝利贏家站 在同一陣線上,(高德源譯,2002:23)。因當某國家選邊表態時,

去依附某一個強權霸國,通常也預告了全世界甚至強權的對手,你 是他的附庸,很容易便會招致攻擊甚或被依附國的入侵,成為強權 手上的獵物。當然還是有些國家願意承擔投靠失敗的風險。以當今 國際情勢觀之,弱國反而會選擇『平衡』其他強權國家的力量,而 不是直接選擇投靠強權國。以東協諸國為例,現階段最好的選擇便 是遊走於中國與日本甚或美國之間,保持中立誰也不得罪,這樣一 來在國際事務上,東協也可以掌握自己的主導權。

在現實主義中無政府狀態之下,一個逐漸強大的國家,尤其是 想要尋求全球霸權地位的國家,在其他強權國家的眼中,他並不是 利益的來源,而是未來潛在的敵人。(高德源譯,2002:215)所以 這些國家之間,難免也會因利益而背叛友邦,反目成仇。這正可以

(14)

解釋中國與日本地理位置相近,兩國關係卻遠遠不如美國與日本。

這種疏離的態勢在中國崛起後更加明顯。因為日本要制衡中國的力 量維持自身的利益,除了壯大本身外也選擇與美國靠攏,美國也樂 得藉由日本插手東亞情事,使美國維持世界強權之地位。相對於中 俄、中印聯手道理亦然,除了資源共享、經濟共生外,也有抵抗美 日的弦外之音,而在這樣的情形下,國與國的關係也很容易形成安 全困境。

現實主義下的囚徒困境塑造了一種無政府狀態的環境,環境下 的行為者若採取合作行為,則他們可以得到較高的利益,也正因為 畏懼遭到背叛而心存恐懼,所以會依照理性而選擇競爭的對策。(高 德源譯,2002:275)在現實的囚徒困境中行為者之所以未受到背叛 的誘惑,是因為假設『只玩一次』就結束,在現實的狀況下重複賽 局比較容易產生,當行為者發現這個賽局只是無止盡的關係中的其 中一環,參賽者比較不會斷然冒著往後的風險去選擇背叛,寧可伴 隨著未來合作利益的價值觀,而選擇合作而不是背叛策略。更仔細 的說,國家之間之所以選擇合作策略,是著眼於未來長遠的合作關 係,而非僅僅目前的利益。

以東海油田爭議為例,日本在現實主義的驅使下,斷不能坐視 中國獲取大量油源。在油源缺乏的今日,誰擁有油源,誰掌握的資 源最多,中國全拿了,相對而言日本的國力也等同削減,唯有去搶 餅吃,不管分大分小,至少都有得吃,更何況日本之意不只是吃小 餅,中國當然也了然於胸。

(15)

貳、現實環境中的霸權與囚徒困境 一、霸權國與囚徒困境

賽 局 中 的 每 一 行 動 者 都 具 有 一 個 優 勢 策 略 (a dominant strategy)。和諧賽局的行動者總是保持合作,而囚徒困境或僵局的行 動者總是選擇背叛。霸權國對抗囚徒困境或僵局行動者,所產生的 均衡結果往往不是合作策略,因為有一些行動者會剝削霸權國的合 作行為。所以在霸權國的囚徒困境賽局中,真正的問題是如何刺激 其他行動者將策略由背叛轉為合作。(黃東煬、陳立譯,2006:122)

解決的方式,便是霸權者要對背叛者施加處罰,而且這個處罰是可 信任的或是提供正面的附加支付來促使這種轉變。不論是前者會是 後者,他們所想欲達到的,都是將對手國背叛的策略改為合作。而 霸權國是使用自身的權利來改變對手國的喜好順序,最終期待是改 變賽局本身。

二、一報還一報—現實主義中的囚徒困境

一次賽局中,行為者通常選擇的是背叛策略,才能獲取有利於 己的最大利益。但在真實情況下行為者之間(或國與國間)通常會 再度交鋒,不斷出招。所以重複的賽局是比較符合現實的狀況。

如果我們假設賽局是無限期且重複發生的,那麼在這些條件 下,基於理性預期,相互合作才是最具有理性的,合作(C,C)是均 衡狀況。(黃東煬、陳立譯,2006:185)。因為合作的出現,是基於 行為者知道也預期為來會再度碰面,也因對未來的考量就會影響現 在的行動。但是未來發生的高回合率不過是賽局中合作出現的必要 而非充分條件,理由是因為未來的所獲得的意義通常會被打折扣,

會低於現在的價值(黃東煬、陳立譯,2006:185)。所以合作策略

(16)

要能夠奏效,必須要是這些未來預期的利在整體的利益的計算要 大,足夠使對手國放棄背叛的策略。

第三節 危機邊緣政策與安全困境

壹、危機邊緣政策

一、危機邊緣政策的意函

危機邊緣政策就是一種把對手帶到最大危險的臨界點,並以此 迫是對手退縮的策略。要能提出「可信的威脅」,製造出一個「災難 邊緣」,再加上一些不可控制的風險,且必須存在有條理的帶領雙方 同時脫離災難邊緣的辦法。危機邊緣政策的概念就是策略行動,威 脅是一種反應的規則。不論是威脅與被威脅的任一方,都相對的必 須要付出代價,例如:威脅失誤的風險,也就是說在進行危機邊緣 政策,也要善用風險管理,即便會發生失去控制的風險,也盡可能 要保持在預期之內的風險範圍。所以在使用危機邊緣策略時要事先 規劃,只能讓情況在某種範圍內失去控制。危機邊緣政策就是要設 計及部屬這樣的可能威脅;這包含了預期中的失去控制。(藍兆杰、

徐偉傑、陳宜君譯,2002:482)如同本文中所要探討的中日東海油 田爭議,從 2005 年 4 月日本批準帝國石油開採及同年 9 月初中國派 遣 5 艘船艦巡視東海等都是參賽者在面對不動稱的訊息,無非不是 在試探對方的底線,提升危機程度試探對方的想法及忍受程度。

危機邊緣政策要能夠奏效,首先必備要素是威脅與反應,此種 威脅是必須具有可信度,但又不一定要執行的,畢竟非到萬不得已 執行威脅,所帶來的後果對於雙方利不一定大於弊,所以危機邊緣 政策的目的,不在於實現威脅,而是將威脅當作工具,提升危機程 度,將對手帶到剃刀邊緣,迫使對手放棄或投降,來達成自身的目

(17)

的。有條件的先行動,例如威脅與保證稱做反應率,是設計來制止 對手的行動以保留現況或強求對手的行動以改變現況。威脅有互相 傷害的可能性,但假使成功就不需要付出代價,如果一個策略利用 威脅僅只是製造災難的風險,就可以視為危機邊緣政策。

危機邊緣政策的實踐就是相互危害風險之逐漸升高(gradual escalation of the risk of mutual harm),可以被想像為現實生活中的懦 夫賽局(chicken in real time)(藍兆杰、徐偉傑、陳宜君譯,2002:450) 兩個年輕人各開著一部車,迎著對方而來,他們只有兩種選擇直衝 或對偏向,兩者皆直衝的話無可避免會造成傷害,當然他們也可以 選擇偏向來避免車禍。在現實生活中們可以在任何時間點選擇偏 向,但需要有足夠時間,我們選擇偏向的確可以避掉車禍,但時間 不夠,迫近的時候偏向不一定能躲開車禍。當兩車對開,雙方都是 在試對方的底線,當忍受度不高的就會偏向了。但無論如何這樣都 會存在一種風險及兩車都要等到距離相近時才會偏向,那麼始終還 會相撞,而有擦槍走火的風險。

在危機邊緣政策中,每個危機、威脅都是隱含承諾的,即是如 果達到或做成某種讓步,危機便會解除,所以在實行危機邊緣政策 要有『反向操作』的能力,即是立即開始降低風險,並且很快將風 險由此狀況抽離,不然對手將無法從讓步中得到好處。(藍兆杰、徐 偉傑、陳宜君譯,2002:452)危機邊緣政策需要一方的參賽者減少 對賽局結果的控制,而又不能完全失去控制。這必須建立一個具有 風險的威脅,此威脅既要大到足以有效或強迫對方,又要小到令自 己承受這個威脅。

危機邊緣政策的實行,是要掌握適度的風險,一方面要讓事件 在某種程度上失去控制,因為在事件發生後才會有足夠的自由採取

(18)

威脅的行動,才能維持威脅的可信度。再來必須要對事情有充分的 控制,以避免風險太多連自己都無法控制。這種『要控制失去控制 的情況』因為牽涉到複雜的判斷差異、訊息散播與實施命令的困難,

會讓單純的威脅變的危險,但也因這些力量使戰爭有風險,讓危機 邊緣政策變的可信。所以真正的難題不是如何讓情況失去控制,而 是如何達到控制失去控制的情況。(藍兆杰、徐偉傑、陳宜君譯,

2002:444)危機邊緣政策是將逐漸升高之危害風險加於己方與敵方 的策略,而行動者(即威脅者)無法完全控制有害結果的發生與否。

二、以賽局樹說明東海油氣爭議中危機邊緣政策使用

在東海油田爭議中鑑於不對稱訊息,中國與日本分別出招,一來 想表達自己的立場,二來想測試對方的容忍度及真實態度,但都還沒 到戰爭一觸即發的態勢。東海油氣田始終是一個爭議性極高的區域,

蘊含著油源及高度的戰略地位,處理的不好很容易便會發生戰爭。目 前東海油田事件雖未走到這一步,但依中日降如冰點的關係,劍拔弩 張的態勢,在不斷試探對方底線下兩國走向使用危機邊緣政策甚或引 發戰爭當然有其可能性。

以東海油田爭議來說,中國近年來積極開拓海內外油源,對於東 海發現豐富的油源並開始進行開發與鑽探,在亟欲鞏固自身利益的日 本自然不能坐視不理,且以『安全困境』來說,對手的提升自我保護 措施,相對便是貶低自己的安全,兩相權衡之下日本勢必出招。東海 不若陸地,海域的劃分本身便是一項極大的爭議,東海油田爭議若以 有限重複囚徒困境或單次囚徒困境來看,要找到解套的方式有其困難 性。但如果要以囚徒困境中解決賽局的方式也不是說不可能,以在重 複賽局中,他國為了長遠的合作關係著想,也會因顧忌對方而多少會

(19)

承擔一些風險。所以當行為者簽訂一個相互合作的協定,並且可以制 定特定的機制來強制執行這個合作協定,那麼或許可以降低被友邦背 叛的風險,而達到相互合作的可能。(高德源譯,2002:29)如此一來,

要在兩難的困境中找到解決的方法就不是完全沒有可能性了。

是以賽局樹分析,國際關係間為重複賽局,一來一往的出招,都 會影響到下次的出招策略。試用圖 2-1 威脅時的中日東海油田爭議賽 局樹說明,中國開發油源,日本感受威脅,他必須出招來抵制或表示 自身的不滿,來拖延對手時間或迫使對手中國正視甚或接受談判。而 在圖 2-2 威脅時的中日油田爭議賽局樹,2005 年 4 月 13 日日本核准帝 國石油試採,挑戰中國底線,中國深受威脅於同年 9 月 9 日派遣五艘 船艦,巡視東海,宣示與警告意味濃厚。此時日方能做的便是溝通,

或是拒絕威脅、對峙,升高危機程度。

未威脅 中國

威脅 溝通 日本

對峙或戰爭

圖 2-1 中國威脅時的東海油田爭議賽局樹

資料來源:作者參考(藍兆杰、徐偉傑、陳宜君譯,2002:445)

製繪

所以在使用危機邊緣政策時,首先要確認雙方的利益及該處境中 不確定的特質,並能指出雙方為升高相互危害風險所使用的策略,且 這個策略是能發揮功用並是可以讓本身所能承受的。

(20)

未威脅---中國逕行開採 日本

威脅 溝通 中國

對峙或戰爭

圖 2-2 日本威脅時的東海油田爭議賽局樹

資料來源:作者參考(藍兆杰、徐偉傑、陳宜君譯,2002:445)

製繪

貳、危機邊緣政策的成功條件

圖 2-3 中,假設我們將東海油田所引發的戰爭風險為 q,那麼不論 日本或中國,我們都可以計算出大概的最佳策略。以圖 2-3 來解釋,

在黑色部分的左方與右下方,分別為 p=2/5 與 p=1/2,當 P<0.42,為 有效狀況。而當 P>0.42 時,為可接受狀況。中國或日本都不知道這些 邊界的準確位置,所以他必定會從下方的位置開始探索,也就是黑色 區會是他的起使位置。此時,座標(p,q)位於黑色區接近底部的某處。

行為者並不知道確實的位置,可能不斷的試探,所以他不確定 p 值為 何。所以在此點上的威脅是安全的,但相對來說也缺乏有效性。所以 行為者會開始升高威脅,也就是垂直的將(p,q)向上移。若情勢依舊 安全,且缺乏有效性,決策者將會再度慢慢提高威脅。(藍兆杰、徐偉 傑、陳宜君譯,2002:449)持續下去,他最後會到達黑色區域的邊界,

至於是那個邊界,便要根據 p 值來決定。

(21)

q1 兩個條件都達到的區域 上極限 (可接受性條件) 。

0.6 低極限 t(有效的條件)

探索區域

0.3 0.4 0.42 0.5 1 p

圖 2-3 危機邊緣政策的成功條件

資料來源:作者參考(藍兆杰、徐偉傑、陳宜君譯,2002:449)

製繪。

然後必定會產生兩種狀況。第一種狀況下,威脅嚴重到足以制止 日本或中國,這種情況會發生在 p 值小於關鍵性的 P=0.42。我們可以 在以下圖中找出這種移動是超出綠色區域的部分,而進入威脅能同時 滿足有效狀況與可接受狀況的區域。(藍兆杰、徐偉傑、陳宜君譯,

2002:450)

在這種情況下,對手國中國或著是日本就必須要讓步。第二種情 況下,行為者的測試將自己推向可接受狀況的上方 M,也就是說超出自 己所能承擔的風險,失去能夠控制的狀況,這樣行為者就必須要讓步,

對手國就會獲勝。所以當行為者在慢慢提高風險時,他必須要從對手 國的態度、行為找出一些線索,讓他更加準確的預測 p 值,也就不會 發生無法控制的狀況出現,盡量降低威脅所應承擔的風險。

參、安全困境(security dilemma)

一、安全困境的意函

根據傳統現實主義以國家為中心的思維,國家就是安全的主體,

因此安全的目標就是要如何確保國家安全,以對抗外來的威脅;由於 國際體系是無政府的狀態下,國家想要尋求自保就必須仰賴軍事力量

(22)

在這樣的架構下,安全的程度是以國家之間的相對軍事力量來衡量 的。所以鄰近國家提升軍備的情形下,自己就相對顯得弱勢而出現了 安全危機。

安全困境是指國家與國家間的競爭關係,當一個國家提升軍備,

讓自己越來越安全,他的安全鞏固是對手國威脅所在,而這種動作,

也勢必引起對手相同的反應,也會因此增加軍備,於是兩者將陷入永 無止境的軍備競賽。安全困境是一種國際常態,因為國際關係常常是 處於無政府狀態,兩國會呈現軍備競賽,也是因為沒有一個更強壯、

更中道的力量去作裁判。安全困境的存在就是因為對對手的意圖有很 大的不確定而且無可解決。例如:在東海爭議中,中國就不是很確定 日本增加軍備是用來防禦日本本身或是東海爭議或者根本想攻打中 國,就如同日本對於中國增加軍事預算是否會危及自己的利益或只是 單純的防禦而已。因為中日結構性的困境(歷史的問題難解),使得兩 國關係本來就有其脆弱性,會產生安全困境有幾個原因,除了國家之 間普遍的不安全感外,再來就是國家之間產生利益的糾葛。

安全困境之所以為「困境」,是因為國家追求安全的目的到最後,

會變質成一種非理性的平衡追求,然而探求其根本,對於國家安全的 維護,雙方似乎都不需要擁有這麼高度的軍力以對抗之。

作為一個正在上升的大國,中國日益擴展的國家利益與相對有限 的利益保衛手段之間存在突出的矛盾。中國迫切需要強化利益保衛手 段;但是單純從增強實力著手,難免使其他國家產生疑慮,結果是引 發軍備競賽。軍備競賽越劇烈,各方越無法得到真正的安全。所以中 國與日本要實現和平發展,必須擺脫這種安全困境。

(23)

二、安全困境的解決之道

安全困境不能完全解決只能緩解,因為國家就如同人性一般,沒 有不自利的人,大同世界很難出現在真實的國際關係上。緩解之道在 於如建立信任機制、元首高層對話管道、雙邊或多邊的安全性議題合 作等。而雙邊或多邊的安全性議題合作更可以使區域內國家共同合作 建構安全環境,從中建立如國際規範、國際秩序與國際統合等範疇,

增加國家間的互信,減輕安全之威脅感,降低或消除國家的安全困境,

從而因規範與機制的制約而增加破壞現狀或侵略的成本。例如聯合國 的集體安全制度即藉由制度性的架構,透過國際合作與強權協調方 式,建構普遍性維持國際和平與安全的國家行為規範。

由於東亞在歷史上缺乏有關安全議題的合作傳統,以及東亞區域 安全的複雜性,因此亞太安全多邊合作機制的建立應該是有相當的困 難,因為目前的亞太多邊安全對話機制,並未發展到能夠面對較為犀 利的議題(如:領土爭議),仍只停留在經貿合作等軟性交流議題等,

尚未能處理立即的危機事件。

東亞缺乏出現如美國般甚孚眾望的警察國家,就連如中、日兩國 亦未有獨霸亞洲的實力,前者尚為發展中國家未來勢力雖不容小覷,

但目前仍在發展自身經濟階段,也難服於日本。日本本身奉行脫亞入 歐,早與亞洲各國有漸行漸遠之勢,加上侵略國的歷史更令鄰國對其 戒懼不已,充其量中日兩國僅能說在亞洲互有影響力,也祇能做到保 護自己、制衡對方而已。中日實力相當在關係冷淡下很容易形成安全 困境,而假使形成的成因將在於沒有適當力量去平衡,加上互信基礎 薄弱,又有領土主權爭議及歷史問題紛擾、美日同盟問題、元首之間 的對話與交流嘎然停止及在雙方軍事武力提高下等等因素交相影響,

東海油田爭議事件只是壓死駱駝的一根稻草。在很多因素的催化及現

(24)

實主義的作祟,中日很可能將形成了安全困境,進而影響到東亞區域 安全,如果局勢真的惡化,這並不是美國或中日兩國所要的結果。

數據

表 2-3 囚徒困境賽局報酬表     A     不認罪  認罪  不認罪 (2,2)  (0,3)  B  認罪 (3,0)  (1,1)  資料來源:(藍兆杰、徐偉傑、陳宜君譯,2002:264)  在囚徒困境中,每位參賽者都有優勢策略,但均衡(即參賽者 皆採取優勢策略)的報酬比參賽者採取劣勢策略所得到的報酬還 低,如何使囚犯放棄自私自利的背叛並選擇採取合作,解決的辦法 便是重複的賽局。  貳、囚徒困境賽局  一次式(one-shot)的囚徒困境賽局的結果是(D,D) (即敵對、背 叛) 。因為不管他

參考文獻

相關文件

如圖,將一張長方形紙張,對摺再對摺,然後剪下一長為 3 公分、寬為 2 公分的長方形,則剪 下的部分展開後的圖形為. 形,且其周長為

一、下表為一年三班票選衛生股長 的得票結果,得票數最多的為 衛生股長,請完成表格並回答 問題(○代表票數). (

 for…迴圈自初值開始判斷 &lt;條件判斷&gt; 是否為 true,若為 true 則執行 for 迴圈內的敘述,並依 &lt;增量值&gt;,每次增 加 (或減少) 指定的增量值,直至 &lt;條件判斷&gt;

3、刑法第 227 條:對於未滿 14 歲之男女為性交者,處 3 年以上 10 年以下有期徒刑。對於未滿 14 歲之男女為猥褻之行為者,處 6 月以上 5 年以下有期徒刑。對於 14 歲以上未滿

當中尤以《雷雨》、《日出》及《原野》一系列優秀作品最

在這一節中,我們將學習如何利用 變數類 的「清 單」來存放資料(表 1-3-1),並學習應用變數的特

Kaiser 提出 MSA(Measure of Sampling Adequacy,資料做因 素分析適合性指標),雖然 MSA 的大小沒有統計上的判斷臨 界點,但實證經驗,當 MSA &gt; 0.8 表示此組資料作因素分析

「不構成犯罪」但另一位認 定未敘及,從形式觀察,兩 位的評斷竟有明顯兩不相容 的歧異判斷,堪認有其中一