「容忍」或「預防攻擊」：核擴散問題下的策略選擇與策略互動

(1)

「容忍」或「預防攻擊」：

核擴散問題下的策略選擇與策略互動*

楊凱皓**

摘　　要

自核武科技的發展以降，「核擴散」（nuclear proliferation）問題便一直為國際所關注。對特定國家而言，核擴散將因非官方核武國家可能發展或取得核武，而對其安全構成威脅。故對擴散國（proliferator）發展核武潛在可能之因應，便成為其安全戰略的重要一環。可能的因應策略包括容忍並給予經濟誘因、制裁、以及「預防攻擊」（preventive strike）。然而在不同的策略選項間，存在一定程度的取捨關係。本文之目的，即在於探討在此一情境下，影響反擴散國與擴散國所採行之策略的因果機制，將國家的策略選擇與策略互動進一步一般化與理論化，並提供核擴散問題的研究些許理論基礎。本文將以「賽局理論」（Game Theory）之途徑建構核擴散情境下的理論模型，並推導該模型的均衡解，由均衡的「比較靜態分析」（comparative static analysis）進一步延伸理論命題的實質意涵。此外，本文將以「兩次北韓核武危機」、以及「伊拉克戰爭」，作為經驗案例的對照，延伸理論之經驗意涵（empirical implications），並由案例初步驗證所建立並推導的理論模型。本文的研究結果發現，擴散國受到的安全威脅及其技術條件、給予或終止制裁與經濟誘因的條件、反擴散國預防攻擊的成本及其攻擊能力以及雙方之預期將影響此一情境下衝突爆發之可能性。關鍵詞：核擴散、預防攻擊、賽局理論、北韓核武危機、伊拉克戰爭

*

作者感謝林繼文教授在形式理論與經驗連結上之教導、陳世民教授在本文主題與案例上之建議，以及二位匿名審查人之寶貴意見及細心斧正。惟本文之文責仍由作者自負。

**

國立臺灣大學政治學研究所碩士生，E-mail: [email protected]。收稿日期：101 年 8 月 23 日；通過日期：101 年 12 月 7 日

(2)

壹、前言

自核武科技的發展以降，「核擴散」（nuclear proliferation）問題便一直受國際所關注。隨冷戰結束與兩極體系的崩解，核擴散的問題更日益突出（Sims, 1991；Maerli & Lodgarrd, 2007: 3；Rauchhaus et al., 2011: 1-3）。對於核擴散管制的各項相關國際建制亦因此持續運作並被討論（Simpson, 1994；Feaver & Niou, 1996；Forland, 2007；Goldblat, 2007）。雖核擴散對國際體系穩定程度的影響仍有不同之見解，但至少對特定國家而言，核擴散的潛在可能確實因將使非官方核武國家發展或取得核武，而對其安全構成威脅（Feaver & Niou, 1996；Schneider, 1994: 210）。因此，受核擴散威脅之國家（反擴散國），其對擴散國（proliferator）發展核武潛在可能之因應，便成為其安全戰略的重要一環。此類國家因應核擴散的可行策略相當繁多，不論在實務上或文獻上皆有一定的歸納，包括容忍並給予經濟誘因、制裁、以及「預防攻擊」（preventive strike）（Dunn, 1991；Martel, 2001: 110； Feaver & Niou, 1996；Conway, 2003；Benson & Wen, 2011；Baliga & Sjostrom, 2008；Schneider, 1994；2004）。1 _{然而，在不同的策略選項間，存在一定}

程度的取捨（trade-off）。越是採取等待、制裁或提供誘因的「容忍」策略，雖衝突較不可能發生，但擴散國發展成功的可能性越高；越是採取強硬的策略，雖發展成功可能性降低，但卻反而增加不必要衝突的機率（Feaver &

1 _{值得注意的是，在理論層次上，}_{「預防攻擊」}_{（preventive strike）與「先制攻擊」}_{（preemptive}

strike）有實質之區別，前者代表不論對方是否有攻擊之意圖（intensions），一旦對方有能力威脅己方時便隨即發動之攻擊；後者則係指當對方攻擊的意圖與態勢明顯時，先於對方而發動之攻擊，故其乃是以對方「明顯的威脅」（imminent threat）為前提。

在核擴散之問題上，小布希政府於2002 年發表的著名演說，乃是採用「先制手術攻擊」

（preemptive surgical strike）之詞彙（Goldstein, 2006: 167；Kristensen, 2008），其實際上之意涵卻較為偏向「預防攻擊」，因其攻擊的條件中並不以他國明顯的軍事佈署為前提（Forland, 2007: 43）。對此一問題，有論者認為，因大規模毀滅性武器的特殊性，在軍事佈署到發動具體攻擊間的時間極短，故並無區分「預防攻擊」或「先制攻擊」之必要（Goldstein, 2006: 169）。因此本文以下的討論中，為求一般性，將一併使用「預防攻擊」之用法。

(3)

Niou, 1996；Forland, 2007；Moriarty, 2004；Baliga & Sjostrom, 2008；Benson & Wen, 2011），因此在既有的核擴散問題上，反擴散國所採取之「策略」（strategy）或「取向」（orientation）皆有相當程度的差異。同時，擴散國在發展核武過程中之策略與回應亦不盡相同。然而既有文獻中，雖對核擴散與因應策略的個案性討論相當豐富，一般性或政策性的歸納與分析亦同樣充足，但對兩方策略的影響因素之理論性與形式化（formalized）研究則相對較少。而既有的理論性與形式化文獻中亦有些許之限制，且其適用情境亦與上述情況不完全相同。因此本文之目的，在於探討在此一情境下，影響反擴散國（counter-proliferator）與擴散國採行策略的因果機制，期望將國家的策略選擇與策略互動進一步一般化（generalize）與理論化（theorize），補足既有文獻中理論的限制，並期望提供核擴散問題的研究些許理論基礎。以下本文將分為三部分，第一部分將針對與核擴散問題以及反擴散國之回應的相關文獻與論點進行歸納與整理，作為本文建構理論之參照。第二部分將以「賽局理論」（Game Theory）之方式建構核擴散情境下的理論模型，並推導該模型的均衡解，最後由均衡的「比較靜態分析」（comparative static analysis）進一步延伸出理論的實質意涵。第三部分中將推廣該理論模型的「經驗意涵」（empirical implications），並與經驗上之案例相互對照，本文將分別以「兩次北韓核武危機」以及「伊拉克戰爭」三個案例作為經驗對照之依據，試圖以理論模型解釋案例、以案例驗證理論。最後再對理論進行反思與檢討，期望對核擴散問題與其因應策略的相關文獻能有些許的助益。

貳、核擴散之影響與可行的回應策略

一、核擴散對體系穩定之影響

在關於核擴散的總體層次之問題上，最為重要的問題即是核擴散對體系穩定程度（stability）之影響。核擴散問題對體系穩定之影響，主要可區分為兩類不同之觀點，分別為「樂觀主義」（optimism）與「悲觀主義」

(4)

（pessimism）。其中樂觀主義認為，核武將使持有國及其對手更為謹慎，如同冷戰時期美蘇間的「戰略穩定」（strategic stability）關係。因此更多國家持有核武將可進一步促成國際體系之穩定，並降低衝突升高的可能（Feaver, 1993；Karl, 1996；Goldstein, 2006: 146-163；Waltz, 1990；2003； Sagan & Waltz, 1995；Berkowitz, 1985；Mearsheimer, 1993；Asal & Beardsley, 2007；Gartzke & Jo, 2011）。而後者則認為，冷戰的經驗有其特殊背景與條件，不能完全適用於後冷戰的情境中（Dunn, 1982；Kaiser, 1989；Karl, 1996； Goldstein, 2006: 15-20；Woods, 2002；Asal & Beardsley, 2007）。且因誤判、擴散國的非理性、危機情況中的不穩定（crisis instability）、初期發展階段第二擊（second-strike）能力不足、或不對稱核關係造成相互第一擊誘因、以及擴散過程中可能引起預防攻擊等原因（Goldstein, 2006: 15-20；Berkowitz, 1985；Feaver, 1993；Feaver & Niou, 1996；Karl, 1996；James, 2000；Sagan,

2003），特定形式的核擴散反將造成體系的不穩定。2 _{由上述文獻間的爭點} 可見，核擴散對體系穩定程度之影響此一「總體層次」問題的關鍵，乃是取決於擴散國之行動、反擴散國之回應以及雙方策略互動之「個體基礎」（micro-foundation）。析言之，除誤判等非理性因素外，「悲觀主義」反駁「樂觀主義」最主要的論點有二。其一是核擴散後因核武實力不平均而造成之戰略不穩定（Berkowitz, 1985）；其二則是核擴散過程中存在反擴散國發動預防攻擊之可能（Sagan, 2003: 53-63；Goldstein, 2006: 14-26）。其中前者乃是多數討論核擴散影響以及「戰略穩定」之文獻的焦點，相對的對後者的討論反而較少。因此，進一步探討核擴散過程中擴散國與反擴散國雙方策略互動之重要性便得以顯現。而此即是本文關注之核心問題。 2 此外，近年來亦有文獻指出，核擴散對體系穩定的影響不一定能單純劃分為「樂觀」與「悲觀」，不同的核擴散形式將造成不同之影響。例如Berkowitz (1985) 指出，核擴散對衝突發生可能性的影響與嚇阻能力密切相關，且有核國家之數目對穩定程度之影響非線性。Goldstein (2006: 14-26; 152) 指出，第一，核擴散在短期上因新獲核武之國家缺乏第二擊能力，因而不穩定，但就長期而言，若其第二擊能力建立，則將反而較穩

定。第二，核分裂的核武較核融合的核武更容易造成不穩定關係。又如Feaver & Niou

(1996) 指出，核擴散穩定與否取決於獲取核武之國家是否有足夠的資源維持其「安全性」，亦即，核武的第二擊能力以及避免核武遭到攔截、偷竊或強奪之能力。

(5)

二、擴散國的目的與策略

就擴散國一方而言，關於擴散國之所以有發展或獲取核武之動機，既有的經驗研究中提出了些許重要的決定因素。其中Singh & Way (2004) 之研究顯示，影響一國是否發展核武之最重要因素在於外部威脅（external threat）。而 Jo & Gartzke (2007) 則更進一步指出，傳統武力威脅較核武威脅影響更鉅。其另指出，一國的經濟能力（economy capacity）亦是重要決定因素。而Gartzke & Jo (2011) 則指出，擁有核武之國家在衝突中使對方退讓之機率較高。3此外，在相關的形式化研究中，Benson & Wen (2011) 指出，擴散國發展核武之動機在於安全威脅以及重要利益（overriding interests），且在特定條件下，發展國將採取「戰略模糊」（strategic ambiguity）之發展策略。4 Baliga & Sjostrom (2008) 則更進一步指出，上述的模糊發展策略，

反而將有助於雙方關係的穩定。5 然而，鑒於衝突是否發生乃是雙方策略互動之結果，故除單方面探討擴散國之動機及其發展策略外，更另需一併討論反擴散國之回應策略，以及雙方策略互動之影響。

三、反擴散國之因應與策略互動結果

在反擴散國之因應以及兩方的策略互動結果方面，影響衝突是否發生之關鍵，乃在於反擴散國在「容忍」型策略與「預防攻擊」策略間之取捨、其效果、以及擴散國之相應策略。6 關於「容忍」類型之策略，Mazarr (1995) 3 在probit 模型中的回歸係數估計值為0.602，在 1% 顯著水準下顯著非零。

4 _{Benson & Wen 之模型指出，當擴散國採取模糊策略時（即採用賽局中的混合策略），}

其將可進一步使反擴散國妥協。該均衡能否維持則取決於當擴散國為「極端」（zealous）類型時，其保有核武可得之利益、反擴散國擔憂之程度、以及擴散國為「極端」類型的先驗機率（prior probability）。

5 _在_{Baliga & Sjostrom 之模型中，戰略模糊係指擴散國核武發展程度的不確定性，該模型}

指出，此一不確定性可作為擴散國嚇阻之能力，降低其被攻擊的可能，且對整體福利而言皆有效率。 6 在此，本文以及其他文獻所討論的焦點在於一般性之策略選項，因而假定各國所處的環境皆為開放且無限制的國際無政府狀態，故「武器管制」、「武器禁運」、「封鎖」等具體性且涉及地域與個別經濟背景等因素之回應策略將不予討論。關於相關的文

(6)

以北韓核武危機為例，說明制裁的無效性以及「包裹協議」（package deal）之重要性；Montgomery (2005) 則強調給予誘因之效果勝過預防攻擊。而以上兩者更強調給予之「包裹協議」須能與擴散國獲取核武之戰略利益同等。關於預防攻擊策略，Goldstein (2006) 指出雙方核武實力的不對稱性將使反擴散國更可能發動預防攻擊，因而提高不穩定之可能。關於不同策略間的取捨，Feaver & Niou (1996) 之模型指出，影響擴散國是否擴散、以及反擴散國協助發展或發動預防攻擊之因素，在於雙方對對方類型的先驗信念（prior belief）、雙方外交關係、雙方相對實力差距、以及擴散國的核武發展程度。Baliga & Sjostrom (2008) 之模型則針對擴散國核武發展的訊息透明化程度進行分析，其指出，在特定的參數條件下反擴散國不會允許擴散國

的訊息模糊，此時「強硬」類型的反擴散國將會發動預防攻擊。而在Benson

& Wen (2011) 之模型中，影響擴散國是否發展核武以及反擴散國是否妥協或發動攻擊之因素，包括雙方對對方類型的先驗信念（prior belief）、反擴散國擔憂的程度、擴散國保有核武的利益以及訊息的結構。

然而，上述的形式化文獻中，Feaver & Niou (1996) 之討論焦點在於反擴散國在「協助發展」與「預防攻擊」間的取捨，涉及的仍是核擴散後的「戰略穩定」問題；Baliga & Sjostrom (2008) 則著重於訊息透明化程度對雙方的福利影響，以及不確定性作為嚇阻依據的條件。僅有 Benson & Wen (2011) 的模型與本文所欲探討的問題較為貼切──即在核擴散過程中，反擴散國在「容忍」型策略（包括給予經濟誘因、制裁等未使用武力之策略）與「衝突性」策略（即預防攻擊）間之策略選擇、雙方的策略互動結果、以及對衝突發生可能性之影響。但此一模型亦仍有近一步發展的空間。包括行為者類型與策略之連續性、訊息不完全的雙邊性、雙方互動的動態性、以及關於核擴散「過程」之形式化。而就非形式化文獻而言，其內在邏輯亦可進一步由形式化之推演檢證。是故，本文以下將針對上述之核心問題，在既有文獻之基礎上，進一步建立擴散國發展核武，反擴散國決定其容忍程度的互動情境下之形式化模型，並透過模型的求解以及均衡的比較靜態分析，提出相關的理論命題與實質意涵。

(7)

參、理論模型

一、模型概述

根據上述的互動關係，此一賽局的情境為：擴散國被反擴散國得知其有可能正在發展核武，此時反擴散國可選擇其「容忍」之時間長度，在此時間內其將僅得採取「制裁」或「給予經濟誘因」的策略，而待此一時間結束，若擴散國仍未明確停止發展，則其將發動「預防攻擊」。同樣地，擴散國亦可選擇其發展核武之時間長度，若在其發展時間超過其「核門檻」（nuclear threshold）前，7 _{反擴散國之容忍期限即先結束，則其將被攻擊；} 若在超過「核門檻」後，對方之容忍期限仍未結束，則其將發展成功；若其時間既未超過核門檻亦未超過反擴散國之容忍時間，則代表其將先妥協。

二、基本假設

在理論的基本假設方面，首先，本文假定行為者符合「理性選擇」（rational choice）的基本假定。8 _{而賽局中所有除「個別訊息」（}_private

information）外之參數與變數，皆為「共有知識」（common knowledge）。其次，關於賽局架構，此一賽局共有兩個行為者（players），分別記為行為者i 與行為者 j。其中 i 代表反擴散國；j 則代表擴散國。此賽局的訊息結 構為「訊息不完全」（incomplete information），亦即，雙方各自有其「個別訊息」（private information）。行為者 i 之個別訊息為 Ci，代表其發動預防攻擊之成本，其中 Ci為任何正實數。對 j 而言，Ci為服從期望值為 1/i

之指數分配（exponential distribution）的隨機變數（random variable）；行為者j 之個別訊息為t ，代表其達到「核門檻」所需的時間，亦為任何正實j 數，對i 而言，t 亦為服從期望值為 1/j j之指數分配的隨機變數。在行為者 7 「核門檻」一詞，在其他文獻上可能被用作「率先使用核武」之界線，然而在本文中，核門檻係指一國成功發展出核武所需要的時間界下限，未免混淆特此說明。 8_{在「理性選擇」途徑中，行為者的偏好被假定為具有「完全性」（completeness）、反身} 性（reflexivity）與「遞移性」（transitivity）（林繼文，2005）。

(8)

策略方面，因此賽局為訊息不完全，行為者之策略為其類型之函數，故行為者i 之策略為其（根據自身不同的成本水準）選擇之容忍時間ti ti(Ci)；行為者 j 之策略亦為其（根據自身不同的核門檻水準）選擇之發展時間 ) ( j j j t t t  。9 最後，此一賽局的順序為：自然（nature）決定 Ci與t 之實現j 值（realization），並僅揭露（reveal）予該資訊之擁有者，隨後 i, j 同時依據揭露的實現值，以及其策略，決定其所選擇之時間。此外，此賽局中亦有其他「外生變數」（exogenous variables）。其中 P 代表單位時間內反擴散國給予擴散國之「經濟誘因」扣除「制裁」的淨值； δ 則代表已給予經濟誘因中，在發生預防攻擊後會被撤回的「可逆性」 （reversible）資源；N 則代表對擴散國而言，獲取核武的戰略利益扣除承諾退讓後獲得的「包裹協議」之淨值；S 代表擴散國受到預防攻擊所承受的損 害；W 則代表擴散國獲得核武後，對反擴散國之負擔。10 _{另外，應注意到}_P 中的「經濟誘因」與 N 中的「包裹協議」兩者的區別，在於前者是只要擴 散國持續發展，其將可得之利益（例如透過發展核武以「訛詐」換取的讓步），獲取利益不以「停止發展」為前提。而後者則是以「停止發展」為前提，若未停止發展，則不可得該項利益。以下將整理模型中的符號、內生變數與外生變數於表1。 9_{亦即，行為者的策略為其類型空間到行動空間之映射，代表在特定策略下，特定的類} 型可直接對應到行為者選擇的特定時間。 10 注意到 P 與 N 皆是以不同的兩個因素相減的淨值表示，之所以如此表示乃是因第一， 若不如此精簡，外生變數個數將過多而不便於分析；第二，單位時間內給予的「經濟誘因」與「制裁」、以及獲取核武的戰略利益與放棄發展核武可得之保證利益，兩者皆互為正反面，故可做如此之簡化。

(9)

表1　符號與變數說明符號意涵

 

i j N  , 行為者（i 表示反擴散國，j 表示擴 散國）內　　生　　變　　數 i i i i t C T t  ( ) , tj tj(tj)Tj 行為者之策略（T 代表策略空間） 外　　生　　變　　數  i C R+ i C i to , ～exp(i)to j  j t R+ j t j to , ～exp(j)toi 行為者之類型 P 單位時間內反擴散國給予擴散國「經濟誘因」扣除「制裁」的淨值 δ 發生預防攻擊後會被撤回的「可逆性」資源 N 擴散國獲取核武的戰略利益扣除承諾退讓後獲得的「包裹協議」之淨值 W 擴散國獲得核武後對反擴散國之負擔 S 擴散國受到預防攻擊所承受的損害 i  , j C , i t 之期望值倒數j 11 資料來源：作者自行整理

三、模型設定

由以上的設定，便可將前述的賽局情境更進一步形式化，根據前述的賽局情境，決定賽局結果（outcome）的關鍵乃在於雙方的策略組合，即雙 11_{嚴格而言，} i, j在此應被歸類為隨機變數Ci,tj之「參數」（parameters），但在本文的理論情境中，反擴散國發動攻擊之成本與擴散國核門檻之期望值，皆有實質意涵，在經驗上亦具意義，故在此一併將之歸類為外生變數，以在下文之比較靜態分析中一併探討其影響。

(10)

方依據其類型選擇的行動── 時間的相對大小。而由賽局的設定，將可知共有四種情境，分別為：情境一：t_j 且t_j ti ，代表擴散國在發展成功以及反擴散國容忍時間結tj 束前退讓，如圖1 所示。圖 1　情境一資料來源：作者自行繪製情境二：t_j 且t_j ti ，代表擴散國仍未發展成功，但反擴散國即率先發tj 動預防攻擊，如圖2 所示。圖 2　情境二資料來源：作者自行繪製情境三：tj 且tj ti ，代表擴散國選擇持續發展至成功為止，而反擴散tj 國容忍時間超過其核門檻，擴散國發展成功，如圖3 所示。圖 3　情境三資料來源：作者自行繪製 tj ti tj ti tj tj tj ti tj

(11)

情境四：t_j 且t_j ti ，代表擴散國選擇持續發展直到成功，但反擴散國tj 於其成功前即採預防攻擊，如圖4 所示。圖 4　情境四資料來源：作者自行繪製在上述四種策略組合下，根據賽局的情境與變數設定，便可進一步決定 i, j 各自的報酬（payoff）。首先，就 i 的報酬而言，在情境一中，報酬 為Ptj；12 在情境二中，報酬為Ci(P)ti；13 在情境三中，報酬為 W t P j  ；14 在情境四中，其報酬亦為Ci(P)ti，其次，就j 的報酬 而言，在情境一下，報酬為Pt ；情境二下，報酬為_j (P ) ti S；情境三下，報酬則為Ptj ；情境四下，其報酬則亦為N (P ) tiS。總結以上，兩行為者的報酬可表示於下：15                          j i j j i i j i j j j j i j j i i j i j j j i t t t t if t P C t t t t if W t P t t t t if t P C t t t t if Pt U , , ) ( , , , , ) ( , ,   12 亦即，此時的總和報酬為，單位時間內其所付出的淨值博奕持續的時間。 13_{注意到因 δ 代表發生預防攻擊後會被撤回的「可逆性」資源，故預防攻擊發生後與預防} 攻擊發生前i 所付出的總值差距即為 δt，後文中 j 之報酬亦然。 14 此時假設當擴散國取得核武後，雙方的博奕即結束，故僅需乘上t 即可。j 15 注意到在以上的設定下，因雙方的行動空間皆為無窮且不可數集（infinitely uncountable），故實際上所能描繪的行動選項範圍相當大。析言之，對i 而言，其選擇之策略實為容忍 時間，因此在容忍時間結束前，此模型並未限制i 實際上的可行選項，只要不是「預防 攻擊」的行動，都能透過此模型描繪之，僅需掌握該行動對外生變數的影響即可。對j 而言亦然。此乃本文之模型相對於既有文獻的一個推廣（generalization），以容許行動空間的無窮性以及策略的連續性（continuity）來增進可描繪的實際政策範圍。然下文中理論實際意涵與經驗意涵的討論將仍聚焦在「給予誘因」與「制裁」兩個常見的政策上，但不代表此模型是建立在僅有此二政策選項的假設上。 ti tj tj

(12)

                     j i j j i j i j j j j i j j i j i j j j j t t t t if S t P t t t t if N t P t t t t if S t P t t t t if Pt U , , ) ( , , , , ) ( , ,  

四、均衡求取

在訊息不完全之賽局下，求取之均衡乃是「貝氏－納許均衡」（Bayesian-Nash equilibrium, BNE）。亦即，在均衡狀態下，對雙方而言，在給定對方之策略與己方對其類型之信念，雙方皆不會改變將己方之類型投射到行動選項之策略。（González-Díaz et al., 2010）然而此一賽局的報酬設定具有一定程度的複雜性，求取均衡的具體過程較為複雜，詳細之證明將於附錄中呈現，以下將概略呈現求取之過程與均衡之結果。此賽局求解之步驟分別為：第一，求取當t_j 時的最適反應，第二，t_j 再求取當t_j 時的最適反應，最後再對照兩者，確認兩種情況下之「局部t_j 最適反應」（local best response）在整個賽局中是否皆為「一般最適反應」（global best response），並依此過濾前兩步驟之結果，如此便得求出均衡解。16 故首先，當t_j 時，i, j 可分別計算其「期望報酬」t_j （expected payoff）：

) ( j _i j i E Pt t t EU    Pr (titj)E(Ci (P)ti titj)Pr(ti tj) ) ( j _i j j E Pt t t EU    Pr(titj)E((P)tiS titj)Pr(titj) 此時便可分別求取使EU 極大的j t*j(tj)以及使EU 極大的i ti*(Ci)。但在此情況下，根據下列命題一， *( ) j j t t 將不存在。17 16_{之所以有「局部」與「一般」之分，乃是因給定} j j t t  或tj  後，所討論的最適反應tj 即被限制於該範圍內，但仍不能排除可能存在tj*t 使 Uj j之值大於當tjt 時求的得最j 適反應下的Uj值，此時即便在範圍內雙方之策略互為最適反應，j 仍將背離該策略組合， 反之亦然。 17 _{命題一之證明將於附錄中呈現，直觀上而言，顯而易見地，當} _t jt 時，j 的報酬中根j 本不存在t ，自然不存在 tj j*(t 。j)

(13)

命題一：當t_j 時，j 的最適反應策略t_j *( )

j

j t

t 不存在

因此，由附錄中可見，此時BNE 不存在，僅能求取未考慮類型的納許

均衡（Nash equilibrium, NE），此時雙方之局部最適反應如命題二所示。命題二：當t_j 時，i, j 的局部最適反應分別為：t_j        , 0 , j i j i t t t t  　 0 , 0 , 0 ,      P or P C P if P C P if i i   ，　  tj 其次，當t_j  時，同樣可計算 i, j 之期望報酬：t_j ) ( j i j i E Pt W t t EU     Pr (ti tj)E(Ci(P) ti tj) Pr (titj) ) ( j i j j E Pt N t t EU    Pr(titj)E



(P)tiS t_i tj



Pr (titj) 由相同方法，將可求出雙方的最適反應策略 *( ) j j t t 及 *( ) i i C t ，故如命題三所示：命題三：當tj 時，i, j 的局部最適反應策略分別為：tj                   j i i i C C W P t    1 ) ( * j j j t t t*( ),  最後，如前所述，需檢驗命題三中，對於 i 的最適反應 *( ) i i C t ，j 的最 適反應是否確實為t*j(tj), tj。若然，則命題三中之局部最適反應即為

此賽局的 BNE；若非，則此賽局中將無 BNE，而僅有 NE。故此賽局之均

衡如命題四所示：命題四：若t*j tj或t*j tj，且EUj[ti*(Ci),t*j]EUj[ti*(Ci),]，則此賽局之均衡為：                             ) ( 1 ) ( * * j j j i i i t t P W C C t

(14)

以及             0 , 0 , , 0 0 , , P or P C P if t t P C P if t t i j i i j i    ,　 tj 若t*_jt_j_，且 _[ *₍ _), *_] _[ *₍ _),__] i i j j i i j t C t EU t C EU  則此賽局之均衡為：                      W t P C if t t t W t P C P C if t t W t P C P if t t j i j j i j j j i j i i j i j i j i , , , , , , 0 ,        ,  tj,if P0                j i j j i j j i i j i j i t P N W C if t t t t P N or W C if t t , , , , , , 0     ,　if P0 其中 } : { , 2 * j j j j i i j P S t T t t t       

五、理論模型之實際意涵

以下的篇幅中，將由上述的均衡解，進一步延伸出其實際意涵，回到核擴散問題的脈絡中，並與既有文獻的理論內容對照。首先，由命題四可見，均衡結果可分為「穩定」與「不穩定」兩種情況。在「穩定」之情況下，t*j tj，且EUj[ti*(Ci),t*j]EUj[ti*(Ci),]，不存在BNE 而僅有 NE。由該情況下的均衡解可見，不論如何反擴散國將不會先發動預防攻擊，衝突不會爆發。僅有Ci PtjW時擴散國才得以發展成功。反之，在「不穩定」的狀況下，t*jtj，且EUj[ti*(Ci),t*j]EUj[ti*(Ci),]，或t*j tj，將存在BNE。且當ti*(Ci)tj時，反擴散國將率先發動預防攻擊，衝突將爆發。而當 j i i C t t*( ) _{時，擴散國將發展成功。值得注意的是，影響雙方關係穩定與否} 之關鍵，在於t 、*j t 、j EUj[ti*(Ci),t*j]以及EUj[ti*(Ci),]之值，由命題五可見，t 是否大於*j t 以及j EUj[ti*(Ci),t*j]是否大於EUj[ti*(Ci),]之關鍵，在於 P、、S、N、i之值以及t 之實現值。j

(15)

命題五：不等式 [ *( ), *] [ *( ),_] i i j j i i j t C t EU t C EU  ，與以下不等式等價（equivalent）                                       i j t i j t _t _S P _e _t _S _N P e i j i j            * * ₍₁₎ 且當t*j tj時，不等式                                      i j t i j t _t _S P _e _t _S P e i j i j            * * (2) 恆成立。析言之，P、、S、i可決定t 與*j t 之實現值之相對大小，當 P、j 、S、 i 之值可使t*j tj，且EUj[ti*(Ci),t*j]EUj[ti*(Ci),]，則雙方關係將為穩定。此外，若 N 值之大小足以使式 (1) 在式 (2) 之條件下成立，則雙方關係 亦將為穩定。由比較靜態分析可見，P、N 越大，雙方關係越容易不穩定； δ、S、i、t 越大，雙方關係越容易穩定。j 18 此一結果在實際意涵上，代表第一，單位時間內經濟誘因與制裁的淨值越小，亦即，繼續持續博奕關係對擴散國而言越不利，雙方關係越穩定。第二，給予之經濟誘因中的「可逆」資源或「耐久財」越多，雙方關係越穩定。第三，反擴散國受到預防攻擊時所承受的損害越大，穩定程度越高。第四，擴散國的技術條件越差，穩定程度越高。第五，擴散國對反擴散國攻擊成本的期望值越低，穩定程度越高。最後，所給予的「包裹協議」越能接近其獲取核武之戰略利益，穩定程度將越高。以上結論與Benson & Wen (2011) 之模型、Feaver & Niou (1996) 之模型、以及 Singh & Way (2004)、Jo & Gartzke (2007) 等經驗研究結果相符。同時亦提供些許增補。進一步而言，若仔細探究P 與 N 之影響，將可發現，雖同樣是給予利 益，但在博奕過程中所妥協給予的經濟利益將會因增加 P 值而增加不穩定 之可能；而以擴散國放棄核武發展為必要條件所給予的利益，即「包裹協 18_{比較靜態分析之過程將於附錄中呈現。}

(16)

議」，將因減少 N 值而提高穩定之可能，在制裁方面亦然。由此可見，影 響穩定與否的關鍵，與「制裁或誘因的撤回或給予能否與核武發展掛勾」一命題密切關連，若可掛勾，則其他條件不變下，雙邊關係更易穩定；若不可掛勾，則雙邊關係將更可能不穩定。此一結論與 Mazarr (1995) 及 Montgomery (2005) 之結論相互呼應。但值得注意的是其認為，所提供的「包裹協議」須能完全與擴散國擴散後所能獲得的利益同等方能奏效。但由本文之模型觀之，在穩定的均衡條件中，N 值不需為負，只要其值不甚大即 可，代表所提供的「包裹協議」不一定需超越或等同於擴散國發展核武之戰略利益，此一結論與其非形式化結論有所不同。其次，由命題四可見，在不穩定之狀況下，根據反擴散國之均衡策略，其所選擇之容忍時間，與 Ci、W、P、、j有關，其中 Ci之實現值以及j 越大，容忍時間越長；W、P、 越大，容忍時間越短。代表當反擴散國採取先制攻擊之成本越高、以及對擴散國技術條件的預期越低時，其可容忍的時間越長，而當繼續維持博奕關係對擴散國越有利、反擴散國在擴散國取得核武後所承受的負擔越大、以及妥協給予的經濟利益中耐久財的比例越高，反擴散國容忍的時間將越短，故越易發動預防攻擊。由此進一步延伸，將可對Goldstein (2006) 之研究結論做進一步的修正。析言之，Goldstein 認為，雙方實力的不對稱性越高，反擴散國越容易發動預防攻擊。但在實際的經驗案例上，仍有少數明顯的「異例」（anomaly）難以解釋。19 _而若由本文之模型觀之，雖雙方實力的不對稱將因使 Ci值較低，而更可能採預防攻擊。但此一結果須以雙方關係是「不穩定」為前提。若雙方關係穩定，則不論實力是否不對稱，皆將不會有衝突發生。故預防攻擊發生與否，不僅取決於實力的不對稱性，更取決於其他會影響理論外生變數之因素。更甚者，雙方實力的不對稱亦將同時使j提高，因而反將使雙方關係更趨於「穩定」。由此可見實力不對稱對預防攻擊發生可能性之淨影響，在此模型中存在雙向的作用，其效果不定。此外，由是可見，核擴散過程中反擴散國發動預防攻擊確實具理性基礎，與Sagan (2003) 以及 Waltz (2003) 之論 19 _{例如，美國在兩次的北韓核武危機中皆未採取預防攻擊，在利比亞的核武危機中亦未} 採取攻擊，且反而是利比亞先行退讓（St. John, 2004）。

(17)

點不同。20 再者，若單探討P 與  之影響，將可發現其與最後均衡結果的非線性關係。析言之，當均衡處於「不穩定」狀況時， 增加將先提高戰爭之可能性，但後將收斂到「穩定」狀態；21 反之，在「穩定」狀況下時，P 增加將 先降低j 發展成功之可能性，但後將進入到「不穩定」狀態。 最後，由命題四可見，當雙方關係不穩定時，擴散國之均衡策略為「任何一個大於t 的時間點」。此一均衡策略隱含擴散國之發展時間不確定，_j

顯示出其「戰略模糊」之特色，與Benson & Wen (2011)、Baliga & Sjostrom (2008) 之模型有類似的結論。而當雙方關係穩定時，存在多重均衡，此亦足以解釋經驗上許多擴散國退讓之情況皆不盡相同之現象。

肆、理論模型的經驗意涵

在以下篇幅中，本文將以前文建立的理論模型，針對特定案例之具體經驗事實加以解釋，同時將理論的命題與實質意涵推廣至理論的經驗意涵（empirical implications ），以經驗事實對理論進行初步的「驗證」（verification）。22 _{以下本文將針對「兩次北韓核武危機」及「伊拉克戰爭」} 三個具體案例，並輔以其他經驗案例，以上述的理論進行分析與解釋，同時驗證上述理論的適用性與正確性。 20 Sagan (2003) 認同 Waltz (2003) 之看法，認為基於理性的假定，國家在核擴散過程中不會發動預防攻擊。其對預防攻擊發生可能性之解釋，乃是由組織途徑之觀點切入。 21 _{因不穩定狀況下}_{ 提高，其他變數不變下將使 t} i*(Ci) 降低，增加 i 發動預防攻擊之可能 性，但 提高亦將使 tj*更接近t ，使雙方關係轉為穩定。j 22 在方法論上，因受限於篇幅以及所研究主題的特性，在此將難以使用大樣本的統計分析方法進行理論的「驗證」（Goldenstein, 2006: 21）。因此，本文乃將此一段落定位為理論模型的經驗意涵。亦即，此一段落之主要目的在於推廣理論在經驗層次上的適用性，並顯示前文中的理論命題在經驗世界中的正確性。而就「驗證」理論而言，因研究的樣本數有限，且因篇幅限制，不足以做小樣本下更為深入且嚴謹的理論驗證（King et al., 1994）。故以下篇幅中的案例分析僅能視為理論模型之實例（illustration），並在選定的個案中「初步」地驗證理論的命題與結論。並作為後續更嚴謹之經驗驗證的基礎（Morton, 1999: 134）。

(18)

一、第一次北韓核武危機

北韓的核武技術發展可回溯至1960 與 1970 年代蘇聯之支持，1985 年

在蘇聯的敦促下加入NPT。1991 年冷戰結束後，南北韓共同發表《朝鮮半

島無核化之聯合宣言》（Joint Declaration on the Denuclearization of the Korean Peninsula），並於1992 年批准與國際原子能總署（International Atomic Energy Agency, IAEA）的雙邊保障監督協定（bilateral safeguard agreement）（O’Neil, 2007: 58；Arms Control Association, 2012；Pollack, 2003；Hayes, 2007: 119-121）。第一次北韓核武危機可追溯至 1992 年 IAEA 的查核中，發現北韓在其宣稱的地點以外仍有核子計畫，1993 年更拒絕 IAEA 的查核人員進入（Spector, 1992: 33；Hayes, 2007: 121-122；O’Neil, 2007: 59），並宣布其退出NPT 之意圖（Arms Control Association, 2012；Niksh, 2005）。此後美國便與北韓展開協商與對峙，同時有在進一步推行制裁甚至採取軍事行動之考量（Goldstein, 2006: 134-135；Hayes, 2007: 122-126）。然而其後，北韓

在美國重新保證不侵略北韓以及IAEA 保證將公正查核之前提下，未在退出

期限屆滿後退出NPT（Hayes, 2007: 123）。最後雙方簽訂《架構協議》，內容包括：北韓凍結、最後銷毀所有核設施、提供過去核子活動之記錄、接受IAEA 的實地查核；美國承諾給予兩座輕水反應爐（light water reactors, LWRs）、23 _{燃料油、減少經濟禁運、以及承諾不侵略北韓（Hayes, 2007:}

124-125；O’Neil, 2007: 60；Sigal, 1998；Cha & Kang, 2003: 136-138）。

此案例中反擴散國為美國（行為者 i），擴散國為北韓（行為者 j）。 顯而易見的，依照理論模型的均衡類型歸類，此案例乃是「穩定」且擴散國退讓之均衡，即t*_jt_j_，且 _[ *₍ _), *_] _[ *₍ _),__] i i j j i i j t C t EU t C EU  。由命題四與命題五以及其延伸的實質意涵可知在此情況下相對較小的P、N 以及相對較 大的 、S、t 與j i，應至少有數項成立，以下將分別探討。 23 _{美國承諾將於}_{2003 年前提供北韓兩座輕水核反應爐，1995 年美國、南韓、日本與其他}

國家成立「朝鮮半島能源發展組織」（Korean Peninsula Energy Development Organization,

(19)

首先，N 相對較小。因第一，對北韓而言，1993 年時北韓並無其他明

顯的安全威脅，美國方於1991 年自南韓撤除戰術核武，並積極促使朝鮮半

島無核化（Hayes, 2007: 121-122；Chang, 2007）。第二，美國在 1994 年提出一系列的「包裹協議」（package deal）（O’Neil, 2007: 60；Mazarr, 1995； Park, 2001；Manyin, 2005），使北韓在放棄發展核武後可獲得的利益更為明顯。在兩方面的影響下，在此一案例中對北韓而言 N 值確實將相對較小， 故「穩定」均衡之可能性相對提高。其次，P 亦相對較小。因第一，美國在 1994 簽訂《架構協議》前，曾 準備推動聯合國的進一步制裁（Chang, 2007），雖在執行制裁前雙方即已簽訂《架構協議》，但美國採取進一步制裁的考量確實對北韓構成壓力（Arms

Control Association, 2012；Hayes, 2007: 125-126；Noland, 2009），24 _使其繼

續維持博奕關係的成本增加，P 值隨之下降。25 _{第二，美國在此一期間內，} 除前述的「包裹協議」外，並未額外給予其他妥協的經濟誘因或利益（Mazarr, 1995）。亦即，美國在此案例中所給予的各項利益，並未與「北韓是否停止發展」一問題「脫勾」。因此所給予的利益皆是使 N 下降，而非使 P 上 升，故P 理應維持在較低之水準。 再者，S 與i則相對較大。因此時美國並未於其他地區介入任何區域衝突，且美國亦曾計畫採取軍事行動，並確實加以計畫（Hayes, 2007: 126； Park, 2001；Goldstein, 2006: 133），足見此時若美國發動預防攻擊，其對北韓造成之損害確實相對較大。同時對北韓而言，其預期美國發動攻擊之成本將相對較低。總結以上之討論，可見在此案例中，P、N 相對較小，S、i相對較大，雖在與t 方面並未有進一步之證據顯示其數值大小，但如此之關係已顯_j 示此案例最後是以北韓之退讓結束而未爆發進一步的衝突之原因，乃在於 24 _{值得注意的是在}_{1992 年美國確實有對北韓採取制裁，然而此次制裁乃是針對北韓的國} 有企業涉及將核子技術外移而違反禁止核擴散原則之行為（Chang, 2007），與北韓本身發展核武較無關聯。 25 _{在美國對北韓的制裁方面，事實上，自}_{1950 年韓戰爆發以來，美國即已持續對北韓實} 施經濟制裁與禁運措施（Rennack, 2006；Chang, 2007），故此處討論之制裁並非絕對數值之概念，而是在採取新的制裁後，「相對」於過去增加的數額。

(20)

P、S 與 N 之值使t*jtj且EUj[ti*(Ci),t*j]EUj[ti*(Ci),]之緣故。

二、第二次北韓核武危機

在美國與北韓1994 年簽訂《架構協議》後，美國承諾提供北韓燃料油，

並於2003 年前提供北韓兩座輕水反應爐。然而，2002 年初，隨北韓自 1998 年試射飛彈以來逐漸挑釁的行動，美國總統小布希在其演說中，將北韓、伊拉克、伊朗三國稱為「邪惡軸心」（axis of evil）（Pollack, 2003；Cha & Kang, 2003: 140；Howard, 2004）。第二次北韓核武危機始於 2002 年初，美國宣稱其掌握了北韓仍在研發核武的情資，北韓亦逕向美國承認其確實擁有鈾濃縮計畫（Arms Control Association, 2012；Hayes, 2007: 128-130）。在北韓公開承認後，美國隨即撤回其對北韓的燃料油援助，並終止朝鮮半島能源發展組織（Korean Peninsula Energy Development Organization, KEDO）對北韓提供的輕水反應爐研發計畫（Chang, 2007；Manyin, 2007）。2003 年，北韓宣布退出NPT，（Arms Control Association, 2012；Hayes, 2007； Rennack, 2006；陳文生，2010）。26 _{此時美國亦在聯合國安理會推動安理} 會的進一步制裁決議，但因南韓、俄羅斯、中國之態度而未能實行（Rennack, 2006；Chang, 2007）。2003 年至 2005 年，美國、俄羅斯、中國、日本、南韓與北韓展開共五次的「六方會談」（six-party talks），五次會談中數度起伏，其中北韓之主張多為要求美國先行提供利益之主張（”reward for freeze”），且亦獲得其他國家之部分支持（Niksch, 2005; 陳文生，2010）。但至2006 年仍未有具體協議（Hayes, 2007: 129）。2006 年，北韓在宣稱其擁有核武後隨即試爆核武成功，正式成為「有核國家」（O’Neil, 2007: 63； Arms Control Association, 2012）。27

26

對此北韓之說法為，其在1993 年時便已提出退出之通知，只是最後並未付諸實行，2003

年退出固然不需於3 個月前通知（Arms Control Association, 2012）。

27 _雖截止至_{2012 年為止，北韓之核武問題仍未解決。但在本文探討的情境中，一旦擴散} 國發展核武成功並取得核武後，雙方的博奕即結束，隨後雙方的互動並不在本文理論的討論範圍內。故針對此案例本文僅討論北韓「正式試爆核武」前之經驗事實。然或有論者認為，應待北韓完成長程「載具」的投射能力發展後，才可將之認定為發展成功。就此而言，因本文理論模型之設定並未以載具完成作為發展完成之條件，而僅以取得核武為條件，故北韓之載具技術將不影響雙方的博奕是否結束，僅會影響模型中

(21)

此案例中，雙方博奕之結果為擴散國發展成功，而反擴散國並未發動預防攻擊。在賽局模型中是為「不穩定」均衡下，t_i*(C_i)t_j_{之情況。由命} 題四與命題五可知，此時代表t*_j t_j_，且 _[ *₍ _), *_] _[ *₍ _),__] i i j j i j j t C t EU t C EU  ，或t*_j t_j_{。亦即，至少數項外生變數應符合「}_N、 i C 、j較大；S、、W、 i  、t 較小；P 值不定」之條件。_j 28 _因其中_N、 i  、S、、t 將使_j * j t 與t 之j 差距較小或 [ *( ),_] i i j t C EU 較大而使均衡為「不穩定」；、W、C 、i i則將使 *( ) i i C t 提高，減低預防攻擊之可能性。首先，就N 值而言，此次之危機與前一次北韓核武危機有明顯之不同。 因第一，就北韓的安全威脅而言，隨1997 年美日安保條約的強化（O’Neil, 2007），以及美國 2002 年將北韓定位為「邪惡軸心」，對北韓而言皆將使其面臨之安全威脅提高（Ahn, 2003）。第二，此次危機下美國及其他國家與北韓之談判內容中，皆未能成功包括如同前次一般的「包裹協議」，保證在北韓停止發展後給予利益，利益提供的時間不確定（Rennack, 2006）。更甚者，利益提供的時間點更成為六方會談中各方爭論之焦點（Niksch, 2005；Hayes, 2007）。因此，在兩方面的差異交互作用下，此一案例中的 N 值將勢必較前一案例中之N 值大。 其次，相對於前一案例，P 值亦較大。因第一，美國於六方會談中受 制於北韓所提出之要求，此類要求皆是在北韓停止發展前即須給予的承諾或實質利益，且獲得六方會談中其他國家的部份支持（Niksch, 2005；Rennack, 2006；Huntley, 2007；陳文生，2010）。對北韓而言，將使其持續博奕的利益提高。第二，雖此時美國亦曾在安理會推動進一步制裁之決議，但一方面，中國與俄羅斯不支持之態度更為明顯（Rennack, 2006；Chang, 2007）。另一方面，根據Rennack (2006)、Noland (2009)、Whitty et al. (2007) 以及的特定外生變數數值（即W 值）。易言之，在擴散國成功發展取得核武後，雙方的博 奕關係在本質上即已非純粹「反核擴散」，更包含「核武裁減」之問題，與本文理論的適用之情境稍有不同。因此，本文選取第二次北韓核武危機的時間點至2006 年試爆成功為止，2007 年後包括第六次六方會談在內的其他互動關係皆未包括在內。 28 _{P 值不定之原因在於一方面，較大的 P 將使雙方關係更容易不穩定，但同時較大的 P} 會降低ti*(Ci) 之值，反而使預防攻擊發生之可能性提高。故給定其他變數不變下尚無法確定P 之大小對結果之影響為何，須視其他變數之大小而定。

(22)

Haggard & Noland (2010) 之實證與評估研究，2000 年後，美國在沒有其他國家的配合下已難透過制裁給予北韓嚴重損害。29 即便是在 2006 年北韓核試爆成功後安理會對北韓實施制裁，亦難以對其造成重大影響。其原因乃在於2000 年後北韓與南韓、中國以及阿拉伯國家的貿易關係日漸密切，故即使實行制裁亦無法完全阻斷北韓之物資來源。由此可見，對北韓而言，一方面持續博奕關係對其利益正有逐漸增加之趨勢，另一方面制裁亦越趨無效，故P 值增加。 再者，C 亦應較大。因第一，考量美國與北韓之相對國力差距，兩者_i 之差距確實小於當時美國與另一「邪惡軸心」國家──伊拉克之差距。30 此外，北韓不論在傳統武力的數量或飛彈技術上皆一定程度地高於伊拉克（Howard, 2004: 807）。第二，就地緣政治上的考量而言，美國仍須擔憂若其對北韓發動預防攻擊，則將勢必引發北韓對南韓的攻擊，朝鮮半島將陷入戰爭，對美國而言亦有相當之成本（Cha, 2002；Silverstone, 2007: 193）。故綜合而言，足見美國發動預防攻擊之成本C 之實現值確實相對較高。同_i 時，因北韓亦可部分認知到以上的影響因素，31 其對美國攻擊成本的期望值亦將相對較高，因此_i較小。最後，在其他有關的外生變數方面，W 相對較小，因北韓的載具仍不 具有長程之投射能力，故即便其核武發展成功，短期內對美國仍不能造成重大威脅（O’Neil, 2007: 61）。S 亦相對較小，因美國在 2003 年後須同時面對反恐佈署、阿富汗戰爭以及伊拉克戰爭，其能對北韓造成之損害便相 29 以奢侈品（luxury goods）為例，在安理會制裁開始執行後一年，由中國出口至北韓之奢侈品反而增加至少25%（Noland, 2009）；又以進出口總額為例，2006 年後北韓之進

出口總額反而逐年遞增（Haggard & Noland, 2010）。

30

在此本文檢視Correlates of War (COW) 資料庫中的國家綜合實力指標（Composite Index

of National Capability, CINC）（Singer et al., 1972），發現北韓在 2003 年前的權力指標為

伊拉克的1.5 倍，若假定發動預防攻擊之成本與相對權力大小差距有關，則將足見此將對美國發動預防攻擊之成本造成一定影響。 31 在此，Ci與i之差別在於Ci乃為美國之「個別訊息」，僅美國可知其具體實現值，對北韓而言Ci乃是期望值為1/i之隨機變數，其對美國攻擊成本之了解僅能透過i描繪之。故在此之分析中，即便北韓無法掌握（實際情況中即是如此）所有影響美國攻擊成本之因素，只要其能掌握其中之部分，即可影響i之值，其他不能掌握之因素即由模型中之隨機因素決定。

(23)

對弱化。t 與_j j方面則因北韓此次乃是「重啟」過去的發展計畫，有一定之技術基礎，故足認其技術條件已使其「核門檻」降低而使t 更可能小於_j * j t 與 *( ) i i C t ，同時美國對其核門檻的期望值亦因此較低，故_j較大。總結而言，經以上的分析，將可見除不定之 P 外，幾乎所有其他外生 變數皆符合「不穩定」均衡下，反擴散國未發動預防攻擊之條件，且此時只要t_i*(C_i)t_j_{不變，較大的}_{P 將使雙方關係維持在「不穩定」情況，此一} 均衡即將被支持，使理論模型之命題與實際現象相符。

三、伊拉克戰爭

伊拉克之核武問題存在已久，1991 年第一次波灣戰爭時，聯合國於伊拉克境內發現其具有核武以及其他大規模毀滅性武器之發展計畫（Dunn, 1991）。1991 年波灣戰爭結束後，聯合國安理會發表決議，要求伊拉克銷毀一切大規模毀滅性武器，並設立聯合國特別委員會（UN Special Commission, UNSCOM）作為監督機制（Arms Control Association, 2002）。在1992 至 1997 年間，伊拉克大致配合 UNSCOM 與 IAEA 的查核工作，然

而 1997 年，伊拉克宣布不再接受 UNSCOM 之查核，並將美國之查核人員

逐出伊拉克（Arms Control Association, 2002；高一中譯，2002：72）。此後，美國便無法確認伊拉克核武之卸除狀況，故持續認為伊拉克仍有持有核武發展計畫之可能（Goldenstein, 2006；Katzman, 2002；Silverstone, 2007: 176）。 2002 年，小布希總統在演說中提及「先制攻擊」（preemptive strike）之概念，並將預防攻擊納為其重要政策（Moriarty, 2004；Goldstein, 2006: 167-172；Bunn, 2009: 162-165）。2003 年，美國終與英國聯合攻打伊拉克（Keegan, 2004）。在此案例中，伊拉克與美國的關係是為「不穩定」均衡下反擴散國發動預防攻擊之情況，即t*_jt_j_，且 _[ *₍ _), *_] _[ *₍ _),__] i i j j i i j t C t EU t C EU  ，或t*_j t_j_。且t_i*(C_i)t_j_{。同樣的，根據命題四與命題五，由比較靜態分析的結果可知，} 「P、N、W、i較大；j、S、C 較小；i 、t 不定」當中應有數項符合實j 際情況。其中P、S、N、i將使「不穩定」均衡更易發生；j、W、C 、Pi 則將使美國之容忍時間較短。以下將分別探討之。首先，與前一案例類似，N 值相對較大。因一方面受到美國將伊拉克

(24)

定為「邪惡軸心」後之影響，其可能面臨的安全威脅便提高。另一方面， 1990 年波灣戰爭伊拉克被盟軍擊敗的經驗亦將使伊拉克受美國傳統武力或飛彈技術優勢的影響擴大。

其次，P 值亦逐漸增加。因第一，自 1997 年以來，聯合國安理會其他

常任理事國皆傾向解除自1990 年以來對伊拉克的制裁，1998 年安理會更向

伊拉克提出減輕制裁之提議（Kondoch, 2000；Lopez & Cortright, 2004）。 1998 年後更因人道問題考量，逐步放寬對伊拉克的制裁，允許民生物資與

燃料的進口。32 反而使伊拉克其在驅逐查核人員，與美國進入核擴散的博

奕關係後得到更多利益。第二， 1997 年美國國務卿 Madeleine Albright 指出其「反對在伊拉克完成卸除大規模毀滅性武器與發展計畫後自動停止制裁」，隱含其認為「制裁須待Saddam Hussein 政權瓦解後才應停止」（Arms Control Association, 2002）。此一宣稱無疑將使制裁與伊拉克是否合作接受查核並卸除武器「脫勾」。再者，δ 則相對較小。因如前述，1998 年後對伊拉克的制裁逐步放寬 後，開放的皆為民生物資與燃料的進口與援助。代表伊拉克在單位時間內取得的利益多非「耐久財」，因即便美國採取預防攻擊後，上述援助物資仍「不可逆」，故δ 值相對較小。 最後，就其他外生變數而言。t 相對較大，因在聯合國的禁運以及 1998_j 年前的一系列卸除行動下，伊拉克短時間內難以自行發展成功（Howard, 2004）。而美國亦因此可預期伊拉克的核門檻較高，故j較小。C 則相對i 較小，因相對於北韓，伊拉克的整體國力較弱，33 且武器質量亦不如北韓（Howard, 2004: 807），更無地緣政治上之優勢。而 911 事件後的國內輿論與意向亦使美國以反恐名義對伊拉克發動戰爭之成本降低（Silverstone, 2007）。此外伊拉克對美國攻擊成本之期望值亦將因部分掌握上述資訊而降低，故_i較大。最後，W 亦相對較大，因在 911 事件後，伊拉克普遍被 認為與恐怖主義有密切連結（Silverstone, 2007: 176-190），故即便其仍無完 32 此時對伊拉克的制裁出現「以油換糧」計畫（oil-for-food）之放寬，允許伊拉克高價出口石油並換取基本民生物資之進口。此一計畫係經聯合國安理會 986 號決議通過，於 1996 年開始執行（Katzman, 2002）。 33 關於整體國力的比較，參照註30。

(25)

善投射載具與技術，一旦核武發展成功，亦將可能落入恐怖組織之控制，對美國而言所承擔之風險極大。總結以上之討論，可見除了不定之 δ 與t 外，其他之外生變數值皆符j 合實際情況 ──「不穩定」均衡且t_i*(C_i)t_j_{時外生變數之相對大小。且同} 時較小的 δ 將使雙方關係更易不穩定。而若雙方關係處於不穩定狀態，較 大的t 將亦使_j ti*(Ci)tj之可能性更高，使此一均衡情況更得以被支撐。然而，關於此一案例，或有論者認為，最後戰爭結果顯示伊拉克根本不具有大規模毀滅性武器，此次戰爭乃是因美國之誤判或其他原因而生，無法適用至本文之理論。關於此一疑問，應注意到以下三點。首先，在美軍進入伊拉克境內前，國際社會對伊拉克核武能力的資訊掌握並不明確，例如，1999 年 IAEA 之查核報告書中，雖指出目前並未有明確指標足以顯示伊拉克已成功製造核武，但卻同時警示：「沒有指標」不代表「不存在」（Arms Control Association, 2002）。又如，美國在戰前確實透過佈署使敵方難以準確追蹤美國武力集中處的空防系統，以降低受到大規模毀滅性武器之攻擊後之損害（Goldstein, 2006: 173）。皆顯示國際社會在戰前對伊拉克是否持有核武或大規模毀滅性武器的不確定，顯然國際社會對其是否具

有核武計畫亦具不確定性。加上伊拉克自1997 年起其便不再接受 IAEA 查

核、持續不願提供關鍵性的文件、亦未提出其放棄核武計畫之證據之事實（Arms Control Association, 2002），更足使美國難以排除其具有發展計畫之可能。其次，在本文模型的設定中，雙方博奕關係是否持續乃是取決於擴散國是否「退讓」或反擴散國是否發動「預防攻擊」。因其所描繪的博弈情境下反擴散國本即無法得知擴散國的發展狀況。故實際上在本文的模型中，擴散國的「發展」並不以具體的發展計畫或成果為條件，只要擴散國未退讓（在此案例中即為接受IAEA 之查核或其他類似妥協），皆屬發展的博奕階段，直至反擴散國發動預防攻擊或擴散國實際發展成功為止。最後，即便實際上伊拉克確實無發展核武之計畫，如前所述，對美國而言，其卻「認為」伊拉克有此計畫，且此認知為一「共有知識」。而若將本文之模型延伸（extend）至此情境，經過簡單的推導，將可見兩者之結果全然相同，並無差異。由上可見，即便在戰後並未發現伊拉克持有核武之證據，此案例與本文理論之情境仍一定程度地相符。

(26)

四、其他相關核擴散情境

除上述的三個具體案例外，許多其他經驗事實亦與本文之理論模型的實際意涵有一定程度的切合性。例如，1981 年以色列對伊拉克的 Osiraq 反應爐採取預防性攻擊。此一案例亦是核擴散情境下反擴散國與擴散國的策略互動。在此案例中，因以色列認為其他阿拉伯國家，尤其伊拉克，在取得核子武器後，便會對以色列採取大規模的攻擊（Feldman, 1982: 122），甚至伊拉克總統 Saddam Hussein 亦曾表示有意使用核子武器對抗以色列

（Brands & Palkki, 2011），顯示對以色列而言其 W 值甚大；而相對較低的

政治成本以及能降低受報復後損害的空防系統優勢則使以色列的C 值較_i 低；（Feldman, 1982: 138-142）；又 IAEA 除了除去會員資格外亦無其他的制裁途徑，且伊拉克持續發展將可能使其他阿拉伯國家跟進，並使以色列喪失區域的核武優勢，此將使P 值降低（Feldman, 1982: 122-128、138-142）。 綜合以上因素，由本文理論之角度關之，此時反擴散國之容忍時間確實將較短，更傾向使用預防攻擊，與此現象相符。或如，1964 年中共試爆核武前，美國亦曾考慮採取預防攻擊清除其設施。但鑒於可能引起的傳統武力報復，以及反促使中蘇關係修復的可能性，對美國而言C 甚大（Burr & Richelson, 2000: 75-78、81、96-99；Goldstein, 2006:_i 69-70、70-72）；而中共獲取核武後，因美國的第二擊能力仍甚強，對核武戰略的平衡實際上並無影響（Burr & Richelson, 2000: 60-63、96-99；Goldstein, 2006: 73-75），因此 W 較低；但相對地對中共而言，取得核武後的心理效 果以及政治效果，將使其改善當時與蘇聯關係緊張後漸受孤立的國際處境（Burr & Richelson, 2000: 60-63），故 N 值大。此外，在美國 1959 獲知中

共正在研發核武後，其對中共進行核試爆時間點之預期皆落在1964 至 1965 間，顯示其對於中共核門檻的預期相對較低，故可見_j較大。上述的因素在本文的理論模型中亦將使反擴散國容忍時間延長，與實際發生之情況相符。綜合以上數個具體案例的分析，足見本文建立之理論模型，在經驗意涵上可獲得一定程度之驗證並初步確認其有效性。亦代表其將能一定程度地解釋經驗現象，而其與既有文獻中的理論亦可相互對應或修正增補。由

(27)

此便可初步確認該模型之適用性、在文獻上的定位及意義，以及其作為相關研究理論基礎之可能性。

伍、結論

總結本文之討論，本文透過建立訊息不完全之賽局模型，試圖解釋核擴散情境下擴散國與反擴散國的策略互動，以及其產生的結果。研究結果發現，賽局的均衡將分為「穩定」與「不穩定」兩類，在互斥的特定條件下，賽局之均衡將分別發生在兩種類型中。在「不穩定」均衡中，結果可能為反擴散國先發動預防攻擊，亦可能為擴散國發展成功；在「穩定」的均衡中，結果可能為擴散國先行退讓，亦可能為擴散國發展成功，但將不會有衝突爆發。而影響均衡是否穩定之因素包括擴散國所受的威脅扣除反擴散國承諾給予之「包裹協議」之淨值、擴散國受到預防攻擊後承受的成本、擴散國在博奕過程中單位時間內可獲得的報酬淨值、該報酬中耐久財的比例、擴散國對反擴散國發動預防攻擊之成本的預期、以及擴散國的「核門檻」。另一方面，不穩定情況下衝突是否發生，則取決以下因素：反擴散國發動攻擊之成本、其在擴散國擴散成功後之負擔、以及其對擴散國核門檻之預期；以及擴散國單位時間內可得的報酬淨值、耐久財的比例、以及其「核門檻」之實現值。以上的理論結論中，除部分與既有文獻的研究結果相符外，亦對現有的研究成果提供的些許的修正或增補。首先，關於「預防攻擊」發生可能性的影響因素，除實力的不對稱外，本文之理論更提出雙方互動關係須為「不穩定」之前提，而此一前提是否成立，又受到其他外生變數的影響。且實力不對稱本身對雙方互動關係穩定與否以及預防攻擊發生可能之影響亦非同向。其次，本文之理論確認了「包裹協議」在維持「穩定」均衡上的有效性，並進一步指出「包裹協議」中之誘因程度不須與擴散國發展成功之戰略利益同等即可發揮作用。復次，本文更確認了核擴散過程中反擴散國採取預防攻擊之理性基礎，有別於過去由組織途徑所做之解釋。再者，本文亦推論出制裁與妥協的幅度與穩定程度以及衝突發生的可能性間之非線性關係，對既有文獻中多半假設的線性關係做出修正。最後，本文之理

(28)

論亦可對不穩定均衡下，擴散國採取「戰略模糊」的發展模式之原因，以及穩定均衡下，擴散國退讓之時間點以及反擴散國採取之行動皆不盡相同之原因提供理論上之解釋。經上述的理論模型建構、推論求解、實質意涵的延伸乃至於實際案例中經驗意涵的驗證，本文之理論已初步具有其在文獻上的意義以及適用的空間。然而，在上述的過程中亦顯示其仍有許多值得進一步深入探究、修正或複雜化的空間，可作為後續研究的重點與目標。首先，模型中的部分外生變數，在實際情境裡可能仍具有「內生」的特色，因此其在模型中的設定可進一步修正。例如，外生變數 N 中隱含了擴散國受到外在威脅的程 度，但外在威脅又與反擴散國選擇的容忍時間有關，容忍時間越短，威脅程度越高。因此 N 可被設定為內生，而非僅外生給定。又如，擴散國單位 時間內所能獲取的報酬淨值P，實際上亦是取決於反擴散國之決策。由是觀 之，上述模型的內生變數將不僅為雙方所決定的容忍時間與持續發展的時間，更可包含反擴散國提供擴散國誘因或制裁之淨值。經此修改後，上述模型將可納入典型之議價模型（bargaining model）架構，與其他議題上為數甚多的相關文獻相對照（Rubinstein, 1982；Powell, 1989；1993；1996a； 1996b；Kydd, 1997；2000）。其次，在實際情況中，行為者採取之行動，可能依據先前對方所採取之行動而定。例如，反擴散國在特定時間點上是否繼續容忍，將取決於經該時間點上擴散國仍未擴散成功之事實，所「更新」（update）後的「事後信念」（posterior belief），以及擴散國在該時間點前的決策。亦即，此一模型可進一步修正為「動態」（dynamic）模型，並求取其「子賽局完美貝氏均衡」（sub-game perfect Bayesian equilibrium）。最後，在經驗驗證部分，本文之討論受限於經驗上相關情境的不足，因而未能採用大樣本（large-N）之途徑，以嚴格的統計方法驗證理論的命題以及其經驗意涵。雖此一限制並不代表本文之經驗分析完全不足以驗證理論之主張，亦不足以否定其在「理論模型的經驗意涵」（empirical impiliction of theoretical model, EITM）上為形式化之理論命題提供之經驗連結。但更進一步且更詳盡的經驗研究，以及經驗現象與理論命題及其假說之異同處，仍是日後相關研究需進一步關注的重要議題。

(29)

擴散國的策略選擇與策略互動提出了些許具實質意涵的理論命題，其與既有文獻有些許呼應對照之處，亦有些許之修正或增補。此外，其更能一定程度的符合實際的經驗現象，足認其適用性與正確性一定程度的被驗證。

「容忍」或「預防攻擊」：核擴散問題下的策略選擇與策略互動