國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
51
第五章 水資源合作與衝突之比較
本章依國家間互動形式的不同,將水資源互動進一步區分為合作與衝突二 類,並依序就以下兩項問題進行比較分析。
問題 1:水資源的「合作發生」與「衝突發生」之模式是否一致?
問題 2:促成不同形式的互動發生,那些因素更具解釋能力?
第一節 分析方法
迴歸分析的依變數,因衡量尺度(measurement scale)的不同,可以是名目變 數(nominal)、順序變數(Ordinal)、區間變數(interval)以及比率變數(ratio)。
倘若依變數性質屬於後兩者,稱作連續變數(continuous variable),統計上用線 性迴歸來配適資料。然而在實際情況中,依變數的資料不一定是連續變數,而經 常是名目變數或順序變數,通稱為類別變數(categorical variable)或間斷變數 (discrete variable)。例如,醫學統計上最常遇到的就是「生存或死亡」、「有病或 無病」。當依變數只有兩種情形時,基於存在殘差的常態性不可能成立,以及依 變數的預測值可能會超過 1 等缺失,因此不宜再使用傳統的線性迴歸分析。面對 這種二元(binary)的類別變數時,統計上則另以羅吉斯迴歸(Logistic Regression Analysis)來處理。
二元類別變數例如死亡與否或成功與否,習慣稱之為事件(event)。運用羅吉 斯迴歸時,依變數為事件發生(Y=1)的預測機率,若以符號 p 代表,線性迴歸方 程式如下:
P
i= 𝛽
0+ 𝛽1𝑋1𝑖+ 𝛽2𝑋2𝑖+ ⋯ + 𝛽𝑘 𝑋𝑘𝑖 其中 𝑖 為觀察對象;k 為預測變數數量;
𝑋𝑘為第𝑘個預測變數;
𝛽0 為截距(intercept)或常數項(constant term);
𝛽𝑘 為第𝑘個預測變數的迴歸係數(regression coefficient);
然而依照上述方程式估算,預測值的範圍有可能大於 1 或小於 0。如此將與 機率值的範圍應介於 0 與 1 之間的條件不符。為瞭解決這個難題,統計上因此將 預測值 Pi 做羅吉斯轉換(logit transformation),也就是取事件發生機率的自然對
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
52
數,其數學方程式如下:
Logit(pi)=ln[(1−𝑃𝑖)𝑃𝑖 ] = 𝛽0+ 𝛽1𝑋1𝑖+ 𝛽2𝑋2𝑖+ ⋯ + 𝛽𝑘 𝑋𝑘𝑖 上式經過整理後可以得到
𝑝 = 𝑃(𝑌 = 1|𝑋) = 1
1 + 𝑒−(𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑘 𝑋𝑘)
羅吉斯迴歸分析與線性迴歸最大不同的地方是,後者的迴歸係數(regression coefficient)解釋為,「當自變項增加一個單位,依變數則會增加多少單位」。但 是羅吉斯迴歸的迴歸係數則解釋為,「當自變數每增加一個單位,事件發生的勝 算(odds of event)會增加多少」。所謂「勝算」(odds),係指一件事情發生的機率 與沒發生的機率的比值。因此,羅吉斯迴歸係數的真正意義是,「當自變數增加 一個單位,依變數為「1」(event)相對於依變數為「0」(non-event)的勝算較原來 的勝算增加多少」。1 羅吉斯迴歸另有稱之為「勝算比」(odds ratio)的統計值,則 是指自變數每增加一單位後,事件發生的機率與未增加前的事件發生之機率的比 值。勝算比常用於解釋屬類別數值的變數。
羅吉斯迴歸的基本原理是找出「最大可能性」(maximum likehood),因此所 找到的一組參數值,將會使所預測到的數值,符合資料的整體可能性達到最大。
基本上,除了迴歸係數的解釋方法不同之外,羅吉斯迴歸與線性迴歸模型解釋其 他差異不大。
由於本章目的在判別影響國際水資源一般互動的發生、衝突發生以及合作發 生的因素,依變數為事件(互動)之發生與否,依變數的值只有「1」(發生)和「0」
(未發生)兩種結果,因此將採羅吉斯迴歸進行分析。
第二節 分析步驟
本章分析步驟如下:
步驟一:資料整理,調整部分自變數編碼。
由於羅吉斯分析在處理屬類別變數的自變數時,會以數值最大者為基 準,為便於後續分析結果的解釋,因此調整部分自變數編碼。例如變數
「鄰接與否」,原始編碼「0」代表兩國不相鄰,「1」表相鄰;調整後相 鄰仍為「1」,不相鄰則為「2」。其餘類別變數處理方式類似。調整後的 變數資料與原始資料對照如表 51。
1 本研究使用的 SAS 統計軟體中,「最大概度估計值」便是羅吉斯迴歸係數。
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
55
變數 平均值 標準差 最小值 最大值 N
人口數量 人口比值
76887.52 0.36
198417.16 0.28
382 0
1324655 1
25354 25354
資料來源:統計值由 SAS 系統產生,作者自行整理。
第三節 分析結果
本研究採用 SAS 統計軟體之羅吉斯迴歸分析,運用「向後消去」法,選定 進入變數的顯著機率門檻為 0.05,分別得到「一般互動發生」、「合作發生」與「衝 突發生」等三種事件的迴歸模型,使用的觀察值數目為 1975 個。2 以下逐一說 明各項統計結果的意義。
1. 模型配適檢定
檢定迴歸模型的配適度分別有 AIC、SC 與2 Log L 三項指標,一般比較 常用的是 AIC 與 SC 兩項。由於統計值的計算與變數多寡有關,因此不能單 憑數值本身來判定模型的好壞。只適宜進行不同模型之間的比較。表 53 顯 示,衝突發生的迴歸模型 SC 值最小,可認定分析所得的衝突發生模型,其 解釋力較其他兩項迴歸模型為佳。
表 53:模型配適統計值
一般互動發生 合作發生 衝突發生
準則 僅截距 截距和 僅截距 截距和 僅截距 截距和
共變量 共變量 共變量
AIC 1412.097 1160.77 1318.035 1107.81 375.152 261.32 SC 1417.655 1260.80 1323.593 1196.73 380.710 328.01 -2 LOG L 1410.097 1124.77 1316.035 1075.81 373.152 237.32
資料來源:統計值由 SAS 系統產生,作者自行整理。
2. 虛無假設檢定
羅吉斯迴歸的全域虛無假設檢定與線性迴歸的 F 檢定類似,表 54 中所 有 p-value 值均達統計顯著,因此可以判定三個迴歸模型悉皆成立,自變數對
2 本研究比較「前進增加」、「向後消去」與「逐步迴歸」三種方法後,因「向後消去」法所得模
式之預測和諧百分比最高,故選擇「向後消去」法。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
56
於事件的發生確實具有解釋能力。
表 54:檢定全域虛無假設: BETA=0
一般互動發生 合作發生 衝突發生
檢定 卡方 DF Pr > ChiSq 卡方 DF Pr > ChiSq 卡方 DF Pr > ChiSq 概度比 285.3294 17 <.0001 240.2266 15 <.0001 135.832 11 <.0001 計分 267.2418 17 <.0001 215.6764 15 <.0001 193.010 11 <.0001 Wald 201.4362 17 <.0001 172.595 15 <.0001 69.940 11 <.0001 資料來源:統計值由 SAS 系統產生,作者自行整理。
3. 迴歸參數檢定
迴歸模型確定成立後,進一步則是檢定模型中各項變數的解釋力是否符 合統計顯著。表 55 至 57 分別是一般互動發生、合作發生、與衝突發生的
「效果的第三型分析」(Type III Analysis of Effects)結果。3
表 55:一般互動發生「效果的第三型分析」
效果 DF Wald 卡方 Pr > ChiSq 年均降雨量 1 19.0028 <.0001 ***
對外依賴程度 1 19.1138 <.0001 ***
民生用水比 1 9.1333 0.0025 ***
民主政體差異 1 4.701 0.0301 **
貿易互賴程度 1 7.7346 0.0054 ***
強國 GDP 值 1 4.3668 0.0366 **
人口數量 1 23.1644 <.0001 ***
水資源壓力等級 3 11.0969 0.0112 * 鄰接與否 1 8.4598 0.0036 ***
強國數量 2 7.4582 0.0240 **
互不侵犯 1 56.4200 <.0001 ***
保持中立 1 15.1066 0.0001 ***
民主國家數量 2 19.4163 <.0001 ***
資料來源:統計值由 SAS 系統產生,作者自行整理。
3 SAS 統計軟體處理羅吉斯迴歸時,若解釋變數中有類別變數,便會出現「效果的第三型分析」。
該項分析類似線性迴歸中參數估計的檢定,可藉以判斷哪些解釋變數符合統計上的顯著性。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
57
表 56:合作發生「效果的第三型分析」
效果 DF Wald 卡方 Pr > ChiSq 年均降雨量 1 11.8780 0.0006 ***
對外依賴程度 1 14.6311 0.0001 ***
民生用水比 1 10.6224 0.0011 ***
貿易互賴程度 1 7.9381 0.0048 ***
人口數量 1 7.2458 0.0071 ***
水資源壓力等級 3 10.7295 0.0133 **
鄰接與否 1 8.5931 0.0034 ***
強國數量 2 8.2921 0.0158 **
互不侵犯 1 72.4833 <.0001 ***
保持中立 1 15.1505 <.0001 ***
民主國家數量 2 20.3041 <.0001 ***
資料來源:統計值由 SAS 系統產生,作者自行整理。
表 57:衝突發生「效果的第三型分析」
效果 DF Wald 卡方 Pr > ChiSq 年均降雨量 1 13.6055 0.0002 ***
對外依賴程度 1 13.1350 0.0003 ***
強國 GDP 值 1 26.4781 <.0001 ***
弱國 GDP 值 1 4.8796 0.0272 **
人口數量 1 37.0503 <.0001 ***
水資源壓力等級 3 17.9533 0.0004 ***
上下游國力關係 2 10.8025 0.0045 ***
互不侵犯 1 13.3853 0.0003 ***
資料來源:統計值由 SAS 系統產生,作者自行整理。
由各統計表可知,「一般互動發生」的羅吉斯迴歸模型中,自變數高達 13 項,「合作發生」的迴歸模型為 11 項,「衝突發生」的模型則減至 8 項。除「一 般互動發生」迴歸模型中,「水資源壓力等級」的顯著性較為薄弱外,其餘模型 中的各項變數,統計顯著性都堪稱突出。
其次,「一般互動發生」的迴歸模型變數繁多,不過一旦將互動區分為合作 與衝突兩組後,解釋變數便有各自不同的組合,甚至部分變數的顯著性,方才現
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
58
出。整體來看,代表水資源變動的「年均降雨量」、「水資源壓力等級」與水資源
「對外依賴程度」等變數,與國家間互動的發生,不論是衝突還是合作,都有一 定關聯。不過屬國家特質的變數,包括「鄰接與否」、「民主國家數量」、「強國數 量」、「貿易互賴」與「保持中立」等,在「一般互動發生」與「合作發生」的模 型中,都有若干影響,但對於解釋衝突的發生則沒有貢獻。值得注意的是,「上 下游國力關係」這項變數,唯獨出現在衝突發生的迴歸模型中。簡言之,國家特 質與合作發生的相關性較為明顯,反之,對於衝突的發生而言,主要因素還是集 中在水資源變數。
表 58:合作發生最大概度估計值的分析
參數 DF 估計值 標準 Wald
Pr > ChiSq 顯著性 誤差 卡方
Intercept 1 -2.0791 0.3588 33.5797 <.0001 ***
年均降雨量 1 -0.0005 0.0001 11.8780 0.0006 ***
對外依賴程度 1 0.0120 0.0031 14.6311 0.0001 ***
民生用水比 1 -0.0219 0.0067 10.6224 0.0011 ***
貿易互賴程度 1 7.8818 2.7975 7.9381 0.0048 ***
人口數量 1 1.12E-6 4.15E-07 7.2458 0.0071 ***
水資源壓力等級 1 1 0.4311 0.3519 1.5005 0.2206 水資源壓力等級 2 1 0.4070 0.3572 1.2979 0.2546
水資源壓力等級 3 1 -1.1396 0.4247 7.1992 0.0073 ***
鄰接與否 1 1 0.6570 0.2241 8.5931 0.0034 **
強國數量 1 1 -0.0105 0.3063 0.0012 0.9727
強國數量 2 1 1.6791 0.6321 7.0564 0.0079 ***
互不侵犯 1 1 2.3675 0.2781 72.4833 <.0001 ***
保持中立 1 1 -0.8766 0.2252 15.1505 <.0001 ***
民主國家數量 1 1 -0.8153 0.2336 12.1854 0.0005 ***
民主國家數量 2 1 -1.0246 0.2492 16.8990 <.0001 ***
資料來源:統計值由 SAS 系統產生,作者自行整理。*p<0.10, ** p<0.05, *** p<0.01。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
59
表 59:衝突發生最大概度估計值的分析
參數 DF 估計值 標準 Wald
Pr > ChiSq 顯著性 誤差 卡方
Intercept 1 -7.4595 0.9769 58.3110 <.0001 ***
年均降雨量 1 -0.0022 0.0006 13.6060 0.0002 ***
對外依賴程度 1 0.0281 0.0077 13.1350 0.0003 ***
強國 GDP 值 1 5.4E-13 1.05E-13 26.4781 <.0001 ***
弱國 GDP 值 1 1.53E-12 6.90E-13 4.8796 0.0272 **
人口數量 1 3.71E-06 6.09E-07 37.0503 <.0001 ***
水資源壓力等級 1 1 1.9636 0.6325 9.6372 0.0019 ***
水資源壓力等級 2 1 2.3796 0.7014 11.5094 0.0007 ***
水資源壓力等級 3 1 -0.7295 0.7859 0.8614 0.3533
上下游國力關係 1 1 2.0041 0.6114 10.7443 0.0010 ***
上下游國力關係 2 1 1.3465 0.6699 4.0396 0.0444 **
互不侵犯 1 1 2.4934 0.6815 13.3853 0.0003 ***
資料來源:統計值由 SAS 系統產生,作者自行整理。*p<0.10, ** p<0.05, *** p<0.01。
4. 預測機率檢定
表 58 綜合整理了三個模型的預測機率和觀測回應的關聯性統計。從和 諧百分比可得知,任兩個觀測值勝算相比的結果與模型預測結果一致者皆達 80%以上,因無繫結(勝算比為 1 者),所以 c 值亦達 80%以上,其中衝突發生 的模型更高達 93.1%。顯示迴歸模型對全體觀測值的預測準確度甚高。4
表 510:預測機率和觀測回應的關聯性 和諧
百分比
不和諧 百分比
繫結
百分比 配對 Somers'
D Gamma Tau-a c 一般互動 81.4 18.6 0 389004 0.628 0.628 0.133 0.814 合作發生 80.1 19.9 0 355056 0.602 0.602 0.117 0.801 衝突發生 93.1 6.9 0 71326 0.863 0.863 0.034 0.931
資料來源:統計值由 SAS 系統產生,作者自行整理。
4 C 值一般也可用來檢定迴歸模型的配適程度,本章變數選定採「向後消去法」,主要原因也是
考量「向後消去法」的 c 值最高所致。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
60
5. 勝算比估計
由上述各項檢定可知,迴歸模型本身與各項變數的解釋或預測能力均達 顯著,但各變數與事件發生的可能性究竟存在何等關聯,需進一步檢視勝算 與勝算比值。「概度最大估計值」與「勝算比估計值分析」分別說明瞭變數與
由上述各項檢定可知,迴歸模型本身與各項變數的解釋或預測能力均達 顯著,但各變數與事件發生的可能性究竟存在何等關聯,需進一步檢視勝算 與勝算比值。「概度最大估計值」與「勝算比估計值分析」分別說明瞭變數與