研究方法與簡單賽局模型 - 運用賽局理論觀點評析國際間合作與紛爭解決

本篇立論主要利用賽局理論為研究方法，並運用簡單的賽局模型來分析近年來東亞政經局勢。而賽局的構成要素中，除了參賽者、動作(反應)、策略、報酬、

出賽順序、出招次數等基本構成外，還有任何可能與賽局相關的所有訊息，其中包括參賽者個人因素（利益與偏好）、可能運用之策略、對其他對手策略的反應與「報酬」等各方面的訊息集合（Information set）的掌握，與早期預判對手可能的策略（招數），為賽局進行中必要的作為。

故而，在不影響個人(國家)利益或使損失降至最低，可接受其他賽局的策略為前題提下的均衡，在參賽者雙方考量可能影響所共同決定的策略組合，一旦參賽者雙方均處於不會再調整或改變其策略的均衡狀態時，即是一種穩定的均衡結果，例如：以海峽兩岸敵對一甲子（九二共識一中各表），維持平衡的情況即為此例。

雖賽局理論的發展以探討合作賽局開端，然合作賽局主要用於分析參賽者之間彼此利用勾結、額外補償、達成協議及互通價格、利潤或成本等訊息的方式，

促進整體及個別利益提升。因應用方式均可能涉及是否違反道德或法律的問題，

故在合作賽局理論，可運用在合作廠商之間分析其策略。而非合作賽局則具有下列特性：參賽者彼此之間無法事先達成勾結、額外補償等合作約定，或經由第三者的監督來達成具有約束力的協議。此外，非合作賽局只能依靠參賽者的自行約束及其對於其他參賽者行為的預測，來獲致賽局的均衡，所以「非合作賽局」理論，更適用於分析在競爭中策略選擇的運用。在賽局模式中分析決策，吳秀光

（2001）歸納出研究賽局理論應作一些相關的假設，包括效用極大化、理性內在邏輯的一致性、期望值的極大化、以個人之決定為分析單位，與理論適用之普遍性等特性。²⁷

第一節靜態賽局－不完全訊息模型（Imperfect Game）

依巫和懋及夏珍（2002），靜態賽局為參賽者同時出招互動一次即終止賽局，

亦即當賽局各參賽者在於其將出招時點上，進行策略選定時，未能觀察出其他參與賽局的對手（參賽者）在同一時點(或前)可能運用之策略情況時，可將此狀況稱之為「不完全訊息的賽局」（Imperfect Game）。²⁸

壹、單一策略不完全訊息之均衡

同步賽局為一典型的不完全訊息的賽局，在同步賽局下，由於參賽者在選定其最適策略時，均無法獲知對方（參賽者）在同一狀況下所可能採取的策略為何，

所以同步(一次)靜態賽局為一具不完全訊息的賽局。運用以下基本單一同步模型

（表 8）說明，A 廠商與 B 廠商為相同商品領域的競爭對手，可採用的「原價」

與「減價」策略，藉以相互競爭，以爭取或提高及保持市佔率。其中，a,b,c,d,e,f,g,h 代表廠商的利潤。

表 8 靜態賽局－不完全訊息的賽局 B廠商原價減價

A廠商原價（a,e）（c,f）

減價（b,g）（d,h）

若 a＞b 且 c＞d，則「原價」為 A 廠商的優勢策略（Dominant Strategy）；同理，若 e＜f 且 g＜h 則「減價」為 B 廠商的優勢策略。以表 8 為例：當兩廠商採優勢策略，獲利分別為 c 及 f，則此均衡即為一納許均衡（Nash Equilibrium）。

在一場賽局中，雙方均可能因具有優勢策略，在雙方不合作但又擬達到較高獲利下，易造成彼此信任度不足的「囚徒困境」（prisoner dillema）的情境的均衡，

此一種「納許均衡為最適反應」（不合作）必然存在。優勢策略必為一納許均衡，

納許均衡非必為優勢策略。例如在表 8 中，假設 b＞a 且 d＞c，同時 f＞e 且 h＞

g。亦即，雙方都均了解任何一方維持原價下，自己可以透過降價（減價行動）

獲得更多的利潤，此時「減價」均為 A 與 B 的優勢策略。然而，若是 A 與 B 均採減價措施，勢必因為價格競爭造成雙方利潤進一步減少。在此一情況下，一旦 d＜a 且 h＜e，雙方獲利均比採維持原價還少，此即發生了「囚徒困境」。

貳、混合策略的不完全訊息均衡

在未能觀察出參賽者可能運用之策略情況時，即為不完全訊息的賽局下，僅能以「混合策略」使其達到預期報酬（Expected Payoffs）前提下，評估可運用之最適策略。依 1950 年納許（J. Nash）所提出：「若允許混合策略，則參賽者與策略數目有限的任何不合作賽局，一定會有均衡存在」。若假設 p 與 q 分別表示 A 與 B 可能採「原價」策略的機率；1－p 與 1－q 即分別表示 A 與 B 可能採「減價」策略的機率。如此，可分別計算出廠商的預期報酬；例如 B 廠商在對手 A 採「原價」或「減價」策略，其預期報酬＝p×e＋（1-p）×g＝p×f＋（1-p）× h ，可解出對手 A 採原價或減價的機率值。

第二節重複賽局模型（Repeat Game）

重複賽局是指二次(含)以上的賽局，即每一參賽者在一場賽局中，具有二次 (含)以上的機會決策其最適策略，換句話說，可以參賽者彼此出招(策略)的次數，

既可獲得二次(含)以上的結果。重複賽局亦可區分為「同時」或「先後」之重複。

依據「無名氏定理」（Folk Theorem）可表述為：「任何高過最大的極小策略報酬的組合，均可成為重複動態賽局中的納許均衡」，²⁹簡單的說任何的行動選項均可能是重複賽局的結果。³⁰

29 巫和懋，夏珍，《賽局高手-全方位策略與運用》（台北：時報出版，2002 年 5 月），頁 133。

在有限次數（n）連續性賽局的重複，可視之為數個不同的子賽局所組成，

連續性賽局是指參賽者在選定其策略的時間點上，有參賽者出招前後的分別，一般說來後者在做決策時，是可以觀察到先出招的參賽者在前某一時間點上所做的決策，亦可稱之為樹狀結構圖或賽局數，一般稱為展開形式（Extensive Form），如下圖所示。A 與 B 分別在同一市場中兩家競爭的廠商，既賽局的參賽

在先行者與後動者之關聯上，先行者由考量後動者之最適策略，是逐次由子賽局或部分賽局的方式推敲出結論而達到均衡，故稱之為「子賽局完美均衡」。然在子賽局均衡狀況下之獲利，對某一參賽者而言，可能並不是最大獲利。用此一分析法來分析如何促使或誘導競爭者 (參赛者) 採行對我最有利之策略，即建立如何讓競爭者(參赛者) 具有高可信度或威脅下，以最大獲利為考量下所執行之方案。在連續賽局中，無論是先行者或後動者均可採用此方法，促使或誘導競爭者(參賽者)採行對我較有利的行動，但可能存在的問題是如何判斷何者才是先行者、何者是後動者。

第四節不充分訊息模型（Incomplete Game）

不充分訊息模型即為前述對訊息集合無法掌握，其中訊息集合是指與賽局相關的所有訊息，如參賽者的特性、策略、動作及報酬等方面訊息。當參賽者無法確定對手的某些特性或其他重要的環境變數時，所肇生的不充分的訊息

（Incomplete Information），使賽局是具不充分訊息的一種賽局，不充分訊息的賽局若存有納許均衡，稱之為貝氏納許均衡（Bayesian Nash Equilibrium）。

在不同訊息的賽局中，若是參賽者不了解彼此之間可能「選擇的行動策略」，則屬於不充份訊息的賽局；如果參賽者之間彼此互相知道可能運用的策略/行動、喜好/報酬等資訊，那就是完全訊息。為求得此不充份訊息之均衡解，可運用參賽者的「預期報酬」的方式得，例如：A 與 B 之間的賽局，當 A 的報酬將視 B 的兩種不同的特性決定：

表 9 會採取「自私」的特性報酬矩陣表

B 合作背叛

合作 4,4

0,6

背叛 6,0 2,2 ^優勢策略

表 10 會採取「友善」的特性報酬矩陣表

B 合作背叛

合作 6,6 2,4 背叛 4,2 0,0

在未能觀察出參賽者彼此可能知道/不知道彼此之間某些資訊，所導致的預期報酬（Expected Payoff）相等之假設，仍評估我可運用之最適策略，可運用適當方式，可得出均衡策略。例如，然在參賽者不同的特性下的決策，將產生不同的行動，亦會造成不同的結果(報酬)。舉例來說，對手 A 廠商預期報酬；p：B 採自私態度的機率；1-p：B 採友善態度的機率；p×0＋（1-p）× 6＝2×p＋（1-p）

× 4；6-6＝4-2p；4p＝2；p＝1/2，即當 B 廠商採取自私態度的機率小於 1/2 時，

則 A 廠商最適策略為「合作」，若 B 廠商採取自私態度的機率大於 1/2 時，則 A 廠商最適策略為「背叛」，即為「不充份訊息」下之「貝氏納許均衡解」（Bayes-Nash equilibrium）。

優勢策略

在文檔中運用賽局理論觀點評析國際間合作與紛爭解決－以東亞為例 (頁 46-53)