• 沒有找到結果。

本篇立論主要利用賽局理論為研究方法,並運用簡單的賽局模型來分析近年 來東亞政經局勢。而賽局的構成要素中,除了參賽者、動作(反應)、策略、報酬、

出賽順序、出招次數等基本構成外,還有任何可能與賽局相關的所有訊息,其中 包括參賽者個人因素(利益與偏好)、可能運用之策略、對其他對手策略的反應 與「報酬」等各方面的訊息集合(Information set)的掌握,與早期預判對手可 能的策略(招數),為賽局進行中必要的作為。

故而,在不影響個人(國家)利益或使損失降至最低,可接受其他賽局的策略 為前題提下的均衡,在參賽者雙方考量可能影響所共同決定的策略組合,一旦參 賽者雙方均處於不會再調整或改變其策略的均衡狀態時,即是一種穩定的均衡結 果,例如:以海峽兩岸敵對一甲子(九二共識一中各表),維持平衡的情況即為 此例。

雖賽局理論的發展以探討合作賽局開端,然合作賽局主要用於分析參賽者 之間彼此利用勾結、額外補償、達成協議及互通價格、利潤或成本等訊息的方式,

促進整體及個別利益提升。因應用方式均可能涉及是否違反道德或法律的問題,

故在合作賽局理論,可運用在合作廠商之間分析其策略。而非合作賽局則具有下 列特性:參賽者彼此之間無法事先達成勾結、額外補償等合作約定,或經由第三 者的監督來達成具有約束力的協議。此外,非合作賽局只能依靠參賽者的自行約 束及其對於其他參賽者行為的預測,來獲致賽局的均衡,所以「非合作賽局」理 論,更適用於分析在競爭中策略選擇的運用。在賽局模式中分析決策,吳秀光

(2001)歸納出研究賽局理論應作一些相關的假設,包括效用極大化、理性內在 邏輯的一致性、期望值的極大化、以個人之決定為分析單位,與理論適用之普遍 性等特性。27

第一節 靜態賽局-不完全訊息模型(Imperfect Game)

依巫和懋及夏珍(2002),靜態賽局為參賽者同時出招互動一次即終止賽局,

亦即當賽局各參賽者在於其將出招時點上,進行策略選定時,未能觀察出其他參 與賽局的對手(參賽者)在同一時點(或前)可能運用之策略情況時,可將此狀況 稱之為「不完全訊息的賽局」(Imperfect Game)。28

壹、單一策略不完全訊息之均衡

同步賽局為一典型的不完全訊息的賽局,在同步賽局下,由於參賽者在選定 其最適策略時,均無法獲知對方(參賽者)在同一狀況下所可能採取的策略為何,

所以同步(一次)靜態賽局為一具不完全訊息的賽局。運用以下基本單一同步模型

(表 8)說明,A 廠商與 B 廠商為相同商品領域的競爭對手,可採用的「原價」

與「減價」策略,藉以相互競爭,以爭取或提高及保持市佔率。其中,a,b,c,d,e,f,g,h 代表廠商的利潤。

表 8 靜態賽局-不完全訊息的賽局 B廠商 原價 減價

A廠商 原價 (a,e) (c,f)

減價 (b,g) (d,h)

若 a>b 且 c>d,則「原價」為 A 廠商的優勢策略(Dominant Strategy);同 理,若 e<f 且 g<h 則「減價」為 B 廠商的優勢策略。以表 8 為例:當兩廠商採 優勢策略,獲利分別為 c 及 f,則此均衡即為一納許均衡(Nash Equilibrium)。

在一場賽局中,雙方均可能因具有優勢策略,在雙方不合作但又擬達到較高 獲利下,易造成彼此信任度不足的「囚徒困境」(prisoner dillema)的情境的均衡,

此一種「納許均衡為最適反應」(不合作)必然存在。優勢策略必為一納許均衡,

納許均衡非必為優勢策略。例如在表 8 中,假設 b>a 且 d>c,同時 f>e 且 h>

g。亦即,雙方都均了解任何一方維持原價下,自己可以透過降價(減價行動)

獲得更多的利潤,此時「減價」均為 A 與 B 的優勢策略。然而,若是 A 與 B 均 採減價措施,勢必因為價格競爭造成雙方利潤進一步減少。在此一情況下,一旦 d<a 且 h<e,雙方獲利均比採維持原價還少,此即發生了「囚徒困境」。

貳、混合策略的不完全訊息均衡

在未能觀察出參賽者可能運用之策略情況時,即為不完全訊息的賽局下,僅 能以「混合策略」使其達到預期報酬(Expected Payoffs)前提下,評估可運用之 最適策略。依 1950 年納許(J. Nash)所提出:「若允許混合策略,則參賽者與策 略數目有限的任何不合作賽局,一定會有均衡存在」。若假設 p 與 q 分別表示 A 與 B 可能採「原價」策略的機率;1-p 與 1-q 即分別表示 A 與 B 可能採「減 價」策略的機率。如此,可分別計算出廠商的預期報酬;例如 B 廠商在對手 A 採「原價」或「減價」策略,其預期報酬=p×e+(1-p)×g=p×f+(1-p)× h , 可解出對手 A 採原價或減價的機率值。

第二節 重複賽局模型(Repeat Game)

重複賽局是指二次(含)以上的賽局,即每一參賽者在一場賽局中,具有二次 (含)以上的機會決策其最適策略,換句話說,可以參賽者彼此出招(策略)的次數,

既可獲得二次(含)以上的結果。重複賽局亦可區分為「同時」或「先後」之重複。

依據「無名氏定理」(Folk Theorem)可表述為:「任何高過最大的極小策略報酬 的組合,均可成為重複動態賽局中的納許均衡」,29簡單的說任何的行動選項均 可能是重複賽局的結果。30

29 巫和懋,夏珍,《賽局高手-全方位策略與運用》(台北:時報出版,2002 年 5 月),頁 133。

在有限次數(n)連續性賽局的重複,可視之為數個不同的子賽局所組成,

連續性賽局是指參賽者在選定其策略的時間點上,有參賽者出招前後的分 別,一般說來後者在做決策時,是可以觀察到先出招的參賽者在前某一時間點上 所做的決策,亦可稱之為樹狀結構圖或賽局數,一般稱為展開形式(Extensive Form),如下圖所示。A 與 B 分別在同一市場中兩家競爭的廠商,既賽局的參賽

在先行者與後動者之關聯上,先行者由考量後動者之最適策略,是逐次由子 賽局或部分賽局的方式推敲出結論而達到均衡,故稱之為「子賽局完美均衡」。 然在子賽局均衡狀況下之獲利,對某一參賽者而言,可能並不是最大獲利。用此 一分析法來分析如何促使或誘導競爭者 (參赛者) 採行對我最有利之策略,即建 立如何讓競爭者(參赛者) 具有高可信度或威脅下,以最大獲利為考量下所執行 之方案。在連續賽局中,無論是先行者或後動者均可採用此方法,促使或誘導競 爭者(參賽者)採行對我較有利的行動,但可能存在的問題是如何判斷何者才是先 行者、何者是後動者。

第四節 不充分訊息模型(Incomplete Game)

不充分訊息模型即為前述對訊息集合無法掌握,其中訊息集合是指與賽局相 關的所有訊息,如參賽者的特性、策略、動作及報酬等方面訊息。當參賽者無法 確 定 對 手 的 某 些 特 性 或 其 他 重 要 的 環 境 變 數 時 , 所 肇 生 的 不 充 分 的 訊 息

(Incomplete Information),使賽局是具不充分訊息的一種賽局,不充分訊息的賽 局若存有納許均衡,稱之為貝氏納許均衡(Bayesian Nash Equilibrium)。

在不同訊息的賽局中,若是參賽者不了解彼此之間可能「選擇的行動策略」, 則屬於不充份訊息的賽局;如果參賽者之間彼此互相知道可能運用的策略/行 動、喜好/報酬等資訊,那就是完全訊息。為求得此不充份訊息之均衡解,可運 用參賽者的「預期報酬」的方式得,例如:A 與 B 之間的賽局,當 A 的報酬將 視 B 的兩種不同的特性決定:

表 9 會採取「自私」的特性報酬矩陣表

B 合作 背叛

A

合作 4,4

0,6

背叛 6,0 2,2 優勢策略

表 10 會採取「友善」的特性報酬矩陣表

B 合作 背叛

A

合作 6,6 2,4 背叛 4,2 0,0

在未能觀察出參賽者彼此可能知道/不知道彼此之間某些資訊,所導致的預 期報酬(Expected Payoff)相等之假設,仍評估我可運用之最適策略,可運用適 當方式,可得出均衡策略。例如,然在參賽者不同的特性下的決策,將產生不同 的行動,亦會造成不同的結果(報酬)。舉例來說,對手 A 廠商預期報酬;p:B 採自私態度的機率;1-p:B 採友善態度的機率;p×0+(1-p)× 6=2×p+(1-p)

× 4;6-6=4-2p;4p=2;p=1/2,即當 B 廠商採取自私態度的機率小於 1/2 時,

則 A 廠商最適策略為「合作」,若 B 廠商採取自私態度的機率大於 1/2 時,則 A 廠商最適策略為「背叛」,即為「不充份訊息」下之「貝氏納許均衡解」(Bayes-Nash equilibrium)。

優勢策略