• 沒有找到結果。

第二章 文獻探討與回顧

第三節 賽局理論

一、賽局理論

中野 明(2012)賽局指的是一種狀況,這種狀況會受到兩個以上的決 策體的行為決策所影響,亦稱賽局狀況,賽局過程中決策主體做出決策 並依照決策來行動,描述這些行為的理論就稱為「賽局理論」;首次提出 賽局理論是匈牙利數學家Von Neumman在1928年撰寫了一篇名為《室內 遊戲的理論》的論文,隨後,Von Neumman and Morgenstern 在1943年聯

合發表《賽局理論與經濟行為》,這部著作成為賽局理論基礎(中野 明,2012);此理論延用至今已成為經濟學、社會科學及其他領域,例如人 際關係的互動、球賽或橋牌的出招、股市的投資、政黨間的互動、乃至 國際關係中的「戰」與「和」,皆可發現賽局理論的應用與影響,此理論 已成為重要的分析工具了(巫和懋、夏珍,2012)。

巫和懋、夏珍(2002)指出賽局理論(Game Theory或譯為博弈理論、競 合論)是「策略性思考」的系統知識。所探討的是互動行為,透過策略推 估尋求自己的最大勝算或利益,從而在競爭中求生存。David M.Kreps (2010)賽局理論的模擬技術使集中於研究競爭性互動的動態特徵以及專 有信息;這些問題的提出使得互動結構-誰做什麼?何時做?掌握哪些 信息?成為研究重點。

29

謝理仰(2013)博士論文內所述:賽局理論以數學模型模擬理性決策者 之間的衝突與合作結果,每個決策者都企圖預測其他人可能的抉擇,以 確定自己的最佳決策;如何合理地進行這相互依存的戰略策劃便是賽局 理論的主題。它可應用於任何具有下列三個條件的社會情境:

(一)有兩個或兩個以上的決策者,稱為參賽者,每個人有兩個或兩個以上 行動方案的選擇,則稱為策略。

(二)整個結果需要是視所有參賽者對策略的選擇而定的。

(三)對於各種可能的結果每一個賽局都有明確的偏好順序,因此可以對每 一個結果給定一個數字以表示這些偏好順序。

Camerer (1997)提出組成賽局的基本要素包括:參賽者、行動、自然、

資訊集、策略、報酬、均衡及結果。其定義說明如下表(藍兆杰、徐偉 傑、陳怡君合譯,2002):

表2-2 賽局的基本要素

賽局的要素 意 義

參賽者(Player) 是作決策的個人;每位參賽者的目標都是藉由選 取行動來極大化的效用。

行動(Action) 參與者在決策空間中所作出的選擇,是種具體且 外顯的行為。

自然(Nature) 是一個在特定機率賽局的特定時點上,採取隨機 行動的準參賽者。

資訊集(Information Set)

參賽者所有的決策節點用虛線圈起來,在虛線內 的節點代表資訊集;虛線內參賽者資訊不完整,

因為資訊的不足所以無法在節點間做決定,所以

賽局的要素 意 義

參賽者在同一資訊集內所做的選擇必須相同。

策略(strategy) 是參賽者可以採行的選擇,同時賽局中每位參賽

者的策略即其採取的行動,依序行動賽局中,後 行動者可視先前已採取的行動而反應,每位參賽 者必須做出一個完整的行動計劃。

報酬(Payoff) 根據參賽者的策略組合賦予實際數值,這數值即 參賽者的報酬,對參賽者來說,報酬越高代表結 果越好;當結果是隨機的或涉及風險時,是以期 望值來計算報酬。

均衡(Equilibrium) 當每個參賽者都能正視他人策略而選擇了最佳 策略時,即產生均衡。

結果(Outcome) 是模型設立者從行動的價值、報酬,利益發生的 結局就是所謂的結果。

資料來源:本研究整理 通常賽局依照不同的性質可分成如下種類:

(一)依賽局型式:

1.策略型賽局:兩個以上的參與者同時實行策略的賽局,其表現方式 以2x2 矩陣呈現出其報酬型態報酬表(報酬矩陣)清楚顯示所有策略 組合下,雙方參與者的報酬(中野 明,2012)。

2.擴展型賽局:參與者輪流實行策略賽局,賽局理論使用賽局樹顯示 行動和結果。因此,參與者可藉由畫出賽局樹(game tree),來判斷 對方將會採取什麼樣行動,而自己應採取何種對策(中野 明,

2012)。

31

(二)依賽局人數:兩人賽局、N 人賽局。

1.兩人賽局即是參賽者人數為兩人,此時參賽者的策略決定僅受到另 一人影響。

2.N 人賽局為超過兩人,所需考慮的是賽局可能會有聯合結盟 (coalition)情況(邱天嵩與翁予恒,2009)。

(三)依賽局協議:

1.合作賽局:合作賽局假設所有參賽者可訂定協議(agreement),在賽 局開始前先商量在賽局中該如何採取行動,參賽者皆遵守協議。

2.非合作賽局:參賽者根據自力的(self-enforcing) 規則參賽,盡可能 尋找最利於己做法,也就是參賽者間無先前協議。

Schelling(1980)在《衝突的策略》書中定義:「非合作賽局是指參 賽者的目標既衝突又競爭,如果參賽者間的互動關係是沒有這種情況,

彼此合作會獲得利益時,稱為合作賽局」。 (四)依報酬分類:

1.零和賽局:一方參與者得到利益,利益就會變成另一方的損失,報 酬與損失的「量」相等(中野 明,2012)。

2.非零和賽局:報酬與損失不一定完全相等 (中野 明,2012)。在國 際關係裡,國與國之間互相依存,既競爭又合作,這樣非零合情 勢不勝枚舉,其中「囚徒困境」被廣泛應用於政治、經濟、心理

與軍事領域中(韓慧林與王貴民,2009)。

(五)依參賽者互動關係

1.靜態賽局:靜態賽局為參賽者同時出招互動一次即終止賽局。

2.動態賽局:是參賽者出招有先後,通常是觀察到對方動作後,再決 定自己動作,因此競爭者間形成動態互動。

(六)依賽局訊息結構分類(Rasmusen, 2006):

賽局訊息分類:區分完全、確定、完整及對稱訊息,如彙總表 2-2。

表2-3 訊息分類

訊息分類 意 義

完全 每個訊息集合都是單點

確定 在任何一位參賽者行動後,自然(是一個在特定機率賽局

的特定時點上,採取隨機行動的準參賽者)不會行動

完整 自然不會先行動,或她的起始行動能被每位參賽者觀察到

對稱 當參賽者行動或在結束節點上,參賽者與其他參賽者有相

同的訊息

資料來源:賽局理論與訊息經濟 五南出版社 2006

1.完全訊息(perfect information):賽局可滿足最強訊息要求,每個 訊息為單一節點(singleton node),參賽者非常清楚他應該要在賽局 樹決策點上做決策,其賽局樹架構所有的決策點是清楚的,如圖 2-6。

33

圖2-6 完全訊息賽局

參賽者在做決策時會有一個資訊集,資訊集內有2 個決策點以 上,當對手決定策略後,參賽者無法決定走那一個決策點,資訊集 有「遮蔽訊息」的功能,此賽局為不完全訊息的賽局。如圖2-7

圖2-7 不完全訊息賽局

2.確定訊息(certain information):參賽者採取行動後,自然將不會

行動,否則為不確定訊息;不確定訊息賽局內,自然在賽局中的行 動可能被參賽者觀察到或不被立即顯現給參賽者。

3.完整訊息(complete information):完整訊息的賽局為每位參賽者皆 曉得賽局元素,如參賽者、行動集、報酬矩陣。如果參賽者不知道

下列情況中一種,則為不完整訊息賽局。

4.對稱訊息(symmetric information):參賽者在採取行動的節點或在終

點的訊息集與任何其他參賽者的訊息集所擁有的節點都相同,否則 為不對稱訊息賽局。

整個賽局依參賽者互動關係「靜態/動態」以及依賽局訊息結構分類

「完全訊息/不完全訊息」兩種分類標準,形成四種不同的賽局類型,同 時也有其相對應的均衡觀念,如表2-4。

表2-4 非合作賽局的分類及對應均衡概念

區分 完全訊息 不完全訊息 靜態 純粹策略納許均衡

納許(1950-1951)

貝氏納許均衡 Harsanyi(1967-1968) 動態 子賽局完美納許均衡

Selten (1965)

貝氏完美納許均衡 Selten (1975)

資料來源:賽局理論與信息經濟學 茂昌圖書 2001 二、納許均衡

鄧志松及唐代彪於國家發展研究發表專刊14,論述《兩岸賽局:一個 新情勢的開始(2006年6月)》,運用改變賽局結構釐清「納許均衡」(Nash Equilibrium)賽局核心概念,特別指出在一種策略組合中,所有參賽者面 臨著他人不改變策略時,此時策略是最佳的,也就是一組互為最適反應 策略組合,在此一點上的參賽者所獲得的支付皆為最高,因而理性參賽

35

者皆不會單獨改變策略,以達到一種均衡穩定狀態。但這種均衡的前提 並非在於一種個人最高利益考量,而是互為最佳報酬的支付結果,也正 因為這種互為「最適反應」,才使結果得以穩定。

張維迎(2001)納許對非合作賽局的主要貢獻是1950年1951年的兩篇 論文中定義了非合作賽局及均衡,並證明了均衡解的存在,且達到均衡 任一參賽者均無誘因偏離此一均衡,也就是在訊息完整的情況下參與賽 局的參賽者必頇同時顧及他人的利益,以求取雙贏的局面。

「囚徒困境」是賽局理論裡很著名的例子,藉以說明納許均衡的意 義;此賽局假設兩位嫌疑犯被警察隔離偵訊,他們可以選擇承認犯罪或 否認犯罪,雙方都有其優勢策略,也就是不論對方選擇為何,都選擇坦 承犯行,均衡結果是雙方都判刑6星期;但如果雙方都選擇否認,結果會 更好,僅關1星期。如果其中一人坦承犯行,以犧牲對方利益換取自己的 利益,則坦承犯行的人可無罪開釋,不認罪的人則加重判刑9星期。

如前所述,「囚徒困境」的「納許均衡」並不等於「最適解」,參賽 雙方對這個結果一定都有些懊惱,但要如何改善呢?這是論者關心的問 題。一種最著名且自然的方式是重複賽局(repeated play),在囚徒困局中,

參賽者會擔心只要背叛,未來的合作就會崩盤,如果未來合作產生的報 酬比短暫的報酬還大,參賽者就不會背叛15。但還是無法保證,參賽者會

15 Robert Axelord, The Evolution of Cooperation, New York: Basic Books, 1984.

沒有「背叛」的歹念,只要有一次參賽者起了歹念,又會回去舊的「囚 徒困境」(鄧志松及唐代彪,2006年)。

三、策略行動賽局

另一種可能是透過「策略行動」(strategic moves),制止對方的背叛。

藍兆杰等 譯《策略行動 2002》,製造一個兩階段賽局。第一階段是一個

藍兆杰等 譯《策略行動 2002》,製造一個兩階段賽局。第一階段是一個