賽局理論

第二章文獻探討與回顧

第三節賽局理論

一、賽局理論

中野明(2012)賽局指的是一種狀況，這種狀況會受到兩個以上的決策體的行為決策所影響，亦稱賽局狀況，賽局過程中決策主體做出決策並依照決策來行動，描述這些行為的理論就稱為「賽局理論」；首次提出賽局理論是匈牙利數學家Von Neumman在1928年撰寫了一篇名為《室內遊戲的理論》的論文，隨後，Von Neumman and Morgenstern 在1943年聯

合發表《賽局理論與經濟行為》，這部著作成為賽局理論基礎(中野明,2012)；此理論延用至今已成為經濟學、社會科學及其他領域，例如人際關係的互動、球賽或橋牌的出招、股市的投資、政黨間的互動、乃至國際關係中的「戰」與「和」，皆可發現賽局理論的應用與影響，此理論已成為重要的分析工具了(巫和懋、夏珍,2012)。

巫和懋、夏珍(2002)指出賽局理論(Game Theory或譯為博弈理論、競合論)是「策略性思考」的系統知識。所探討的是互動行為，透過策略推估尋求自己的最大勝算或利益，從而在競爭中求生存。David M.Kreps (2010)賽局理論的模擬技術使集中於研究競爭性互動的動態特徵以及專有信息；這些問題的提出使得互動結構－誰做什麼？何時做？掌握哪些信息？成為研究重點。

謝理仰(2013)博士論文內所述:賽局理論以數學模型模擬理性決策者之間的衝突與合作結果，每個決策者都企圖預測其他人可能的抉擇，以確定自己的最佳決策；如何合理地進行這相互依存的戰略策劃便是賽局理論的主題。它可應用於任何具有下列三個條件的社會情境：

(一)有兩個或兩個以上的決策者，稱為參賽者，每個人有兩個或兩個以上行動方案的選擇，則稱為策略。

(二)整個結果需要是視所有參賽者對策略的選擇而定的。

(三)對於各種可能的結果每一個賽局都有明確的偏好順序，因此可以對每一個結果給定一個數字以表示這些偏好順序。

Camerer (1997)提出組成賽局的基本要素包括：參賽者、行動、自然、

資訊集、策略、報酬、均衡及結果。其定義說明如下表（藍兆杰、徐偉傑、陳怡君合譯，2002）：

表2-2 賽局的基本要素

賽局的要素意義

參賽者(Player) 是作決策的個人；每位參賽者的目標都是藉由選取行動來極大化的效用。

行動(Action) 參與者在決策空間中所作出的選擇，是種具體且外顯的行為。

自然(Nature) 是一個在特定機率賽局的特定時點上，採取隨機行動的準參賽者。

資訊集(Information Set)

參賽者所有的決策節點用虛線圈起來，在虛線內的節點代表資訊集；虛線內參賽者資訊不完整，

因為資訊的不足所以無法在節點間做決定，所以

賽局的要素意義

參賽者在同一資訊集內所做的選擇必須相同。

策略(strategy) 是參賽者可以採行的選擇，同時賽局中每位參賽

者的策略即其採取的行動，依序行動賽局中，後行動者可視先前已採取的行動而反應，每位參賽者必須做出一個完整的行動計劃。

報酬(Payoff) 根據參賽者的策略組合賦予實際數值，這數值即參賽者的報酬，對參賽者來說，報酬越高代表結果越好；當結果是隨機的或涉及風險時，是以期望值來計算報酬。

均衡(Equilibrium) 當每個參賽者都能正視他人策略而選擇了最佳策略時，即產生均衡。

結果(Outcome) 是模型設立者從行動的價值、報酬，利益發生的結局就是所謂的結果。

資料來源：本研究整理通常賽局依照不同的性質可分成如下種類：

(一)依賽局型式:

1.策略型賽局：兩個以上的參與者同時實行策略的賽局，其表現方式以2x2 矩陣呈現出其報酬型態報酬表(報酬矩陣)清楚顯示所有策略組合下，雙方參與者的報酬(中野明，2012)。

2.擴展型賽局：參與者輪流實行策略賽局，賽局理論使用賽局樹顯示行動和結果。因此，參與者可藉由畫出賽局樹(game tree)，來判斷對方將會採取什麼樣行動，而自己應採取何種對策(中野明，

2012)。

(二)依賽局人數：兩人賽局、N 人賽局。

1.兩人賽局即是參賽者人數為兩人，此時參賽者的策略決定僅受到另一人影響。

2.N 人賽局為超過兩人，所需考慮的是賽局可能會有聯合結盟 (coalition)情況（邱天嵩與翁予恒，2009）。

(三)依賽局協議：

1.合作賽局：合作賽局假設所有參賽者可訂定協議(agreement)，在賽局開始前先商量在賽局中該如何採取行動，參賽者皆遵守協議。

2.非合作賽局：參賽者根據自力的(self-enforcing) 規則參賽，盡可能尋找最利於己做法，也就是參賽者間無先前協議。

Schelling(1980)在《衝突的策略》書中定義：「非合作賽局是指參賽者的目標既衝突又競爭，如果參賽者間的互動關係是沒有這種情況，

彼此合作會獲得利益時，稱為合作賽局」。 (四)依報酬分類：

1.零和賽局：一方參與者得到利益，利益就會變成另一方的損失，報酬與損失的「量」相等(中野明，2012)。

2.非零和賽局：報酬與損失不一定完全相等 (中野明，2012)。在國際關係裡，國與國之間互相依存，既競爭又合作，這樣非零合情勢不勝枚舉，其中「囚徒困境」被廣泛應用於政治、經濟、心理

與軍事領域中（韓慧林與王貴民，2009）。

(五)依參賽者互動關係

1.靜態賽局：靜態賽局為參賽者同時出招互動一次即終止賽局。

2.動態賽局：是參賽者出招有先後，通常是觀察到對方動作後，再決定自己動作，因此競爭者間形成動態互動。

(六)依賽局訊息結構分類（Rasmusen, 2006）：

賽局訊息分類:區分完全、確定、完整及對稱訊息，如彙總表 2-2。

表2-3 訊息分類

訊息分類意義

完全每個訊息集合都是單點

確定在任何一位參賽者行動後，自然(是一個在特定機率賽局

的特定時點上，採取隨機行動的準參賽者)不會行動

完整自然不會先行動，或她的起始行動能被每位參賽者觀察到

對稱當參賽者行動或在結束節點上，參賽者與其他參賽者有相

同的訊息

資料來源：賽局理論與訊息經濟五南出版社 2006

1.完全訊息（perfect information）：賽局可滿足最強訊息要求，每個訊息為單一節點(singleton node)，參賽者非常清楚他應該要在賽局樹決策點上做決策，其賽局樹架構所有的決策點是清楚的，如圖 2-6。

圖2-6 完全訊息賽局

參賽者在做決策時會有一個資訊集，資訊集內有2 個決策點以上，當對手決定策略後，參賽者無法決定走那一個決策點，資訊集有「遮蔽訊息」的功能，此賽局為不完全訊息的賽局。如圖2-7

圖2-7 不完全訊息賽局

2.確定訊息（certain information）：參賽者採取行動後，自然將不會

行動，否則為不確定訊息；不確定訊息賽局內，自然在賽局中的行動可能被參賽者觀察到或不被立即顯現給參賽者。

3.完整訊息（complete information）：完整訊息的賽局為每位參賽者皆曉得賽局元素，如參賽者、行動集、報酬矩陣。如果參賽者不知道

下列情況中一種，則為不完整訊息賽局。

4.對稱訊息（symmetric information）：參賽者在採取行動的節點或在終

點的訊息集與任何其他參賽者的訊息集所擁有的節點都相同，否則為不對稱訊息賽局。

整個賽局依參賽者互動關係「靜態/動態」以及依賽局訊息結構分類

「完全訊息/不完全訊息」兩種分類標準，形成四種不同的賽局類型，同時也有其相對應的均衡觀念，如表2-4。

表2-4 非合作賽局的分類及對應均衡概念

區分完全訊息不完全訊息靜態純粹策略納許均衡

納許(1950-1951)

貝氏納許均衡 Harsanyi(1967-1968) 動態子賽局完美納許均衡

Selten (1965)

貝氏完美納許均衡 Selten (1975)

資料來源：賽局理論與信息經濟學茂昌圖書 2001 二、納許均衡

鄧志松及唐代彪於國家發展研究發表專刊¹⁴，論述《兩岸賽局:一個新情勢的開始(2006年6月)》，運用改變賽局結構釐清「納許均衡」(Nash Equilibrium)賽局核心概念，特別指出在一種策略組合中，所有參賽者面臨著他人不改變策略時，此時策略是最佳的，也就是一組互為最適反應策略組合，在此一點上的參賽者所獲得的支付皆為最高，因而理性參賽

者皆不會單獨改變策略，以達到一種均衡穩定狀態。但這種均衡的前提並非在於一種個人最高利益考量，而是互為最佳報酬的支付結果，也正因為這種互為「最適反應」，才使結果得以穩定。

張維迎(2001)納許對非合作賽局的主要貢獻是1950年1951年的兩篇論文中定義了非合作賽局及均衡，並證明了均衡解的存在，且達到均衡任一參賽者均無誘因偏離此一均衡，也就是在訊息完整的情況下參與賽局的參賽者必頇同時顧及他人的利益，以求取雙贏的局面。

「囚徒困境」是賽局理論裡很著名的例子，藉以說明納許均衡的意義；此賽局假設兩位嫌疑犯被警察隔離偵訊，他們可以選擇承認犯罪或否認犯罪，雙方都有其優勢策略，也就是不論對方選擇為何，都選擇坦承犯行，均衡結果是雙方都判刑6星期；但如果雙方都選擇否認，結果會更好，僅關1星期。如果其中一人坦承犯行，以犧牲對方利益換取自己的利益，則坦承犯行的人可無罪開釋，不認罪的人則加重判刑9星期。

如前所述，「囚徒困境」的「納許均衡」並不等於「最適解」，參賽雙方對這個結果一定都有些懊惱，但要如何改善呢？這是論者關心的問題。一種最著名且自然的方式是重複賽局(repeated play)，在囚徒困局中，

參賽者會擔心只要背叛，未來的合作就會崩盤，如果未來合作產生的報酬比短暫的報酬還大，參賽者就不會背叛¹⁵。但還是無法保證，參賽者會

15 Robert Axelord, The Evolution of Cooperation, New York: Basic Books, 1984.

沒有「背叛」的歹念，只要有一次參賽者起了歹念，又會回去舊的「囚徒困境」(鄧志松及唐代彪，2006年)。

三、策略行動賽局

另一種可能是透過「策略行動」(strategic moves)，制止對方的背叛。

藍兆杰等譯《策略行動 2002》，製造一個兩階段賽局。第一階段是一個

在文檔中運用賽局理論探討中、美南海競合策略之研究: 兼論我國太平島安全 (頁 37-53)

第二章 文獻探討與回顧

第三節 賽局理論

第二章文獻探討與回顧

第三節賽局理論