第三章 賽局理論與模式
3.2 賽局的基本概念
1. 基本假設:
根據 Romp 對於參賽廠商的決策行為做出了三個基本的假設: 即自利主義 (individualism)、理性(rationality)、彼此牽制(mutual interdependence)。
「自利主義」主要是假設賽局中的參賽者均是自私的,做任何策略都是以自 身利益極大化為考量前提。
27
「理性主義」是假設參賽者的個體皆是理性的,也就是能夠預設參賽者有能 力判斷他們做任何決定所得到的結果。這樣的理性假設受到不少質疑,因為個人 報酬並不只決定於本人的策略,還決定於他人策略之互動。由於任何理論均需要 有簡化的假設,故仍舊可以定義策略性的理性選擇,是一個「極大化一群策略互 動決策者的報酬」之數學問題,而此問題的解就稱之為賽局的解。
「彼此牽制」是假設參賽者間的互動是彼此牽制或影響的,參賽者除了以自 身利益最大化為考量外應該留意對手的反應予以調適策略,不能單純考量自身的 決策,此為賽局的精髓所在,也是與傳統經濟學最大不同所在。
2. 賽局理論的基本元素
賽局理論主要是研究參賽者間策略行為互動的關係,不同賽局類型將產生不 同的結果。賽局理論的元素包含了參賽者、行動、訊息、策略、報酬、結果與最 後的均衡解,將各元素與對應之內涵整理如下表 3.2。
表3.2 賽局的基本元素
賽局理論元素 說明
參賽者 單人和多人
行動或規則 參賽者可應用的行動以及行動的先後順序、出招次數。
訊息 訊息結構之分類:
完全訊息:訊息集合為單一節點,所有訊息皆為共同資 訊,不完全訊息有兩個以上的節點,但不會同時發生。
充分訊息:每位參賽者均曉得賽局之所有基本元素。
策略 參賽者由其擁有的訊息集,選擇該執行的行動集合。
報酬 參賽者在賽局結束時,所能得到的報酬。
結果 結果=行動策略+報酬 Outcomes = action + payoff
均衡 把對方之決策視為既定,自己再作決策,包括每位參賽 者在給定其他參賽者的最佳策略下,所選擇之策略組 合。當參賽者之預期與策略都不再修正時,則賽局達到 平衡。
資料來源: 張宮熊(2009),賽局
賽局的迷人之處便在於利用上表之元素組成簡單的遊戲規則(參賽者、訊息
28 靜態賽局(static game)則是只參賽者同時出手,即一局定輸贏的賽局。
2 參賽者是否掌握其他對手的相關資訊(背景、策略運用、報酬函數等)
Nash, J(1950,1951)
完全訊息動態賽局:
子賽局完美納許均衡:
Selten (1965)
不完全訊息
不完全訊息靜態賽局:
貝式納許均衡:
Harsanyi (1967~1968)
不完全訊息動態賽局:
完美貝式納許均衡:
Selten (1975) 資料來源: 巫和懋、夏珍,「賽局高手」,時報出版社,2004 年。
完全訊息中的靜態賽局觀念是由 Nash, J(1950,1951)提出的納許均衡(Nash Equilibrium, NE)為基礎。只要對手的策略確定,競爭者就可以有最適反應(best response),納許(Nash, J)定義:當一組策略是互為最適反應時,就是「納許均 衡」(Nash Equilibrium)。其後,Selten (1965)提出完全訊息動態賽局之子賽局完 美納許均衡(Subgame Perfect Nash Equilibrium,SPNE)。另外,還有 Harsanyi (1967~1968)所提出的不完全訊息的靜態賽局,可以利用貝式納許均衡(Bayesian Nash Equilibrium, BNE)來分析,以及 Selten (1975)、Kreps and Wilson (1982)、
Fudenberg and Tirole (1991)所提出的不完全訊息動態賽局下的完美貝式納許均衡
29
(Perfect Bayesian Nash Equilibrium, PBNE)。
除了以上基本賽局分類之外,也可依照不同的情境或模式來加以分類,而這 些情境並非單獨存在,有時候是兩種或以上的模式混合之多人複雜性賽局,端賴 所分析的情境而定。
(1)參賽者以行動順序,區分為:
a.靜態賽局(static game)
在賽局中參賽者同時行動,或行動雖有先後,蛋後參賽者無法得知前一參賽者的 行動,通常以賽局方格或賽局樹來呈現。
b.動態賽局(dynamic game)
在賽局中參賽者的行動有先後順序,且後參賽者在行動前可以得之前參賽者的行 動,進而改變自己的行動,常以賽局樹呈現。
(2)依訊息性質,區分為:
a.完全訊息賽局(compete information games)
每位參賽者對所有其他參賽者的背景、行動策略及報酬函數均有充分了解。
b.不完全訊息賽局(non-compete information games)
賽局中至少有一位參賽者對其他參賽者的訊息不得而知。
(3)依賽局參賽者承諾強度,區分為:
a.合作賽局(cooperative games)
參賽者可作出具約束性承諾的賽局;在衝突的環境中,經多次的互動,產生隱性 勾結,由對立到合作,達到雙贏。分析單位是群體(Group)或聯合體(Coalition)。
b.不合作賽局(non-cooperative games)
參賽者間不存在約束性承諾的賽局;對手的策略確定,競爭者可有最適反應,透 過策略推估,尋求自身最大利益。分析單位是參賽者。
(4)依賽局行動先後關係,區分為:
a.同步賽局(simultaneous game)
各參賽者同時行動、或各參賽者之行動雖有前後,但彼此的行動是無法觀察到彼 此行動的先後。
b.逐步賽局(sequential game)
各參賽者的行動有一定的先後順序,後行動者能在觀察對手先行動者的行動後,
30
再採取行動。
(5)依賽局報酬關係,區分為:
a.零合賽局(Zero-sum game)
參與者為兩人,則一參與者的正償付洽為另一參賽者的負償付,即兩人之償付完 全衝突。
b.非零和賽局(Zero-sum game)
參與者之償付的總合非一定常數,而是隨參賽者策略組合之異而不同。
3.2.2 賽局理論的表現方式
一般我們會用兩種方式來分析參賽者之策略並找出賽局之均衡解:
1.常規型(normal form)
靜態賽局通常用矩陣方式呈現,稱作常規形式(normal form)或是策略形式 (strategic form),表格的維度比需與參賽者數目相同。一個常規型賽局包括三個 組成部分:參賽者、每位參賽者可能採取之各種策略以及相對應的報酬函數。參 賽者採取策略的不同組合存在對應之報酬組合關係。
圖 3.1 常規形式(以囚犯兩難賽局為例) 2.擴展型(extensive form)
說明依序行動賽局的最好方式就是畫出賽局樹狀圖(game tree),這些樹狀圖 通常被稱為賽局的擴展形式,如下圖 3.2 所示。賽局樹狀圖由各參賽者的決策分 支(decision trees)組成,該圖形包含參賽者可能採取的所有行動以及賽局的所有 可能結果,並由節點(nodes)與分支(branches)所構成。節點有兩種,各節點之間 以分支連結,第一種節點是決策節點(decision node),參賽者在點上會作出決策。
每個賽局樹都有一個稱為始節點(initial node)的決策節點,作為賽局的開始。第
31
二種節點是終結點(terminal node),代表賽局的結果,每個終結點會顯示一組所 有參賽者獲得的報酬。所謂子賽局是指某一個單點(singleton)及其以下所有的路 徑,資訊集合、決策點及報酬。
圖 3.2 賽局樹範例
在每個可能的決策點上該如何採取行動的規則,稱為純粹策略(pure strategy),
若純粹策略為連續變數時,賽局樹的畫法如下圖3.3所示。
圖 3.3 連續區間之賽局樹
賽 局 這 種 彼 此 相 依 (contingent) 的 特 性 意 味 著 參 賽 者 必 須 向 前 設 想 (look forword),而往後推導(reson back)出在每個可能決策點下的最適行動。使用向前 設想而往後推導的這種觀念來預測依序行動賽局中參賽者行為的這種方法稱為 反推法(rollback)。反推法是從思考在所有終點可能發生的情況開始,順著賽局樹 反推回始節點的一種分析方式。由於此法是一次推導一步,因此也被稱為逆向歸 納法(backward induction) (Dixit and Skeath, 2002)。
所謂逆向歸納法是指,給定賽局到達最後一個決策結,該決策結上行動的參 賽者有一個最適選擇,這個最適選擇就是該決策開始的子賽局納許均衡。然後再 倒回到倒數第二個決策結,找出倒數第二個決策結的最適選擇,這個最適選擇與 第一步找出的最後決策者的最適選擇構成倒數第二個決策結開始的子賽局的一 個納許均衡。如此不斷直到初始結,每一步都得到對應的子賽局的一個納許均 衡,且根據定義,這個納許均衡是該子賽局的所有子賽局的納許均衡,在這個過
參賽者A
參賽者B
策略A1
策略A2 策略B1
策略B2
報酬集合 (參賽者A,參賽者B)
( 1 , 1 )
( 3 , 3 ) ( 2 , 0 )
1 2
( , )
參賽者1 參賽者2
策略空間1 策略空間2
32
程的最後一步得到整個賽局的納許均衡也就是整個賽局的子賽局完美納許均衡 (SPNE)。