競爭與賽局模型

第五章法域競爭的大時代

第二節競爭與賽局模型

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第二節競爭與賽局模型

第一項賽局理論

一、賽局理論的源起

二十世紀經濟學中最重大的成果之一，就是從研究競爭的數學模型發展出來的賽局理論（game theory）。賽局理論又稱為對策論或博弈論，其主要內容是以數學模型來說明策略運用及其結果。其數學理論最早是由Emile Borel 於一九二一年提出，並在一九二八年由John Von Neumann 證明其理論，但直到一九四四年，John Von Neumann 及 Oskar Morgenstern 共同發表賽局理論及經濟行為

（Theory of Games and Economic Behavior）後，才得到廣泛的關注³⁴⁸。早年，賽局理論的研究重點是完全衝突賽局（零和賽局）。其他賽局則被當作一種合作的形式來檢視，也就是說，參與者可以共同選擇和採取行動。在現實中的大部份賽局裡，人們各自選擇行動，但是他們的行動對別人產生的影響並非是完全衝突的。

現在我們可以研究同時存在衝突與合作的典型賽局，這個突破要歸功於約翰．納許（John Nash），他於一九九四年被授予諾貝爾經濟學獎³⁴⁹。除了一九九四年以外，一九九六年、二○○一年、二○○五年、二○○七年、二○一二年、二○一四年及二○一六年的諾貝爾經濟學獎，也是頒發給對賽局理論進行相關研究的學者。

二、賽局的基本規則

以下是一個賽局的基本規則說明³⁵⁰：

(一) 參與者：在賽局能夠或需要自主做出決策並行動，且能從最後的決策組

348 MELVIN DRESHER,GAMES OF STRATEGY THEORY AND APPLICATIONS, 1-2 (1961).

349 阿維纳什．迪克西特 (AVINASH K.DIXIT) 及貝利．奈勒波夫 (BARRY J.NALEBUFF) 著，董志強等譯, 思辨賽局，頁 224，2017 年 7 月。

350 同前註，頁 2-3。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

合得到報償的每個個體，都是賽局的參與者，參與者可以有兩個或以上。

(二) 決策數量：參與者在賽局中可以選擇的行動數量必須標明，常見的是許可參與者從數個不同行動中擇一的行為即為決策，所產生的策略為「單純策略」。

(三) 靜態或動態賽局：賽局中所有參與者同時行動，稱為靜態賽局；若參與者有意識的在前一參與者行動後才進行行動，稱之為動態賽局。

(四) 資訊取得：必須要定義每個參與者可以得到的資訊數量，在大多數的賽局中，尤其是同時行動的靜態賽局，個別參與者對於其他參與者的行為所知相當有限，甚至是完全不知情的；如果一個賽局為動態賽局，且每一參與者確實知道前一參與者的行動內容，則稱參與者擁有「完全資訊」（perfect information）。

(五) 定額報償（payoff）：所謂報償額，是指參與者選定策略後所得到的效用（utility），報償額要確定，才能讓參與者進行策略評估。

此外，如果在一個賽局中，任何的最終策略組合，其參與者所得到的報償總額，在這樣的賽局中，一參與者的利得，必定來自另一參與者的等額損失，這樣的賽局，稱之為零合賽局（zero-sum game），例如戰爭賽局或選舉賽局，就是常見的零合賽局。但在某些賽局中，參與者的策略組合可以增加報償總額，稱之為非零合賽局，此時可能引發雙方的合作，例如經濟合作暨發展組織

（Organisation for Economic Co-Operation and Development，即 OECD）在二○一四年與歐盟聯手共同推動「金融資訊自動交換模式」（Automatic Exchange of Financial information in Tax Matters）以協助各國全球追稅，即屬於此類³⁵¹。

三、賽局理論的經典案例

賽局理論是用以預測參與者的行為，並研究它們的優化策略。表面上不同的相互作用可能表現出相似的激勵結構（incentive structure），其中一個有名有趣的

351 同前註 190。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

應用例子是「囚徒困境」。囚徒困境是由Merrill Meeks Flood 及 Melvin Dresher 於 1950 年代提出的理論，經典的囚徒困境內容如下：

警方逮捕甲、乙兩名嫌疑犯，但沒有足夠證據指控二人犯有重罪。於是警方分開囚禁嫌疑犯，分別和二人見面，並向雙方提供以下相同的選擇：

若一人認罪並作證檢控對方（相關術語稱「背叛」對方），而對方保持沉默，

此人將即時獲釋，沉默者將判監10 年。

若二人都保持沉默（相關術語稱互相「合作」），則二人因輕罪同樣判監1 年。

若二人都認罪（互相「背叛」），則二人同樣判監5 年。

用報償矩陣（payoff matrix）的方式概述囚徒困境的策略組合及報償值如下

（括弧內的數字代表刑期的組合）：

乙沉默（合作）乙認罪（背叛）

甲沉默（合作） 1,1 10,0 甲認罪（背叛） 0,10 5,5

這個賽局的規則為（1）兩個參與者、（2）各有一個決策可以選擇、（3）雙方同時做出選擇的靜態賽局、（4）資訊完全封閉，參與者在做決策時不知道另一個參與者的決策、（5）每一個合作或背叛的策略組合已給定刑期（報償額）。

在假設（1）參與者為理性、（2）完全理解其可選擇的策略種類、以及（3）

知道各種策略組合的報償額的前提下，對某甲而言，當某乙選擇合作時，他最好的策略是選擇背叛（可以不必服刑），如某乙選擇背叛時，某甲最好的策略還是選擇背叛（可以只服刑5 年）；同理，對某乙而言，情況也是相同。因此，「背叛」

成為是兩人的優勢策略（dominant strategy），這個賽局在理論上會由甲乙均選擇背叛，而達到一個納許均衡（Nash equilibrium）³⁵²。

352 納許均衡是賽局理論中一個很重要的概念。如果某一組策略是納許均衡，任何一個參賽者單獨改變自己的策略並不會使自己的報酬提高。也就是說，如果別的參與者都採取納許均衡策略時，個別參與者會發現這個均衡策略也是其最佳回應（best response）。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

做為法律研究者，可以理解實務上執法機構不可能設立上述情境來誘使所有囚徒招供，因為司法機關的量刑標準並不只有認罪與否，而囚徒們也必須考慮刑期以外的因素（例如出賣同夥無論在獄中或出獄後可能受到報復等），所以這是一個在限制性條件下的參考案例。雖然「囚徒困境」的賽局特徵包括資訊不透明、

非零和、單次賽局等，並不適用在所有的賽局中，但其之所以成為賽局理論的經典，是因為它將已賽局最重要的基本因素呈現出來，各種不同的賽局，包括本節以下所討論法域競爭的賽局模型，都可以由「囚徒困境」這個基本模型衍生出來。

四、賽局條件與競爭策略

賽局條件對於參與者選擇競爭策略至關重要，個別參與者各自具有不同的目標或利益，為了達到各自的目標和利益，各方必須依據賽局的特徵，考慮對手的各種可能的行動方案，並力圖選取對自己最為有利或最為合理的競爭方案。以下將借用賽局模型的概念，提出公司規範法域競爭的賽局（以下稱「公司規範賽局」）

進行討論。

第二項公司規範賽局模型

一、公司規範賽局的基本假設

假設世界上只有兩個國家－ A 國與 B 國，每個國家有兩種公司規範制度可以選擇，一是具有較多任意規定，尊重股東自主決定其公司治理方式的公司法

（以下稱「柔性公司法」），另一種是以強行規定為主，股東必須遵循公司法所訂定的公司治理規範（以下稱「剛性公司法」）。而且投資人（投資後即成為公司股東）在甲國及乙國之間擁有無障礙的移動性，但仍有移動成本。

二、公司規範賽局的報償矩陣

根據上述假設，進行公司規範賽局報償矩陣分析如下：

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

甲國

乙國

柔性公司法剛性公司法柔性公司法 8,8 10,2 剛性公司法 2,10 4,4

如上表，如果甲、乙兩國都選擇柔性公司法，因公司規範較為自由，可各獲得8 個單位的效用；如果都選擇剛性公司法，因為公司規範較無彈性，只能各獲得4 個單位的效用。但如甲國選擇柔性公司法，乙國選擇剛性公司法，則部份乙國投資人將轉向甲國設立公司，部份乙國的人才亦將轉向設立於甲國的公司效力，

因此甲國得到較高的效用單位10，乙國的效用單位降低為 2；反之，如甲國選擇剛性公司法，乙國選擇柔性公司法，則部份甲國投資人將轉向乙國設立公司，部份甲國的人才亦將轉向設立於乙國的公司效力，因此乙國得到較高的效用單位 10，甲國的效用單位降低為 2。

在這個矩陣中，可以看出納許均衡是（柔性公司法，柔性公司法）這個組合。

因為當乙國選擇採用柔性公司法時，甲國最佳的策略選擇也是柔性公司法；當乙國選擇剛性公司法時，甲國最佳的策略選擇還是柔性公司法；反之，當甲國選擇採用柔性公司法時，乙國最佳的策略選擇也是柔性公司法；當甲國選擇剛性公司法時，乙國最佳的策略選擇還是柔性公司法。

三、公司規範賽局的納許均衡

理解這個賽局時，首先要注意它與囚徒困境賽局在規則上有兩個重大的差異，

一是公司規範競爭為動態多次的重覆賽局，二是其為完全資訊的賽局。在這個動態重覆的公司規範賽局中，甲國與乙國各自修正公司法的時點通常不同。但只要其中一國修正完畢之後，其修法內容及得到的報償值都是透明的資訊，另外一個國家隨時有機會可以修正其公司法以回應對方所採取的策略，其結果是雙方的博弈反覆地進行下去，當反覆接近無限的數量，最終納許均衡將趨向於帕累托最優

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

（Pareto optimal）³⁵³。

四、公司規範賽局的參與者特性

公司規範賽局另外一個重點在於參與者是國家，但決策者是個人（有決策權的官員），賽局的報償值是對國家生效，不是對決策者直接生效，而決策者個人利益與國家利益未必一致，因此出現了公共政策的代理人成本。本章第三節將以公共選擇理論進一步討論。

第三項法律規範賽局的理論與現實

上述簡單的賽局模型，或可解釋十九世紀發生在美國及現代發生在歐洲的公司規範競爭，為何各法域的回應策略是以增加法律彈性、或是將過度管制法規自由化為主³⁵⁴。

但回到現實面上，必須要注意的情況是，公司設立登記地的競爭因素並不

在文檔中員工股權獎酬計畫之研究－從法域競爭的觀點出發 - 政大學術集成 (頁 182-194)

第五章 法域競爭的大時代

第二節 競爭與賽局模型

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二節 競爭與賽局模型

第一項 賽局理論

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二項 公司規範賽局模型

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三項 法律規範賽局的理論與現實

第五章法域競爭的大時代

第二節競爭與賽局模型

立政治大學

第二節競爭與賽局模型

第一項賽局理論

立政治大學

立政治大學

立政治大學

第二項公司規範賽局模型

立政治大學

立政治大學

第三項法律規範賽局的理論與現實