第五章 法域競爭的大時代
第二節 競爭與賽局模型
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第二節 競爭與賽局模型
第一項 賽局理論
一、 賽局理論的源起
二十世紀經濟學中最重大的成果之一,就是從研究競爭的數學模型發展出來 的賽局理論(game theory)。賽局理論又稱為對策論或博弈論,其主要內容是以 數學模型來說明策略運用及其結果。其數學理論最早是由Emile Borel 於一九二 一年提出,並在一九二八年由John Von Neumann 證明其理論,但直到一九四四 年,John Von Neumann 及 Oskar Morgenstern 共同發表賽局理論及經濟行為
(Theory of Games and Economic Behavior)後,才得到廣泛的關注348。早年,賽 局理論的研究重點是完全衝突賽局(零和賽局)。其他賽局則被當作一種合作的 形式來檢視,也就是說,參與者可以共同選擇和採取行動。在現實中的大部份賽 局裡,人們各自選擇行動,但是他們的行動對別人產生的影響並非是完全衝突的。
現在我們可以研究同時存在衝突與合作的典型賽局,這個突破要歸功於約翰.納 許(John Nash),他於一九九四年被授予諾貝爾經濟學獎349。除了一九九四年以 外,一九九六年、二○○一年、二○○五年、二○○七年、二○一二年、二○一 四年及二○一六年的諾貝爾經濟學獎,也是頒發給對賽局理論進行相關研究的學 者。
二、 賽局的基本規則
以下是一個賽局的基本規則說明350:
(一) 參與者:在賽局能夠或需要自主做出決策並行動,且能從最後的決策組
348 MELVIN DRESHER,GAMES OF STRATEGY THEORY AND APPLICATIONS, 1-2 (1961).
349 阿維纳什.迪克西特 (AVINASH K.DIXIT) 及貝利.奈勒波夫 (BARRY J.NALEBUFF) 著,董志強 等譯, 思辨賽局,頁 224,2017 年 7 月。
350 同前註,頁 2-3。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
合得到報償的每個個體,都是賽局的參與者,參與者可以有兩個或以上。
(二) 決策數量:參與者在賽局中可以選擇的行動數量必須標明,常見的 是許可參與者從數個不同行動中擇一的行為即為決策,所產生的策略為「單純策 略」。
(三) 靜態或動態賽局:賽局中所有參與者同時行動,稱為靜態賽局;若 參與者有意識的在前一參與者行動後才進行行動,稱之為動態賽局。
(四) 資訊取得:必須要定義每個參與者可以得到的資訊數量,在大多數 的賽局中,尤其是同時行動的靜態賽局,個別參與者對於其他參與者的行為所知 相當有限,甚至是完全不知情的;如果一個賽局為動態賽局,且每一參與者確實 知道前一參與者的行動內容,則稱參與者擁有「完全資訊」(perfect information)。
(五) 定額報償(payoff):所謂報償額,是指參與者選定策略後所得到的 效用(utility),報償額要確定,才能讓參與者進行策略評估。
此外,如果在一個賽局中,任何的最終策略組合,其參與者所得到的報償 總額,在這樣的賽局中,一參與者的利得,必定來自另一參與者的等額損失,這 樣的賽局,稱之為零合賽局(zero-sum game),例如戰爭賽局或選舉賽局,就是 常見的零合賽局。但在某些賽局中,參與者的策略組合可以增加報償總額,稱之 為 非 零 合 賽 局 , 此 時 可 能 引 發 雙 方 的 合 作 , 例 如 經 濟 合 作 暨 發 展 組 織
(Organisation for Economic Co-Operation and Development,即 OECD)在二○一 四年與歐盟聯手共同推動「金融資訊自動交換模式」(Automatic Exchange of Financial information in Tax Matters)以協助各國全球追稅,即屬於此類351。
三、 賽局理論的經典案例
賽局理論是用以預測參與者的行為,並研究它們的優化策略。表面上不同的 相互作用可能表現出相似的激勵結構(incentive structure),其中一個有名有趣的
351 同前註 190。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
應用例子是「囚徒困境」。囚徒困境是由Merrill Meeks Flood 及 Melvin Dresher 於 1950 年代提出的理論,經典的囚徒困境內容如下:
警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人犯有重罪。於是警方 分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:
若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,
此人將即時獲釋,沉默者將判監10 年。
若二人都保持沉默(相關術語稱互相「合作」),則二人因輕罪同樣判監1 年。
若二人都認罪(互相「背叛」),則二人同樣判監5 年。
用報償矩陣(payoff matrix)的方式概述囚徒困境的策略組合及報償值如下
(括弧內的數字代表刑期的組合):
乙沉默(合作) 乙認罪(背叛)
甲沉默(合作) 1,1 10,0 甲認罪(背叛) 0,10 5,5
這個賽局的規則為(1)兩個參與者、(2)各有一個決策可以選擇、(3)雙 方同時做出選擇的靜態賽局、(4)資訊完全封閉,參與者在做決策時不知道另一 個參與者的決策、(5)每一個合作或背叛的策略組合已給定刑期(報償額)。
在假設(1)參與者為理性、(2)完全理解其可選擇的策略種類、以及(3)
知道各種策略組合的報償額的前提下,對某甲而言,當某乙選擇合作時,他最好 的策略是選擇背叛(可以不必服刑),如某乙選擇背叛時,某甲最好的策略還是 選擇背叛(可以只服刑5 年);同理,對某乙而言,情況也是相同。因此,「背叛」
成為是兩人的優勢策略(dominant strategy),這個賽局在理論上會由甲乙均選擇 背叛,而達到一個納許均衡(Nash equilibrium)352。
352 納許均衡是賽局理論中一個很重要的概念。如果某一組策略是納許均衡,任何一個參賽者 單獨改變自己的策略並不會使自己的報酬提高。也就是說,如果別的參與者都採取納許均 衡策略時,個別參與者會發現這個均衡策略也是其最佳回應(best response)。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
做為法律研究者,可以理解實務上執法機構不可能設立上述情境來誘使所有 囚徒招供,因為司法機關的量刑標準並不只有認罪與否,而囚徒們也必須考慮刑 期以外的因素(例如出賣同夥無論在獄中或出獄後可能受到報復等),所以這是 一個在限制性條件下的參考案例。雖然「囚徒困境」的賽局特徵包括資訊不透明、
非零和、單次賽局等,並不適用在所有的賽局中,但其之所以成為賽局理論的經 典,是因為它將已賽局最重要的基本因素呈現出來,各種不同的賽局,包括本節 以下所討論法域競爭的賽局模型,都可以由「囚徒困境」這個基本模型衍生出來。
四、 賽局條件與競爭策略
賽局條件對於參與者選擇競爭策略至關重要,個別參與者各自具有不同的目 標或利益,為了達到各自的目標和利益,各方必須依據賽局的特徵,考慮對手的 各種可能的行動方案,並力圖選取對自己最為有利或最為合理的競爭方案。以下 將借用賽局模型的概念,提出公司規範法域競爭的賽局(以下稱「公司規範賽局」)
進行討論。
第二項 公司規範賽局模型
一、 公司規範賽局的基本假設
假設世界上只有兩個國家 - A 國與 B 國,每個國家有兩種公司規範制度 可以選擇,一是具有較多任意規定,尊重股東自主決定其公司治理方式的公司法
(以下稱「柔性公司法」),另一種是以強行規定為主,股東必須遵循公司法所訂 定的公司治理規範(以下稱「剛性公司法」)。而且投資人(投資後即成為公司股 東)在甲國及乙國之間擁有無障礙的移動性,但仍有移動成本。
二、 公司規範賽局的報償矩陣
根據上述假設,進行公司規範賽局報償矩陣分析如下:
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
甲國
乙國
柔性公司法 剛性公司法 柔性公司法 8,8 10,2 剛性公司法 2,10 4,4
如上表,如果甲、乙兩國都選擇柔性公司法,因公司規範較為自由,可各獲 得8 個單位的效用;如果都選擇剛性公司法,因為公司規範較無彈性,只能各獲 得4 個單位的效用。但如甲國選擇柔性公司法,乙國選擇剛性公司法,則部份乙 國投資人將轉向甲國設立公司,部份乙國的人才亦將轉向設立於甲國的公司效力,
因此甲國得到較高的效用單位10,乙國的效用單位降低為 2;反之,如甲國選擇 剛性公司法,乙國選擇柔性公司法,則部份甲國投資人將轉向乙國設立公司,部 份甲國的人才亦將轉向設立於乙國的公司效力,因此乙國得到較高的效用單位 10,甲國的效用單位降低為 2。
在這個矩陣中,可以看出納許均衡是(柔性公司法,柔性公司法)這個組合。
因為當乙國選擇採用柔性公司法時,甲國最佳的策略選擇也是柔性公司法;當乙 國選擇剛性公司法時,甲國最佳的策略選擇還是柔性公司法;反之,當甲國選擇 採用柔性公司法時,乙國最佳的策略選擇也是柔性公司法;當甲國選擇剛性公司 法時,乙國最佳的策略選擇還是柔性公司法。
三、 公司規範賽局的納許均衡
理解這個賽局時,首先要注意它與囚徒困境賽局在規則上有兩個重大的差異,
一是公司規範競爭為動態多次的重覆賽局,二是其為完全資訊的賽局。在這個動 態重覆的公司規範賽局中,甲國與乙國各自修正公司法的時點通常不同。但只要 其中一國修正完畢之後,其修法內容及得到的報償值都是透明的資訊,另外一個 國家隨時有機會可以修正其公司法以回應對方所採取的策略,其結果是雙方的博 弈反覆地進行下去,當反覆接近無限的數量,最終納許均衡將趨向於帕累托最優
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
(Pareto optimal)353。
四、 公司規範賽局的參與者特性
公司規範賽局另外一個重點在於參與者是國家,但決策者是個人(有決策權 的官員),賽局的報償值是對國家生效,不是對決策者直接生效,而決策者個人 利益與國家利益未必一致,因此出現了公共政策的代理人成本。本章第三節將以 公共選擇理論進一步討論。
第三項 法律規範賽局的理論與現實
上述簡單的賽局模型,或可解釋十九世紀發生在美國及現代發生在歐洲的 公司規範競爭,為何各法域的回應策略是以增加法律彈性、或是將過度管制法規 自由化為主354。
但回到現實面上,必須要注意的情況是,公司設立登記地的競爭因素並不
但回到現實面上,必須要注意的情況是,公司設立登記地的競爭因素並不