前言 - 賽局理論與學習模型的實證研究

國

立政治大學

‧

Na tiona

l Ch engchi University

第一章前言

第一節研究動機

賽局理論(Game Theory)是經濟學的一個分支，用於研究人類的決策及行為，

有助於了解人們如何制訂策略，在日常生活中有許多賽局理論的應用。賽局理論主要在探討的問題是雙向互動，我的計算必須考慮你的計算，而你的計算也考慮了我的計算，為一門研究「多人決策」（包括兩人）之間的問題。賽局中的每一個人的決策，會受到賽局中其他人的影響。個人的報酬不只根據自己的選擇，也取決對手的決定，因此使得賽局理論更加複雜。例如：市場上只有甲乙兩家公司，

且生產的產品同質，若整個市場對產品的需求量固定，甲乙公司分別可以選擇製造高產量或是低產量，下表列出兩家公司不同策略所能得到的報酬。

表 1.1、市場報酬矩陣乙公司

甲公司高產量低產量

高產量 (50，50) (120，20) 低產量 (20，120) (80，80)

註：(A，B)分別代表(甲公司，乙公司)的報酬單位：萬元

根據表 1.1 的報酬表，如果雙方選擇的是高產量，此時供給大於需求會導致價格變低，產量變高卻只能各獲利 50 萬元。如果甲公司選擇高產量，乙公司選擇低產量，生產高產量的甲公司可以獲得龐大利益 120 萬元，選擇低產量的乙公司只能獲得 20 萬元；反過來說，若乙公司選擇高產量，甲公司選擇低產量，乙公司的獲利較高；如果雙方都選擇低產量，因為供給小於需求使得價格上漲，提高邊際利潤，因此雙方都可以獲利 80 萬元。此時，若你是甲(乙)公司的決策者，

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

你會選擇什麼策略？

當然實際上一定不如上述問題那麼簡單，但是多少可藉由簡化問題獲得有用的想法。由上例來看，如果乙公司選擇的是高產量的決策，甲公司該如何應對呢？

如果甲公司選擇高產量，公司就會獲利 50 萬元，如果選擇低產量，公司僅能獲利 20 萬，相較之下理性的總經理應當會選擇高產量的決策；如果乙公司選擇的是低產量的決策，甲公司若選擇低產量，可以獲利 80 萬元，若選擇高產量則可以獲利 120 萬元，此時甲公司的總經理應當還是會選擇較高報酬的高產量。綜觀以上分析，不管乙公司選擇什麼策略，甲公司都會選擇高產量，對乙公司而言也是如此，因此最後雙方都會選擇高產量的決策，這也是著名的奈許均衡(Nash Equilibrium)。奈許均衡主要應用在非合作博弈，假設人是理性且自利，因此只選擇對自己最有利的策略，不將對手的報酬列入考量。以上例來看，不管對手的公司選擇為何，選擇高產量可獲得較高報酬，因此「高產量」就是均衡或是最佳決策。

表 1.2、囚犯困境償付矩陣犯人乙

犯人甲坦承沉默

坦承 (-8，-8) (0，-10) 沉默 (-10，0) (-1，-1)

註：(A，B)分別代表(犯人甲，犯人乙)的報酬單位：年

上述兩家公司的範例，屬於眾所皆知的囚犯困境(Prisoner Dilemma)賽局。常見的敘述為有兩個囚犯，在一次案件中同時被逮捕，警方分別將兩人分開偵訊，

如表 1.2 所示，若兩人都坦承，分別會被判八年刑期；若一人坦承一人沉默，坦承的人因轉為證人而無罪釋放，而沉默的人必須負擔十年刑期；如果兩人同時保

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

持沉默，則因罪證不足僅能以較輕微的罪名起訴，兩人只會被判一年刑期。從奈許均衡理論推測，若雙方為理性且自利的，最終都會選擇坦承。

從單一回合的囚犯困境，可以從理論基礎找到帄衡點，但重複的囚犯困境就又不同了，以上述生產的例子來說，假設兩家公司的決策僅會影響一季的生產量，

未來長久的日子裡，兩間公司每一季都會遇到相同的問題，雙方也都知道長期選擇低產量是對雙方最好的策略，但是每一次都陷入該選擇高產量還是低產量的決策問題，因為你不知道另一個搭擋到底是競爭對手，還是合作夥伴，此時若你是公司的總經理，又該如何做決策呢？

像這樣重複的囚犯兩難問題，可能存在兩個以上的最佳決策，有別於奈許均衡的單一帄衡點，雙方有可能會為了長期合作而選擇合作。實證上，經濟學家以學習模型(Learning Model)解釋人在重複賽局的學習行為，但過去研究選擇模型時，通常是依據配適結果或交叉驗證的標準，缺乏統計分析比較有系統的模型選擇，因此本文希望引進迴歸分析的操作模式選取最佳學習模型。

第二節研究目的

如果挑選學習模型以較小變異數或最大概似估計量為優劣準則，可能會和迴歸分析遭遇類似的問題，變數愈多、誤差愈小（或是R²愈大），但R²最大不見得是最適合的模型，還必須檢查殘差是否符合迴歸模型假設，如：服從常態分佈、

資料獨立、變異數同質等。但是重複賽局的資料有時間先後關係，因此資料不服從獨立假設，增加分析的複雜性，因此建議以電腦模擬解決。

賽局一開始探討理論較多，從簡單的零和賽局證明「壞中取小」定裡，到之後非合作博弈賽局證明奈許均衡，都是賽局理論之一。賽局理論主要探討的是單

理論實驗設計電腦模擬

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

回合的賽局，單回合的賽局通常存在均衡點，而重複賽局僅以理論較難證明存在單一均衡點。又或許可以推論有單一均衡點，但實際上人的決策卻未必會與理論結果一致，因此經濟學家透過實驗，記錄人在重複賽局中的決策行為，觀察實際上人的決策變化，並以學習模型解釋人的決策行為，此為實驗經濟。而除了實驗數據，本文也將電腦模擬應用在賽局上，探討理論上學習模型的特性。

本文實證的資料，從實驗經濟出發，利用實證資料帶入模型，與以往實驗不同的是多人重複的囚犯困境賽局，以及實證資料的遊戲規則。本文希望可以提出其他輔助選取模型的判斷標準，因此除了傳統的配適結果判斷模型的優劣以外，

還希望可以透過蒙地卡羅模擬，檢驗資料是否符合模型假設，從符合假設的模型中，選取較佳的模型。其次，透過敏感度分析，希望可以找到表現最穩健的模型，

如此即使判斷失誤，資料並非來自判斷的模型，也不會與實際結果差異太大。

本文第二章將介紹文獻探討，以及本文使用的學習模型、蒙地卡羅模擬法。

第三章會介紹本文使用的實證資料以及研究方法。第四章是資料分析，第一節介紹學習模型的必要性，之後分成四個情境資料，探討不同模型在不同情境下的表現，以及探討學習模型的敏感度分析。第五章則是結論及建議的部分。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

在文檔中賽局理論與學習模型的實證研究 - 政大學術集成 (頁 8-12)

前言

國

立 政 治 大 學

‧

第一章 前言

第一節 研究動機

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

第二節 研究目的

理論 實驗設計 電腦模擬

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

立政治大學

第一章前言

第一節研究動機

立政治大學

立政治大學

第二節研究目的

理論實驗設計電腦模擬

立政治大學

立政治大學