• 沒有找到結果。

立 政 治 大 學

Na tiona

l Ch engchi University

1

第一章 前言

第一節 研究動機

賽局理論(Game Theory)是經濟學的一個分支,用於研究人類的決策及行為,

有助於了解人們如何制訂策略,在日常生活中有許多賽局理論的應用。賽局理論 主要在探討的問題是雙向互動,我的計算必須考慮你的計算,而你的計算也考慮 了我的計算,為一門研究 「多人決策」(包括兩人)之間的問題。賽局中的每一 個人的決策,會受到賽局中其他人的影響。個人的報酬不只根據自己的選擇,也 取決對手的決定,因此使得賽局理論更加複雜。例如:市場上只有甲乙兩家公司,

且生產的產品同質,若整個市場對產品的需求量固定,甲乙公司分別可以選擇製 造高產量或是低產量,下表列出兩家公司不同策略所能得到的報酬。

表 1.1、市場報酬矩陣 乙公司

甲公司 高產量 低產量

高產量 (50,50) (120,20) 低產量 (20,120) (80,80)

註:(A,B)分別代表(甲公司,乙公司)的報酬 單位:萬元

根據表 1.1 的報酬表,如果雙方選擇的是高產量,此時供給大於需求會導致 價格變低,產量變高卻只能各獲利 50 萬元。如果甲公司選擇高產量,乙公司選 擇低產量,生產高產量的甲公司可以獲得龐大利益 120 萬元,選擇低產量的乙公 司只能獲得 20 萬元;反過來說,若乙公司選擇高產量,甲公司選擇低產量,乙 公司的獲利較高;如果雙方都選擇低產量,因為供給小於需求使得價格上漲,提 高邊際利潤,因此雙方都可以 獲利 80 萬元。此時,若你是甲(乙)公司的決策者,

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

2

你會選擇什麼策略?

當然實際上一定不如上述問題那麼簡單,但是多少可藉由簡化問題獲得有用 的想法。由上例來看,如果乙公司選擇的是高產量的決策,甲公司該如何應對呢?

如果甲公司選擇高產量,公司就會獲利 50 萬元,如果選擇低產量,公司僅能獲 利 20 萬,相較之下理性的總經理應當會選擇高產量的決策如果乙公司選擇的 是低產量的決策,甲公司若選擇低產量,可以獲利 80 萬元,若選擇高產量則可 以獲利 120 萬元,此時甲公司的總經理應當還是會選擇較高報酬的高產量。綜觀 以上分析,不管乙公司選擇什麼策略,甲公司都會選擇高產量,對乙公司而言也 是如此,因此最後雙方都會選擇高產量的決策,這也是著名的奈許均衡(Nash Equilibrium)。奈許均衡主要應用在非合作博弈,假設人是理性且自利,因此只 選擇對自己最有利的策略,不將對手的報酬列入考量。以上例來看,不管對手的 公司選擇為何,選擇高產量可獲得較高報酬,因此「高產量」就是均衡或是最佳 決策。

表 1.2、囚犯困境償付矩陣 犯人乙

犯人甲 坦承 沉默

坦承 (-8,-8) (0,-10) 沉默 (-10,0) (-1,-1)

註:(A,B)分別代表(犯人甲,犯人乙)的報酬 單位:年

上述兩家公司的範例,屬於眾所皆知的囚犯困境(Prisoner Dilemma)賽局。常 見的敘述為有兩個囚犯,在一次案件中同時被逮捕,警方分別將兩人分開偵訊,

如表 1.2 所示,若兩人都坦承,分別會被判八年刑期;若一人坦承一人沉默,坦 承的人因轉為證人而無罪釋放,而沉默的人必須負擔十年刑期;如果兩人同時保

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

3

持沉默,則因罪證不足僅能以較輕微的罪名起訴,兩人只會被判一年刑期。從奈 許均衡理論推測,若雙方為理性且自利的,最終都會選擇坦承。

從單一回合的囚犯困境,可以從理論基礎找到帄衡點,但重複的囚犯困境就 又不同了,以上述生產的例子來說,假設兩家公司的決策僅會影響一季的生產量,

未來長久的日子裡,兩間公司每一季都會遇到相同的問題,雙方也都知道長期選 擇低產量是對雙方最好的策略,但是每一次都陷入該選擇高產量還是低產量的決 策問題,因為你不知道另一個搭擋到底是競爭對手,還是合作夥伴,此時若你是 公司的總經理,又該如何做決策呢?

像這樣重複的囚犯兩難問題,可能存在兩個以上的最佳決策,有別於奈許均 衡的單一帄衡點,雙方有可能會為了長期合作而選擇合作。實證上,經濟學家以 學習模型(Learning Model)解釋人在重複賽局的學習行為,但過去研究選擇模型 時,通常是依據配適結果或交叉驗證的標準,缺乏統計分析比較有系統的模型選 擇,因此本文希望引進迴歸分析的操作模式選取最佳學習模型。

第二節 研究目的

如果挑選學習模型以較小變異數或最大概似估計量為優劣準則,可能會和迴 歸分析遭遇類似的問題,變數愈多、誤差愈小(或是R2愈大),但R2最大不見 得是最適合的模型,還必須檢查殘差是否符合迴歸模型假設,如:服從常態分佈、

資料獨立、變異數同質等。但是重複賽局的資料有時間先後關係,因此資料不服 從獨立假設,增加分析的複雜性,因此建議以電腦模擬解決。

賽局一開始探討理論較多,從簡單的零和賽局證明「壞中取小」定裡,到之 後非合作博弈賽局證明奈許均衡,都是賽局理論之一。賽局理論主要探討的是單

理論 實驗設計 電腦模擬

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

4

回合的賽局,單回合的賽局通常存在均衡點,而重複賽局僅以理論較難證明存在 單一均衡點。又或許可以推論有單一均衡點,但實際上人的決策卻未必會與理論 結果一致,因此經濟學家透過實驗,記錄人在重複賽局中的決策行為,觀察實際 上人的決策變化,並以學習模型解釋人的決策行為,此為實驗經濟。而除了實驗 數據,本文也將電腦模擬應用在賽局上,探討理論上學習模型的特性。

本文實證的資料,從實驗經濟出發,利用實證資料帶入模型,與以往實驗不 同的是多人重複的囚犯困境賽局,以及實證資料的遊戲規則。本文希望可以提出 其他輔助選取模型的判斷標準,因此除了傳統的配適結果判斷模型的優劣以外,

還希望可以透過蒙地卡羅模擬,檢驗資料是否符合模型假設,從符合假設的模型 中,選取較佳的模型。其次,透過敏感度分析,希望可以找到表現最穩健的模型,

如此即使判斷失誤,資料並非來自判斷的模型,也不會與實際結果差異太大。

本文第二章將介紹文獻探討,以及本文使用的學習模型、蒙地卡羅模擬法。

第三章會介紹本文使用的實證資料以及研究方法。第四章是資料分析,第一節介 紹學習模型的必要性,之後分成四個情境資料,探討不同模型在不同情境下的表 現,以及探討學習模型的敏感度分析。第五章則是結論及建議的部分。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

5

相關文件