• 沒有找到結果。

立 政 治 大 學

Na tiona

l Ch engchi University

58

第五章 結論及建議

第一節 結論

一開始賽局的發展著墨於理論較多,從單一回合的賽局,通常可以從理論證 明均衡狀態,接著經濟學家以賽局實驗驗證理論,發現多回合的重複賽局不如理 論所述,因此使用學習模型解釋人的學習行為,爾後也漸漸使用電腦模擬,探討 各種學習模型的特性等等。

在重複的賽局問題裡,經濟學家以學習模型解釋人的學習行為,而過去決定 模型通常以模型配適結果(最小均方差或最大概似估計量),或者是以模型預測能 力(交叉驗證)來判斷模型好壞,但這樣僅能比較模型之間的好壞,無法說明模型 是合適的,有可能配適結果是最好的,但是資料卻不符合模型的假設。就如同迴 歸模型,除了比較Radj2 .或者是 AIC、BIC 以外,還會對其殘差做多種檢定,如:

常態檢定、變異數同質性檢定、獨立性檢定等。

因此本文希望引進統計概念驗證模型假設,提出輔助選取模型的標準,本文 提出輔助的標準有:F 檢定以及驗證模型假設。而賽局資料裡,驗證資料是否* 符合模型假設會有困難,因為沒有好的分佈可以解釋賽局資料,而且資料彼此不 獨立,對於這樣的資料,較難提出分佈假設驗證。因此本文使用蒙地卡羅模擬驗 證這件事情,如果資料可以用某個學習模型解釋,則實證資料應可視為其中一筆 亂數,模擬亂數特性的信賴區間也應包含實際值特性,用此種方法驗證模型假設,

雖然不能說符合信賴區間就是正確的模型,但藉由這樣的方法至少可以挑出不正 確的模型,進而從剩下的模型中挑出較佳的。而分析之後的結果得到幾個結論:

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

60

察到較複雜的模型其模擬結果未必就會較好,以 RM 與 WH 情境來看,加權經 驗吸引模型的模擬結果就不如增強學習模型。

三、學習模型的穩健性

在第四章的敏感度分析中,發現增強學習模型比起其他模型都來的穩健,因 此在囚犯困境的賽局資料中,即使實證資料不是來自增強學習模型(RL),亦可以 用此模型配適,從模擬結果看來,其配適結果會與實際模型非常接近,此結果與 之前的分析有一致的結果,顯示增強學習模型非常適合描述囚犯兩難的賽局資 料。

第二節 後續發展與建議

本文主要針對修正估計參數以及選取學習模型做探討,本文使用的資料都僅 有一組數據,因此無法確定資料是否具有樣本代表性,但本文主要希望提出輔助 方法幫助選取模型,因此在樣本代表性較少討論,而之後建議可實驗多組數據,

以增加驗證模型假設的證據。另外,實證資料僅使用囚犯兩難賽局做實驗,或許 可以嘗詴不同類型的賽局,探討學習模型是否也能捕捉其他不同賽局的資料特 性。

本文主要考慮的資料特性為合作機率以及轉換機率,但是僅以這兩種機率描 述賽局資料的特性似乎仍有點不足,或許有不同的特性更能描述賽局資料。而現 有的學習模型通常偏向漸漸收斂的效果,但是有些人在某些規則下似乎顯得震盪 (較游移不定),或許可以嘗詴找出新的模型解釋某些人的震盪行為。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

61

參考文獻

中文部分

張宮熊(2009):"賽局:又稱博奕論"高雄市:玲果國際文化出版。

劉常勇(2008):"賽局理論中的雙贏策略"。

取自 http://cm.nsysu.edu.tw/~cyliu/paper/paper10.html

英文部分

Anderson C. and Camerer C. F. (2000) , “Experience-weighted Attraction Learning in Sender-receiver Signaling Games,” Economic Theory, 16(3), 689-718

Arifovic J. and Ledyard J. (2004), “Scaling up learning models in public good games,”

Journal of Public Economic Theory 6, 205–238

Bendor J., Diermeier D., and Ting M.(2003), “The Predictive Power of Learning Models in Social Dilemma Research,” Stanford University working paper.

Cabrales A. and Garcia-Fontes W. (2000), “Estimating Learning Models with Experimental Data,” University of Pompeu Febra working paper 501.

Cabrales A., Garcia -Fontes W. and Motta M. (2000) , “Risk Dominance Selects the Leader. An Experimental Analysis,” International Journal of Industrial Organization, 18:137-162.

Camerer, C. F., and Ho, T. (1999) , “Experience-weighted attraction learning in normal form games,” Econometrica 67, pp. 827–874.

Camerer C.F.(2003), “Behavioral Game Theory: Experiments in Strategic Interaction,”

Princeton Univ. Press, Princeton, NJ.

Cournot, A. (1960), “Recherches sur les Principles Mathematiques de la Theories des Richesses,” Translate into English by N. Bacon as Researches in the

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

62

Mathematical Principle of the Theory of Wealth. London: Haffner

Erev I. and Roth A. E.(1998), “Predicting how people play games with unique, mixed-strategy equilibria,” Amer. Econom. Rev., vol. 88, pp. 848 - 881.

Friedman D.(1998), “Evolutionary economics goes mainstream: A review of the theory of learning in games,” Journal of Evolutionary Economics, 8: 423-432.

Jacob K. Goeree, Charles A. Holt, and Thomas R. Palfrey(2002), “Quantal response equilibrium and overbidding in private-value auctions,” Journal of Economic Theory, 104(1):247-272

Joy Woller(1996) , “ The Basics of Monte Carlo Simulations,” Retrieved from http://www.chem.unl.edu/zeng/joy/mclab/mcintro.html

Lai Y.H.(2005), “A Study of Learning models for analyzing prisoners' dilemma data,” Working Paper, Chengchi university.

McKelvey, R.D. and Palfrey, T.R.(1995), “Quantal Response Equilibria for Normal Form Games,” Games and Economic Behavior, Vol. 10, pp. 6–38.

Sutton R.S., Barto A.G.(1998), “Reinforcement Learning: An Introduction,” MIT Press, Cambridge, MA.

Yang C.-L., Yue J.C. and Yu I.-T. (2007) , “The Rise of Cooperation in Correlated Matching Prisoners Dilemma: An Experiment,” Experimental Economics 10, 3-20.

Yang C.-L. and Yue, C.J.(2010), “Assortative Matching, Information and Cooperation:

An Experiment,” Economics Bulletin (SSCI), vol. 30(1), 414-420.

相關文件