第一節 研究動機與目的
現代投資組合理論 (Modern Portfolio Theory, MPT) 為 Markowitz 於 1952 年 所提出,是近代金融史上一重要論述。該理論描述了投資組合對理性投資者之重要 性。而 MPT 設定投資組合報酬率之標準差即為風險,且報酬率假定為常態分配。
一方面,假設資產報酬率為常態分配將使得估計與預測相對容易,故許多研究 與實務應用上,經常假定資產報酬率為常態分配;但隨著越來越多研究結果顯示,
該項假設可能在估計結果與預估風險上將產生嚴重偏誤。
Mandelbrot (1963) 、Fama (1965) 為最早提出資產報酬率具有波動聚集現象 (Volatility Clustering),並指出資產價格並非高斯分配 (Gaussian Distribution) 即常態 分配後,陸續許多學者皆證明資產報酬率不為常態分配,例:Engle 與 Bollerslev (1986)、 Hsieh (1988) 、 Gonzalez-Rivera (1991)、 Richardson 與 Smith (1993)、
Ghose 與 Kroner (1995) 、 Pagan (1996) 、 McCulloch (1997) 、 Heyde (1999) 、 Hosking et al. (2000)、 Aparicio and Estrada (2001) 、 Lu (2005) 與 Xu 與 Hou (2006) 等,並支持資產報酬率呈厚尾 (Fat tail) 並具有高狹峰 (Leptokurtic) 之特性。
然而,在研究過程中,發現多數實證支持 t 分配 (Student’s t distribution) 較適合 用 於 描 述 資 產 報 酬 率 。 例 如 : Praetz (1972) 、 Blattberg and Gonedes (1974) 、 Hagerman (1978)、Perry (1983) 、 Bollerslev (1987) 、 Hsieh (1989)、 McNeil and Frey (2000)、Aparicio and Estrada (2001)、Glasserman et al. (2002)、Kan and Zhou (2003) 與 Broda (2012)…等,上述研究結果皆顯示,t 分配較常態分配更合適於敘述 資產報酬率其高峰厚尾之特性。
但多數研究僅止於發現資產報酬率等財金數據較服從 t 分配,卻無後續研究關 於如何應用 t 分配。詴想若當資產報酬率呈現 t 分配,但卻使用常態分配或其他分配
模型化,其在預測與分析風險上,t 分配與常態分配究竟會呈現多大的差距?另一方 面,若想了解資產報酬率之機率時,一般而言,為了便於計算,通常會假設資產報 酬率為常態分配後再進行估計。但許多研究皆指出,資產報酬率較符合 t 分配,此 時,計算機率應使用 t 分配為基礎,再進行估計應較為合理。但如此一來,該如何 計算 t 分配下其資產報酬率之機率呢?
就 t 分配之理論基礎而言,t 分配為應用於樣本數小於 30 之小樣本統計方法,
常用於假設檢定。但令人感到好奇的是,t 分配下其機率究竟如何計算呢?而翻閱坊 間之統計學相關書籍,卻鮮少提及關於如何估計 t 分配之機率。
除此之外,在諸多文獻與書籍中也發現到,t 分配之機率密度函數(Probability Density Function, pdf)1 理應是表現出高峰且厚尾之形狀,且自由度越低,其高峰狀 越明顯。但在許多繪有 t 分配之 pdf 上,卻發現在越低自由度下,t 分配居然呈現越 低峰勢之低峰狀,顯然與我們的理解有所差異,究竟為何會產生如此現象?
為了解答疑惑,本文將從眾多學者之研究成果與 t 分配之特性開始探討 t 分配,
並詴圖了解為何 t 分配之 pdf 其不合常理之處,與 t 分配之機率應如何計算;並利用 R 語言對資料進行估計,當實際資料為 t 分配時,若由其他分配如常態分配模型化 後,兩者在於估計風險上,後者產生錯估的現象與前者有何差距。在本文中,對於 風險的衡量採用兩種方法:其一為風險值 (Value at Risk, VaR) ,其二為預期損失 (Expected Shortfall , ES) 。藉此瞭解資產報酬率選用正確模型之必要性。
統整前述想法與問題後,本文之研究目的建立如下:
一、釐清與解釋 t 分配之特性與謬誤。
二、求算 t 分配之機率、風險值、預期損失,並與常態分配相互比較。
三、由實證結果探討應用 t 分配於分析財金資料之重要性。
1 為描述一隨機變量之值,在某一確定取值點附近之可能函數。而隨機變量之取值落在某個區域內時,
機率密度函數在此區域上之積分即為機率。
上述所提及之 R 語言為一種免費的自由軟體 (Free Software)2,主要應用於統計 分析、繪圖、資料探勘。R 語言源自紐西蘭奧克蘭大學 (The University of Auckland) 之 Ross Ihaka 和 Robert Gentleman 開發,因此取開發者名字之字首將該程式語言命 名為「R 語言」。
R 語言 當中包 含許多統 計模型之 數學函 數,利用 該程式即 可透過 程式套件 (Package) 或函數 (Funtion) 3指令,使得許多艱澀複雜的統計理論過程,變得較為輕 鬆地執行;簡而言之,R 語言可說是結合眾多套件所構成的大型計算軟體。R 語言 已獲許多中外知名大學院校,如:台灣大學、清華大學、屏東大學、史丹佛大學 (Stanford University)、約翰霍普金斯大學 (Johns Hopkins University) …等,皆開設 相關課程教授,且近年來國內外多家企業或機構,利用 R 語言對數據進行分析之風 氣亦蔚為流行,包括 Google、Facebook、Agoda、Intel…等企業。
國際知名的 KDnuggets 論壇最新統計,R 語言已經連續三年獲得資料科學家採 用資料分析語言第一名的殊榮4。本文採用 R 語言進行研究與分析,透過 R 語言,
不但能取代許多複雜的數學式,更使得估計與找尋問題的解答變得相對容易,而在 本文內,對 R 語言之應用亦有其說明。
本文於實證中,利用檢定台灣加權股價指數、倫敦黃金現貨與北海布蘭特原油 等資產其報酬率之分配形式,且考量保有四種不同天數之資產報酬率,用以探討資 產報酬率在不同持有天數下之變化情形;並詴圖了解若資產報酬率呈現 t 分配,卻 使用常態分配或是歷史法計算 VaR 與 ES,究竟與使用 t 分配所計算之 VaR 與 ES,
會 產 生 何 種 程 度 之 差 異 。 於 研 究 方 法 上 , 採 用 最 大 概 似 估 計 法 (Maximum-Likelihood Estimation, MLE) 估計所需之未知參數值,並利用兩種訊息評選指標 AIC 與 BIC 判斷最適模型。
2 根據自由軟體基金會之定義,是一類可不受限制地自由使用、複製、研究、修改和分發的,並且尊
重使用者自由的軟體。
3 在數學中,函數是描述每個輸入值對應唯一輸出值的一種對應關係。例如,把實數 x 聯繫到其平方
x2的對應關係,就是一個函數。若以 3 作為此函數的輸入值,所得的輸出值便是 9。
4 2014 台灣資料科學愛好者年會之資料 http://twconf.data-sci.org/about/r_tutorial.html
VaR 已被各界廣泛地用來評量下檔風險 (Downside risk),不論是作為投資決策 或管理風險上,首重 VaR 的計算為其考量;而 VaR 有其理論上之限制與不足,故本 文再利用估計資產報酬率之 ES 作為評估風險的方法。ES 在許多期刊上被多數學者,
例如:Aloui, C. 和 ben Hamida, H. (2014) 、Degiannakis et al. (2013) 、Rossignolo et al. (2012) …等認為是更適合用於預測風險,因 ES 具有較 VaR 更能捕捉尾部風險之 優點,且對於提高極端報酬預測有更好的效果。
另外,本文特別將研究中用於估計與模擬之 R 語言程式,均附註於附錄中,提 供給讀者與先賢後進作為驗證或參考之用。最後,冀望藉由本文研究,達到拋磚引 玉之效,開啟後續更多關於應用 t 分配於財金領域之研究。
第二節 研究架構
本文全文架構共為五章,最後為本文附錄,各章節摘要如下:
第一章:緒論,共分作兩小節,第一節為本文之動機與目的,第二節為本文之 研究架構與流程圖。
第二章:文獻回顧與探討,本章分作兩小節,第一節為探討資產報酬率呈何種