演化式類神經網路應用於台股指數報酬率之預測
周宗南1 劉瑞鑫2 摘 要
本研究建構四種時間序列之計量與人工智慧模型,探討各模型在純粹的時間序列資料中之預測績 效表現。除了單純的ARMA模型及倒傳遞類神經網路模型外,藉由基因演算法演化類神經網路中權重與 偏權值後,利用網路再進行訓練的兩階段演化式類神經網路模型,可用來避免類神經網路中可能收斂 不完全及無法符合資料特性之缺失。最後則結合時間序列與人工智慧模型,將GARCH變數加入類神經 網路中,觀察加入報酬波動的類神經網路模型之表現能否較單純的類神經網路佳。在衡量模型的績效 準則上分為預測誤差、方向準確度與預測涵蓋能力等三個部分,觀察四種模型在不同準則下的預測能 力。結果顯示兩階段演化式類神經網路模型,在預測誤差、方向準確度上皆優於其他模型,並且可改 善類神經網路過適化問題。ARMA模型在方向準確度上表現不佳,顯示時間序列模型由於統計上的假設 與限制,相異於人工智慧模型為尋找資料間的對應關係。在預測涵蓋性能力上,則以兩階段演化式類 神經網路可涵蓋其他模型,顯示兩階段演化式類神經網路模型可捕捉到其他模型所沒有的訊息。
關鍵詞:倒傳遞類神經網路、基因演算法、ARMA 模型、GARCH 模型
Abstract
This study applies four models, including ARMA model, the back-propagation neural network (BPN), genetic algorithm based neural network (GANN) and neural network with GARCH parameter (GARCH-BPN), to predict return. By acquiring the weight and bias values based on genetic evolution and retraining process, the GANN model can avoid the over-fitting of BPN model and reduce the effort of training process. The GARCH-BPN model involves the impact of the conditional variance of returns within the neural network to predict returns. The performance measurement criteria consist of the forecast error, directional accuracy and forecast encompassing test to compare the predicting ability of models. The results show that GANN model is better than other time-series and artificial intelligence models in most criteria. The inferior of the ARMA model reveals the time-series model in virtue of statistical assumptions and restrictions which differ from artificial intelligence model finding the corresponding relationship betweens inputs and output values. During forecast encompassing test, the GANN encompasses others models, denotes the GANN model can capture more information of the data set than other models.
Key word::Neural Network, Genetic Algorithms, ARMA, GARCH
* 作者非常感謝評審委員的寶貴意見
1 朝陽科技大學財務金融系助理教授
2 朝陽科技大學財務金融所碩士
壹
、緒論
一般之經濟資料皆具有時間序列之關係,因此在對其進行估計及預測時必須利 用時間序列模型。常用之時間序列模型包含了自我迴歸(Autoregressive)及移動平 均(Moving Average)兩部分。自我迴歸部分以本身資料之滯後項作為迴歸模型中之 自變數;而移動平均部分則採用殘差項之滯後項作為迴歸模型中之自變數。除了傳 統的計量模型外,人工智慧中之類神經網路、基因演算法亦可應用於時間序列資料 分析。類神經網路(Artificial Neural Network;ANN)具有強大學習能力及容錯能 力,透過其架構中隱藏層與神經元的不同搭配,並藉由訓練加以學習進而解決資料 中線性及非線性的問題,近幾年來有許多學者將其應用在財務領域中,像是財務預 警、股市分析、信用評等相關議題,有人轉而與傳統模型相結合,也得到不錯的評 價。而基因演算法(Genetic Algorithms;GA)則是一種有關最佳化方面的搜尋技巧,
取法於自然界的物競天擇、適者生存之道,其原理是將問題視為生存環境,而隨機 產生一群可能的解答(母代),所有母代透過篩選(Selection or Reproduction)、交 配(Crossover)及突變(Mutation)等程序,依據其在生存環境的適應函數值高低,加 以評判母代之好壞,產生較母代優質的新個體,由於新生代(Offspring)中的基因會 是較優良而予以保留,劣質基因則會被漸次淘汰,反覆執行直到找出滿意之解答為 止。基因演算法在搜尋、最佳化、機器學習,控制問題上已獲至相當成功的結果。
本研究利用台灣加權股價指數報酬率作為時間序列上之研究樣本,建立一般之 時間序列 ARMA 模型以及其他不同之人工智慧模型,包括有倒傳遞類神經網路、結合 基因演算法與類神經網路及再訓練程序之兩階段演化式類神經網路以及加入 GARCH 變數的類神經網路共四種模型,透過不同之準則方式,觀察各模型在時間序列資料 的估計與預測上之績效表現,期能提供後續研究者在使用人工智慧模型時有較深入 的瞭解及做有效的運用。
貳、文獻探討
在一般財金或經濟方面之變數上,多具有前後期相關之程度存在,因此在對資
料進行估計時常應用到時間序列之計量方法。而其中 Box and Jenkins (1976)透過 一連串之方程式運算,進而推導出時序資料中存在之關係而形成 ARMA 模型。此外也 有其他學者進而衍生出各種不同之時間序列模型。時間序列模型之演進在鄭天德 (2002)有詳盡之說明。 Koreisha and Fang (1999)討論了 ARMA 模型中預測誤差之 影響;另外 Makridakis and Hibon (1997)則解釋為何在樣本內的估計能力通常簡 單的時間序列模型便已足夠,主要的關鍵在於資料的定態方式。另外 Chen (1996) 則利用 MSE 最小法對 ARMA 模型在短期預測時進行監督之方式,逐步修正其係數。雖 然 ARMA 模型可以應用在報酬的估計或預測上,但後來有學者發現報酬波動並非是一 固定常數,而是會隨著時間的不同而有所變動。且報酬波動也存在著自我相關的特 性。在 1982 年 Engle 提出自我迴歸異質條件變異數(ARCH)模型,有關於條件變異數 (即報酬波動)隨時間變動而不同的相關議題就被廣泛的研究。接著 Bollerslev (1986)則修正了 ARCH 模型,使條件變異數不僅受前期之預測誤差項平方的影響,也 受前期條件變異數的影響,提出一般化自我迴歸異質條件變異數(GARCH)模型。由於 GARCH 模型為衡量波動的模型,因此多數研究皆進一步的將其應用在選擇權的定價 方面。像是黃婉茹(2001)、林裕崇(2001)等。
在計量模型中,要求變數間之關係為線性,否則必須採用其他非線性模型估計,
而在類神經網路中,只需增加隱藏層數目便可達到估計非線性關係之效果,且如前 所述,變數間之交互關係包含於網路之架構中,因此陸續有學者利用類神經網路來 建構模型。例如 Chenoweth, Hubata and Louis(2000)、Hwarng and Ang (2001)利 用類神經網路估計或比較在不同 ARMA 參數上其能力是否有所提昇。楊琪倫(2001)、
林昇毅(2000)、楊雯寧(2001)、蔡榮裕(1998)之研究則針對期貨、外匯或是股票等 市場,使用類神經網路加以估計或預測,在其結論中也顯示類神經網路與其他模型 之預測能力相比後確實較佳。另外 Donaldson、Kamstra (1997)將類神經網路與 GARCH 相結合,將 GARCH 所捕捉不到的非線性或無法估計之波動訊號利用類神經網路取 得。而在其另一篇文章中(1999)也討論了類神經網路、OLS 模型及 GARCH 模型對於 擷取交互作用的能力上作一分析。由於類神經網路運算過程中可能落入區域解之問 題,因此利用基因演算法之全域搜尋法則,可對類神經網路之訓練作一修正。其中 包括了林聖哲(2002)針對認購權證建構不同之人工智慧評價模型。鍾澄吉(1997)將
類神經網路與基因演算法結合後,用來估計與模擬台灣 30 家上市公司之選擇權波動 率。而梁世璋(1998)、沈宗澤(2001)則是利用基因演算法對類神經網路之訓練函數、
或其輸入值加以演化。在國外研究中, Nag and Mitra (2002)、Cook, Ragsdale and Major (2000)、Tsukimoto and Hatano (2003)則利用基因演算法對類神經網路之參 數設定進行搜尋,找出績效最佳之參數值。
綜合以上各種文獻後,發現類神經網路及基因演算法之變化性高、適用範圍廣 大,可應用在時間序列上,因此本研究選取台灣股市加權股價報酬率作為時間序列 之樣本,除了使用時間序列模型中的 ARMA 及 GARCH 模型外,並且以時間序列之方式 建構類神經網路,針對類神經網路所可能存在之問題,藉由基因演算法加以改良,
此外並另加入 GARCH 變數至倒傳遞類神經網路中,觀察是否有助於模型的建構。最 後透過預測誤差、預測方向準確度與涵蓋性檢定之準則,衡量各模型在測試樣本之 績效表現。
叁、研究方法
本研究希望比較四種包括時間序列計量模型與人工智慧模型在預測台股指數報 酬率之能力。因此分別針對所使用之模型做一介紹。
一. ARMA 模型
時 間 序 列 模 型 中 變 數 本 身 會 因 時 間 因 素 , 而 造 成 資 料 本 身 產 生 自 我 相 關 (Autoregressive)的現象存在。另外,在殘差項也有可能會具有自我相關的現象,
此稱為移動平均(Moving Average)。因此 ARMA(p,q)可分為兩個部分,一部份為 AR(p),代表序列受到前 p 期之數值影響;第二個部分為 MA(q),代表序列受到前 q 期之殘差項數值影響。
式(3-1)為常用的 ARMA(p,q)模型:
1 0
1
q
j t
j p
t i t i t j
i
b u
r a a r ε
− = −
=
= +
∑
+∑
+ (3-1)其中,i、j 分別為自我相關與殘差項的相關滯後期數、ε 為誤差項,μ 為服
從白噪音分配之殘差項。此 ARMA 模型為本研究所使用的第一種模型。另外在進行 ARMA 模型的估計時,必須對時間數列資料進行一些相關之檢定,確定資料不具單 根,為一定態數列,才可進行 ARMA 的估計。
二. 倒傳遞類神經網路(BPN)
本研究所使用的第二種模型為倒傳遞類神經網路,採用前 5 期的報酬率 r t-1、r
t-2、r t-3、r t-4及 r t-5作為推論當期報酬率 r t的輸入神經元。其網路架構為透過基 因演算法演化網路拓撲求得為 5-7-4-1 架構,即輸入層有五個輸入神經元、有 7 個 隱藏神經元的第一層隱藏層、4 個隱藏神經元之第二層隱藏層以及包含一個輸出神 經元之輸出層。輸入與輸出向量均以極小值與極大值方法進行尺度化(Scaling)的前 處理與後處理。另外,網路的轉換函數則採用雙曲線正切函數。
三. 兩階段演化式類神經網路(GANN2)
本研究所使用的第三種模型乃將基因演算法運用在連結權重與偏權值的計算 上,首先由類神經網路的架構,得知所需的權重及偏權值數目共 79 個(權重有 5*7+7*4+4 個另加上 12 個偏權值),隨後建立基因演算法中之染色體,隨機的產生 10 個初始族群後,將每條染色體代入先前架構好的類神經網路中,得到類神經的輸 出值。並將此輸出值與實際值相比,而基因演算法中的適應函數(Fitness Function) 可表示為下式:
( )
1 2
1 1
1 1
T
actual gann t
FF r r
T =
= −
−
∑
$其中,
r
actual為真實的目標值(當期報酬率),r$
gann為演化式神經網路所得到的輸出值,
T
1為估計樣本數。若誤差已達收斂,則代表此網路已建構完成,若誤差未 達收斂,則依據各染色體適應函數的高低進行基因演算法中挑選、交配與突變的程 序步驟。透過基因演算法演化得到最佳族群後,將其數值代入原先倒傳遞類神經網 路之權重及偏權值,讓網路架構進行再訓練過程。其流程如下:四. 含 GARCH 之倒傳遞類神經網路(GARCH-BPN)
在前述的時間序列模型中若殘差的變異數並非為一固定之常數,不僅隨時間改 變,且彼此有所相關。因此 Bollerslev (1986)提出一般化自我迴歸異質條件變異 數(Generalized Autoregressive Conditional Heteroskedasticity,GARCH)模型。
而 GARCH(1,1)模型可表示如下:
2
0 1 1 1 1
t t t t
h
=
A+
A u−+
B h−+
z (3-2) 其中,ut2−1為前期誤差項平方、ht−1為前期條件變異數,zt為一服從白噪音分配誤差未達收斂 誤差已達收斂
或已達演化代 數
隨機產生初始族群 (取得權重之組合)
將權重代入類神經網 路,直接模擬得到輸出值
決定權重組合相對應適應值 (輸出與實際值之誤差)
依適應值高低進行配對 選擇
進行基因挑選(Selection)、交配 (Crossover)、突變(Mutation) 程 序,產生新世代的權重組合
建立類神經網路架構
圖 1. 兩階段演化式類神經網路運作流程圖 進行第二階段類神經
網路訓練至收斂完成
之殘差。
GARCH-BPN 模型除了使用前五期之對數報酬率作為輸入神經元外,另外使用式 (3-2)建立 GARCH 之時間序列模型,將所估計之條件變異數作為第六個輸入神經元,
以比較在考量了報酬波動後之倒傳遞類神經網路,對於時間序列資料的估計與預測 上是否較其他模型來的佳。
肆、研究設計與績效評定方法
本研究所蒐集的資料樣本是取自於台灣經濟新報資料庫中的台灣集中市場加權 股價指數取自然對數後的日報酬資料,樣本期間為 1995 年 1 月 5 日至 2000 年 10 月 9 日,共有 1605 筆日報酬資料。但保留後 100 筆的資料作為樣本預測的比較,因 此在估計樣本中共 1500 筆資料。當取得樣本後,首先對數列資料作基本的統計量檢 定、自我相關檢定,以確定是否可以利用時間序列模型加以估計。另對於資料是否 具有異質變異數之問題,則採用 Engle (1982)提出的 LM 檢定(Lagrange Multiplier test),檢定在條件平均數的誤差項是否具有異質變異數的現象存在。本研究所使用 的 檢 定 方 法 包 括 單 根 檢 定 (Unit Root test) 檢 定 一 序 列 是 否 為 定 態 的 序 列 (Stationary series)。Ljung-Box Q 檢定觀察樣本資料是否具有自我相關的現象。
ARCH 效果檢定(LM test)檢測條件變異數估計完成之後,其殘差項是否仍具有異質 變異數的現象。
績效評定方法中,大致分類為三種。第一種為預測誤差的衡量,包括有 MSE、
MAE。第二種為方向準確度的衡量,針對預測之方向是否與實際值相同,包括有 CSR、
DA 檢定以及利用預測方向進行投資策略的 Strategy。第三種則是預測涵蓋性檢定分 析各模型是否有其他模型所沒有的資訊存在。
一. 預測誤差的衡量
MSE 準則:均方誤差(Mean Square Error)乃計算實際值與預測值之預測誤差後取 平方並加以平均。
MAE 準則:平均絕對誤差(Mean Absolute Error)考慮了誤差之絕對距離。
二. 方向準確度的衡量
符號正確率(Correct Sign Ratio;CSR):衡量預測與實際之方向是否正確,由於 在報酬率預測上之準確度並不高,因此若考量了模型所預測之值與實際值間的方向 是否相同,亦可比較出模型之好壞,若 CSR 低於 50%時,則代表此模型對於報酬率 方向之預測能力還不如隨機猜測之 50%來的佳。
方向準確檢定(Directional Accuracy):其檢定方法將預測值對實際值之方向準 確度轉化成為機率,在計算其標準差後,即可採用標準常態分配予以檢定。
Strategy:Strategy 為 CSR 所衍生出之另一種衡量方式,藉由模型之預測方向而 進行投資策略。當模型預測為正報酬時,則予以買進,所獲得之報酬為當日股市之 實際報酬;若模型預測為負報酬時,則予以放空,同樣地可獲得當日股市之實際報 酬。但先前假設為預測方向與實際方向相同才可成立,若方向相反時,則報酬應轉 為損失。雖然 CSR 可以得知模型之在預測方向之能力,但透過 Strategy 可以更清楚 的知道若是採用模型之預測方向進行投資策略時,所獲得之報酬會是多少。
三. 預測涵蓋性檢定
預測涵蓋性檢定:在預測之檢定上,Clements and Hendry(1998)所提出之預測 涵蓋性檢定(forecast encompassing test)。若模型 A 的預測無法涵蓋模型 B,則 表示模型 B 中存在著可以預測資料的訊息,且這些訊息是模型 A 中所沒有的。
伍、實證結果
本章根據先前所擬定之研究設計與流程,對樣本建立估計模型並做一分析與比 較。本研究使用 E-VIEWS 4.1 版處理時間序列資料,而 Matlab 6.0 版為執行類神經 網路與基因演算法之軟體。
模型 1:ARMA 模型
由樣本之敘述性統計檢定量的結果可發現在樣本期間中,報酬序列資料呈現左偏的 高狹峰分配型態,而非為一常態分配。接著本研究利用擴展型的 Dickey and Fuller
(1979,1981)方法,檢定報酬序列是否具有單根。單根檢定統計量為-37. 27,小於 1%顯著水準下的臨界值-3. 964。因此報酬序列拒絕有單根的虛無假設,表示報酬序 列具備平穩的特性。為了確定資料樣本是否可以使用時間序列模型來加以估計。採 用 Ljung-Box 的 Q 統計量檢定日報酬序列是否具有自我相關的現象。日報酬序列的 6、12、18 階自我相關檢定中,在 1%顯著水準下,其 Q 統計量分別為 17.498、20.917、
39.268,其 p 值皆小於 0.01,拒絕了無自我相關的虛無假設日報酬率序列具有自我 相關的現象。因此採用時間序列的 ARMA 模型加以估計。本研究採用計量分析時一般 慣用的 Akaike 準則(Akaike’s information criterion , 簡稱 AIC)及 Schwarz 準 則(Schwarz’s criterion , 簡稱 SC)來共同決定自我相關與移動平均的最適期 數。在決定了 ARMA 之期數後,便可得到估計的 ARMA 模型。估計結果如下表:
表 1. 報酬率條件平均數模型估計結果
估計參數 估計值 t 值
a0 0.017102 0.431301
a1 -0.789366 -177.8874***
a2 -0.985641 -231.0006***
b1 0.824336 31.26782***
b2 1.026303 49.72778***
b3 0.039765 1.527930
***表在顯著水準為 1%時顯著
由表中可發現,在估計的六個係數中,僅有截距項及滯後第三期的 MA 項並不顯 著,而表中之係數顯示了台股指數之報酬率與前兩期之報酬及前兩期之殘差項有顯 著之相關;且當期之報酬率與前兩期之報酬率皆呈現負向的關係。在經過 ARMA 的估 計後,模型殘差項的 Q 統計量在 6 階、12 階、18 階分別為 3.24、7.02 以及 19.76,
其 p 值皆大於 0.1,代表經 ARMA 估計後殘差項並不具有自我相關的現象。
模型 2:倒傳遞類神經網路
倒傳遞類神經網路使用之參數值設定如表 2,其網路架構為透過基因演算法演
化網路拓撲求得,其中訓練次數為 1000 次,而訓練函數採用結合適應性學習速率與 動量之演算法。在訓練 1000 次後之 MSE 為 0.0537665,但由於資料必須經由後處理 程序以還原到原先的尺度,在經過後處理後,倒傳遞網路之 MSE 為 2.11。
表 2. 類神經網路參數設定
參數 設定值 參數 設定值
Input 5 Goal 0 Hidden1 7 Learning Rate 0.01 Hidden2 4 Decrease Learning
Rate 0.7 Output 1 Increase Learning
Rate 1.05 Training function TRAINGDX Max fail 5 Adaption learning
function LEARNGDM Max perform increase 1.04
Epochs 1000 Minimum grad 1e-006
模型 3:兩階段演化式類神經網路
本模型首先由基因演算法找出類神經網路中最適之權重及偏權值,其中基因演 算法的運算為採用 100 代之演化代數,並使用實數編碼、交配方式採用實數型的均 勻交配、挑選方式為整體抽樣挑選以及突變率為 10/79;而類神經網路之架構則是 原先的 5-7-4-1 之網路結構。而兩階段則是增加類神經網路再訓練的步驟,透過再 次的訓練可使網路架構更符合資料之特性。經由倒傳遞網路進行再訓練後,其 MSE 值為 0.0530776。顯示藉由類神經網路對基因演算法所搜尋之權重加以訓練後,MSE 比原先單純的倒傳遞類神經網路低。因此透過基因演算法先找出可能的網路權重 值,再經由網路訓練後可縮短網路訓練之時間及提高其效率性。而演化式類神經網 路之參數設定列於表 3。
表 3. 演化式類神經網路參數設定
參數 設定值 參數 設定值 Input 5 Mutation Function Real-value
Breeder
Hidden1 7 Chromosome 10
Hidden2 4 Generation 100
Output 1 Crossover Rate 1.
Encoding Real-value Mutation Rate 10/79 range -1~1 Insertion Rate 0.9 Selection
Function SUS Termination 1e-4 Crossover
Function Uniform
模型 4:加入 GARCH 變數之倒傳遞類神經網路
由於原先之輸入資料僅有報酬率之滯後 5 期資料,並未考慮報酬率所可能之波 動程度,因此加入 GARCH 方程式所估計出之條件變異數作為輸入神經元,並經由倒 傳遞類神經網路加以訓練,以確認在考量了當期報酬波動後,對於報酬率之估計與 預測是否有所提高。至於 GARCH 方程式的參數估計值如表 4 所示。
表 4. 條件平均數與條件變異數方程式估計結果 條件平均數方程式估計結果
係數值 P-value
α0 0.037828 0.3294
α1 -0.791017 0.0000
α2 -0.984158 0.0000
β1 0.854331 0.0000
β2 1.048246 0.0000
β3 0.067380 0.0171
條件變異數方程式估計結果
係數值 P-value
Α0 0.117905 0.0001
Α1 0.116844 0.0000
Β1 0.832545 0.0000
估計 GARCH 條件變異數方程式後,對其殘差項進行 ARCH LM 之異質變異數檢定,
在滯後五期的檢定下,其值為 4.669942,小於自由度為 5 的卡方分配 15.09。顯示 殘差項已無異質變異數之現象存在,因此採用 GARCH(1,1)方程式。在加入當期報酬 波動後,MSE 達 0.0549。
一. 預測誤差之比較
此部分針對各模型在測試樣本中,預測值與實際值間的預測誤差進行分析。
表 5. 各模型測試樣本之預測誤差分析表
ARMA(2,3) BPN GANN2 GARCH- BPN MSE 3.279667 3.353283 3.250664 3.299392
排名 2 4 1 3
MAE 1.413366 1.408269 1.398071 1.411078
排名 4 2 1 3
在表 5 之 MSE 準則中,表現最佳的為兩階段演化式類神經網路,其 MSE 為 3.250664 最佳;最大值為倒傳遞類神經網路 3.353283。顯示倒傳遞類神經網路確實 有可能造成過度配適的問題,導致預測結果有較大的偏誤。在直接考慮估計誤差之 絕對距離的 MAE 中,表 4-9 顯示最佳的模型為兩階段演化式類神經網路,其值為 1.398071,最差之模型為 ARMA 模型。由於時間序列 ARMA 模型在進行估計時為採用 最小平方法,並未採用絕對誤差進行估計,才會在 MAE 上表現較差。
二. 方向準確度之比較
觀察前述預測誤差上的分析後,由於單純使用報酬率作為估計變數較為薄弱,
對於預測之效果並無法彰顯。因此若忽略其數值大小,僅考慮其預測之方向,觀察 其與實際報酬率之方向是否相同。並加入 Pesaran and Timmermann 所提出 DA 檢定,
以檢定模型在方向性上是否與真實情況相獨立。另外,並根據預測值進行投資策略,
觀察是否可以得到超額報酬。其結果列於表 6。
表 6. 各模型測試樣本之方向準確性及投資策略績效表
ARMA(2,3) BPN GANN2 GARCH -BPN CSR 0.52 0.6 0.56 0.57
排名 4 1 3 2
DA1 0.54 2.86*** 1.64* 3.23***
排名 4 2 3 1
Strategy2 -1.34% 20.8% 11.2% 8%
排名 4 1 2 3
註 1:DA 中為各模型之 t 統計量註 2:Strategy 中大盤之報酬率為-39.22%
***表 P 值小於 0.01 *表 P 值小於 0.1
在預測方向的準確性上,表 6 的 CSR 顯示預測值與實際值方向相同準確度最高 的為倒傳遞類神經網路,達到 60%,;反之,準確度最差的為 ARMA 模型,其 CSR 為 52%。顯示在預測報酬率的方向上,ARMA 模型較不易估計或預測。整體來說,四個 模型的 CSR 皆大於 50%,顯示利用此四種模型進行預測報酬率方向時,在測試樣本 中均有不錯的表現。由於在 CSR 方法中,無法確定是否有達到統計上之顯著程度,
因此更進一步的採用 DA 檢定,確認模型之預測值在方向上是否與真實情況為獨立或 相依。在表 6 之 DA 檢定中,只有 ARMA 模型屬於不顯著,其餘人工智慧模型皆在不 同信心水準下達到顯著。因此利用人工智慧模型對報酬率之方向進行預測是有效的。
在考量預測值方向作為投資策略的比較準則下,本研究採用大盤之報酬率作為對照 組,在表 6 的 Strategy 顯示最佳的模型為類神經網路,其報酬率可達 20. 8%;而
四個模型中報酬率最低的為 ARMA 模型,但在採用 Buy and Hold 策略時,大盤的報 酬為-39.22%,代表採用此四個模型皆可擊敗大盤,應用在投資策略上皆可有不錯的 績效。
三. 預測涵蓋性檢定
在各模型預測能力之比較上,採用 Clement and Hendry (1998)的預測涵蓋性 檢定,觀察各模型間預測能力是否可以涵蓋其他模型。由表 7 發現,在第一行中,
加入 GARCH 後的倒傳遞類神經網路及兩階段演化式類神經網路可涵蓋線性之 ARMA 模型。在第二列中,則是兩階段演化式類神經網路涵蓋了倒傳遞類神經網路。而在 第三行中,兩階段演化式類神經網路涵蓋了加入 GARCH 後的倒傳遞類神經網路。
表 7 預測涵蓋性檢定中(βA , dB)的顯著性 模型 A
模型 B
ARMA BPN GANN2 BPN (X,X) GANN2 (0,X) (0,X) GARCH-BPN (0,X) (0,0) (X,0)
註:" 0 "代表估計係數顯著性之 P 值大於 5%
"X "代表估計係數顯著性之 P 值小於 5%
陸、結論
類神經網路與基因演算法為近年來新興之研究方法。其不同於計量模型中有較 多的假設與限制。類神經網路在操作概念上,為一類似資料探勘之方法,透過網路 架構及簡單的運算式,進而找尋資料中所存在之對應關係,並予以呈現。而基因演 算法之操作概念則是藉由自然界中之"適者生存、物競天擇"之方式,透過演化之過 程,所保留下來的染色體便是最符合自然界競爭環境,若將其作為應用時,則可轉 換成最符合目標函數之數值,作為最適解,避免落入區域解之問題。因此本研究同
時使用了傳統之計量模型、新興之人工智慧系統方法、以及兩者相結合之模型。其 中計量模型為 ARMA 模型,為時間序列中常用之模型;人工智慧系統有倒傳遞類神經 網路與結合基因演算法之演化式類神經網路;及利用計量模型求出報酬波動之 GARCH 數值,並將其作為倒傳遞類神經網路之輸入神經元,以作為傳統與新興方法 之結合。
綜合所有實證結果,本研究可得到下列幾項結論。第一個部分為關於預測誤差 的績效,整體來說,以兩階段類神經網路表現最佳,而倒傳遞類神經網路的表現不 佳,顯示倒傳遞類神經網路可能產生過度配適資料的問題,因此透過基因演算法進 行權重與偏權值的搜尋,並且須再藉由類神經網路的再訓練過程,可更符合資料的 特性,並降低上述的問題產生。
第二部分是僅考慮預測方向的正確性,在三個不同準則下(CSR、DA、Strategy),
ARMA 模型皆為最差,代表在進行方向預測之正確性上較為不足。而在 DA 檢定中,
人工智慧模型皆可拒絕虛無假說,顯示人工智慧模型對大盤方向進行預測是有效 的。在進行投資策略時,各模型皆可擊敗大盤,其中又以類神經網路與兩階段演化 式類神經網路為最佳。
第三部分為模型在預測之涵蓋性上,在結果中各模型只有加入 GARCH 之倒傳遞 類神經網路及兩階段演化式類神經網路可以涵蓋 ARMA 模型,其餘模型皆無法涵蓋。
另外,兩階段演化式類神經網路表現最好,可涵蓋其他三種模型,代表藉由類神經 網路對基因演算法求得權重與偏權值後進行再訓練程序,確實可以捕捉到其他模型 所沒有的資訊,也顯示兩階段演化式類神經網路是有效的。
就本研究結果而言,人工智慧模型在預測誤差、方向準確度上確實優於 ARMA 模型,但仍有可能會造成過度配適資料或落在區域解的問題產生。因此透過基因演 算法演化權重及偏權值的兩階段演化式類神經網路可避免過度配適資料的問題,同 時也顯示藉由網路的再訓練過程才可讓網路收斂並更加符合資料特性。此外,加入 有效的變數(GARCH 條件變異數)作為類神經網路的神經元,確實可提高提高模型之
預測能力。
參考文獻
中文文獻
1、 鄭天德(2002),「ARMA-TGARCH 模型之建立」,國立交通大學經營管理研究所碩 士論文。
2、 黃婉茹(2001),「組合型認購權證評價模型之研究」,真理大學管理科學研究所 碩士論文。
3、 林裕崇(2001),「Price FTSE 100 Index Options Under GARCH Option Valuation Model」,國立中正大學財務金融研究所碩士論文。
4、 楊琪倫(2001),「台灣指數期貨開盤價預測之研究」,輔仁大學管理學研究所碩 士論文。
5、 林昇毅(2000),「台股指數期貨之預測—模糊時間序列之應用」,朝陽科技大學 財務金融研究所碩士論文。
6、 楊雯寧(2001),「台灣股價指數模型之探討」,元智大學工業工程與管理研究所 碩士論文。
7、 蔡榮裕(1998),「現貨盤後期貨交易資訊內涵之研究」,輔仁大學金融研究所碩 士論文。
8、 林聖哲(2001),「不同人工智慧演算方法於認購權證評價績效之研究」,實踐大 學企業管理研究所碩士論文。
9、 鍾澄吉(1997),「運用類神經網路預測選擇權評價模式中股票價格波動率之實 證研究」,國立交通大學資訊管理研究所碩士論文。
10、 梁世璋(1998),「利用基因演算法訓練模糊類神經網路」,國立交通大學電機與 控制工程研究所碩士論文。
11、 沈宗澤(2001),「以遺傳演算法及共軛梯度訓練類神經網路」,國立成功大學航 太工程研究所碩士論文。
英文文獻
1、 Box, G.E.P. and Jenkins, G.M. (1976), Time Series Analysis:Forecasting and Control, The San Francisco:Holden-Day, Inc. Press.
2、 Koreisha, S.G. and Fang, Y. (1999), ”The impact of measurement errors on ARMA prediction,” Journal of Forecasting, Vol. 18, 95-109.
3、 Makridakis, S. and Hibon, M. (1997), “ARMA Models and Box-Jenkins Methodology,” Journal of Forecasting, Vol. 16, 147-163.
4、 Chen, J.F. (1996), “Analysis of an adaptive time-series autoregressive moving-average(ARMA)model for short-term load forecasting,” Fuel and Energy Abstract, Vol. 37, 108-121.
5、 Engle, R.F. (1982), “Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of UK Inflation,” Econometrica, Vol. 50, 987-1008.
6、 Bollerslev, T. (1986), “Generalized Autoregressive Conditional Heteroskedasticity,”
Journal of Econometrics, Vol. 31, 1307-1327.
7、 Chenoweth, T., Hubata, R. and Louis, R.D.S. (2000), “Automatic ARMA identification using neural networks and the extended sample autocorrelation function:a reevaluation,” Decision Support Systems, Vol.19, 21-30.
8、 Hwarng, H.B. and Ang, H.T. (2001), “A simple neural network for ARMA (p,q) time series,” Omega, Vol. 29, 319-333.
9、 Donaldson, R.G. and Kamstra, M. (1997), “Artificial neural network-Garch model for international stock return volatility,” Journal of Empirical Finance, Vol. 4, 17-46.
10、 Donaldson, R.G. and Kamstra, M. (1999), “Neural network forecast combing with interaction effects,” Journal of the Franklin Institute, Vol. 336, 227-236.
11、 Nag, A.K. and Mitra, A. (2002), “Forecasting the Daily Foreign Exchange Rates Using Genetically Optimized Neural Networks," Journal of Forecasting, Vol. 21, 501-511.
12、 Cook, D.F., Ragsdale, D. C. and Major, R.L. (2000), “Combining a neural network with a genetic algorithm for process parameter optimization,” Engineering Applications of Artificial Intelligence, Vol. 13, 391-396.
13、 Tsukilmoto, H. and Hatano, H. (2003), “The functional localization of neural networks using genetic algorithms,” Neural Networks, Vol. 16, 55-67.
14、 Clement, M.P. and Hendry, D.F. (1998), Forecasting economic time series.
Cambridge UK:Cambridge University Press.
15、 Dickey, D.A. and Fuller, W. A. (1981), “Likelihood Ratio Test for Autoregressive Time Series with a Unit Root,” Journal of American Statistics association, Vol. 49, 1057-1072.