• 沒有找到結果。

第三章、 研究方法

第三節、 模型變數

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 9、神經網路配置方式

第三節、模型變數

過去分析股票市場走勢大致有三種方法:基本面、技術面和籌碼面分析,

然而對於國外的交易在國內很難取得有關籌碼面的訊息,加上大陸上市公司 的流通股數較低,公司本身通常兼具國家企業的特性,分析基本面相比政策 面較不具參考價值,因此本文僅考慮使用技術指標作為變數。技術分析並非 像基本分析和籌碼分析試圖理解股價走勢背後的驅動因素,而僅僅是觀察過 去的股價走勢,並從這些資訊中分析未來股價的潛在走勢,以及時提供精確 的買賣時機,且適合用於短線操作。在超過上百種的技術指標中,過去學者 和投資人通常較頻繁的使用某些指標,原因在於其方法上的簡單性或有效 性,故本文參考R 語言中的 TTR 套件,使用以下四種指標。

一、移動平均(Moving Average, MA)

★𝑀𝐴(𝑛) = 過去𝑛日內收盤價的算術平均, 𝑛 = 5, 20

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

𝐸𝑀𝐴(𝑛) =2

𝑛× 今日收盤價 +𝑛 − 1

𝑛 + 1× 昨日𝐸𝑀𝐴(𝑛)

二、相對強弱指標(Relative Strength Index, RSI)

若今日收盤價 > 昨日收盤價,則𝑈𝑝 = 今日收盤價 − 昨日收盤價,𝐷𝑛 = 0 若今日收盤價 < 昨日收盤價,則𝑈𝑝 = 0,𝐷𝑛 = |今日收盤價 − 昨日收盤價|

𝑈𝑝𝐴𝑣𝑔 = 過去14日內𝑈𝑝的𝑀𝐴 𝐷𝑛𝐴𝑣𝑔 = 過去14日內𝐷𝑛的𝑀𝐴

★𝑅𝑆𝐼 = × 100

三、隨機指標(Stochastic Oscillator, KD)

★𝐹𝑎𝑠𝑡%𝐾 = 收盤價 過去 日內最低的最低價

過去 日內最高的最高價 過去 日內最低的最低價× 100

★𝐹𝑎𝑠𝑡%𝐷 = 過去 3 日內𝐹𝑎𝑠𝑡%𝐾的𝑀𝐴

★𝑆𝑙𝑜𝑤%𝐷 = 過去 3 日內𝐹𝑎𝑠𝑡%𝐷的𝑀𝐴

𝐶𝑀 = 收盤價 −過去 13 日內最高的最高價 + 過去 13 日內最低的最低價 2

𝐻𝐿 = 過去 13 日內最高的最高價 − 過去 13 日內最低的最低價 𝐶𝑀𝐴𝑣𝑔 = 過去25日內之「過去2日內𝐶𝑀的𝐸𝑀𝐴」的𝐸𝑀𝐴 𝐻𝐿𝐴𝑣𝑔 = 過去25日內之「過去2日內𝐻𝐿的𝐸𝑀𝐴」的𝐸𝑀𝐴

★𝑆𝑀𝐼 =

⁄ × 100

★Signal = 過去9日內𝑆𝑀𝐼的𝐸𝑀𝐴

𝑆𝑀𝐼 Signal

今日𝑀𝐴(5)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

今日𝑀𝐴(20)

5日前𝑀𝐴(20)

今日𝑀𝐴(20)

20日前𝑀𝐴(20)

在確定變數的選擇後,仍需對上述二十種變數進行標準化和正規化,使得資 料範圍皆介於[0, 1]之間,以消除不同資料間的不齊性,並滿足神經網路計算的有 效性,即當激活函數選擇使用斜坡函數時,輸入值需為正值,使得輸入值經過函 數轉換後不會進入飽和區,防止神經網路在訓練時產生梯度消失的問題。此外,

在對變數進行標準化時,仍須注意不能使用到未來資料做計算,以符合實務上在 做預測時僅有過去資料能參考,故本文在標準化時僅使用訓練期間的變數計算期 望值和標準差,並用該值對訓練期間和測試期間的變數進行標準化,最後再將標 準化後的值經過標準常態的累積分配函數轉換為機率值,即[0, 1]之間。

𝑧 = 𝑥 − 訓練資料的𝑚𝑒𝑎𝑛 訓練資料的𝑠𝑑

𝑦 = 𝑃(𝑧 < 𝑧 ), 𝑧~𝑁(0, 1)

將變數做好資料處理後,本文目標即是希望透過這些技術指標,以預測未來 二十日後的股價走勢,其走勢主要分為兩個類別:上漲或下跌,並納入交易成本,

大陸股市的交易在買入和賣出時須付給券商手續費 0.3%,且賣出時須額外多付 印花稅(即我國所稱證交稅)0.1%,故本文的股價走勢主要判斷隔日開盤價與二十 日後開盤價的比值是否超過1.007 倍,以此判斷該股票在未來的上漲潛力。

若二十一日後收盤價 明日收盤價 > 1.007,則為 1(上漲) 若二十一日後收盤價 明日收盤價 ≤ 1.007,則為 0(下跌)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

此外,在進行預測前須注意類別佔比是否有過大差異。根據 Mizuno et al.

(1998)所述,在訓練樣本所欲預測的類別佔比差異過大時,神經網路在反向傳播 算法訓練時傾向只去改善主要類別的預測準確率,且對次要類別將預測較少的訊 號,若是類別佔比差異過大時,需要利用相關方法(例如根據類別的重要性來複 製樣本數)將樣本資料重新做平衡,以期能讓神經網路同等的對各類別進行學習 和預測。本文在檢視上漲和下跌的樣本數時,發現兩類別佔比均在五成左右,故 無須再做類別平衡處理。

另一方面,本文額外考慮另一種變數選取方法,也就是不使用技術指標,而 僅考慮過去二十日內每日股價的日報酬作為變數,每個變數為今日收盤價和昨日 收盤價的比值,並同樣考慮標準化和正規化處理,以期從單純的過去股價走勢預 測未來股價走勢的關係。

相關文件