3 研究方法
3.1 研究變數之定義
3.2.3 S 隸屬函數(S member function)
2 ) exp ( 2
2
Ax x a
(24)其中 a 為高斯隸屬函數之中心點;
為高斯隸屬函數之標準差。3.2.3
S 隸屬函數(S member function):圖 3. S 隸屬函數圖
S 隸屬函數為一單調遞增(monotonical increasing)函數,圖 3 為 S 隸屬函數示意圖。
其中小於 a 值的隸屬度為 0;大於等於 b 值的隸屬度為 1;在(a+b)/2 的位置,其隸屬度 為 0.5。此隸屬函數之公式如(25)所示。
,3.2.4
三角型隸屬函數(triangular member function):在目前的實驗結果中,我們發現利用三角型隸屬函數,其建立的投資模型相較於前
20
其中,在點 a 至點 b 之間為一嚴格遞增函數;而在點 b 至點 c 之間為一嚴格遞減函數。
在本論文中,構成三角型隸屬函數的 a、b、c 三數則由經遺傳演算法演化而得。其目的 為了找尋較佳的三角型隸屬函數,將股票排名做些微的變動,利用此模糊化方法將獲得 更好的投資報酬率。而關於股票排名變動之詳細說明,稍後在後面章節作介紹。
3.3 遺傳演算法
遺傳演算法為人工智慧中的一環,此方法由 Holland (1975)所提出,其主要是依據 生物遺傳學與物競天擇理論所建立的研究方法。遺傳演算法是模擬生物學上的一些現 象,它承襲了達爾文進化論的精髓,其運算機制分為三個部分:選擇親代、交配與突變、
子代篩選。其中,子代篩選是利用一個反應當時生存環境定義的適應性函數(fitness function)來評估。若是能適應的子代,則將予以保留並繁衍下一代;而不能適應者,則 將被剔除。其演算法之簡易流程如下所示:
Step 1 由隨機產生之 k 個個體所組成的原始群體,每一個體由 p-bits 的遺傳型染色體 組成,其表示如(27):
1,
2,..., , ; {
1,
2,..., }, { 0 , 1 },
G G G
kk N G
kb b b
pb
pC
(27)其中,C 代表由 k 個個體所組成的原始群體;
G 表示原始群體中第 k 個個體;
kb
p則代表一個體中的某一個編碼,其值為 0 或 1。Step 2 根據研究之定義適應性函數,評估每一個體的適應能力,並計算出其適應強度。
在本研究中,我們要找尋最大之月均化報酬率(關於月均化報酬率的算法在後面 章節會詳加描述),因此我們可以將其簡述如(28)式:
, }, max{arg
f G G C
y
k k
(28)其中,
f
表示我們研究所定義的適應性函數;C 為原始群體。我們將所有個 體代入至研究設定的適應性函數後,若能獲得最大值之個體(y),則會有較高的22
Step 3 重複下列演算直到有 k 個子代被挑選出來為止:
i. 選擇一對親代。
ii. 進行交配動作。
iii. 進行變異動作(包括基因突變與重組)。
Step 4 以此 k 個新產生子代來取代原有 k 個個體的原始群體,並成為新一代的群體。
Step 5 返回 Step 2,一直到終止條件發生及停止演算為止。
經過一系列的選擇、交配、突變與產生下一代後,遺傳演算法會對每一個體做評估 並計算其適應度,然後將整體適應度調整至最佳。前述情形將一代接著一代,直到滿足 終止條件為止。關於終止條件,有以下幾種:第一種是設定終止世代。亦即系統達到所 預設的特定世代則停止演算。第二種是判斷是否收斂?若個體已達到滿足最優條件,而 且適應度也已達到飽和,此時繼續演化將不會再產生更好的個體。前述情況即為收斂並 停止演算,反之則繼續演化。第三種是由時間來決定是否停止演算,若已達到預設時間,
則停止演算。本論文所使用的遺傳演算法之染色體編碼方法、交配方式與突變方法說明 如下:
3.3.1
編碼方法:本論文中,遺傳演算法採用二進制(0 與 1)編碼方式,其大致上分為三個部份即權 重編碼、股票排序指標編碼與模糊數編碼,其編碼方式如圖 5 所示:
圖 5. 遺傳演算法編碼圖
1. 權重編碼方式:
本研究共利用了 11 個投資人情緒代理變數,為了要展現出這 11 個代理變數的 重要性,本研究給予每個投資人情緒代理變數各一個權重值,其權重值設置的範圍 介於 0 至 1 之間。若演化後投資人情緒指標 j 獲得到較高的權重值,則代表投資人 情緒指標 j 在所有投資人情緒代理變數中的重要性越強。在圖 5 權重編碼部份,
wj
b
代表投資人情緒指標 j 的權重編碼,我們將此權重編碼更進一步來看,如圖 6:圖 6. 權重編碼圖
在圖 6 中,從 1
wj
b 至
wmb 其表示我們給予投資人情緒指標 j 總共 m 位元的權重編
j碼,而後再由公式(29)轉換成本論文中我們所要應用的權重值。
), min 1 (max
minw 2m
D
w wW
(29)其中 W 代表經由轉換後所得到的權重值;m 代表編碼長度(即 m 個位元);D 代表 將 m 位元的二進位編碼轉成十進位之值;max 代表我們所要轉換出來之權重最大w 值,min 則代表我們所要轉換出來之權重最小值 (例如:本研究的目標是要將權w 重值限定在 0 與 1 之間,所以maxw
1;minw
0)。24
2. 股票排序指標編碼方式:
在本論文 3.3 的圖 5 中,
ij
b 代表投資人情緒指標 j 的股票排序指標編碼。根據
本論文 2.2 投資人情緒之文獻回顧(Basu, 1977、Fama 和 French, 1992、Wong et al., 2003、Baker 和 Stein, 2004、Nagel, 2005、Verma 和 Soydemir, 2006、Kuo 和 Chen, 2006、Baker 和 Wurgler, 2007、Chong 和 Ng, 2008、Verma 和 Soydemir, 2009、Chenet al., 2009 與 Sehgal et al., 2010…等),本研究定義當本益比、股價淨值比、市值成
圖 7. 三角模糊數編碼圖
26
圖 8. 遺傳演算法之交配方式
其中 PA、 PB代表親代;CA、CB代表交配後產生的子代。我們採用上述的遺傳演算步 驟直到產生 50 條新產生的染色體,然後再根據我們設定的突變機率(mutation rate)來判 斷是否進行突變(在此我們設定突變機率為 0.005)。
關於突變機制的設計,本研究利用隨機產生交配點的方式,在選擇一突變點之後,
我們將突變點上的編碼,若為 0 則轉變成 1;若為 1 則轉變成 0。其方式呈現如圖 9 所 示。而經由突變後,獲得下一代的 50 條染色體,我們再返回上述步驟,直到符合終止 條件才停止演算。
圖 9. 遺傳演算法之突變方式
3.4 選股模型之建立
在早期的實證研究中,鮮少文獻將遺傳演算法與模糊理論應用於探討投資人情緒與 股票報酬之關係。因此,除了單純利用遺傳演算法來探討投資人情緒與股票報酬的相關 性外,本研究還分別還融入模糊理論與先前 Huang et al. (2012)的股票排序指標自由演化 的方法所建立的選股模型,來加以探討投資人情緒與股票報酬之間的關連。茲將本研究 的選股模型介紹如下:
3.4.1
樂觀與悲觀股票之定義:在先前 3.3 遺傳演算法介紹的股票排序指標編碼部分,有提及根據相關文獻定義若 本益比、股價淨值比、市值成長率、週轉率、三大法人合計持股率、前一個月報酬率、
法人情緒、散戶情緒、乖離率、12 月內心理線、12 月內相對強弱指標這 11 項指標值越 高則代表投資人情緒對於某股票越樂觀;反之則越悲觀。因此,根據早期文獻的定義,
我們可以將這 11 項股票排序指標值都設定為 0(或 1)來代表追隨前一期悲觀(或樂觀)股 票的投資策略在未來所獲得的績效為何?
3.4.2
根據股票排序指標與排序函數建立投資策略:在本研究的程式中,對於每一個投資人情緒指標,我們分別給予 1-bit 的股票排序 指標(0 或 1)。當採用「跟隨樂觀投資人情緒」的投資策略時,若某一個投資人情緒標 的值越高,則其所得到的分數就越高(即股票排序指標為 1)。而當採用「跟隨悲觀投資 人情緒」的投資策略時,某一個投資人情緒標的值越低,則其所得到的分數就越高(即 股票排序指標為 0),我們可以用(34)及(35)公式來表示:
0
I
j :
i,j,t
k,j,tiff v
i,j,t v
k,j,t for i≠k; (34)
(35)28
其中
I
j表示投資人情緒指標 j 之股票排序指標;v
i,j,t代表股票 i 在第 t 月投資人情緒指標 j 之值;
i,j,t代表股票 i 在第 t 月針對投資人情緒指標 j 之獲得分數。當I
j 1
時,若 股票 i 所獲得的分數越高,則代表投資人根據投資人情緒指標 j 對於股票 i 的樂觀程度 越高;若I
j 0
時,股票 i 所獲得的分數越高,則代表投資人根據投資人情緒指標 j 對 於股票 i 的悲觀程度越高。1. 跟隨樂觀投資人情緒投資策略:
對於「跟隨樂觀投資人情緒」(買進前期投資人情緒最樂觀的股票)策略,我 們對於每一個投資人情緒指標分別給予 1-bit 為 1 的股票排序指標值(因為根據我們 的假設,若每個投資人情緒指標的值越高,則代表投資人對於此股票未來走勢越樂 觀)。假設股票 i 在第 t 月的投資人情緒指標 j 之值為
P
i,j,t R, i = 1, ..., m ,則我們
定義一個排序函數 (o) 如(36):
, ,,
,,jt o i jt
i
P
Q
(36)其中
Q
i,j,t 1 ,..., m
為股票 i 在第 t 月的投資人情緒指標 j 於整個測詴股票集合中的 排序。亦即如果P
i,j,t P
k,j,t,則Q
i,j,t Q
k,j,t。則依前述定義,我們指定股票 i 在第t 月的投資人情緒指標 j 所獲得之分數為 Q
i,j,t,而且所有測詴股票均可獲得介於 1 到 m 的分數。(亦若投資人情緒指標 j 獲得 m 分,則代表根據投資人情緒指標 j,投 資人對於股票 i 的情緒最樂觀)。由於每一項投資人情緒指標其預測股票報酬之能力程度可能不同,因此我們透 過加入權重的概念來賦予每個指標相對的重要性。關於每一個投資人情緒指標的權 重,我們利用遺傳演算法來搜尋各指標的權重值。茲將計算權重的線性模型如(37):
, ,
i j i j,
i j
T
Y Q (37)其中,
Y
j表示投資人情緒指標 j 得到的權重值;Q
i,j表股票 i 在投資人情緒指標 j 所的到的分數;Ti代表股票 i 經由線性模型計算後的總分。而我們能透過(37)之公式來算出每支股票整體的樂觀程度。因此,當採用「跟隨樂觀投資人情緒」(買進
前期投資人情緒最樂觀的股票)的投資策略時,我們的方法是將 Ti 值乘上其隸屬 度後所獲得之值,以之選擇最高得分的前 N 支股票進行投資,如公式(40)所述。
2. 跟隨悲觀投資人情緒投資策略:
另一方面,對於「跟隨悲觀投資人情緒」(買進前期投資人情緒最悲觀的股票)
策略,我們對於每一個投資人情緒指標分別給予 1-bit 為 0 的股票排序指標值(因為 根據我們的假設,若每個投資人情緒指標的值越低,則代表投資人對於此股票未來 走勢越悲觀)。假設股票 i 在第 t 月的投資人情緒指標 j 之值為
G
i,j,t R, i = 1, ..., m ,
則我們定義一個排序函數 (p) 如 (38):
, ,,
,
,jt p ijt
i
G
S
(38)其中,
S
i,j,t 1 ,..., m
為股票 i 在第 t 月的投資人情緒指標 j 於整個測詴股票集合中 的排序。亦即如果G
i,j,t G
k,j,t則S
i,j,t S
k,j,t。依前述定義,我們指定股票 i 在第 t 月的投資人情緒指標 j 所獲得之分數為S
i,j,t;而且所有測詴股票均可獲得介於 1 到m 的分數(亦即若投資人情緒指標 j 獲得 m 分,則代表根據投資人情緒指標 j,投資
人對於股票 i 的情緒最悲觀)。30
, ,
i j i j,
i j
X
W S (39)其中,
W
j示投資人情緒指標 j 得到的權重值;S
i j, 表示股票 i 在投資人情緒指標 j所得到的分數;
X 代表股票 i 經由線性模型計算後的總分。而我們能透過(39)之公
i式來算出每支股票整體的悲觀程度。因此,當採用「跟隨悲觀投資人情緒」(買進
前期投資人情緒最悲觀的股票)的投資策略時,我們的方法是將 Xi 值乘上其隸屬
前期投資人情緒最悲觀的股票)的投資策略時,我們的方法是將 Xi 值乘上其隸屬