S 隸屬函數(S member function) - 研究變數之定義

3 研究方法

3.1 研究變數之定義

3.2.3 S 隸屬函數(S member function)

2 ) exp ( ₂

 

 



  

 



x ^x ^a

(24)

其中 a 為高斯隸屬函數之中心點；



為高斯隸屬函數之標準差。

3.2.3

S 隸屬函數(S member function)：

圖 3. S 隸屬函數圖

S 隸屬函數為一單調遞增(monotonical increasing)函數，圖 3 為 S 隸屬函數示意圖。

其中小於 a 值的隸屬度為 0；大於等於 b 值的隸屬度為 1；在(a+b)/2 的位置，其隸屬度 為 0.5。此隸屬函數之公式如(25)所示。

 

3.2.4

三角型隸屬函數(triangular member function)：

在目前的實驗結果中，我們發現利用三角型隸屬函數，其建立的投資模型相較於前

其中，在點 a 至點 b 之間為一嚴格遞增函數；而在點 b 至點 c 之間為一嚴格遞減函數。

在本論文中，構成三角型隸屬函數的 a、b、c 三數則由經遺傳演算法演化而得。其目的 為了找尋較佳的三角型隸屬函數，將股票排名做些微的變動，利用此模糊化方法將獲得更好的投資報酬率。而關於股票排名變動之詳細說明，稍後在後面章節作介紹。

3.3 遺傳演算法

遺傳演算法為人工智慧中的一環，此方法由 Holland (1975)所提出，其主要是依據生物遺傳學與物競天擇理論所建立的研究方法。遺傳演算法是模擬生物學上的一些現象，它承襲了達爾文進化論的精髓，其運算機制分為三個部分：選擇親代、交配與突變、

子代篩選。其中，子代篩選是利用一個反應當時生存環境定義的適應性函數(fitness function)來評估。若是能適應的子代，則將予以保留並繁衍下一代；而不能適應者，則將被剔除。其演算法之簡易流程如下所示：

Step 1 由隨機產生之 k 個個體所組成的原始群體，每一個體由 p-bits 的遺傳型染色體 組成，其表示如(27)：



^,

^...,  ^,  ^;  ^{

^,

^..., ^},  ^{ ⁰ ^, ¹ ^},

 G G G

k N G

b b b

b

C

(27)

其中，C 代表由 k 個個體所組成的原始群體；

G 表示原始群體中第 k 個個體；

b

p則代表一個體中的某一個編碼，其值為 0 或 1。

Step 2 根據研究之定義適應性函數，評估每一個體的適應能力，並計算出其適應強度。

在本研究中，我們要找尋最大之月均化報酬率(關於月均化報酬率的算法在後面章節會詳加描述)，因此我們可以將其簡述如(28)式：

 

, }, max{

arg

f G G C

y 

_k _k



(28)

其中，

f   

表示我們研究所定義的適應性函數；C 為原始群體。我們將所有個 體代入至研究設定的適應性函數後，若能獲得最大值之個體(y)，則會有較高的

Step 3 重複下列演算直到有 k 個子代被挑選出來為止：

i. 選擇一對親代。

ii. 進行交配動作。

iii. 進行變異動作（包括基因突變與重組）。

Step 4 以此 k 個新產生子代來取代原有 k 個個體的原始群體，並成為新一代的群體。

Step 5 返回 Step 2，一直到終止條件發生及停止演算為止。

經過一系列的選擇、交配、突變與產生下一代後，遺傳演算法會對每一個體做評估並計算其適應度，然後將整體適應度調整至最佳。前述情形將一代接著一代，直到滿足終止條件為止。關於終止條件，有以下幾種：第一種是設定終止世代。亦即系統達到所預設的特定世代則停止演算。第二種是判斷是否收斂？若個體已達到滿足最優條件，而且適應度也已達到飽和，此時繼續演化將不會再產生更好的個體。前述情況即為收斂並停止演算，反之則繼續演化。第三種是由時間來決定是否停止演算，若已達到預設時間，

則停止演算。本論文所使用的遺傳演算法之染色體編碼方法、交配方式與突變方法說明如下：

3.3.1

編碼方法：

本論文中，遺傳演算法採用二進制(0 與 1)編碼方式，其大致上分為三個部份即權重編碼、股票排序指標編碼與模糊數編碼，其編碼方式如圖 5 所示：

圖 5. 遺傳演算法編碼圖

1. 權重編碼方式：

本研究共利用了 11 個投資人情緒代理變數，為了要展現出這 11 個代理變數的重要性，本研究給予每個投資人情緒代理變數各一個權重值，其權重值設置的範圍 介於 0 至 1 之間。若演化後投資人情緒指標 j 獲得到較高的權重值，則代表投資人 情緒指標 j 在所有投資人情緒代理變數中的重要性越強。在圖 5 權重編碼部份，

b

代表投資人情緒指標 j 的權重編碼，我們將此權重編碼更進一步來看，如圖 6：

圖 6. 權重編碼圖

在圖 6 中，從 ¹

b 至

_w^m

b 其表示我們給予投資人情緒指標 j 總共 m 位元的權重編

碼，而後再由公式(29)轉換成本論文中我們所要應用的權重值。

), min 1 (max

min_w 2_m

D

_w _w

W  

 



(29)

其中 W 代表經由轉換後所得到的權重值；m 代表編碼長度(即 m 個位元)；D 代表 將 m 位元的二進位編碼轉成十進位之值；max 代表我們所要轉換出來之權重最大_w 值，min 則代表我們所要轉換出來之權重最小值 (例如：本研究的目標是要將權_w 重值限定在 0 與 1 之間，所以max_w



1；min_w



0)。

2. 股票排序指標編碼方式：

在本論文 3.3 的圖 5 中，

b 代表投資人情緒指標 j 的股票排序指標編碼。根據

本論文 2.2 投資人情緒之文獻回顧(Basu, 1977、Fama 和 French, 1992、Wong et al., 2003、Baker 和 Stein, 2004、Nagel, 2005、Verma 和 Soydemir, 2006、Kuo 和 Chen, 2006、Baker 和 Wurgler, 2007、Chong 和 Ng, 2008、Verma 和 Soydemir, 2009、Chen

et al., 2009 與 Sehgal et al., 2010…等)，本研究定義當本益比、股價淨值比、市值成

圖 7. 三角模糊數編碼圖

圖 8. 遺傳演算法之交配方式

其中 P_A、 P_B代表親代；C_A、C_B代表交配後產生的子代。我們採用上述的遺傳演算步驟直到產生 50 條新產生的染色體，然後再根據我們設定的突變機率(mutation rate)來判斷是否進行突變(在此我們設定突變機率為 0.005)。

關於突變機制的設計，本研究利用隨機產生交配點的方式，在選擇一突變點之後，

我們將突變點上的編碼，若為 0 則轉變成 1；若為 1 則轉變成 0。其方式呈現如圖 9 所示。而經由突變後，獲得下一代的 50 條染色體，我們再返回上述步驟，直到符合終止條件才停止演算。

圖 9. 遺傳演算法之突變方式

3.4 選股模型之建立

在早期的實證研究中，鮮少文獻將遺傳演算法與模糊理論應用於探討投資人情緒與股票報酬之關係。因此，除了單純利用遺傳演算法來探討投資人情緒與股票報酬的相關 性外，本研究還分別還融入模糊理論與先前 Huang et al. (2012)的股票排序指標自由演化 的方法所建立的選股模型，來加以探討投資人情緒與股票報酬之間的關連。茲將本研究的選股模型介紹如下：

3.4.1

樂觀與悲觀股票之定義：

在先前 3.3 遺傳演算法介紹的股票排序指標編碼部分，有提及根據相關文獻定義若本益比、股價淨值比、市值成長率、週轉率、三大法人合計持股率、前一個月報酬率、

法人情緒、散戶情緒、乖離率、12 月內心理線、12 月內相對強弱指標這 11 項指標值越高則代表投資人情緒對於某股票越樂觀；反之則越悲觀。因此，根據早期文獻的定義，

我們可以將這 11 項股票排序指標值都設定為 0(或 1)來代表追隨前一期悲觀(或樂觀)股票的投資策略在未來所獲得的績效為何？

3.4.2

根據股票排序指標與排序函數建立投資策略：

在本研究的程式中，對於每一個投資人情緒指標，我們分別給予 1-bit 的股票排序指標(0 或 1)。當採用「跟隨樂觀投資人情緒」的投資策略時，若某一個投資人情緒標的值越高，則其所得到的分數就越高(即股票排序指標為 1)。而當採用「跟隨悲觀投資人情緒」的投資策略時，某一個投資人情緒標的值越低，則其所得到的分數就越高(即股票排序指標為 0)，我們可以用(34)及(35)公式來表示：

 0

I

j :



_i_,_j_,_t

 

_k_,_j_,_t

iff v

_i_,_j_,_t

 v

_k_,_j_,_t for i≠k; (34)

    

(35)

其中

I

_j表示投資人情緒指標 j 之股票排序指標；

v

_i_,_j_,_t代表股票 i 在第 t 月投資人情緒指

標 j 之值；



_i_,_j_,_t代表股票 i 在第 t 月針對投資人情緒指標 j 之獲得分數。當

I

 1

時，若 股票 i 所獲得的分數越高，則代表投資人根據投資人情緒指標 j 對於股票 i 的樂觀程度 越高；若

I

 0

時，股票 i 所獲得的分數越高，則代表投資人根據投資人情緒指標 j 對 於股票 i 的悲觀程度越高。

1. 跟隨樂觀投資人情緒投資策略：

對於「跟隨樂觀投資人情緒」（買進前期投資人情緒最樂觀的股票）策略，我們對於每一個投資人情緒指標分別給予 1-bit 為 1 的股票排序指標值(因為根據我們的假設，若每個投資人情緒指標的值越高，則代表投資人對於此股票未來走勢越樂 觀)。假設股票 i 在第 t 月的投資人情緒指標 j 之值為

P

_i_,_j_,_t

 R, i = 1, ..., m ，則我們

定義一個排序函數 (^o) 如(36):

 

, ,

^,

,jt o i jt

P

Q  

(36)

其中

Q

_i_,_j_,_t

  1 ,..., m 

為股票 i 在第 t 月的投資人情緒指標 j 於整個測詴股票集合中的 排序。亦即如果

P

_i_,_j_,_t

 P

_k_,_j_,_t，則

Q

_i_,_j_,_t

 Q

_k_,_j_,_t。則依前述定義，我們指定股票 i 在第

t 月的投資人情緒指標 j 所獲得之分數為 Q

_i_,_j_,_t，而且所有測詴股票均可獲得介於 1 到 m 的分數。(亦若投資人情緒指標 j 獲得 m 分，則代表根據投資人情緒指標 j，投 資人對於股票 i 的情緒最樂觀)。

由於每一項投資人情緒指標其預測股票報酬之能力程度可能不同，因此我們透過加入權重的概念來賦予每個指標相對的重要性。關於每一個投資人情緒指標的權重，我們利用遺傳演算法來搜尋各指標的權重值。茲將計算權重的線性模型如(37)：

, ,

i j i j,

i j

T 



Y Q (37)

其中，

Y

_j表示投資人情緒指標 j 得到的權重值；

Q

_i_,_j表股票 i 在投資人情緒指標 j 所的到的分數；Ti代表股票 i 經由線性模型計算後的總分。而我們能透過(37)之公

式來算出每支股票整體的樂觀程度。因此，當採用「跟隨樂觀投資人情緒」（買進

前期投資人情緒最樂觀的股票）的投資策略時，我們的方法是將 Ti 值乘上其隸屬 度後所獲得之值，以之選擇最高得分的前 N 支股票進行投資，如公式(40)所述。

2. 跟隨悲觀投資人情緒投資策略：

另一方面，對於「跟隨悲觀投資人情緒」（買進前期投資人情緒最悲觀的股票）

策略，我們對於每一個投資人情緒指標分別給予 1-bit 為 0 的股票排序指標值(因為根據我們的假設，若每個投資人情緒指標的值越低，則代表投資人對於此股票未來 走勢越悲觀)。假設股票 i 在第 t 月的投資人情緒指標 j 之值為

G

_i_,_j_,_t

 R, i = 1, ..., m ，

則我們定義一個排序函數 (^p) 如 (38):

 

_, _,

,

,jt p ijt

G

S  

(38)

其中，

^S

i_,j_,t

  1 ,..., ^m 

為股票 i 在第 t 月的投資人情緒指標 j 於整個測詴股票集合中 的排序。亦即如果

G

_i_,_j_,_t

 G

_k_,_j_,_t則

S

_i_,_j_,_t

 S

_k_,_j_,_t。依前述定義，我們指定股票 i 在第 t 月的投資人情緒指標 j 所獲得之分數為

S

_i_,_j_,_t；而且所有測詴股票均可獲得介於 1 到

m 的分數(亦即若投資人情緒指標 j 獲得 m 分，則代表根據投資人情緒指標 j，投資

人對於股票 i 的情緒最悲觀)。

, ,

i j i j,

i j

X 



W S (39)

其中，

W

_j示投資人情緒指標 j 得到的權重值；

S

_{i j}_, 表示股票 i 在投資人情緒指標 j

所得到的分數；

X 代表股票 i 經由線性模型計算後的總分。而我們能透過(39)之公

式來算出每支股票整體的悲觀程度。因此，當採用「跟隨悲觀投資人情緒」（買進

前期投資人情緒最悲觀的股票）的投資策略時，我們的方法是將 X_i 值乘上其隸屬

在文檔中應用遺傳演算法及模糊理論探討投資人情緒與股票報酬之關係 (頁 27-0)

S 隸屬函數(S member function)

3 研究方法

3.1 研究變數之定義

3.2.3 S 隸屬函數(S member function)

 

 



  

 



x x a



3.2.3

S 隸屬函數為一單調遞增(monotonical increasing)函數，圖 3 為 S 隸屬函數示意圖。

 

3.2.4

3.3 遺傳演算法



,

...,  ,  ;  {

,

..., },  { 0 , 1 },

 G G G

k N G

b b b

b

C

G 表示原始群體中第 k 個個體；

b

 

f G G C

y 



f   

3.3.1

b

b 至

b 其表示我們給予投資人情緒指標 j 總共 m 位元的權重編

D

W  

 







b 代表投資人情緒指標 j 的股票排序指標編碼。根據

et al., 2009 與 Sehgal et al., 2010…等)，本研究定義當本益比、股價淨值比、市值成

3.4 選股模型之建立

3.4.1

3.4.2

 0

I



 

iff v

 v

    

I

v



I

 1

I

 0

P

 R, i = 1, ..., m ，則我們

 

,

P

Q  

Q

  1 ,..., m 

P

 P

Q

 Q

t 月的投資人情緒指標 j 所獲得之分數為 Q



Y

Q

G

x ^x ^a

^,

^...,  ^,  ^;  ^{

^,

^..., ^},  ^{ ⁰ ^, ¹ ^},

^,

^S

  1 ,..., ^m 