• 沒有找到結果。

台灣 50 與中型 100 成分股之非金融股

第四章 實驗結果與分析

4.1. 影響填權息的關鍵特徵

4.1.1. 台灣 50 與中型 100 成分股之非金融股

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第四章 實驗結果與分析

本研究的實驗對象為「台灣 50 指數」與「台灣中型 100 指數」之成分股,由台 灣經濟新報(TEJ+)資料庫蒐集該公司之個股原始資料,再進行資料前處理,使用 資料期間為 2013 年至 2015 年之資料共三年。

透過 Weka 的 Wrapper 類特徵選取方法結合 Libsvm4與 J485篩選出影響個股完全 填權息的重要因素,以此建立股票完全填權息預測模型,調整參數藉此提高預測 模型的精準度。Libsvm 是林智仁教授開發用於支持向量機的程式庫,開發該程 式庫的目的是為了讓使用者更加方便快捷的使用支持向量機,而 J48 則是 Weka 使用 open source 對於 C4.5 決策數演算法的實作。

4.1.影響填權息的關鍵特徵

4.1.1.台灣 50 與中型 100 成分股之非金融股

本實驗使用 Weka.AttributeSelection.WrapperSubsetEval 的特徵選取方法,結 合 Libsvm、J48 分類器,分類器參數皆使用 Weka 預設值,屬性搜尋方法

GreedyStepwise,通過執行貪婪向前搜索,計算屬性子集的準確率,希望找出最 高準確率的屬性子集。Weka.Libsvm 特徵選取參數設定見圖 4.1,執行結果見表 4.1;Weka.J48 特徵選取參數設定見圖 4.2,執行結果見表 4.2。

4 C.-C. Chang and C.-J. Lin. LIBSVM: a library for support vector machines, 2001.

Software available at http://www.csie.ntu.edu.tw/~cjlin/libsvm.

5 Machine Learning Group at the University of Waikato. Weka 3: Data Mining Software in Java at http://weka.sourceforge.net/doc.dev/weka/classifiers/trees/J48.html

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4.1:非金融股 Weka 特徵選取 Libsvm 設定值,資料來源:本研究整理

圖 4.2:非金融股 Weka 特徵選取 J48 設定值,資料來源:本研究整理

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

表 4.1:非金融股 Weka 特徵選取 Libsvm 執行結果,資料來源:本研究整理 特徵選取工具 Weka 評估器 Wrapper

演算法 Libsvm 交叉驗證 5-fold

維度 加入特徵 準確率

1 現金流量比率 67.1%

2 股票殖利率 67.7%

3 總資產週轉率

68.5%

4 ROE 66.8%

5 每股盈餘 (元) 66.1%

6 ROA 65.5%

7 應收帳款週轉率 64.9%

8 股價淨值比 65.8%

9 存貨週轉率 (次) 65.4%

10 流動比率 64.5%

11 速動比率 64.4 %

12 固定資產週轉率 64.5%

13 前一日收盤價 64%

14 預計稅額扣抵比率 64%

15 股利支付率 64%

16 普通股股本 64%

17 稅後淨利率 64%

18 負債股東權益比率 64%

19 負債比率 64%

20 營業利益率 64%

21 利息保障倍數 64%

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

至 21 個屬性之間,分類器將所有資料 Class 分類為 YES,且訓練資料中 YES 的 資料比例為 64%。J48 演算法在特徵選取的過程中,準確率呈現峰狀由低至高再 回低(如圖 4.4),準確率在累計到第 8 個屬性「每股盈餘 (元)」時達到最高,

在累計第 14 個屬性「營業利益率」之後,準確率開始下降。同樣地,Libsvm 演 算法,從下圖 4.3 中可觀察累計第 4 個屬性「ROE」之後準確率開始下降。證明 了過多或過少的屬性,皆會導致預測準確率降低,使用參數不足,模型並沒有很 好的捕捉到數據資料的結構,準確率較低。使用過多參數,模型複雜,歸納學習 效率不良,一樣使準確率降低。J48 演算法雖然在累計選取 9 至 13 個屬性時,

擁有與 8 項屬性一樣的準確率,根據奥卡姆的剃刀理論,最簡單的解釋就是最好 的解釋,以「預計稅額扣抵比率」、「前一日收盤價」、「股利支付率」、「股價淨值 比」、「普通股股本」、「存貨週轉率(次)」、「總資產週轉率」「每股盈餘(元)」8 項屬性的集合做為選取結果。

圖 4.3:Libsvm 演算法準確率折線圖,資料來源:本研究整理

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4.4:J48 演算法準確率折線圖,資料來源:本研究整理

4.1.2.台灣 50 與中型 100 成分股之金融股