• 沒有找到結果。

結論與建議

在文檔中 中 華 大 學 (頁 68-73)

5-1 結論

本研究使用分類探勘及關聯探勘兩種方法,以個股的13 個每季的基本面或 技術面指標,包括季報酬率、ß 風險因子、負債權益比、股東權益報酬率、成交 量、周轉率、市值、股價、每股淨值、每股盈餘、淨值股價比、成長價值報酬率、

修正成長價值報酬率,建立選股模型,並以第t+2 季的季報酬率來評估選股模型。

所採用的資料為1996 到 2007 年台灣上市公司每一個季度之季資料,研究期間為 1996 年 3 月~2007 年 9 月共 12 年總和 47 季。以 1996~2001 年的 24 個季度為訓 練範例,以2002~2007 年的 23 個季度為測試範例。其中使用之因變數為第 t+2 季報酬率,以反映每年季報於真實的投資情況中公佈的時間差。分類探勘使用邏 輯迴歸、倒傳遞網路、分類樹三種演算法;關聯探勘使用Apriori 演算法。

總結如下:

一、分類探勘

測試期間誤判率由低而高依序是邏輯迴歸(0.461)、分類樹(0.4749) 、倒傳遞 網路(0.4794);平均季報酬率由高而低依序是倒傳遞網路(6.85%)、分類樹

(6.80%)、邏輯迴歸(6.50%),三種選股模型之表現皆優於「不採任何選股模型」

的測試期間大盤表現,表示使用資料探勘分類模型明顯有助於選股的效益。

二、關聯探勘

以t+2 季為持有期來進行投資,由訓練期間產生的高報酬規則在測試期間得 到相當優異的結果,的平均報酬率6.84%,標準差 26.57%,優於大盤(報酬率 4.78%,標準差 26.23%)與低報酬規則(報酬率 1.33%,標準差 26.39%)。

以t+3 季為持有期來進行投資,由訓練期間產生的高報酬規則在測試期間得 到相當差的結果,高報酬規則的平均報酬率4.99%,標準差 22.53%,低於大盤(報 酬率6.02%,標準差 28.9%)之外,也低於低報酬規則(報酬率 8.21%,標準差 36.63%),出現了很明顯的反轉現象。

三、入選股票的特徵

1. 單變數排序法:股東權益報酬率、淨值股價比、成長價值報酬率、每股淨值、

益本比、成長價值報酬率(考慮股價淨值比)越大,ß 風險因子、負債權益比、

成交量、周轉率、市值及股價越小,則第t+2 季之報酬率越大。

2. 分類探勘

(1) 邏輯迴歸:股價、成長價值報酬率越大,ß 風險因子及市值越小,則第 t+2 季之報酬率越大。

(2) 分類樹:成長價值報酬率、每股淨值及成長價值報酬率(考慮股價淨值 比)越大,第 t 季報酬率及 ß 風險因子越小,則第 t+2 季之報酬率越大。

3. 關聯探勘

股東權益報酬率、成長價值報酬率、益本比及成長價值報酬率(考慮股價淨 值比)越大,ß 風險因子、成交量及周轉率越小,則第 t+2 季之報酬率越大。

4. 比較

將上述結果整理成表5-1,可知第 t+2 季之報酬率高的股票之主要特徵如下:

 ß 風險因子小

 成長價值報酬率大

 益本比大

 成長價值報酬率(考慮股價淨值比)大 次要特徵如下:

 股東權益報酬率大

 淨值股價比大

 每股淨值大

 成交量小

 週轉率小

 市值小

四、資料探勘方法的投資績效之比較

總結分類與關聯資料探勘方法的投資績效如下(以平均值(±標準差表示)):

1. 分類的最佳演算法為倒傳遞網路,測試期間季報酬率為 6.85% (±20.64%),比 不採任何選股模型的大盤整體季報酬率4.74%(±22.35%)明顯改善。

2. 關聯的最佳選股模型為在以 t+2 季季報酬率為因變數下產生的 28 條關聯規 則,例如:

IF X2A (ß 風險因子低) And X6A(周轉率低)

And X10B(成長價值報酬率高)

Then YB(t+2 季報酬率高) (Support=750, Confidence=57%)

這些利用訓練期間資料產生的關聯規則在測試期間季報酬率為6.84%

(±26.57%),比不採任何選股模型的大盤整體季報酬率 4.78%(±26.23%) 明顯改善。

表5-1 第

t+2

季之報酬率高的股票之特徵 分類探勘

選股變數 單變數

排序法 LR CT 關聯探勘 總結

X1 第t 季報酬率 ▼

X2 ß 風險因子 ▼ ▼▼ ▼▼ ▼▼▼ ▼▼

X3 負債權益比 ▼

X4 股東權益報酬率 △△ △ △

X5 成交量 ▼ ▼ ▼

X6 周轉率 ▼ ▼▼ ▼

X7 市值 ▼ ▼▼ ▼

X8 股價 ▼ △△

X9 淨值股價比 △ △

X10 成長價值報酬率 △△△ △△ △△ △△△ △△△

X11 每股淨值 △ △ △

X12 益本比 △△△ △△ △△

X13 成長價值報酬率

(考慮股價淨值比) △△△ △△△ △△△ △△

(備註:▼▼▼明顯反比, ▼▼反比, ▼可能反比;△可能正比, △△正比, △△△明顯正比)

5-2 建議

本論文作者對投資者的選股的建議如下:

1. 由本研究結果所得好股票之特徵,對於投資大眾來說,選股意涵則為可選擇 投資的股票類型為低風險股(ß 風險因子小)、價值股(益本比大、成長價值報 酬率大、淨值股價比大、每股淨值大)。其次可選擇成長股 (股東權益報酬率 大)。

2. 若要追求高獲利,可以採用論文第三章的分類的最佳演算法(倒傳遞網路)選 股,另也可採用論文第四章的關聯分析選股模型,並設定持有期間為t+2 季。

3. 雖然本研究建立的選股模式在研究的 47 季中大部份是可以提高投資報酬 率,但仍有不少期間是反而降低投資報酬率。但長期而言,可以明顯提高投

資報酬率。因此如果投資人採用本文的選股模式,必須透過長期投資來消除 系統風險,得到穩健的獲利。

對後續研究,作者提出以下幾點建議:

一、選股指標變數的改善

本研究所採用的資料為季度的財報資料,但作者認為仍有改善的空間,例 如可以改善目前舊有指標仍有較為落後的情況,建議可以使用包含更即時資料 內容的指標。舉例來說,本研究之變數X8 為收盤價,使用的是第 t 季季底收盤 價,但當本研究於第t+2 季初欲進行投資時,使用第 t 季季底資料顯得有些落後,

因為收盤價的資料性質是可以即時取得的,故建議使用最即時的t+1 季底之無 落後的資料來當做選股指標變數。

二、訓練期間與測試期間可考慮調整

目前的訓練與測試期間劃分是以最基本的方式來分割,將研究期間一分兩 半,前期進行訓練,後期進行測試。如此雖然看是理所當然,且較容易建構選 股模型,但是也許會不利於人工智慧依最近期的資訊進行學習,導致模型準確 率隨時間而衰減。建議可以採用移動學習模式來改善。

三、資料的合理性改善

本研究在資料收集方面還有需改善之處,例如應 (1) 考量存活偏差 (2) 考 略微型股偏差,即計算投組報酬率時應以市值權重平均較合理。

四、資料的可靠度改善

因為研究期間愈長,資料筆數也會增加,也更容易因為人為因素導致資料 不正確。本研究的人工資料整理方式較不利於資料的再利用與資料正確性驗 證。未來應較正規的資料庫管理系統來改善資料整理的效率與可靠度。

五、資料改用其它市場資料

本研究的對象是台灣股市,可以進一步以美國、香港、大陸等重要股市做 為研究對象,以進一步確認本文方法的適用性。

參考文獻

丁一賢、陳牧言,2005,『資料探勘』,滄海出版社。

文少宣,2004,『類神經網路與決策樹在顧客關係管理應用之比較』,中華大學碩 士論文。

王源遠,2005,『風險值與股票報酬之關係-臺灣實證研究』,淡江大學碩士論文。

王嘉隆、詹淑慧,2005,『分類迴歸樹於 S&P500 指數預測之研究』,管理科學研 究第一屆管理與決策學術研討會特刊,141~150 頁。

甘堯昌,2006,『以資料採礦技術探討影響個股績效之關鍵因素:以台灣上市個 股為例』,大同大學碩士論文。

林文盟,2005,『關聯分析在台灣股市消息面與技術面分析之比較研究 』,中華 大學碩士論文。

林宏昌,2002,『知識萃取於資料探勘之研究-以股票預測為例 』,國立台北科 技大學碩士論文。

林冠宇,2005,『智慧型多層次股市篩選模型與投資策略之應用』,嶺東技術學院 碩士論文。

張云濤、龔玲,2007,『資料探勘原理與技術』,五南出版社。

張瑞益、黃文雄,2003,『專家知識和股價之關聯性 - 以券商研究報告為基礎』,

第四屆電子化企業經營管理理論暨實務研討會論文摘要集。

張萬鈞,2008,『以分類、迴歸、聚類、關聯四種資料探勘方法建立選股模型 - 台 灣股市之實證研究』,中華大學碩士論文。

陳文銓,2007,『排序正規化與分類資料探勘建立選股模型─台灣股市之實證研 究 』,中華大學碩士論文。

陳榮昌,2002,『台灣股票報酬之結構分析』,國立中山大學碩士論文。

曾秀珠,2007,『以排序正規化與迴歸資料探勘建立選股模型─台灣股市之實證 研究 』,中華大學碩士論文。

葉怡成,2002,『應用類神經網路』,儒林圖書有限公司。

葉怡成,2006,『類神經網路-模式應用與實作』,第五版,儒林圖書公司。

葉怡成,2008,『資料探勘–程序方法與實作』,中華大學資管系,講義。

葉承楙,2005,『淨值市價比及信用風險指標(O-score 與 TCRI)運用在投資績效之

在文檔中 中 華 大 學 (頁 68-73)

相關文件