• 沒有找到結果。

台股股利完全填權息關鍵影響因素之研究 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "台股股利完全填權息關鍵影響因素之研究 - 政大學術集成"

Copied!
101
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學資訊科學系 Department of Computer Science National Chengchi University 碩士論文 Master’s Thesis. 立. 政 治 大. 台股股利完全填權息關鍵影響因素之研究. ‧ 國. 學. ‧. The key influencing factors of Taiwan stock price successfully remaining previous price after dividend payment n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 研 究 生:陳人豪 指導教授:徐國偉教授. 中華民國一百零七年一月 January 2018. i.

(2) 台股股利完全填權息關鍵影響因素之研究 The key influencing factors of Taiwan stock price successfully remaining previous price after dividend payment Student:Jen-Hao Chen. 研 究 生:陳人豪. Advisor:Kuo-Wei Hsu. 指導教授:徐國偉. 國立政治大學. 學. ‧ 國. 立. 政 治 大 資訊科學系 碩士論文. ‧ sit. y. Nat. er. io. A Thesis. n. a lDepartment of Computer v submitted to n i Science Ch. U. i e n g c hUniversity National Chengchi. in partial fulfillment of the Requirements for the degree of Master in Computer Science. 中華民國一零七年一月 January 2018 ii.

(3) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. iii. i n U. v.

(4) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. iv. i n U. v.

(5) 致謝. 總有幾段回憶,會在生命中留下深刻的記憶,碩士求學過程會是那樣存在的一段。 論文撰寫的過程,歷經我許多人生大事,一路走來點滴在心頭。 「行百里者半九十」 堅持到最後會發現,努力過後的果實是最甜美的。感謝許多人的關心與協助,讓 我能順利的完成這漫長的道路。. 政 治 大 首先最要感謝的是我的指導教授 徐國偉教授。對恩師的學識淵博而感敬佩,亦對 立. ‧ 國. 學. 他的教學風格非常折服。恩師總是以正向、開放及鼓勵的方式,指導我的論文寫 作,不設限研究題目與方向,但若有須修正之處,也從不吝於指引正確方法。在. ‧. 研究學習的路途上,當碰到瓶頸苦思許久無法突破時,恩師的幾句話,幾個觀念,. y. Nat. al. er. io. sit. 可以讓我茅塞頓開,獲益匪淺。而因為工作上的關係,常佔用恩師課後的時間來. n. 指導我,學生銘謝於心。. Ch. engchi. i n U. v. 另外感謝口試委員左瑞麟教授及戴碧如教授,提供的寶貴意見使本論文更加完善, 也感謝同學耀文和萬恬;好友炫光和龍偉,感謝您們在我碩士生涯的砥礪與幫助, 有共同的目標一起向前,克服萌生放棄的念頭。特別感謝妻子星羽,謝謝妳這段 期間的體諒,無數個假日陪伴我等著我,讓我可以專心完成論文。最後要感謝雙 親,沒有他們就沒有現在的我,僅以此篇論文,獻給我的家人。. v.

(6) 摘要. 本研究以台灣50與中型100成分股為對象,運用資料探勘特徵選取技術,分析影響 股票完全填權息成功之關鍵因素,並依此關鍵因素建構一個完全填權息預測模型, 最後比較研究結果與過去研究之異同。本研究完全填權息預測模型的建構過程分 為五階段:(1)定義完全填權息之股票:運用TEJ資料庫抓到的歷史股價資料與股 利資訊,計算除權息前與除權息後股價,標註完全填權息和未完全填權息二個類. 政 治 大 別。(2)影響填權息相關因素:根據過去文獻所發現,影響短期填權息行情超額報 立. ‧ 國. 學. 酬的因素,以及影響股價的基本面因素,蒐集與股利相關的指標與基本分析中所 用的公開財務報表資料。(3)特徵選取分析:利用循序前進搜尋(SFS)結合分類. ‧. 演算法,整合與計算所有影響因素資料,藉此找出關鍵的影響因素。(4)預測模型. y. Nat. al. er. io. sit. 建立:根據特徵選取之結果資料,使用Weka軟體進行資料探勘支持向量機和決策. n. 樹分類模型訓練。(5)模型準確性比較與分析:本研究所建構之模型可協助存股型. Ch. engchi. i n U. v. 投資者,判斷可領取高股息且無股價損失之股票,提供投資人選股參考。. 關鍵字 : 股利、資料探勘、特徵選取。. vi.

(7) Abstract In this study, we use the Feature Selection Method for Data Mining to analyze the key factors that may affect the rate of the stock price successfully remaining previous price after dividend payment among stocks of 50 largest companies and 100 medium-sized companies in Taiwan. Based on these key factors, we construct a forecasting model for stocks with the 100% flat stock price. Finally, We try to find out the similarities and differences between the current study and past research. In this study, the construction of a forecasting model for stocks with the 100% flat stock. 政 治 大 stock price: Marking stocks with the 100% flat stock price and the non-100% 立 flat stock price on historical stock data and dividend information price is divided into five stages: (1) Defining stocks with the 100% flat. ‧ 國. 學. captured by the TEJ database; (2) Relevant Factors Affecting increase in the stock price after dividend payment: According to the factors found. ‧. in the past literature that may affect excess returns from short-term increase in the stock price after dividend payment and the fundamental. Nat. sit. y. factors affecting the stock price, we are able to collect indexes related. io. er. to dividends and public financial statements for basic analysis. (3) Feature Selection Analysis: By using the Sequential Forward Selection. n. al. i n U. v. (SFS) method and the classification algorithm, all influencing factors. Ch. engchi. are integrated and calculated to find out the key influencing factors; (4) The Establishment of the Prediction Model: According to the results of feature selection, we use the Weka software to conduct data mining and train the classification model based on support vector machines and decision trees. (5) Comparison and Analysis on Accuracy of the Model: The model constructed in this study can help stock-holding investors determine stocks with high dividends without loss of the stock price and provide reference for investors in stock selection.. Keywords: Dividend, Data mining, Feature selection.. vii.

(8) 目錄 摘要 ............................................................. vi Abstract ........................................................ vii 目錄 ........................................................... viii 第一章緒論 ........................................................ 1 1.1.研究背景與動機................................................ 1 1.2.研究問題與目的................................................ 6. 政 治 大 第二章文獻探討 .................................................... 9 立 1.3.論文架構...................................................... 8. 2.1 影響除權息日前後股價變動之指標 ................................ 9. ‧ 國. 學. 2.1.1.股利相關指標.............................................. 9 2.1.2.財務相關指標............................................. 14. ‧. 2.2 特徵選取(Feature Selection).................................. 25 2.2.1.循序前進搜尋(Sequential Forward Selection, SFS).......... 27. y. Nat. sit. 2.3 分類......................................................... 29. er. io. 2.3.1.支持向量機(Support Vector Machine, SVM).................. 30. al. 2.3.2.決策樹(Decision Tree).................................... 32. n. v i n Ch 第三章 研究方法 .................................................. 38 engchi U 3.1.系統架構..................................................... 38 3.2.樣本選取與資料來源........................................... 38 3.2.1.資料樣本................................................. 38 3.2.2.資料週期................................................. 40 3.2.3.資料來源................................................. 42 3.3.資料前處理................................................... 43 3.4.特徵選取(Feature Selection).................................. 51 3.5.分類器參數之選擇............................................. 53 3.6.評價方法..................................................... 54 第四章 實驗結果與分析 ............................................ 58 4.1.影響填權息的關鍵特徵......................................... 58 viii.

(9) 4.1.1.台灣 50 與中型 100 成分股之非金融股........................ 58 4.1.2.台灣 50 與中型 100 成分股之金融股.......................... 63 4.1.3.分析與評估............................................... 66 4.2.預測模型建立分析............................................. 67 4.2.1.台灣 50 與中型 100 成分股之非金融股........................ 68 4.2.2.台灣 50 與中型 100 成分股之金融股.......................... 75 4.2.3.分析與評估............................................... 81 第五章 結論與建議 ................................................ 83 5.1.結論......................................................... 83 5.2.建議......................................................... 85 附錄 參考文獻 .................................................... 87. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. ix. i n U. v.

(10) 圖目錄 圖 1.1:潤弘 k 線圖 .................................................. 4 圖 2.1:個人股利所得課稅 ........................................... 11 圖 2.2:Overfitting and Underfitting ............................... 27 圖 2.3:循序前進搜尋 ............................................... 28 圖 2.4:線性分類 ................................................... 31 圖 2.5:核函數映射 ................................................. 32 圖 2.6:決策樹 ..................................................... 33. 政 治 大 圖 3.1:資料前處理 ................................................. 43 立 圖 2.7:熵值分佈範圍 ............................................... 35. ‧ 國. 學. 圖 3.2:除權息資料表 schema ........................................ 44 圖 3.3:每日股價資料表 schema ...................................... 44. ‧. 圖 3.4:稅額扣抵資料表 schema ...................................... 45. sit. y. Nat. 圖 3.5:股利政策資料表 schema ...................................... 45. io. er. 圖 3.6:財務資料表 schema .......................................... 46 圖 3.7:除權息資料表 schema 增加 Class 欄位 .......................... 47. al. n. v i n Ch 圖 3.8:計算分類結果語法 ........................................... 47 engchi U 圖 3.9:除權息資料表 schema 增加股票殖利率欄位 ...................... 48 圖 3.10:計算股票殖利率語法 ........................................ 48 圖 3.11:除權息資料表 schema 增加股價淨值比欄位 ..................... 49 圖 3.12:計算股價淨值比語法 ........................................ 49 圖 3.13:Weka 資料格式 ............................................. 50 圖 3.14:Weka 欄位中英文對照表 ..................................... 50 圖 3.15:5-fold 交叉驗證 ........................................... 52 圖 4.1:非金融股 Weka 特徵選取 Libsvm 設定值 ......................... 59 圖 4.2:非金融股 Weka 特徵選取 J48 設定值 ............................ 59 x.

(11) 圖 4.3:Libsvm 演算法準確率折線圖 .................................. 62 圖 4.4:J48 演算法準確率折線圖 ..................................... 63 圖 4.5:金融股 Weka 特徵選取 Libsvm 設定值 ........................... 63 圖 4.6:金融股 Weka 特徵選取 J48 設定值 .............................. 64 圖 4.7:格式化為 Libsvm 資料格式程式碼 .............................. 70. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. xi. i n U. v.

(12) 表目錄 表 1.1:現金殖利率前 10 名 ........................................... 2 表 2.1:財務指標相關文獻整理 ....................................... 22 表 2.2:Filter 方法與 Wrapper 方法比較 .............................. 26 表 3.1:台灣 50 指數成分股 .......................................... 39 表 3.2:台灣中型 100 指數成分股 ..................................... 40 表 3.3:輸入變數列表 ............................................... 42 表 3.4:混淆矩陣 ................................................... 55. 政 治 大 表 4.2:非金融股 Weka 特徵選取 立 J48 執行結果 ..........................61 表 4.1:非金融股 Weka 特徵選取 Libsvm 執行結果 ....................... 60. ‧ 國. 學. 表 4.3:金融股 Weka 特徵選取 Libsvm 執行結果 ......................... 64 表 4.4:金融股 Weka 特徵選取 J48 執行結果 ............................ 65. ‧. 表 4.5:特徵選取結果 ............................................... 66. sit. y. Nat. 表 4.6:非金融股樣本 J48 決策樹訓練結果 ............................. 69. io. er. 表 4.7:非金融股樣本 Libsvm 支持向量機訓練結果 ...................... 71 表 4.8:金融股樣本 J48 決策樹訓練結果 ............................... 76. al. n. v i n Ch 表 4.9:金融股樣本 Libsvm 支持向量機訓練結果 ........................ 77 engchi U 表 4.10:模型調整參數訓練結果 ...................................... 81. xii.

(13) 第一章緒論 1.1.研究背景與動機 台灣股市一直以來有所謂的除權息行情,"除"是「分配」的意思,除權是分配股 票,除息是分配現金。每年上市櫃公司會根據過去一年的盈餘,與預估未來營運 或再投資所需的保留現金,提出股利政策將獲利分配給股東,配發方式有股票股 利與現金股利兩種。我們以第一金於 2015/07/17 發佈之 103 年度股利除權除息. 政 治 大 日為 104/07/31』。上例中由於每張股票為 1000 股,所以投資人參與除權息後, 立. 公告為例說明: 『每股分派現金股利 0.7 元及股票股利 0.65 元,除權(息)交易. ‧ 國. 學. 一張第一金的股票將獲得 1000 * 0.7 = 700 元的現金股利;每股的票面價值為 10 元,每股可配發的股票股利股數,按比例可以下式計算:. al. x�股�. → x = 0.065�股�. sit. 0.65�元�. (1.1). er. io. 1�股�. =. y. ‧. Nat. 10�元�. n. v i n Ch 其中 X 等於每股可配發的股票股利股數,則一張第一金的股票將獲得 1000 * engchi U 0.065 = 65(股)。股利的發放對股價是有影響的,為了讓股東在除息前與除息後 所買到的價格一致,必須在除權或除息日當天向下調整股價,成為除權息參考價。 經濟日報(2015)的報導指出包括美國、加拿大及一些歐洲國家,都沒有除息除權 日下調股價作法。前金管會主委曾銘宗則表示,沒有這項機制的美國,主要是以 法人為主的市場,法人下單時自然會考慮到除息後的價格,透過市場機制就會反 映應有的價格;但以散戶為主的市場,若未下調股價,散戶若不知相關資訊,以. 1.

(14) 為未除權除息,用高的價格買,對散戶也不見得公平。由此可見,除權息日下調 股價作法,現階段在台灣仍是不易改變的機制。. 投資人在除權息後因為股價下調買進,或者是除權息前因想賺股息買進,而造成 股價開始上漲,此情況稱作除權息行情。存在銀行的資金,我們會參考定存利率, 參與除權息多會參考殖利率,在股票市場中,殖利率是將現金股利除以除權息前 一日股價計算而得。下表 1.1 是截至 2015/9/6 為止,台灣股票市場殖利率前 10 名的個股,可以輕易看出與銀行定存利率相比,持有的報酬率遠大於定期存款,. 治 政 大 但此項推論需建立在完全填息的假設上。 立 ‧ 國. 學. 精英. 20150710. 31.75. 5.00. 15.75 14.45. Nat. 除權息日期 前日收盤價 現金股利 殖利率 20150805. 17.3. 2.50. 5522. 遠雄. 20150716. 33.5. 3.80. 11.34. 2520. 冠德. 11.11. 4930. 燦星網. 2597. 潤弘. 1715. 萬洲. 20150721. 14.55. 1.56. 10.71. 9912. 偉聯. 20150902. 9.59. 1.00. 10.43. 2458. 義隆. 20150723. 35.6. 3.66. 10.28. 2493. 揚博. 20150713. 27.25. 2.80. 10.28. sit. F-光麗. io. 6431. er. 2331. 名稱. ‧. 代碼. y. 表 1.1:現金殖利率前 10 名,資料來源:鉅亨網. n. 18 2.00 a 20150811 v i l20150514 n 36.1 4.00 Ch U i e h n c g68.6 20150615 7.50. 2. 11.08 10.93.

(15) 除權息日下調股價的作法,使得股東在除息前與除息後所買到的價格一致,調整 的計算公式如下:.    . PADR =. PADR = 除權息後參考價. PBDR − C. (1.2). 𝑠𝑠. 1 + 10. PBDR = 除權息前一天收盤價 C = 現金股利 S = 股票股利. 以第一金 103 年度股利除權除息公告為例說明:『每股分派現金股利 0.7 元及股. 政 治 大. 票股利 0.65 元,除權(息)交易日為 104/07/31』。第一金 2015/07/30 日的收. 立. ‧ 國. 學. 盤價為 18.95 代入上式中PBDR ,0.7 代入上式中 C,0.65 代入上式中 S,則算出. 之除權息後參考價約等於 17.136。而台股股價在 10 元~49 元間,每檔的價位是. ‧. 0.05 元,所以 17.136 調整後的除權息參考價為 17.15 元。戶頭裡多了配股配息,. sit. y. Nat. 股價則調整成除權息參考價,所以除權息交易日開盤時,所持有的股票帳上價值. io. al. er. 加上股息,與前一天收盤是相同的。而股價從除權息後參考價回升到除息前一天. n. 的收盤價,我們稱之為『填息』;反之,股價除權息後,沒有回補除權息差價,. Ch. engchi. i n U. v. 反而下跌,使參與的投資人蒙受損失,我們稱之為『貼息』。如果沒有填息,則 資產並無增加。. 衛生署於 2013 年元旦,開徵二代健保補充保費:依「全民健康保險法」第 31 條規定,受薪勞工與全體國民只要有以下 6 種所得,並單次所得或獲利超過 5000 元(含)以上至 1000 萬元以內都要繳納 2% 的「補充保費」予健保局。這 6 大 項所得包括:全年累計逾當月投保金額 4 倍部分之獎金,其他兼職收入,執行業 務收入,股利所得,利息所得,以及租金收入。. 3.

(16) 所以,只要單筆股利超過 5,000 元,不論有無填權息皆須扣繳 2%補充保費,依 此稅徵規定,若參與除權息的股票未來沒有填權息的話,如同資金從左邊口袋移 到右邊口袋,沒有獲利行為卻仍要繳補充保費,反而增加了投資人的負擔。根據 經濟日報 1的報導,健保補充保費開徵兩年有餘,收入一年比一年多,其中,股 利所得所徵收的保費,連續兩年都名列補充保費六大項目之首。2013 年補充保 費的股利部分徵收了 88.99 億元,2014 年則增加至 116.11 億,各占當年健保總 體保費收入 1.6%、2.1%以上,收入幅度更遠超過其他五項保費,包括獎金、兼 職所得、利息、執行業務所得與租金之收入。在股市動能不振之際,此舉無異是. 治 政 大 懲罰長期持有的投資人,鼓舞短期投機者,成為受人詬病的原因之一。 立 ‧ 國. 學. 既然政策如此,選擇高股息股票的同時,注意股價未來是否具備『完全填息』的. ‧. 能力更顯重要,我們以表 1.1 的潤弘為例,殖利率高達 10.93%,可是從下圖 1.1. sit. y. Nat. 潤弘的 k 線圖可發現自從 2015/6/15 除權息後,股價持續呈現貼息的狀態,如果. n. al. er. io. 股票一年內皆是貼息的狀態,賺了股息卻賠了價差,賠錢卻仍要繳稅,就失去原 先欲領取股息追求穩定報酬的意義。. Ch. engchi. i n U. v. 圖 1.1:潤弘 k 線圖,資料來源:CMoney 1黃文奇(2015-07-24)補充保費年年增股民悶。經濟日報,摘自. https://ecorp.chinatrust.com.tw/cts/law_download/1040724.doc 4.

(17) 過去研究中,多半著重在除息日當日或前後短時間內,填權息現象存在之研究, 即各國股市在除權息當日,有配發股利之股票,股價收盤的跌幅是否有小於股利, 或超額報酬的出現。學者 Elton and Gruber(1970)提出了租稅效應假說,假說 中指出,因為股利所得適用稅率高於資本利得適用稅率,造成投資人棄息先賣後 買,可以解釋除權息日的股價填權息現象。學者 Kalay(1984)認為公司在進行除 息或除權時,股價下降通常不會等於息值或權值,對某些投資人而言在除權息日 可能存有一些套利的機會,故其另外提出所謂的短線交易假說來分析除權息日的 交易行為。陳怡文(1990)研究民國 72 年到 77 年間在台灣證券交易所掛牌交易之. 治 政 大 股票,發現除息日當天確實有顯著之填息現象存在,可為租稅效應所解釋,並且 立 僅除息日有顯著超額報酬,其他各日則無。李存修(1994)提出比價心理假說,亦. ‧ 國. 學. 即除權息的股利愈高,除權息後的價格相對愈低,會使投資人有股價偏低的感覺. ‧. 而吸引買盤,因而造成除權息日的超額報酬。林世銘、陳明進、李存修(2000). sit. y. Nat. 探討兩稅合一實施前後,上市公司的除權息日是否仍存在以往文獻所稱的超額報. n. al. er. io. 酬之市場現象,研究結果發現,在實施兩稅合一後,除權息日的超額報酬繼續存. i n U. v. 在。陳秀燕(2005)研究各個不同因素對除權除息日股價行為的影響,發現除權息. Ch. engchi. 日有顯著為正的異常交易量及異常報酬率,可見台灣股票市場的投資人對於除權 除息相當敏感,也積極參與除權除息,短線交易相當活絡,投資人可經由除權除 息獲得利益。姚怡欣(2008)收集民國 88 年至民國 96 年,台灣 50 成分股之除權 息行情進行研究,指出台灣證券市場除權息行情於 11 天前即開始發酵,造成較 大之正異常報酬可能與高配股率、外資買賣超比率有關。王彥鈞(2013)研究民國 98 年至 100 年間有發放股利的台灣上市公司,發現市場景氣變數確實是影響除 權息後報酬的重要因素,且不論市場景氣多、空頭,在除權息後初期的累積異常 報酬皆為正。 5.

(18) 上述有關國內股票股利之研究,多數採用統計方法,尚未有以完全填權息為目標 並採用資料探勘方法的探討。資料探勘可找出物件(Object)之間的關係 (Relationship),透過探勘的過程,發掘出資料中隱含的資訊,且如果依照特定 條件將資料分類,可判斷資料是否隱含此族群特性之規則,進而做到預測結果。 若本研究能藉由探勘的方法,設定完全填權息與否當作分類依據,且所需時間為 一季內,而觀察出個股中影響其完全填權息之影響因素為何,將有助於投資人去 判斷股票是否有完全填權息的可能並與定存利率相比較,支援想以穩健投資賺取 股利的投資人,買賣決策之參考。. 立. 政 治 大. 1.2.研究問題與目的. ‧ 國. 學. 過去在填權息現象與因素的研究中,大部分是短期間內填權息現象之實證以及行. ‧. 為因素之探討,然而想參與股票除權息,領取股利的一般投資人,大多不擅長短. Nat. sit. y. 期進出股票的操作行為,徒增交易成本。近年流行投資定存股,定存股意謂風險. n. al. er. io. 較低、股價穩定、股利配發穩健的股票,若不以短沖套利為目的,而是追求「安. i n U. v. 全穩健」這項定存股的基本特質,就不應以一日漲跌為選股標準,取而代之的是. Ch. engchi. 找尋可以完全填權息的標的。本文的第一個目的,乃整理過去有關在除權息日前 後,影響股價行為的各項變數,觀察在時間放大到一季、目標定為完全填權息後, 是否仍然有顯著影響。. 填息的過程等同於股價上漲,目標漲幅就是股利,由於影響股價的因素眾多,舉 凡基本面、技術面、籌碼面、市場假說、時事新聞、政治、稅制、總體經濟等因 素。一般來說股價分析以三大研究面向:基本面,技術面,籌碼面為主,三派皆 有其理論依據,亦各有相當多學術研究深入鑽研。. 6.

(19) 基本面分析偏重產業市場狀況,公司的財務狀況、企業經營能力等對公司進行研 究與分析,從公司角度考察股票的合理價格,再與股票市場價格進行比較,決定 是否購買。技術面分析就是研究過去資料,預測未來股價走向。這些過去的資料, 以『成交量』和『股價』 基礎,衍伸出許多量價指標及圖表,技術面分析著重 在對技術指標及圖表進行研究,相信歷史會重演,進而決定買賣時間點。籌碼面 是研究主力的動向,他們擁有雄厚的資金、影響股價的能力,因為股票價格還是 取決於市場買賣行為,主力一買一賣都是幾百張甚至幾千在買賣同一支股票,他 們一買進,價格自然上漲,一旦賣出也會使股價下跌。. 立. 政 治 大. 股神巴菲特曾說:「你不打算持有某支股票達十年,則十分鐘也不要持有。」巴. ‧ 國. 學. 菲特強調成功投資的重要因素,取決於企業的實質價值也就是著重在基本面價值. ‧. 投資。常言道: 「基本面選股,技術面擇時」 ,本研究目的為找出影響股票一季內. sit. y. Nat. 完全填權息的關鍵因素,買進股票的時間會假定在除權息日之前,技術面擇時的. io. al. er. 功能在本研究中已被限制住。基本面因為資料來源包括財務報表、總體經濟指標. n. 等,資料頻率較長,適合中長期的操作,與本研究一季期的時間限制相符。基於. Ch. engchi. i n U. v. 上述的理由,除了除權息日前後,影響股價行為的各項變數外,本研究也將加入 基本面指標當作研究變數。. 隨著時間的推移,配合股票市場而產生的各式各樣統計數據也越來越多。在預測 分析中,特徵選擇(Feature Selection)指的是識別出少量最重要的變量或參數, 用來幫助預測結果的重要過程。在現今的電腦運算效能高漲的世界裡,並不太需 要擔心過多變量導致模組計算耗時,比較重要的原因來自於實用性,因為如果兩 個以上的獨立變量對因變數是相互關聯的,那麼在回歸模型係數的估算往往會不 穩定。另外在大量資料的預測模型中,資料會有較高缺值的機率,為了模型的計 7.

(20) 算更加可靠,於是刪除有缺值的資料,最終可能會導致樣本的短缺。最後,較少 的特徵也能夠讓我們更容易去解釋預測的結果。因此本文的第二個目的,是除了 上述影響股價行為的各項變數外,加入其他基本面統計數據,再藉由特徵選擇的 幫助篩選出重要指標,以篩選後指標,透過分類器的學習與辨識能力來發展一個 快速且精準的預測模型,藉此降低存股型投資人選擇投資標的無法完全填權息的 機率,進而推斷出其他影響完全填權息之重要因素。. 1.3.論文架構. 政 治 大 本文內容分為五章,其架構簡短說明如下。第一章說明研究動機,提出研究目的, 立. ‧ 國. 學. 彙整研究架構。第二章針對國內外相關文獻進行整理與探討,參考相關研究結果, 導論本文的研究指標與研究方法,闡述各種指標的意義以及分類演算法。第三章. ‧. 根據文獻回顧章節的方法與指標,說明研究範圍資料、進行指標變數資料搜集與. Nat. sit. y. 資料前處理,接著說明特徵選取方法,最後解釋分類器參數選擇和評價分類之方. n. al. er. io. 法。第四章進行實證,先以特徵選取篩選出重要影響指標,觀察與短期影響因素. i n U. v. 的異同。再以選取的指標建立預測模型,並對模型分類效能結果分析比較。第五. Ch. engchi. 章根據分析結果彙總本文結論,說明本研究限制及不足之處,引申出未來可研究 方向供後續研究參考。. 8.

(21) 第二章文獻探討 本文彙整過去國內外相關文獻,共分成三個小節。第一節主要整理在除權息日前 後,可能影響股價行為的指標與其相關文獻資料,包括國內外學者提出除權息交 易日附近異常行為之研究結果及相關假說,進而提出影響除權息日前後股價變動 之指標,另外根據上一章節所提,完全填權息的過程等同於股價上漲,目標漲幅 就是股利,與股價分析基本面有關的各項財務指標也是本節欲探討的範圍。. 政 治 大. 因為整理出影響股價的指標眾多,為了模型運算的實用性,使用了特徵選取的方. 立. 法,識別出少量最重要的指標,且較少的特徵也能夠讓我們更容易去解釋預測的. ‧ 國. 學. 結果,第二節說明特徵選取的相關文獻。. ‧. 為利用特徵選取後已知特徵,來對本研究之股票樣本資料進行分類模型的建立,. y. Nat. er. io. sit. 進而預測以及推估完全填權息與否的結果,第三節探討分類預測模型中,本研究 所使用的分類方法,支持向量機與決策樹之相關研究。. n. al. Ch. engchi. i n U. v. 2.1 影響除權息日前後股價變動之指標 2.1.1.股利相關指標 (1) 可抵扣稅額比率: 理論上公司股價除息前後的價格差,應等於股利金額,但 Elton and Gruber(1970) 研究 1966 年至 1967 年美國證券市場的上市公司股票股價行為,發現在除息日當 日股價平均降幅小於公司所發行的股利金額,代表除息日當天有超額報酬的產生。 而造成此現象的原因,乃是因為股票持有人的資本利得稅率小於股利收入稅率所 9.

(22) 致,此即為文獻上所說的「租稅效應」。Poterba and Summers(1984)在英國股市 1955 到 1981 年間的研究,結果亦支持 Elton and Gruber 的租稅效應。國內股 市則有陳怡文(1990)以統計方法對民國 72 年至 77 年間在台灣證券交易所掛牌交 易之股票,從事除息日股價變動的填息現象研究,並對租稅效應假說作一驗證。 首先統計除息日股價降幅與股利比,及超額報酬等兩種統計量。測試除息日之填 息現象是否顯著;其次再擴大至除息期間(除息前 5 天到除息後 5 天)之超額報酬 研究,視其是否支持租稅效應假說。實證結果發現,除息日當天平均股價降幅為 股利金額的 58.77%,平均超額報酬則在千分之八左右,得以確信除息日之股價. 治 政 大 行為,是因其避稅傾向之需求;將股票於除息前賣出,待除息日當天再買進,此 立 結果支持租稅效應假說。. ‧ 國. 學 ‧. 我國於 87 年開始實施兩稅合一制,所謂兩稅合一係指將營利事業所得稅與綜合. sit. y. Nat. 所稅兩種稅目合而為一。實施兩稅合一制的目的在於消除營利所得兩次課稅的現. io. al. er. 象,因為在概念上認為公司為法律的虛擬體,不具獨立納稅能力,只是為把盈餘. n. 傳送給股東,不應重複課稅。意即公司所繳納的營所稅,在股東繳納股利綜所稅. Ch. engchi. 時可以全部抵繳。舉例說明如下:. 10. i n U. v.

(23) 立. 政 治 大. 圖 2.1:個人股利所得課稅,資料來源:財政部網站. ‧ 國. 學 ‧. 假設甲股東投資某公司,某公司繳納年度營利事業所得稅 300 萬元,稅後盈餘. sit. y. Nat. 800 萬元,在繳納所得稅後,分配該 800 萬元盈餘(可抵扣稅額比率=300 萬/800. io. al. er. 萬=37.5%)。若該公司共有股東 10 人,每人股權占十分之一,每一股東獲配 80. n. 萬元股利淨額,且因公司營所稅得抵扣個人所得稅,所以甲股東可獲配的可扣抵. Ch. engchi. i n U. v. 稅額為 300 萬元的十分之一,30 萬元(80 萬*0.375=30 萬),甲股東的股利總和 為股利淨額加上可抵扣稅額,110 萬元(80 萬+30 萬=110 萬)。. 現若甲股東其適用的邊際稅率為 40%,應繳納股利稅額為 44 萬元(110 萬*0.4 =44 萬),可扣抵稅額為 30 萬元,故股東僅需再補繳 14 萬元(44 萬-30 萬=14 萬),另外補充保費則是 5000 元以上則單筆 2%,所以還需繳納 2.2 萬(110 萬 *0.02=2.2 萬)補充保費;若適用的邊際稅率為 5%,應納稅額為 5.5 萬元(110 萬*0.05=5.5 萬),可扣抵稅額為 30 萬元,故股東尚可獲退稅 24.5 萬元(5.5 萬 -30 萬=-24.5 萬),當然同樣需要繳納 2.2 萬補充保費。 11.

(24) 針對兩稅合一,林世銘、陳明進及李存修(2000)利用國內上市公司於民國 85 年 至民國 87 年間的除權息作為研究樣本。在研究結果中發現,除權除息日出現平 均超額報酬的市場異象,在實施兩稅合一後繼續存在,而且原來新稅制實施前只 有邊際稅率 13%以下的投資人才可獲得超額利潤,但兩稅合一實施後擴大到稅率 21%以下的投資人都可以獲得超額報酬,表示在除權息交易日附近進行「先買後 賣」的行為可以獲取超額的利潤。由此看來,本國確實存在租稅效應,可抵扣稅 額比率是影響投資人投資報酬的攸關因素。. 政 治 大 股票殖利率一直是很多價值投資人參考的重要數據之一,我們可由 「顧客效應理 立 (2) 股票殖利率:. ‧ 國. 學. 論」談起,顧客效應理論也稱作追隨者效應理論,該理論最先由 Miller 和 Modigliani 在 1961 年提出來。從股東的邊際所得稅稅率出發,認為邊際稅率高. ‧. 的投資人,如公司大股東與邊際稅率低的一般散戶投資人,他們對待股利的態度. y. Nat. io. sit. 不一樣,前者偏好低股利或不支付股利的股票,後者喜歡高股利的股票。據此,. er. 公司會相應調整其股利政策,使股利政策符合股東的願望。達到均衡時,高股利. al. n. v i n 的股票將吸引一類追隨者,由處於低邊際稅率等級的投資者持有;低股利的股票 Ch engchi U 將吸引另一類追隨者,由處於高邊際稅率等級的投資者持有。這種股東聚集在滿 足各自偏好的股利政策的公司的現象,就叫做「顧客效應」。. 按照該理論的觀點,公司的任何股利政策都不可能滿足所有股東對股利的要求, 公司股利政策的變化,只是吸引了喜愛這一股利政策變化的投資者前來購買公司 的股票,而另一些不喜愛新的股利政策的投資者則會賣出股票。因此,當市場上 喜愛高股利的投資者的比例大於發放高股利的公司的比例時,則支付高股利公司 的股票處於短缺狀況,按照供求理論,它們的價格會上揚,直到二者的比例相等, 12.

(25) 市場會達到一個動態平衡(王素娟,2008)。由此可知股票殖利率可能是影響填權 息一個有效因素,本文將之列入影響候選變數中。. (3) 股票市場價格: 李存修(1994)研究民國 73 年到 81 年間,我國上市公司股票股利除權日前後進行 先買後賣,是否有稅後超額之報酬。該文統計分析顯示,除權交易日之異常報酬 率遠比股利所得稅、來回手續費及證券交易稅還多,投資人在其研究期間內,若 遇到股票除權即進行先買後賣之套利操作,雖不保證每一次均會賺到超額報酬,. 政 治 大 報酬的現象,起因於「比價心理假說(the hypothesis of bargain hunting)」。 立 但整個期間累積下來,應可得到顯著的超額報酬。李存修認為這種除權日有超額. ‧ 國. 學. 此論點認為,投資人對於個別股票有一預設之股價範圍,當除權後個別股票的股 價相對較低時,會使投資人有股價偏低的感覺,因而吸引買盤,所以除權配股率. ‧. 愈大,除權後價格便相對愈低,除權交易日之比價心理愈強,將有買盤湧入,因. y. Nat. io. sit. 而產生的異常報酬率便愈大。依此論點,股價較高的股票,在相同殖利率的假設. n. al. er. 下,擁有比股價低股票更多的降幅,比價心裡的影響下,可能較偏好股價高的股 票。. Ch. engchi. i n U. v. (4) 股利支付率: 股利支付率計算方式為普通股每股股利除以每股盈餘。用以表示公司的股利政策, 為每股股利與每股盈餘的比例關係,顯示企業每賺取一元時,普通股股東所能分 配到的股利金額。就單獨的普通股投資者來講,這一指標比每股盈餘更能直接實 現當前利益。而股息發放率高低要依據各公司對資金需要量的具體狀況而定,公 司要綜合考慮經營擴張資金需求、財務風險高低、最佳資本結構來決定支付股利 的比例。. 13.

(26) Gordon(1959)提出「一鳥在手理論(the bird-in-the-hand theory)」,認為投資 者購買股票是為了股利,公司盈利在股利和保留盈餘之間的分配確實能影響股票 價格。一鳥在手理論的核心是認為在投資者眼裡,公司留存收益再投資帶給投資 者的收益具有很大的不確定性,並且投資風險將隨著時間的推移而進一步增大, 股利收入要比由保留盈餘再投資帶來的資本收益更為可靠,故公司需要定期向股 東支付較高的股利。因此,如果公司從盈餘中分配的股利越多,公司的市場價值 也就越大。. 治 政 大 從資訊不對稱的角度來看,由於投資者無法辨識高股利政策是公司討好股東的短 立. 期政策,或係未來價值將增加的訊號。為保障個人權益,投資者會偏好具短期的. ‧ 國. 學. 高股利支付率政策,即使這種政策可能會損傷公司的未來成長。公司若採行高股. ‧. 利支付率政策,至少在短期之內公司價值會增加,此「百鳥在林,不如一鳥在手」. sit. n. al. er. io 2.1.2.財務相關指標. y. Nat. 的高股利支付率,確實有可能推升股價,影響填權息速度。. Ch. engchi. i n U. v. 基本面分析利用公開發行公司所提供的資訊,對其財務狀況和經營成果進行解剖 和分析,能夠對企業經濟效益的優劣作出評價與判斷。而作為評價與判斷標準的 財務指標之選擇和運用尤為重要。. 基本面分析首先由 Graham and Dodd(1934)開始倡導,Graham and Dodd 認為 投資者應拋開股票市場的價格,注重對個別股票內在價值的分析,尋找那些價格 被市場低估的股票進行投資。投資者通過公司的內在價值的估算,比較其內在價 值與公司股票價格之間的差價,當兩者之間的差價達到安全邊際時,就可選擇該 14.

(27) 公司股票進行投資。為了應用安全邊際法進行投資,投資者就需要掌握對公司內 在價值進行估算的技術。而公司的內在價值是由公司的資產、收入、利潤以及任 何未來預期收益等因素決定,其中最重要的因素是公司未來的獲利能力。因為這 些因素都是可以量化的,因此,一個公司的內在價值可用一個模型加以計量,以 數量方法解讀資產、盈餘、股利等基本面的財務數據,藉以推算股票的真值。儘 管目前的價格偏離了該股票的真實價值,但長期來看股價應該要回歸到其合理價 位,所以若估計出來的價值低於目前的市價,代表該股票被高估,此時應脫手賣 出;反之則進場買入,此即基本面分析於投資領域的應用。. 立. 政 治 大. 本研究希望藉由公司的基本面分析,找出個股財務報表資料與股價填權息的關聯. ‧ 國. 學. 性,一般分析財務報表基本面時,常將分析重點區分為財務結構、獲利能力、償. ‧. 債能力、經營能力、市場價值等面向。本研究就這些面向中,挑選認為相對重要. sit. y. Nat. 的財務指標,獲利能力包括資產報酬率、股東權益報酬率、營業利益率、稅後純. n. al. er. io. 益率;財務結構包括負債比率、負債權益比率、股本;償債能力包括流動比率、. i n U. v. 速動比率、現金流量比率、利息保障倍數;經營能力包括應收帳款週轉率、存貨. Ch. engchi. 週轉率、固定資產週轉率、總資產週轉率;市場價值則看股價淨值比。以下茲就 各項財務指標說明:. (1) 每股盈餘(Earning Per Share, EPS):. 每股盈餘(EPS) =. 稅後淨利-特別股股利 流通在外股數. (2.1). EPS 很容易計算,亦常在公開的資訊中獲得,所以一般投資人最普遍地在衡量公 司獲利能力的指標就是 EPS。每股盈餘是衡量在某一會計期間內,公司為它的每 15.

(28) 一股普通股所賺得的盈餘。但若公司亦有發行特別股,則因公司所賺得之淨利, 有一部份是歸屬於特別股,且特別股分配股息和公司剩餘財產的順序先於普通股。 故在計算每股盈餘時,上列公式中分子的淨利,須扣除特別股所享有之淨利。EPS 為公司獲利能力的最後結果。EPS 越高,表示公司具有某種較佳的能力,如產品 行銷、技術、管理能力等等,使得公司可以用較少的資源創造出較高的獲利。本 業的每股獲利,通常也代表著該年度所能配發的股利。. (2) 股東權益報酬率(Return Of Equity, ROE):. 治 政 稅後淨利-特別股股利 大. (2.2). 股東權益. ‧ 國. 立. 學. 股東權益報酬率 =. 股東權益報酬率亦稱淨值報酬率,為該年度股東權益的成長速度。其中稅後淨利. ‧. 部分係指扣除掉特別股股利後之盈餘,而股東權益係指普通股權益總額。EPS 和. sit. y. Nat. ROE 的差別,在於 EPS 使用發行股數當分母,ROE 則用整個股東權益當分母,是. n. al. er. io. 以股東權益為主要考量。股東權益概略來說是資產減去負債所得,主要由股本+. i n U. v. 資本公債+保留盈餘所組成。隨著企業不斷成長,企業保留盈餘會不斷累積成長,. Ch. engchi. 保留盈餘會用來購置公司資產,再更進一步擴大獲利。因此由股東權益成長率可 以看出一個企業如果不仰賴對外舉債也能促使其企業成長的能力。. (3) 資產報酬率(Return On Assets, ROA):. 資產報酬率 =. 稅後淨利-特別股股利 總資產. (2.3). 資產報酬率即在衡量公司所其資產是否充份利用。不論公司的資產是以舉債而來 或是股東資金,公司利用其所有的資產從事生產活動,所獲得的報酬表現在稅後 16.

(29) 淨利上,因此資產報酬率便在衡量公司的營運使整體資產的報酬運用效率狀況。 和 ROE 相比,ROA 多考慮了從負債帶來的效益,銀行和金控公司擁有龐大資產, 但這些資產大部分來自銀行存款,以及向同業和政府拆款及舉債,這些都算是金 控公司的負債,因此金控公司負債比率都極高,而這些企業也是在高度負債的狀 況下穩定的營運。. (4) 流動比率(Current Ratio): 流動比率 =. 流動資產. (2.4). 流動負債. 政 治 大 流動比率,就是短期可運用資金和短期必須清償債務的比例, 「流動資產」是可 立. ‧ 國. 學. 以在一年內換成現金的資產,如現金、股票、應收票據、存貨等。「流動負債」 就是一年內到期的債務如短期借款、應付帳款與票據、應付現金股利、一年內到. ‧. 期的長期負債、預收款項和其他應付款等。流動比率越高表示短期償債能力越. n. al. er. io. sit. y. Nat. 強。. (5) 速動比率(Quick Ratio):. 速動比率 =. Ch. engchi. i n U. 流動資產 − 存貨 − 預付款 流動負債. v. (2.5). 用以檢測企業在短期內可變現償還流動負債的能力,速動比率越高,表示企業短 期償債能力越佳。速動比和流動比的差別在存貨和預付款,其中存貨是主要觀察 的重點。假如速動比率較流動比率低很多,可能是因為存貨的比例太高,而存貨 如果像是電子商品或食品,具有時效性,那麼存貨比例高會有無法變現的風險。. 17.

(30) (6) 負債比率(Liability Ratio):. 負債比率 =. 負債總額. (2.6). 資產總額. 負債比率為負債總額與資產總額的比率關係,是衡量一家公司資本結構的重要指 標。資產等於負債加股東權益,以舉債的方式籌資具有發揮財務槓桿的功能,有 助提高投資報酬率,並且由於利息費用可以抵稅,因此也有稅務上的優點;但其 缺點則是當舉債過高時,由於槓桿因素也將使風險提高,若同時發生營運不若預. 政 治 大 並在選股時能及早過濾掉有潛在財務危機的地雷股。 立. 股東權益. (2.7). y. 負債總額. ‧. Nat. 負債對股東權益比率 =. io. sit. (7) 負債對股東權益比率(Debt Equity Ratio):. 學. ‧ 國. 期時甚至有倒閉的風險。因此由負債比率可大致看出一家公司的體質是否健全,. er. 對債權人而言,負債對股東權益比率越低,表示企業的長期償債能力越強;比率. al. n. v i n 越高表示債權人受保障程度越低。此項比率,比資產負債率更能準確地揭示企業 Ch engchi U. 的長期債償能力狀況,因為公司只能通過增加資本的途徑來降低負債率。負債對 股東權益比率為 200%時為一般的警戒線,若超過則應該格外關注。. (8) 存貨週轉率(Inventory Turnover):. 存貨週轉率 =. 銷貨成本 期初和期末平均存貨. (2.8). 銷貨成本指賣出貨品的成本價,由於存貨會隨時變動所以存貨成本使用期初與期 末的平均,存貨週轉率用以衡量一企業存貨週轉速度,代表企業推銷商品的能力 18.

(31) 與經營績效。存貨周轉率越高,表示銷售能力高,資本運用效率也越高,但比率 過高時,也有可能表示公司存貨不足,導致銷貨機會喪失。相反的,若此存貨周 轉率越低,則表示企業營運不振,存貨過多。. (9) 營業利益率(Operating Profit Ratio):. 營業利益率 =. 營業收入-營業成本-營業費用 營業收入. (2.9). 營業利益率為公司每創造 1 元的營收所能得到的獲利,與毛利率的差別在於毛利. 治 政 大 率只考慮直接因為生產產品所需要的成本,而營業利益則是考慮了在取得收入的 立. 過程中所耗用的一切成本。營業利益率為反映一家公司本業獲利能力的指標。由. ‧ 國. 學. 於營業利益的計算已將過程中所耗用的一切成本均列入考量,因此在關注本業的. ‧. 獲利能力時,營業利益率便為重要指標。與毛利率概念相同,當營業利益率發生. sit. y. Nat. 變化時,通常代表著公司體質發生轉變,例如新產品效益出現、規模經濟量顯現. al. n. 中。. er. io. 或是管理能力的提升等等,這些公司體質轉佳的效益都會顯現在營業利益率數字. Ch. engchi. i n U. v. (10) 稅後純益率(Net Profit Ratio):. 稅後純益率 =. 營業淨利 + 營業外收入 − 營業外支出 − 所得稅費用 營業收入. (2.10). 稅後純益率亦稱做淨利率,用以衡量企業最終的獲利能力,業外損益也會影響企 業獲利能力,公司不一定只能經營本業,也可以有副業。所以一間企業本業經營 得好,營業利益率高,但經營的副業都在虧錢,最後還是會壓低稅後純益率。稅 後純益率通常用來比較同一公司不同期間稅後盈餘的變化以了解公司獲利情況 19.

(32) 的趨勢變化。. (11)公司規模: 股本是指股東繳足並向主管機關辦理登記的資本額,又稱法定資本,是企業必須 維持資本之最低金額。股本為一家公司規模大小的指標。當公司仍處於小股本階 段時,通常也代表著公司處於黃金的成長階段。而公司股本較大,則常代表著公 司已於某一個產業取得領導地位。在另一方面,股本的大小代表著籌碼的多寡。 籌碼少的股票具有安定的優點,而籌碼多的股票則具有流動性佳的優點。. 政 治 大. (12)總資產週轉率(Total Asset Turnover):. 總資產週轉率 =. 銷貨額 總資產. 學. ‧ 國. 立. (2.11). ‧. 用以衡量公司所有資產的使用效率,總資產周轉率越高 資產運用效率越高,也. y. Nat. io. sit. 就是投資 1 元資產,所產生多大的銷貨收入,週轉率越高表示資產使用的效能越. er. 高,週轉率越低表示公司的資產被浪費了,對公司收入,並沒有幫助。如果只看. al. n. v i n 單一比率,可能見樹不見林。例如:存貨周轉率高,只代表銷售部門能力強,無 Ch engchi U 法反映整間企業的營運效率;固定資產周轉率高,代表製造部門生產能力強,同 樣看不出整間企業的營運效率。所以使用總資產周轉率來判斷整間企業的綜合效 率。. 20.

(33) (13)固定資產週轉率(Fixed Asset Turnover):. 固定資產週轉率 =. 銷貨額. (2.12). 淨固定資產. 用以衡量公司廠房、機器設備、土地等固定資產的使用效率,表示 1 元的固定資 產,可以產生多少的營業效能。比率越高越好,表示運用固定資產的效率越高。. (14)應收帳款週轉率(Account Receivable Turnover): 營業收入 治 政 平均應收帳款 大. 應收帳款周轉率 =. 立. (2.13). ‧ 國. 學. 用以衡量企業在特定期間內,收回賒銷帳款的能力,數值越高,表示公司信用及 收款政策越佳,或企業過分收縮信用;若數值偏低,則表示企業收款條件或收帳. ‧. 政策不當,或客戶發生財務困難,或企業過分擴充。. sit. y. Nat. n. al. er. io. (15)利息保障倍數(Interest Coverage):. Ch. 利息保障倍數 =. i n U. 稅前息前純益. e n 利息費用 gchi. v. (2.14). 用以衡量企業支付利息的能力,倍數越高,表示債權人受保障程度越高,亦即債 務人支付利息的能力越高。就是看企業賺來的盈餘,能不能償還負債的利息。大 部分企業都會舉債經營,舉債就會產生利息。如果利息還不出來,以後可能就借 不到錢,甚至會倒閉。所以我們用利息保障倍數來觀察這間公司能不能回出利 息。. 21.

(34) (16)股價淨值比(Price/Book Value Ratio,PBR):. 股價淨值比 =. 股價. (2.15). 每股淨值. 股價淨值比是風險衡量指標。PBR 與盈餘成長性成正比,與風險成反比,與淨值 報酬率成正比,實務上常把市價淨值比高的股票稱為「成長股」,把市價淨值比 低的股票稱為價值股。. 歷年來學者對國內股票市場進行績效研究,不論是以技術面角度切入,分析眾多. 治 政 大 的量價指標,亦或是以基本面角度切入,選擇多項財務指標預測資本市場報酬率 , 立 皆各有之。許多文獻指出,財務報表具有資訊內涵,亦對股票市場、企業內部具. ‧ 國. 學. 有決策性,分析財務比率的確能預測出股票報酬率,並可利用財務指標篩選出相. ‧. 對健全的股票,為投資者帶來超額的報酬率。以下僅將歷年來文獻中,所使用的. n. al. er. io. sit. y. Nat. 財務指標及其分析結果,彙總如下:. i n U. v. 表 2.1:財務指標相關文獻整理,資料來源:本研究整理. Ch. engchi. 作者. 年度. 摘要. 指標. 張文玉. 1998. 在「財務比率對公開發行公司每股盈餘之預測. 資產報酬. 力」的研究中發現資產報酬率、淨值報酬率、. 率、淨值報. 負債比率與流動比率對於股票報酬具備較佳的. 酬率、負債. 預測能力。. 比率、流動 比率. 林冠秀. 1999. 以合併橫斷面與時間序列的迴歸模式的線性與. 純益率、公. 二次混合迴歸模式,探討財務因素對台灣半導. 司規模. 體上市公司股價季報酬率的影響。實證分析結 果,欲探討的變數對於台灣半導體上市公司季 報酬率影響,都具有顯著的解釋能力。其中以 純益率最高,公司規模次之。 22.

(35) 周資輔. 王正翔. 2001. 2002. 針對高科技產業類公司進行分析,經過不同計. 每股盈. 量模型實證分析結果:在四個財務比率中,以. 餘、流動比. 每股盈餘(EPS)和股票報酬率呈現顯著正相. 率、負債比. 關,其餘如流動比率、負債比率及存貨週轉率. 率、存貨週. 則呈現不顯著的關係。. 轉率. 針對未預期盈餘資訊與宣告日前後股價報酬率. 公司規. 之關聯性進行研究,主要發現,當公司表現超. 模、市價淨. 出預期時,小型公司的正向累積超額報酬較大. 值比. 型公司為大。而當公司表現不如預期時,小型 公司的價格向下調整幅度反而較大型公司之價 格向下調整幅度為小。當公司表現超出預期. 政 治 大. 時,市價淨值比越高的股票,其股價超額報酬 越大。 吳政勳. 2003. 立. 探討財務比率與股票報酬率之關聯性,實證結. 應收帳款. ‧ 國. 學. 果發現:81 年至 85 年間:電子業財務比率對股 週轉率、資 產報酬. 產報酬率較顯著;紡織業以流動比率較顯著;. 率、流動比. 不區分產業別則以負債比率、流動比率、應收. 率、負債比. 帳款週轉率、資產報酬率具良好之解釋力。86. 率、現金流. ‧. 票報酬率變動之影響,以應收帳款週轉率、資. y. Nat. sit. 年至 90 年間:電子業以流動比率、應收帳款週 量比率. er. io. 轉率與資產報酬率較顯著;紡織業以流動比. al. n. v i n Ch 不區分產業別以資產報酬率、現金流量比率影 engchi U 響較顯著。 率、現金流量比率、應收帳款週轉率較顯著;. 邱俊仁. 2004. 以台積電為個案研究對象,依據美國紐約 Stern 股東權益 Stewart & Co.財務顧問公司對 EVA 的定義,計 報酬率、每 算台積電每季經濟附加價值,再與該公司每季. 股盈餘、資. 的傳統績效指標如股東權益報酬率(ROE)、每股 產報酬率 盈餘(EPS)、資產報酬率(ROA),相互比較,並 探討其資訊內涵,迴歸分析中,以股東權益報 酬率(ROE)對台積電股價(TSP)及市場附加價值 (MVA)之解釋度最高。在相關性分析或迴歸分析 中,經濟附加價值(EVA)對台積電股價(TSP)及 市場附加價值(MVA)之相關性或解釋度,均不強. 23.

(36) 烈,且其解釋能力不如傳統獲利指標。顯示台 積電的股東,其投資決策,仍以傳統績效指標 作為依據。 張呈榜. 2010. 以 229 檔上市上櫃個股為研究對象,發現在持. 負債資產. 有週期為一週時,負債資產比率、存貨週轉率、 比、存貨週 現金流量比率、營業利益率、以及股價淨值比, 轉率、現金. 范曉芬. 2014. 與股價報酬率關係較為顯著。當投資期間延長. 流量比、營. 至一個月甚或三個月以上者,根據實證結果,. 業利益. 資產報酬率、以及股東權益報酬率,會與股價. 率、股價淨. 報酬率關係較為顯著。. 值比. 以台灣上市電子類股為對象,選用財務報表中. 存貨周轉. 政 治 大 動比率等 20 個財務指標及三大法人持股資訊、 立 券資比為選股變數,以季為投資單位,運用主. 率、負債比. 研究發展費用率、存貨周轉率、負債比率、流. 率、流動比 率. ‧ 國. 學. 成份分析法分析,依據主成份加權分數做排 名,取得排名前 5、10、15、20 及 40 家的公司. ‧. 股票作為投資組合,假設資金等比例投資在所 設計的投資組合中之個股,評估分析各投資組. y. Nat. 合與對照組(即台股加權股價指數、電子類股. sit. 指數及台指 50ETF)之報酬率、實證結果顯示,. er. io. 以 12 季投資期間相比,排名前 5 公司投資報酬. n. al. i n C 合與對照組的報酬率不具顯著性。 hengchi U. v. 率顯著高於對照組投資報酬率,其餘組投資組 吳淑錂. 2015. 以台灣上市(櫃)公司公開財務報表中的八大. 每股盈. 財務指標進行篩選,並依股本大小配以不同權. 餘、股東權. 重建構投資組合,主要發現,考慮公司規模利. 益報酬. 用股本大小來調整投資權重,能穩健超越大盤. 率、殖利. 報酬率,另外利用,每股盈餘、股東權益報酬. 率、本益. 率、殖利率、本益比、負載比率、營收成長率、 比、負債比 盈餘成長率、現金流量比等八大財務指標,做. 率、營收成. 為選股依據,在均權、加權、累積報酬率及夏. 長率、盈餘. 普指數上皆明顯優於大盤,且不論是在空頭抑. 成長率、現. 或多頭市場都能顯著提高投資績效。. 金流量比. 24.

(37) 2.2 特徵選取(Feature Selection) 在資料探勘領域,或現今很常被提起的大數據,變數的數量往往非常龐大,不同 的變數間我們不一定能確定其中是否有重複性或是相依性,容易影響到系統模型 的建立與預測的正確性。因此,特徵選擇成為該領域研究的重要過程,透過特徵 選取可以找出資料集中的顯著變量(Sikora and Piramuthu,2007)。. 尋找顯著變量的問題中,n 維的特徵變數共有 2n-1 種變數組合情形,當擁有的 特徵變數數目越多,所需測試的變數組合也越多。如要獲得「最佳」的特徵變數. 政 治 大 組合,那只有使用暴力法,把所有組合都測試過一遍才能得知,多維度特徵的測 立. ‧ 國. 學. 試將非常耗時且不切實際。故在研究上往往退而尋求「近似最佳」的特徵變數組 合,利用有效的特徵變數選取方法,來節省運算時間及找出可信賴的變數組合。. ‧. Dash 和 Liu(1997)定義了特徵選擇的四個步驟,生成子集合、評估子集合、停. Nat. sit. y. 止測試標準和結果驗證。在評估子集合的過程中,依據特徵選取方法是否獨立於. n. al. er. io. 分類的演算法,可以分為兩大類: (1) Filter方法:. Ch. engchi. i n U. v. 獨立於分類器的演算法,直接利用所有訓練數據統計出的相關性來評估所選取特 徵,速度快,但所選取的特徵與後續分類演算法的準確率偏差較大。 (2) Wrapper方法: 相對於 Filter 方法,Wrapper 方法主要的目的是利用分類器演算法比較各種不 同特徵子集合在 Training data 的效果(例如,準確率),最後尋找出效果最好的 特徵組合(歐嘉文,2012) 。下表整理了 Filter 方法 與 Wrapper 方法特性比較。. 25.

(38) 表 2.2:Filter 方法與 Wrapper 方法比較,資料來源:歐嘉文(2012) 種類 Filter. 特色 1.快速 2.可擴展 3.獨立於分類器. 缺點 1.無法針對特定模型調校 2.忽略與分類器的交互. Wrapper. 1.結合分類器 2.適配特定模型. 1.計算密集 2.依賴分類器 3.過適風險. 常見方法 1.ANOVA 2.Stepwise logit regression 3.Discriminant analysis 4.Iterative RELIEF 1.Sequential forward selection 2.Sequential backward selection 3.Randomized hill climbing 4.Genetic algorithms. 另一方面,Wrapper 方法普遍都會遇到 Overfitting 的問題。Overfitting 現象 是指在訓練模型時,使用過多參數,造成訓練結果很好,因為模型複雜,完美地. 政 治 大 適應訓練資料,但預測結果卻很差的狀況。Overfitting 的可能性不只取決於參 立. ‧ 國. 學. 數個數和資料,也跟模型架構與資料的一致性有關。通常一個學習演算法是藉由 訓練範例來訓練的,亦即範例資料的結果是可知的,而演算法必須達到可以預測. ‧. 出其它資料的正確結果。Dieterle(2003)認為,預測誤差主要由兩種誤差組成,. Nat. sit. y. 干擾誤差和估計誤差。干擾誤差是指數據資料中未被模型辨識出的系統誤差,估. n. al. er. io. 計誤差是由數據資料中的隨機雜訊造成。當干擾誤差和估計誤差相互平衡(圖. i n U. v. 2.2 中的箭頭)時,獲得最佳預測。由於太簡單的模型,預測誤差增加稱為學習. Ch. engchi. 不足,而由於太複雜的模型以致預測誤差增加被稱為過適訓練。在機器學習中, 為了避免過適現象,須要使用額外的技巧,如交叉驗證。. 26.

(39) 政 治 大 圖 2.2:Overfitting and Underfitting,資料來源:Dieterle(2003) 立. ‧ 國. 學. 通常在預測分類正確率時,Wrapper 方法所得之正確率會優於 Filter 之方法. ‧. (Zhu,Z.,Ong,Y.S.,& Dash,M.,2007),原因是因為 Filter 方法獨立於演算法,. Nat. sit. y. 著重挑選出相關性高的特徵,而相關性高並不代表在預測會有最好的效果。常見. n. al. er. io. 的 Wrapper 方法包括 Sequential forward selection 和 Sequential backward selection。(Kohavi and John,1997). Ch. engchi. i n U. v. 2.2.1.循序前進搜尋(Sequential Forward Selection, SFS) 本文使用循序前進搜尋作為特徵選取之方法,SFS 由 Whitney(1971)首次用於特 徵選取上。從一維開始測試每個特徵,根據分類器的準確率挑出一個績效最高的 特徵,以此特徵為基礎加入其它特徵當作二維特徵的候選組合,再次挑選出績效 最高的特徵當作最佳組合,以此最佳組合當基礎,繼續加入其他特徵為三維特徵 的候選組合,依上述條件搜尋下去,停止條件為到達預選取特徵的所需數目。SFS 之流程圖如下: 27.

(40) 政 治 大. 立. ‧. ‧ 國. 學. 圖 2.3:循序前進搜尋,資料來源:本研究整理. 舉例來說,如果我們要找出{F1,F2,F3,F4}特徵集合中,最佳的 3 個特徵變數,. n. al. er. io. sit. y. Nat. 我們需要遵循三個步驟:. i n U. v. 第一步:我們需要確定單一維度的最有代表性的特徵。於是我們測試每個特徵在. Ch. engchi. 分類器計算下,擁有最佳準確率的特徵,在此假定是 F2。 第二步:以 F2 為基礎,兩維的候選組合是{F2,F1},{F2,F3},{F2,F4}。選 擇每個候選組合在分類器計算下,擁有最佳準確率的特徵組合,假定其為{F2, F3}。 第三步:最後,我們再增加一個維度。該組合是{F2,F3,F1},{F2,F3,F4}。 如果{F2,F3,F4}的分類準確率最高,達到我們欲選取特徵的數目,則 SFS 的特 徵挑選結果即為{F2,F3,F4}。. 28.

(41) 以 SFS 方法選取特徵,因結合了分類器,所需計算的組合數量也遠比窮舉法要來 得少,因此 SFS 被視為是傳統上快速的特徵選取方法,選取的質量則會隨著訓練 資料量的增加而跟著提昇(Jain and Zongker,1997)。. 2.3 分類 分類之定義為,建立一個學習函數,使得這個學習函數可以藉由屬性對應至類別, 多用於預測以及推估,適合預測二元分類或是名目分類的問題,具順序特性的類 別其預測效果較差。分類方法包含決策樹、類神經網路、支撐向量機以及單純貝. 政 治 大 氏等等(施雅月、賴錦慧,2000) 立 。分群與分類兩者經常被混淆,兩者最大的不同. ‧ 國. 學. 是,分群並不預先設定各群所代表的意義,而是藉由每筆資料的屬性,自動將整 組資料分成好幾個類別、群集;而分類則必須先定義各群所代表的意義與主要屬. ‧. 性,然後依照資料與各群的相關性進行分類。. sit. y. Nat. io. al. er. 以機器學習的方法來說,分類為監督式學習,分群為非監督式學習。非監督式學. v. n. 習並不需要標記資料的類別,所以若是標記大量訓練資料成本昂貴,或者擁有一. Ch. engchi. i n U. 個未知的大資料庫,可以反向找到不同類別定義。例如,記錄語音實際上是非常 便宜容易取得的,但是準確地標記每個時刻發出什麼詞則非常昂貴和耗時,這時 適合使用非監督式的學習方法幫助資料分群(Duda,R.,Hart,P.and Stork,D., 2012)。監督式學習,談的是在已知類別的資料輸入後,透過類別與屬性對應關 係的建構,得到有預測能力的模型輸出,這樣的學習過程被稱之為監督式學習, 也就是說,透過這樣的資訊解析過程,了解其中資訊的變化,並進行相關資訊的 萃取與解讀。. 回顧過去資料探勘研究中,有關財務指標的分類文獻,黃敏菁(2005)進行分類模 29.

(42) 型於臺灣加權股價指數之研究,證實了支援向量機在財務資料應用上的可行性與 準確性。陳佳郁(2011)在支援向量機於財務危機預測研究中發現,支援向量機在 預測企業財務危機是一個很好的方法,且財務比率指標導入模型,會依季資料量 增加使得準確率增加。. 另外一項資料探勘很常見的分類方法決策樹,又可稱為分類樹,為一種歸納學習 法,利用樹的概念來將不同的資料進行分類(Sun,W.,Chen,J.,& Li,J.,2007)。. 政 治 大 提供了簡單且容易理解的預測模型 立 ,因此被廣泛的運用在資料探勘上與各種不同 由於決策樹能產生具解釋性的規則,讓使用者能快速理解其資料中隱含的資訊,. ‧. ‧ 國. 學. 領域的問題上,不論是醫學領域、商學領域、社會學領域都可見到決策樹的應用。. 綜上所述,本研究認為在人工智慧模型使用財務資料預測股價中,支撐向量機與. sit. y. Nat. 決策樹模型實為可行。而過去相關文獻並無以人工智慧預測模型,來預測股價完. n. al. er. io. 全填權息與否的研究實證,因此,本研究採用了支撐向量機與決策樹,來預測股. i n U. v. 價填權息與否,期能歸納出易判斷與理解的影響填權息之重要因素。茲就本文使 用到的分類方法說明。. Ch. engchi. 2.3.1.支持向量機(Support Vector Machine, SVM) 支持向量機由 Cortes 與 Vapnik(1995)提出,是一種監督式學習的機器學習方法。 其方法藉由將輸入向量非線性映射到高維度的空間,在該空間中,找出最大邊界 (maximum-margin)之超平面(hyperplane),應用在二元分類上有很高的準確率。. 30.

(43) 圖 2.4:線性分類,. 政 治 大. 資料來源:Duda,R.,Hart,P.and Stork,D.(2012). 立. ‧ 國. 學. 以上圖 2.4 線性分類為例,可以看出 H1 線無法分隔兩類,但能用來區分兩類別 資料之線條不只一種,H2、H3 皆能將兩類別的資料分開,支持向量機目的是找. ‧. 到將二個類別資料分隔出來,且具有最大邊界之線性圖形,雖然 H2 也有做到此. y. Nat. n. al. er. io. sit. 點,但卻只有很小的邊界量,所以 H3 代表的是此分類的最佳線性函數。. i n U. v. 若在現實問題中,碰到線性不可分的問題,則利用核函數將輸入資料映射到高維. Ch. engchi. 空間,這樣不但容易能以線性的方法處理非線性的分類問題,更可以避免實際座 標做映射運算時的大量複雜運算,這個技巧被稱為 kernel trick。如下圖 2.5, φ是映射函數,我們透過φ把 x 映射到特徵空間。同樣地,符合這樣的超平面會 有很多個,支持向量機用以找到能讓二類別資料可以明顯區分出來,且邊界距離 能夠最大的超平面當作分類超平面。. 31.

(44) 圖 2.5:核函數映射,資料來源:林宗勳(2000). 政 治 大. 立. 如何選擇適用的核函數對於支援向量機亦是相當重要的一個部份,目前常見的核. 𝑑𝑑. sit. Nat. 2.多項式(𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃): 𝐾𝐾�𝑥𝑥𝑖𝑖 , 𝑥𝑥𝑗𝑗 � = �𝛾𝛾𝑥𝑥𝑖𝑖 𝑥𝑥𝑗𝑗 + 𝛾𝛾� ,𝛾𝛾 > 0. n. i n U. v. (2.17) 2. �𝑥𝑥𝑖𝑖 −𝑥𝑥𝑗𝑗 �. er. io. 3.徑向基函數(𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹): 𝐾𝐾�𝑥𝑥𝑖𝑖 , 𝑥𝑥𝑗𝑗 � = 𝑒𝑒𝑒𝑒𝑒𝑒 �−. al. (2.16). y. 1.線性(𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿): K�xi , xj � = xi ∙ xj. ‧. ‧ 國. 學. 函數則有以下三種。. 𝜎𝜎2. �. (2.18). 本研究選擇使用徑向基函數(RBF)核函數,其具有以下特點:能分類非線性且高. Ch. engchi. 維之資料,只須調整 Cost 與 Gamma 兩項參數,減少操作之複雜性,亦可達較高 之預測能力。. 2.3.2.決策樹(Decision Tree) 決策樹的發展久遠,是資料探勘中的分類技術,命名由來在於所生成的分類或預 測模型顯示方式為一種樹狀結構的模型,其方法的原理是藉由分類的規則來分類 資料,分類的規則一般而言都是自上而下,每個事件都可能引出兩個或多個事件, 導致不同的結果並從中歸納出資料中各屬性間的關係,所產生出樹狀的結構。而 32.

(45) 產生出來的決策樹,也能利用來做樣本的預測。. 進一步解釋,如下圖中,每個節點代表一個屬性,樹葉代表分類類別,而每個分 枝代表屬性的某個值或某個範圍。由樹的根節點開始,按照分類的問題與屬性展 開各節點,經由分枝條件走至樹葉,樹葉部份則為得到的結果,從根節點到樹葉 的過程,可轉換歸納成相對應的分類法則,就是決策樹的最大特色: 1.. if (Attribute1 = condition1 and Attribute2 = condition4) then class1. 2.. if (Attribute1 = condition3) then class1. 3.. if (Attribute1 = condition2 and Attribute3 = condition6) then class2. 立. 政 治 大 .. ‧ 國. 學. . .. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 2.6:決策樹,資料來源:本研究整理. 而如何做到決策樹生成?使用訓練資料來建立決策樹,每一個節點,依據屬性選 擇指標,從現有未被挑選過的屬性中,選出分類能力最好的屬性做為樹的內部節 點,利用內部節點的所有不同資料做節點分割(Splitting Node),產生出對應的 分支,針對每一個新產生的分支,將訓練資料重新排列,以進行下一個內部節點 33.

(46) 的產生,重複上面的過程,直到所有的新產生節點都是樹葉節點為止。. 在上述決策樹生成中,顯而易見屬性選擇指標扮演關鍵角色,屬性選擇指標主要 功能是用來選擇出某一個屬性,透過該屬性,將帶有類別標記的資料作適當的分 類。理想情況是:所挑選的屬性可以使得分類結果中,同類別所包含的資料集合 具有高同質性。因此,屬性選擇指標也稱為分割條件。屬性選擇指標,根據不同 的決策樹演算法有不同的形式,常見的有 Quinlan(1979、1992)提出的 ID3、C4.5 演算法,使用「資訊獲利(Information Gain)」做為屬性選擇指標。. 政 治 大 ID3 與 C4.5 演算法雖有不同,本質上仍是透過熵(Entropy)為分割概念,所謂的 立. ‧ 國. 學. 熵是對某個系統之不確定性或混亂程度的度量方法,在這我們指的是某屬性中, 資料分佈的分散程度,混亂程度愈高則愈無規則,決策樹就是要降低屬性中資料. ‧. 分佈的分散程度,最低者即是最佳的樹狀結構。熵值計算方式為:. al. n. 其中. Ch. 𝑖𝑖=1. engchi. . S=資料集合. . C=類別數目. . 𝑃𝑃𝑖𝑖 = 類別 i 在資料集合中出現的機率. er. io. Entropy(S) = � − 𝑃𝑃𝑖𝑖 log 2 𝑃𝑃𝑖𝑖. sit. y. Nat. 𝑐𝑐. i n U. (2.19). v. ID3 在建構決策樹過程中,就是以熵為基礎,計算出資訊獲利的值,並選擇最大 的資訊獲利值作為分類屬性。圖 2.7 中,x 軸代表某類別顯現的機率,y 軸代表 熵值大小,當出現的機率為 0.5 時,表示資料的不確定性最高,熵的值最大,相 對地,當某類別顯現的機率越低或越高,則熵值愈小,代表資訊的凌亂程度愈低。. 34.

(47) 立. 政 治 大. ‧. ‧ 國. 學. 圖 2.7:熵值分佈範圍,資料來源: 陳士杰. 至於資訊獲利的計算方式,假設屬性 A 中有 n 個不同值{a1 ,a2 ,…, an },. sit. y. Nat. 而資料集合 S 會因為這些不同值而分割出 n 個不同的資料子集合{s1,s2 ,…,. n. al. er. io. sn },屬性 A 在資料集合 S 的資訊獲利 Gain(S, A)被定義為:. i n U. Ch. v. e n g𝑛𝑛 c|𝑆𝑆𝑗𝑗h| i Gain(S, A) = Entropy(S) − � Entropy�𝑆𝑆 � 𝑗𝑗=1. 其中. |𝑆𝑆|. 𝑗𝑗. . Entropy(S):資料集合 S 整體的亂度. . Entropy(𝑆𝑆𝑗𝑗 ):資料子集合 𝑆𝑆𝑗𝑗 的亂度,其中j = 1, 2, …, n. . |𝑆𝑆𝑗𝑗 | |𝑆𝑆|. (2.20). :第 j 個子集合之資料個數佔總資料集合的比率(即:權重). Gain(S, A)表示利用屬性 A 對資料集合 S 進行分割的獲利,Gain 值愈大,表示 屬性 A 內資料的凌亂程度愈小,用來分類資料會愈佳;Gain 值愈小,表示屬性 A. 35.

(48) 內資料的凌亂程度愈大,用來分類資料會愈差。. ID3 演算法所使用的資訊獲利會傾向選擇擁有許多不同數值的屬性,例如一個產 品資訊的資料集中,「產品編號」欄位,每一個產品的產品編號皆不同,若依產 品編號進行分割,會產生出許多分支,且每一個分支都是很單一的結果,其資訊 獲利會最大。但這個屬性對於建立決策樹是沒有意義的。. C4.5 演算法利用屬性的「獲利比率(Gain Ratio)」克服此問題。計算屬性 A 的. 政 治 大. 獲利比率時,除資訊獲利外,尚需計算該屬性的「分割資訊值(Split. 立. n. j=1. (2.21). sit. y. Nat. |Sj | |Sj | ∙ log 2 |S| |S|. ‧. SplitInfo(S, A) = − �. 學. ‧ 國. Information)」:. io. n. al. er. 求出屬性 A 的分割資訊值後,獲利比率 GainRatio(A)則為:. Ch. i n U. Gain(S, A) GainRatio(A) = SplitInfo(S, A). engchi. v. (2.22). 擁有最大獲利比例的屬性被設為分割屬性。C4.5 可說是 ID3 的改進版本,在 ID3 基礎上增加了對連續屬性的處理以及對選擇擁有許多不同數值但不具意義的屬 性之處理。. 在建構決策樹的過程中,增加樹的階層固然可以提高預測精確度,但是很重要的 一點是必須注意到是否造成過度學習,當在相同的精準度的結果時,如果樹的階 層愈少是愈好的。此論述根據奥卡姆的剃刀理論(Occam's Razor)而來: 「當實驗 36.

(49) 取得的事實能夠得到說明時,不應增添不必要的假設,應把它一剃而盡。」最簡 單的解釋就是最好的解釋。當選擇某一個屬性做為決策樹的一個內部節點,若會 導致該屬性的指標值低於事先定義的臨界值時,則應該停止此一節點及其以下的 所有子節點之成長,至於臨界值的定義則常運用統計門檻值加以衡量。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 37. i n U. v.

參考文獻

相關文件

 Promote project learning, mathematical modeling, and problem-based learning to strengthen the ability to integrate and apply knowledge and skills, and make. calculated

Wang, Solving pseudomonotone variational inequalities and pseudocon- vex optimization problems using the projection neural network, IEEE Transactions on Neural Networks 17

volume suppressed mass: (TeV) 2 /M P ∼ 10 −4 eV → mm range can be experimentally tested for any number of extra dimensions - Light U(1) gauge bosons: no derivative couplings. =>

Define instead the imaginary.. potential, magnetic field, lattice…) Dirac-BdG Hamiltonian:. with small, and matrix

incapable to extract any quantities from QCD, nor to tackle the most interesting physics, namely, the spontaneously chiral symmetry breaking and the color confinement.. 

• Formation of massive primordial stars as origin of objects in the early universe. • Supernova explosions might be visible to the most

This kind of algorithm has also been a powerful tool for solving many other optimization problems, including symmetric cone complementarity problems [15, 16, 20–22], symmetric

Continue to serve as statements of curriculum intentions setting out more precisely student achievement as a result of the curriculum.