簡介 - 以語法式的屬性導向歸納演算法挖掘企業在股價上漲期間的財務資料特徵之研究-以紡織纖維業與金融業為例

1.1 研究背景與動機

財務績效指標是投資者最容易從各個管道去收集到有關企業體質的公開資訊，投資者在選擇其投資標的時，往往會先從企業的財務報表中去分析得到各項績效指標的相關資訊，更可以從財務方面有關的績效指標來了解企業目前的營運狀況，過去的研究多以時間序列(Time Series Prediction)或迴歸分析(Regression Analysis)的方式來預測財務績效指標的走勢，然而能夠從財務報表上得到的資訊量是非常豐富的，使用者在進行分析時往往會依照各自的專業知識來挑選應納入考量的財務績效指標(Pinches et al. ,1973；Henderson and Kaplan,2000；吳道凱,2000；Jaap et al. ,2003)，而學者 Rappaport(1986)在其研究中提出企業在財務績效指標表現良好不代表股東的價值也會跟著提升，也不能因此判定財務績效表現良好的企業就是值得投資的企業，因此使用者在做出挑選投資標的決策時，要如何從眾多的財務績效指標中找出需要特別留意的指標與指標的表現好壞以及如何從眾多指標裡決定觀察順序成了相當困難的問題。

這種要從大量的資訊中找出決策的參考依據的情境逐漸發生在各個領域，起因於隨著資訊科技的發展，各式各樣的電磁資料在不同屬性的資訊系統中被快速的累積，

例如 POS 系統中的交易紀錄、CRM 系統中的消費者行為研究、ERP 系統中的企業營運資料，系統運作過程中所產生的大量資料內容以電磁紀錄的形態進行累積與永久保存。然而，傳統的資料分析技術能否有效率的分析數量日漸龐大的資料庫亦引起注意。在傳統的資料分析技術無法維持以往的高效率來處理龐大資料數量的困境下，而實務上又有分析大量資料的急迫需求，在這個情況之下帶動了資料探勘(Data Mining) 技術的興起，藉由其優異的資料過慮、演算、分析、歸納的技術，可自龐大的資料庫中粹取出有趣且無法直接察覺的內隱知識，使得資料探勘成為資料庫領域上新的應用，資料探勘技術更成為新興的研究領域(Koperski et al. 1996)。因此使用資料探勘的技術與概念可以挖掘出眾多的財務績效指標中應特別關注某些財務績效指標的表現。

使用資料探勘技術所挖掘出來的結果會與使用因素分析法、時間列序或迴歸分析技術所得到的結果產生根本上的差異，造成差異的原因在於因素分析法、時間序列或迴歸分析技術是以演繹法為基礎，透過證明或反證假說的方式來詮譯資料中所含的意

義，而資料探勘則是透過歸納的方式從資料中挖掘出內隱知識來形成假說(Mennis and Liu, 2003)。在過去的研究中多以因素分析法、時間序列或迴歸分析搭配財務績效指標所提供的數據來進行預測，而在資料探勘中也可依照使用不同的探勘技術把挖掘的結果區分為預測型(Predictive)與描述型(Descriptive)兩種，預測型的內容著重在以決策樹與非決策樹的分類法進行分類、預測(Han and Kamber,2000;Berry and Linoff,1997)，

前者以決策樹為基礎的分類法有 ID3、PRISM、Gini Index，而後者以非決策樹為基礎方分類法有屬性導向歸納法、貝氏分類法、記憶基礎推論法、類神經網路分類法。描述型的資料探勘著重在對己發生的事實進行描述、了解、說明、內隱知識發掘 (Berry,1997)，因此在本研究中將以資料探勘的技術從歷史資料中挖掘出股價呈現漲勢的企業在財務績效指標上的特徵，然而過去的研究多以針對一個或多數的幾項財務績效指標做為研究對象，研究結果也是以某項財務績效指標在數據變化或指標之間的某種關係變化來做為投資決策參考的依據，缺乏從各個學者在其研究中所提出應關注的眾多財務績效指標中去發掘出一般化的財務特徵以應用於決策的方法。

因此本研究將以如何從各個學者在其研究中所提出應關注的眾多財務績效指標中歸納出應優先關注的指標及指標的特徵為何為做研究目的，為此本研究將採用屬性導向歸納法(Attribute-Oriented Induction, AOI)做為主體，取其用於分類、歸納的概念做為研究方法，AOI 是資料歸納學習領域中俱有重要代表性的方法(Cai et al., 1990;

Han et al., 1992; Han et al., 1993; Chen et al., 1996; Han and Kamber, 2001)，AOI 將複雜的大量事實案例去經由概括(Summarize)、推理(Inference)的方式去尋找出資料內一般性原則(Principles)或特徵法則(Characteristic Rule)，藉此由此探勘結果來做為決策時的參考資料的依據。在歸納演算之前必須透過領域專家(Specialist)或學者(Researcher)先整理出具有概念階層(Concept Hierarchies)的概念樹(Concept Tree)來協助屬性資料的歸納，此為 AOI 處理資料的特色，而此特色也成為 AOI 發展的瓶頸，造成瓶頸的主要原因有以下兩點，分述如下，第一，在定義概念階層的過程中必須有專家學者的人為介入，但在許多情境之下，目標屬性之間沒有一個很明顯的概念階層時，使用者只能依照自身的背景知識來對大量的資料表格內的資料進行運算，若由多個不同背景的使用者來對相同的資料庫進行歸納演算會使得各個不同使用者的歸納結果有所出

的格式存在，例如人口普查資料(Census Data)、地理資料(Geographic Data)或者是帶有環境建築物的空間資料(Spatial Data)，而在本研究中所使用到的財務績效指標亦可視為一種多質屬性的資料，這類多質屬性的資料在傳統 AOI 中皆無法處理，使得 AOI 在使用上產生了限制。雖然有學者(Roy & Mumey,2010)提出了修改概念階層的方式，

使其修改後的 AOI 方法在一定的程度上能夠處理多值屬性的問題，但此種仍須要專家學者的人為介入方式，仍然存在著不同的專家學者就有不同的歸納結論的問題。

為解決前述的兩項問題，在學者(黃書猛等人,2010；Huang et al. ,2010)研究中提出以修改後的卡諾圖理論(Modified Karnaugh Map)為基礎的創新演算方法，稱為改良屬性導向歸納演算法(Modified Attribute Oriented Induction, MAOI)，也稱為類卡諾圖演算法，在 MAOI 的方法中不需要定義概念階層的程序即可直接進行屬性資料歸納，

也因為不需要再借助於概念階層，使得歸納結果少了人為介入干擾的不穩定性。同時 MAOI 也具有處理多值屬性資料的功能，使得前述的多值屬性資料都能透過 MAOI 方法去歸納化簡來挖掘出資料中的廣義特徵，此外 MAOI 是以一種接近人類直接思考的圖示(Graphic Representation)化簡方式，是屬於語意(Semantic)層次的方法，但根據本研究整理發現到 MAOI 用圖示方式進行化簡歸納時會有存在兩個很大的缺陷，

其一，在類卡諾圖中一個多質屬性欄位最多僅能顯示並離散化(Discretization)成六個變數，因此限制了類卡諾圖能夠處理的變數數量，如果需要化簡七個以上的變數時，

類卡諾圖便不太適用。其二，在類卡諾圖的前置處理中，有一步驟為原始的多質屬性資料轉換為二進制值(Binary)，而此種轉換方式會受到原始資料的特色來影響決定能否轉換，當原始資料的特色不適合使用類卡諾圖的轉換方式，該屬性下所含的資料只能直接捨棄無法納入化簡歸納；這兩個缺陷嚴重限制了 MAOI 能夠有效應用的範圍。

因此，本研究在 MAOI 化簡原理上提出一個不需要使用類卡諾圖的化簡方式，希望能夠突破圖示上變數數量的限制缺點，且適用於任意數量變數的歸納方法，本研究稱此種不需要借助使用類卡諾圖化簡歸納方法為語法式的屬性導向歸納演算法(Syntax Attribute Oriented Induction, SAOI)(黃書猛等人,2011)，在後續將以 SAOI 演算來達到自財務績效指標中化簡並挑選出應優先關注指標的研究目的。

1.2 研究目的

1. 使用化簡歸納的方式從選定的產業中找特定企業在財務績效指標上的共通特徵做為決策的參考。

2. 修改 MAOI 演算法的化簡方式使其突破限有的最大六個變數的限制，讓使用者能夠依照需求去離散化成更多的變數。

3. 針對多質屬性資料的特色設計新的轉換方法，讓目前己知不適合使用 MAOI 演算法進行二進制值轉換的多質屬性資料亦能轉換成二進制值。

1.3 論文架構

本論文內容共分為五個章節：第一章為緒論，包含研究背景與動機、研究目的、

研究限制以及論文的架構，第二章為文獻探討，分別是資料探勘、屬性導向歸納法、

改良屬性導向歸納法，第三章為語法式屬性導向歸納，包含演算流程、多質屬性資料前置處理、資料轉換後的化簡歸納，第四章為實作驗證，透過真實的 281 筆上市公司屬於財務績效指標的資料來進行演算，第五章為研究結果，用以解讀化簡歸納後的特徵。第六章則是結論。

在文檔中以語法式的屬性導向歸納演算法挖掘企業在股價上漲期間的財務資料特徵之研究-以紡織纖維業與金融業為例 (頁 9-13)