• 沒有找到結果。

4. 實驗結果分析

5.6 比較分析

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

5.6 比較分析

本研究與其他各研究文獻比較,詳如表 5-6 所示。在研究方法部份,除 TDM(Peng et al., 2005)自創判斷股票指數轉折點方法外,其餘採用人工智 慧、機器學習及網路探勘暨情緒分析方法。本研究是採巨量資料分析(Big Data analytics)方法進行建構。而 Teixeira et al.(2010)則採 KNN 進行樣本比對,

識別買賣訊號;Chavarnakul and Enke(2009)使用 NN 結合 fuzzy 判斷買賣訊 號;Pham et al.(2014)採 Kansei SOM 結合專家調查意見將股票分類分群,區 分出股票投資候選標的;Lin et al.(2014)則採網路探勘暨情緒分析、線段切割 法(Piecewise Linear Representation Method)及基因演算法(GA)方式,鑑別 買賣訊號;在研究方法部份差異較大,每個方法各有特色。

在 ROI 投資報酬績效部分,本研究屬期初上升盤整及期末下降盤整趨勢,

而與其他研究方法進行比較,本研究之每家股票平均獲利程度為 210.80%,優 於大盤 181.60%;而其他研究方法如 KNN(Teixeira et al., 2010)優於大盤 75.09%、GRNN(Chavarnakul and Enke, 2009)優於大盤 24.71%、PLR-GMKL

(Lin et al., 2014)優於大盤 37.46%、TDM(Peng et al., 2005)優於大盤 33.61%、Kansei SOM(Pham et al., 2014)優於大盤 6.21%,本研究方法投資報 酬績效相對偏高。

在解決問題思考的領域知識分析方法上,本研究包含基本分析與技術分 析,與 PLR-GMKL(Lin et al., 2014)文獻相同,其餘研究文獻為技術分析、基 本分析擇一作為研究分析基礎。另本研究同時涵蓋選擇與交易兩種策略,除

略。在資料結構部份,本研究方法、PLR-GMKL、Kansei SOM 等均處理結構與 非結構資料。

(TeixeirKa et al., 2010)

index daily

data)

年度 1997-2014 1999-2009 1995-2003 2010-2012

1995-2003 2009-2010

(TeixeirKa et al., 2010)

2010/1/1-2012/9/28 2001-2003

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

6.討論、意涵與限制

本研究發展之 EPSO-GHSOM 股票選擇交易策略,可以提供股票投資人進 行股票選擇與交易決策。本研究方法運用巨量資料分析(Big Data Analytics)

的資料觀點、分析方法與平台架構技術(如圖 3-1 所示),結合知識發掘方 法,以及變動天數移動平均線技術指標(VLMA)與其黃金死亡交叉決策準 則、價值投資理論等股票領域知識,建構由資料驅動之股票選擇交易策略模 型。本研究系統架構包括五個階段,分別是建構階段、平台架構階段、訓練測 試階段、分析塑模階段與決策支援階段,如圖 3-2 所示。

在建構階段(The Constructing Phase),(1)首先定義股票選擇交易應用 領域問題流程,找出優質安全的股票及交易價格低買高賣等知識。(2)在前所 探討優質安全的股票及交易價格低買高賣等知識基礎下,進行重要議題發掘;

在股票交易策略部份,找出可識別買賣點訊號之變動天數簡單移動平均線

(VLMA)與黃金死亡交叉決策準則等;而在股票選擇策略部份,找出可進行 識別優質安全股票特性之財務指標與網路財經新聞資料等資料集合。(3)設計 模型建構之資料驅動點,在股票交易策略部份,資料驅動點設計於交易決策準 則之參數,以變動天數簡單移動平均線(VLMA)作為可調參數,使決策準則 具有資料驅動能力;在股票選擇策略部份,在屬量財務指標之資料驅動點設計 於分群分類規則,以本身具有資料驅動(data-driven)之非監督式學習演算法特 性,作為選擇演算法的依據;在屬質網路財經新聞資料部份,設計於關鍵字剖 析並經資料結構化(datafication)步驟後,進行情緒分析(sentiment)評價,使 屬質資料具有資料驅動特性。(4)最後,導入適合問題解決的資料分析方法。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

在股票交易策略部份,提出 EPSO 最佳化演算法,將具資料驅動能力之交 易決策準則(如公式 3-2 所示),作為最佳化演算法目標適應函數(fitness function),衡量並找出股票交易策略中之最佳交易決策準則,以及識別股票最 佳買賣點(buying and selling signals);在股票選擇策略之屬量財務指標部份,

應用 GHSOM 非監督式學習演算法,自動形成基於訓練樣本態樣及其空間關係 之最優分群分類規則;在股票選擇策略之屬質網路財經新聞資料部份,以網路 探勘取得資料,再經關鍵字剖析並予以資料結構化(datafication),最後進行 情緒分析(sentiment)評價計算正負情緒積分。

在平台架構階段(The Platfom and Application Constructing Phase)部份,

(1)首先區分欲處理之資料屬性是屬於結構化、半結構化或非結構化資料。

(2)再評估資料適合以 SQL 或 NO-SQL 方式儲存、處理。(3)考量分析結果 是否有即時回應需求,進而選擇以即時或批次方式處理。(4)剖析資料分析方 法的特性是否適合 Map-Reduce 分散式運算,或演算法內之步驟相依性高需獨 立運算(single alone)完成。(5)選擇適配的分散式運算平台系統架構並進行 系統平台建構與資料分析程式開發。

在訓練測試(The Training and Testing Phase)階段部份,(1)首先選用來 源資料並自動讀入,在股票交易策略部份,選用台灣上市股票並讀取每日交易 資料;在股票選擇策略屬量分析部份,選用台灣上市股票並讀取證券交易所公 布財務報告及投顧公司次級資料;在股票選擇策略屬質分析部份,選用

facebook 經濟日報、工商日報及 MoneyDJ 網路財經新聞等報導作為訓練測試資 料來源。(2)將讀取之來源資料進行 ELTL(Extract, Load, Transform,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

Load),處理內容包括去除干擾資料(removing noise)、處理缺漏資料

(handling missing data fields)、彙整資料子集合資訊(collecting required information to model)、計算時間及已知變化的資訊(calculating time

information and known changes)等。(3)最後,分別依 EPSO 最佳化演算法、

GHSOM 演算法及網路探勘暨情緒分析等資料分析方法,執行訓練測試步驟。

在分析塑模階段(The Analyzing and Modeling Phase)部份,(1)將實驗 結果按資料子集合的資料屬性、可調參數及子集合本身資料等進行剖析規則 化。(2)進而,萃取出態樣與特徵(feature extraction)並建立策略模型。

在決策支援階段(The Decision Support Phase)部份,(1)將各類來源資 料選用自動讀入,並依資料結構化及非結構資料特性進行 ELTL(Extract, Load, Transform, Load)。(2)依 EPSO-GHSOM 及網路探勘暨情緒分析(Web Mining with Sentiment Analysis)股票選擇策略規則篩選優質安全股票標的。

(3)最後挑選出之股票標的,再依 EPSO 股票交易策略決策準則,偵測買賣交 易點執行股票交易。

以下分節闡述說明本研究結果與發現(6.1)、實務意涵(6.2),以及研究 限制(6.3)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y