• 沒有找到結果。

3. 研究方法

3.1 研究架構

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3. 研究方法

3.1 研究架構

股票投資獲利的關鍵在於好的股票投資標的及交易價格低買高賣,進而引 申如何區分公司經營獲利能力與找出交易決策規則並識別股票最佳買賣點的議 題。本研究採系統建構(System Development;Palvia et al., 2004)研究方法,

運用巨量資料分析框架(Wu et al., 2014),研析有關股票選擇及交易專業領域 知識、導入巨量資料分析方法、選擇與建構巨量資料分析運算平台服務等三大 面向,對於本研究所關注股票選擇交易策略專業領域知識(domain

knowledge)議題,結合知識發掘步驟,設計由資料驅動的巨量資料分析方法,

並架構巨量資料分析運算平台服務,以建立一兼顧基本面與技術面的股票選擇 與交易混搭(mash-up)策略,以期能找出優質安全低風險之股票標的,進而決 定最佳買賣點交易時機,並作為實踐巨量資料分析方法建構經驗(practice),

本研究架構如圖 3-1 所示。

在如何區別公司經營獲利能力,識別優質安全低風險股票標的問題部份,

本研究以公司長期永續經營能力與財務健全觀點著眼,從基本分析理論出發,

找出衡量一家公司財務健全、賺錢獲利能力、發放股息股利政策、董監事持股 角度等資料屬性,包含結構化資料屬性,如財務指標等,以及非結構化資料屬 性,如網路財經新聞評論資訊等,來鑑別公司經營本質優劣,評估公司股票實 際應有價值與未來看好的潛力。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

然區別公司經營優劣與股票價值好壞問題,在屬量結構化資料部份,如每 股盈餘、股本報酬率、稅後淨利、配息率、盈餘再投資率、董監持股比率等財 務指標,屬一分群分類區別問題,而分群問題最重要考量的因素有二,所選屬 量區別變數(屬性)是否具有鑑別力,以及可否分配適合群數及群內成員。本 研究在分群問題選擇區別變數(屬性)上,以巴菲特價值投資理論(Buffett and Carol, 2001;Hagstrom, 1997)之重要衡量公司價值之屬量變數為主。而在分群 分析方法選擇上,以能依資料分佈母體狀況,即依資料的平均值與變異程度來 決定其母體分群態樣,自我配置適當群數及群內成員,彰顯群組資料特徵之增 長層級式自我組織映射圖演算法(GHSOM),作為解決分群問題的方法,建 立股票選擇策略模型,以找出基本面相關態樣(pattern)、特徵(feature),來 區別股票內在價值優劣,協助投資人進行最佳股票選擇決策,以降低投資風 險、提高交易安全,獲取最大利潤。

此外,本研究在解決股票選擇問題屬質部份,以巴菲特價值投資理論質化 分析(Buffett and Carol, 2001)為前提,模仿 Kansei words(Pham et al., 2011)

處理方式,建立股票評價正負向情緒關鍵字資料庫,經由爬文解析、斷字斷 句、情緒及意見分析後,對於網路財經新聞所發表之股票價值評價輿論資訊,

透過處理非結構資料之分散式運算平台技術進行挖掘,以建立股票評價好壞識 別資訊,作為股票選擇策略的參考來源。

‧ Single process

Elastic

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

叉決策準則,並以投資報酬率(ROI)作為目標適應函數(fitness function),

透過資料來決定買賣訊號與交易決策準則,進而建構股票買賣交易模型。

本研究之系統架構包括五個階段,分別是建構階段、平台架構階段、訓練 測試階段、分析塑模階段及決策支援階段,如圖 3-2 所示。

本研究之系統建構流程步驟,因研究方法之限制,所以本研究所分析資料 與策略,係屬基本面、技術面之資料與分析方法建構策略進行探討,未包含異 常、政治、政策因素等不確定原因。

Feature and pattern

Feature retrieving and ROI records

OIParticles

Extracting trading rules and

signals

Trading rules and signals identifying Daily stock data

SMA computing

Trading signals retrieving and

operating SMA

indicators Evalution of

stocks database Web, Facebook news of stocks

Web Mining with Sentiment

Analysis

The orders of stocks of evaluation and

rank Evaluating and

ranking of stocks

zookeeper

Hadoop

HBase

Elastic Search Training/Testing

phase

Analyzing and

Modeling phase Decision support phase

Constructing phase

Positive and negative keywords database of

stocks

Platform and Application Constructing Phase

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y