3. 研究方法
3.2 建構階段
3.2.2 股票選擇策略模型
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
and holding capital += (sheet of hold stock * close price of this d date of this stock) − transaction cost.
2-6 return holding capital.
3.2.2 股票選擇策略模型
步驟 1:定義應用領域問題流程,找出知識發掘重要議題。
在如何找出優質安全低風險股票標的問題部份,本研究以公司長期永續經 營能力與財務健全觀點著眼,從基本分析理論出發,衡量一家公司財務健全與 否、賺錢獲利能力為何、發放股息股利政策、董監事持股角度與網路輿論資訊 等,包含結構化與非結構化資料屬性,以鑑別公司經營本質優劣,評估公司股 票實際應有價值與未來看好的潛力。
然區別公司經營優劣與股票價值好壞問題,在屬量之結構化資料部份,如 每股盈餘、股本報酬率、稅後淨利、配息率、盈餘再投資董監持股比率等財務 指標,屬一分群分類區別問題,而分群問題最重要考量的因素有二,所選區別 變數(屬性)是否具有鑑別力,以及可否分配適合群數及群內成員。本研究在 分群問題選擇區別變數(屬性)上,以巴菲特價值投資理論(Buffett and Carol, 2001;Hagstrom, 1997)之重要衡量公司價值之屬量變數為主。
此外,本研究亦選擇網路輿論資訊,如專家或投資人對於股票評價資料,
屬非結構化資料部份,以巴菲特價值投資理論(Buffett and Carol, 2001)之衡量 屬質變數為主,透過處理非結構資料之分散式運算平台技術進行挖掘,以建立 股票評價好壞識別資訊,作為股票選擇策略的參考來源。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
步驟 2:由知識發掘重要議題中產生資料集合(subset data point)
本研究在股票選擇議題,包含屬量財務指標的結構化資料,以及屬質的網路 財經新聞資訊之非結構化資料兩種角度,匯聚成為一選擇策略,由於結構化與非 結構化資料處理方式不同,以下再就結構化與非結構化資料分別探討之。
1.結構化資料
(1)定義輸入變量
一般研究在進行分群區別變數選擇上,大多使用區別分析、邏輯模型、專 家選擇或文獻評析等方法。本研究於文獻探討中了解財務指標對於識別公司經 營獲利能力及財務健全程度,相當具有參考意義。
因此,本研究在分群區別變數的選擇,經文獻評析後,選用以價值投資理 論(Buffett and Carol, 2001;Hagstrom, 1997)之基本面財務指標作為輸入顯著 變量。由於上述變量是依據財務指標相關文獻探討而得,其變數衡量值相對於 母體較具有代表性,有助於識別優質安全特性的股票,並縮小輸入變數的數 量,使收集到更適合之樣本集合。
本研究之分群區別變數,如每股盈餘(Earnings Per Share, EPS)、股本報 酬率(Return On Equity,ROE)、稅後淨利、配息率、盈餘再投資率(洪瑞泰, 2004 ;Earnings reinvestment)、董監持股比率等,其財務指標公式如表 3-2 所 示:
‧
(EPS,Earning Per Share)
(1)公式=稅後淨利/股數
(2)說明:本研究以 EPS 表示。
2 股本報酬率
(Return On Equity)
(1)公式=每股盈餘(EPS)/股東權益
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
股票投資報酬率受買賣時點價差影響,不同投資人有不同買賣決策,將影 響投資報酬率是否具有衡量客觀性。因此,本研究選擇經由 EPSO 股票交易預 測模型所產生投資報酬率(ROI)作為輸出之顯著變量,採納原因是由於同一 交易決策準則與方法產出,較具衡量客觀性。
2.非結構化資料
股票選擇策略屬質非結構化資料分析,採用價值投資理論(Buffett and
Carol, 2001)之基本面屬質分析,如網路專家或投資人對於股票評價資料,屬
非結構化資料部份,再經由關鍵字剖析,儲存該評價資訊。 步驟 3:設計資料驅動點
1.結構化資料
本研究股票選擇策略模型在屬量財務指標之結構化資料部份,是分群分類問 題,本研究思考如何由資料自動驅動分群分類規則,選擇增長層級式自我組織映 射圖演算法(GHSOM),屬非監督式學習演算法,因演算法本身具有資料驅動
(data-driven)特性,可依母體資料分佈狀況,由其平均值與變異程度來決定母 體分群態樣,並且自我配置適合群數及群內成員,亦即分群分類規則演算法為本 研究股票屬量選擇策略之資料驅動點。
2.非結構資料
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
在屬質網路財經新聞評價資訊之非結構化資料部份,是網路資料探勘暨情緒 分析問題,而所挖掘的網頁資料經資料結構化(datafication)、情緒分析評價衡 量是本研究屬質選擇策略的資料驅動點。
步驟 4:導入適合問題解決的資料分析方法
1.結構化資料
由於 GHSOM 競爭學習特性,使得其成為一可發現樣本群中具有統計學顯 著特點之規律性偵測器(regularity detector)。其發展拓撲表達方式,可以捕捉 每一集群之最顯著特徵。此外,透過一組小型葉節點,GHSOM 可以將訓練樣 本分類成具有層次之分類關係,而不是僅二分結果,因此,其優點是可細膩分 析與分類。
經過 GHSOM 分群聚類後,計算每群之輸入變量(區別變數)之平均數、
標準差、最大值、最小值,並且與輸出變量 ROI 一併探討,找出每群蘊涵的財 務資訊及其代表的意義,以及其財務資訊與 ROI 間關係,並觀察輸入變數(區 別變數)是否具有鑑別度,是否足夠衡量一家公司之獲利能力評斷參考。本研 究是以 GHSOH 演算法為核心,透過股票分群變數的選擇及股票分群規則建立 而成,最終獲得一 GHSOM 樹。此 GHSOM 樹之每個葉節點內資料,均透過廣 度參數(τ1)和深度參數(τ2)值,自動形成基於訓練樣本資料態樣及具一空間 關係之最優分群分類規則。因此,經廣度參數(τ1)和深度參數(τ2)訓練後產 生之分類規則,則為影響選擇策略分群分類規則。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
2.非結構化資料
在股票選擇屬質非結構資料部份,本研究結合網路探勘暨情緒分析方法
(Web Mining with Sentiment Analysis),首先將網頁財經新聞進行資料結構化
(datafication),即依關鍵字剖析儲存成為股票評價資料庫,再按股票正負評 價積分、熱度排行並進行特徵萃取(feature extraction),產生結果做為選擇股 票策略的參考。