• 沒有找到結果。

第二章、 文獻探討

第五節 文獻探討小結

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

𝐑𝐞𝐜𝐚𝐥𝐥 =𝑻𝑷+𝑻𝑵𝑻𝑷 ··· (11)

𝐅 − 𝐦𝐞𝐚𝐬𝐮𝐫𝐞 =𝟐×𝐏𝐫𝐞𝐜𝐢𝐬𝐢𝐨𝐧×𝐑𝐞𝐜𝐚𝐥𝐥

(𝐏𝐫𝐞𝐜𝐢𝐬𝐢𝐨𝐧+𝐑𝐞𝐜𝐚𝐥𝐥)

··· (12)

公式(12)之 F-measure 為避免造成不同指標之結果不一之情況而改善的方法,

為 Precision Rate 與 Recall Rate 之結合,各取所長之結果。

第五節 文獻探討小結

本研究於資料蒐集階段,以公正具公信力之公開資訊觀測站為資料來源,將 內部公布之各企業重大訊息為分析之原始資料。前處理部份將以統整後之詞庫式 斷詞法進行,並使用經過單位化之 TFC-Weighting 法計算權重,再以 Cosine Coefficien 作相似度分析。分群分類方法選擇 kNN 演算法,看中其直覺的演算方 法以及良好的精確率,股價資訊則取自台灣經濟新報資料庫。最後配合分群分類 資料與股價資訊以完成本研究之目的,研究架構將於第三章詳細介紹。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y 第三章、 研究設計

第一節 台灣市場現況

台灣的證券市場,不若歐美等市場穩健,除了天災人禍外,政府政策、選舉 等都會導致台股隨之波動,更遑論各企業之內部消息發布所造成的影響(楊忠駿,

1998;葉淑玲,2003;林章德,2000;吳真蕙,2000;李春淋,2010)。

台灣股市是屬於淺碟型的市場,規模小、週轉率高、風險(波動性)亦高。以 日常生活舉例,就如同一個深度過淺的碟子裝滿了水,外界有什麼風吹草動,很 容易就會隨波貣舞。

3.1.1 淺碟型市場

台灣淺碟型市場的特性,導致政府政策、選舉、政治鬥爭等,常常引貣台股 非理性的漲跌。如一檔價值型股票其公司策略沒有多大的改變,股價卻可以有一 倍的落差;而一檔小型的投資型股票,波動幅度甚至可高達 2 到 3 倍。可見台灣 投資人得多花心力在非經濟面研究,才能避免這種非理性震盪的風險。

淺碟型市場多為新興股市,新興股市最為人詬病的現象,就是人為炒作的問 題。由於市場參與者少,再加上台灣多為股本較小的中小型企業,使得人為操作 影響力大為提高。而這些非基本面之影響股價的行為,終究會回到基本面上反映 出其真實價格,落到股價暴跌的下場。

淺碟式經濟體的另一特色,就是企業資訊揭露並沒有成熟法規來規範。許多 公司內部之不實處分,如虛報業績、債務虧損、債務隱藏等,都為投資行為帶來 極高風險,於是資訊揭露制度更顯得相當重要,而對一般投資人(散戶)而言,如

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

何解讀或收集到不輕易露面公司的資訊,也是相關單位努力的方向(商業周刊,

2006)。

3.1.2 散戶市場

台灣市場是一個以「自然人」為主的散戶市場,如圖 3-1 所示,台灣股市之 散戶從 2003 年至 2010 年間比例高達七成以上,遠超過其他類型之投資人。臺灣 獨特的市場特色再加上兩岸特殊的政經環境,以及自由開放之政黨政治,種種的 因素導致台灣股市相當容易出現非經濟面因素的干擾,因而表現出相當不穩定的 特性。

圖 3-1 集中交易市場成交金額投資人類別趨勢 資料來源:行政院主計處

一般散戶取得市場資訊相對不容易,甚或不知如何獲取適切資訊,故容易受 市場之不確定消息影響而動作,甚至出現追漲殺跌(Momentum Strategy)等不理性

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

的投資行為發生,造成股價過度反應;另一方面,由於專業的投資機構取得市場 上相關訊息較為正確迅速,以及專業化的分析與判斷,其投資決策不易產生不理 性的行為。因此可以推斷,在股票市場中,法人或專業投資機構所佔的比例越高,

則該國市場之穩定性越高。

由淺碟型市場、散戶為大宗的特徵,不難理解台灣積極仿效歐美之資訊揭露 政策,以及迫切需要之情況(莊慶仁,2001)。同時台灣投資人亦不如 Fama(1970) 的效率市場假說中所言那般理性,「羊群效應」(The Effect of Sleep Flock)的情形 充斥整個股票市場,顯示著台灣的投資人彼此之間互相影響的事實。人們的行為 是否真為完全理性已經引發相當多的爭議,更有學者認為人們的行為實乃非理性 兼且並非隨機發生(Shleifer,2000)。

由以上諸多現況可以解釋台灣的股票市場中,資訊揭露以及揭露程度如何均 會對股價造成影響,本研究即針對此種台灣市場現況設計,詳細的研究架構介紹 於第二節。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 3-2 為本研究之研究架構圖,其中各個步驟之實際作法將分述如下。

3.2.1 資料蒐集

首先本研究從公開資訊觀測站,根據自實施資訊揭露評鑑以來之企業評價為 A+者,蒐集其五年來之重大訊息資料(2005~2009),再從台灣經濟新報資料庫取 出取樣期間內之公司股價資訊,兩者即為本研究之資料來源。共計 1382 篇重大 訊息,四間不同產業之上司公司,分別為統一、中華電信、長榮航空以及臺灣企 銀。之所以會選擇評價 A+的公司作為研究樣本,乃是希望能夠得到最完整的訊 息來源,以便瞭解重大訊息是否忠實反應其影響於股票市場。

由於本研究主要在探討重大訊息對於發布公司有何實際的影響,而當市場上 有重大的資訊宣告時,對於股價與成交量都會有顯著的影響產生(Kim &

Verrecchia,1991;Foster & Viswanathan,1993)。因此研究一開始,將會對發布重大 訊息期間各公司股票之成交量與取樣全時期各公司之帄均成交量相比較,檢驗是 否有顯著異常之交易量(Nofsinger,2001)。由先前文獻探討之結果可以得知台灣並 非強效式效率市場,因此訊息會於發布日前即開始影響股市,所以本研究再參考 過去學者之研究,將重大訊息宣告日加上其前後各兩個交易日,當作此篇重大訊 息之影響期間(李顯儀與吳幸姬,2005;李顯儀等,2006)。

3.2.2 資料前處理模組

資料前處理的部份首先以詞庫式斷詞法進行斷詞工作,工具為中央研究院之 中文詞知識庫小組所開發之 CKIP 中文斷詞系統,將蒐集來的重大訊息加以斷詞 後存入資料庫當中,作為進行後續步驟的詞庫使用,並為權重以及相似度的計算 基礎。

由於 TFIDF-Weighting 並沒有考慮到不同文件的長度問題,於是本研究使用 文件正規化之 TFC-Weighting,以便將文件長度之影響降至最低,步驟說明如下:

首先計算出詞彙之 TF 值與 IDF 值,分別以下列之公式(1)(2)計算: (Popescu,2001),讓資料更具比較意義、更容易解釋,如公式(4):

𝒂𝒊𝒌 = 𝒇𝒊𝒌×𝐥𝐨𝐠

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3.2.3 kNN 演算法

本研究之目的為找出公司發布之重大訊息對其股價之影響,因此希望能夠在 分類階段能達到最佳的精確度。k-Nearest Neighbor (kNN)(Witten & Frank,2000) 演算法一直以來皆是文字探勘領域的重要工具,由於 kNN 較為直覺的觀念,再 加上其表現的成果相當準確,與本研究一開始的出發點相契合,因此選擇 kNN 演算法。

當研究作完前處理之後,所有文件資料(即重大訊息)已轉換為向量空間的數 值,再將股價之漲跌資訊投入。之後開始計算向量空間所有兩兩文件的距離,距 離即為相似度的判斷基礎,愈近者可以理解為較為相似的文件。在此如前所述,

本研究以 TFC-Weighting 計算出各文件之權重,並以 Cosine Coefficien 進行文件 相似度的比較如公式(5):

𝐂𝐨𝐬(𝒙, 𝒚)= 𝐭𝒊=𝟏𝒙𝒊𝒚𝒊

√∑𝒕𝒊=𝟏𝒙𝟐√∑𝒕𝒊=𝟏𝒚𝟐

··· (5)

x、y:為兩向量文件。

t:為 x、y 的維度。

本研究即以上述的步驟進行,當有一筆新的向量文件進來後,將會與向量空 間內所有的文件計算距離,比較前 k 個最近的文件中,哪個類別的文件比例最高 即將此新進的文件加入此類別。

本研究以 1050 篇重大訊息,共四間不同產業之上市公司作為訓練資料,先 以 kNN 進行訓練動作,將這些樣本予以分群;之後再將 332 篇的重大訊息作為 測詴資料分入已分群之群組。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3.2.4 漲跌預測模組

漲跌預測模組為對照各篇重大訊息所發布的時間,以及該時間點前後各兩日 的股價,來評斷此類重大訊息對股價的影響為何,是上升、下跌抑或持帄,如圖 3-3。

圖 3-3 重大訊息影響股價示意 資料來源:本研究整理

區分漲跌的辦法本研究參考以往預測股價之相關研究,以個股收盤價之漲跌 變動量作為評估標準,假設某篇於 x 日所發布重大訊息之收盤價變動量 x 之計算 公式如下,其中 y 為此訊息影響時間,即圖 3-3 中所示之前後兩日:

收盤價變動量𝒙 = 收盤價𝒙+𝒚−收盤價𝒙−𝒚

收盤價𝒙−𝒚

··· (13)

當收盤價變動量大於 0.03 時,將此重大訊息歸類為上漲;而當收盤價變動 量小於-0.03 時,將此重大訊息歸類為下跌;介於此範圍時則表示此訊息無顯著 影響,歸類為持帄(喻欣凱,2008)。

以此為準則將各群內之重大訊息以收盤價變動量為基礎加以分類,將各群之 漲跌類別以比例原則進行分類,因此在此步驟之結果產出即為上漲、下跌以及持 帄等三種重大訊息類別,之後再將 332 篇的重大訊息作為測詴資料予以分入這三 種類別。

重大訊息 i 重大訊息 j

2 2 2 2

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3.2.5 分群分類績效評估

最後分群分類之績效評估的部份,將使用精確率(Precision Rate)和召回率 (Recall Rate)來比較結果如何,不過為避免單獨使用兩者而造成彼消我長的情形,

本研究將使用混合兩者的 F-measure 來評估分群分類的績效如公式(12):

𝐅 = 𝟐×𝐏𝐫𝐞𝐜𝐢𝐬𝐢𝐨𝐧

(𝐏𝐫𝐞𝐜𝐢𝐬𝐢𝐨𝐧+𝐑𝐞𝐜𝐚𝐥𝐥)

··· (12)

3.2.6 結果分析

透過這一系列完整的步驟之後,能夠分群出各公司之重大訊息,進而能夠分 析出各群重大訊息對於各自公司的股價影響趨勢,藉此瞭解台灣市場之發展現況 為何;若是能夠歸納出公司對於所發布之重大訊息於股價影響,將能成為投資者 買賣其股票之依據;更進一步瞭解何種訊息將影響公司股價,何種類別之訊息又 會如何影響股價波動(漲、跌)。

在重大訊息分群之前,本研究會先將重大訊息之發布日及其前後各兩日之交 易量資訊與本研究取樣之全部交易日之交易量作顯著性分析,證實重大訊息發布 時對於各公司之股票交易量確實有異常之變動,藉此結果作為本研究之支持論點,

再繼續後續分群分類之實驗,將重大訊息分群後再分成上漲、下跌與持帄三類。

最後本研究會再針對測詴的資料作進一步的解析,分別選出上漲群組以及下 跌群組內之重大訊息,計算其發布後兩日的累積報酬率加以觀察。是否上漲群組 在發布兩日後仍有正向的累積報酬率?又下跌的群組於發布兩日後是否仍有負

最後本研究會再針對測詴的資料作進一步的解析,分別選出上漲群組以及下 跌群組內之重大訊息,計算其發布後兩日的累積報酬率加以觀察。是否上漲群組 在發布兩日後仍有正向的累積報酬率?又下跌的群組於發布兩日後是否仍有負

相關文件