• 沒有找到結果。

中 華 大 學

N/A
N/A
Protected

Academic year: 2022

Share "中 華 大 學"

Copied!
81
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

以 FCM 分群、指標模糊化與 SVR 探討多國股市的動態

Exploring Stock Market Dynamism of Multi-country with FCM Clustering, Fuzzy, and SVR Methods

系 所 別:資訊管理學系碩士班 學號姓名:M09510032 游 士 億

指導教授:邱 登 裕 博 士

(2)

摘要

投資理財在近年來愈來愈受到重視,許多研究探討以許多不同的投資方法,來獲取 報酬和抵抗通貨膨脹等問題,其中金融市場的投資成為市場的主軸,為了有效且快速的 分析數據以協助進行交易策略的擬定,從 1990 起,資料探勘的技術被大量應用於金融 領域中,初期以類神經網路最被廣為使用,但類神經網路有著局部最佳解和過度學習之 問題。然後開始有許多學者以不同的人工智慧的方法(如模糊理論、基因演算法等)與類 神經網路,來降低這些問題與雜訊所造成的影響,期望可以提供更好的買賣策略。

本研究以模糊理論 (Fuzzy theory) 結合支持向量迴歸 (support vector regression, SVR) 應用於多國股市之買賣策略探討。我們首先以模糊集群分析 (Fuzzy c-mean, FCM) 建立各特徵值的歸屬函數 (Membership function) ,再以模糊關係 (Fuzzy relation) 建立 各特徵對股市動向的關聯關係,並以解模糊化方法 (Defuzzification)產生具股市之買賣 策略程度的模糊化指標,以支持向量迴歸的方法探討股市動態。

由本研究的實驗結果發現,在累積獲利率上,本研究模型可勝過傳統SVR模型與買 入持有方法,而在年獲利率平均之檢定上,本研究模型於台灣與美國之結果顯示可顯著 勝過傳統SVR模型與買入持有方法,故此研究方法在股市上下

波動較大的國家,可以有效的找出交易規則來獲取利潤。

關鍵字:模糊集群分析、模糊關係、支持向量迴歸

(3)

Abstract

Financial investment became more important in recent years. Many studies on investment use many different ways to gain better return and avoid inflation risk. Investment on financial markets is one of the main targets. In order to effectively and quickly analyze data of trading and make strategies, the data mining technology has been utilized in the financial investment from 1990. Neural network was the most popular method. But the neural network has the local optimum and over-learning problems. Then, many researches began to combine different artificial intelligence methods (such as fuzzy theory, genetic algorithms, etc.) with the neural networks, to reduce these problems and noise to provide better trading strategies.

In this study, fuzzy theory and SVR are applied to analyze the trade strategy of the stock market for multi-country. First, the fuzzy cluster-mean is used to construct the membership functions of each characteristics. Then, fuzzy indicators are constructed through fuzzy relation and defuzzification to produce the degree of the stock market trading strategies. Finally support vector regression is adopted to explore stock market.

From the experimental results, we find that the proposed model can perform better than both of traditional SVR methods and buy-and-hold method. And the proposed model can find the trading rules to gain better return in the stock markets with high fluctuation, such as Taiwan and USA.

keywords:fuzzy c-mean, fuzzy relation, support vector regression

(4)

誌謝

在這兩年的研究所生活裡,在為人處事與學問上都有很大的收穫,首先謝謝指導教 授 邱登裕教授的耐心指教,指導學生有正確的研究精神與態度,不時的討論並給予我 意見,使我在這些年中獲益匪淺。

論文口試期間,承蒙吳玫瑩 老師與陳聰毅 老師兩位口試委員百忙之中給予指導,

提出寶貴的意見,使論文更為完善,在此深表感謝。在實驗室的生活點滴與學術上的討 論,感謝眾位學長姐、同學、學弟妹的共同砥礪,你/妳們的陪伴讓兩年的研究生活變 得多采多姿。

也感謝黃匡陵、吳致遠學長與潘雅真學姊的細心指導與敦敦教誨,不厭其煩的指導 學生在研究上的缺失,也感謝載宇宏同學的幫忙,進而將學業完成。實驗室的許子邦、

周俊言學弟們當然也不能忘記,你們的幫忙將銘記於心。

最後,感謝我至愛的家人們,爸爸、媽媽以及哥哥們,因為你們無怨無悔地付出與 默默地支持,讓我有這個機會和無後顧之憂可以攻讀碩士學位,沒有你們就沒有今日的 我,對於你們,我由衷地感謝。最後,將本論文獻給所有關心我的人。

游士億 謹識于中華大學資管所

中華民國九十七年七月

(5)

目錄

摘要...ii

誌謝...iv

目錄...v

圖目錄...vii

表目錄... viii

第壹章 緒論...1

1.1 研究動機 ...2

1.2 研究目的 ...3

1.3 研究架構 ...3

第貳章 文獻探討 ...6

2.1 股市投資理論 ...6

2.1.1 技術分析(Technical Analysis) ...6

2.1.2 基本分析(Fundamental Analysis) ...10

2.2 模糊理論(Fuzzy Theory) ...10

2.2.1 模糊集合(Fuzzy Set) ... 11

2.2.2 模糊集合的基本運算 ...13

2.2.3 模糊關係 (Fuzzy relation) ...15

2.2.4 模糊推論(Fuzzy inference) ...16

2.2.5 解模糊化(Defuzzification)...16

2.2.6 模糊理論相關文獻 ...17

2.3 支持向量迴歸 (Support Vector Regression) ...18

2.3.1 線性支持向量迴歸 ...19

2.3.2 非線性支援向量迴歸 ...21

2.3.3 支持向量迴歸相關文獻 ...22

第參章 研究方法 ...24

3.1 資料前置處理 ...25

3.2 技術指標模糊化 ...25

3.2.1 FCM 分群 ...26

3.2.2 歸屬函數 µc建立...27

3.2.3 技術指標具買賣策略模糊化 ...28

3.3 以支持向量迴歸建立決策模型 ...30

3.3.1 支持向量迴歸模型訓練 ...30

3.3.2 測試與分析 ...31

第肆章 實驗...32

4.1 實驗資料 ...32

(6)

4.3 實驗變數 ...34

4.4 移動式模型設計 ...34

4.5 實驗評估 ...35

4.6 實驗分析 ...37

4.6.1 台灣實驗結果分析 ...37

4.6.2 美國實驗結果分析 ...39

4.6.3 巴西實驗結果分析 ...41

4.6.4 英國實驗結果分析 ...43

4.6.5 交易成本考量之實驗結果分析 ...46

第伍章 結論與未來展望 ...48

5.1 研究結論 ...48

5.2 研究限制 ...49

5.3 未來研究與建議 ...49

參考文獻...50

中文部分 ...50

英文部分 ...51

附錄 A、台灣之測試時期的買賣決策點與獲利資料...53

附錄 B、美國之測試時期的買賣決策點與獲利資料...58

附錄 C、巴西之測試時期的買賣決策點與獲利資料...63

附錄 D、英國之測試時期的買賣決策點與獲利資料...68

(7)

圖目錄

圖 1-1 研究架構圖 ...4

圖 2-1 三角型歸屬函數 ...12

圖 2-2 梯形歸屬函數 ...13

圖 2-3 高斯歸屬函數 ...13

圖 2-4 模糊集合 A 和 B 的聯集 ...14

圖 2-5 模糊集合 A 和 B 的交集 ...14

圖 2-6 模糊集合 A 的補集 ...15

圖 2-7 函數轉換後的高維空間 ...21

圖 3-1 模糊化指標結合 SVR 之股市交易決策模型 ...24

圖 3-2 歸屬函數μcn...28

圖 3-3 模糊關係合成 ...29

圖 4-1 美國 S&P500 股價指數收盤價波動圖...32

圖 4-2 台灣 TESC weighted index 股價指數收盤價波動圖...32

圖 4-3 巴西 BOVE SPA 股價指數收盤價波動圖 ...33

圖 4-4 英國 FTSE 100 股價指數收盤價波動圖...33

圖 4-5 各國正規化之收盤價波動圖 ...33

圖 4-6 移動視窗 ...34

圖 4-7 台灣之年獲利率曲線圖 ...38

圖 4-8 台灣之累積獲利率曲線圖 ...38

圖 4-9 美國之年獲利率曲線圖 ...40

圖 4-10 美國之累積獲利率曲線圖 ...40

圖 4-11 巴西之年獲利率曲線圖 ...42

圖 4-12 巴西之累積獲利率曲線圖 ...42

圖 4-13 英國之年獲利率曲線圖 ...44

圖 4-14 英國之累積獲利率曲線圖 ...44

(8)

表目錄

表 4-1 移動視窗實驗之期間 ...35

表 4-2 台灣各區間之年獲利率表 ...37

表 4-3 台灣之統計檢定表 ...39

表 4-4 美國各區間之年獲利率表 ...39

表 4-5 美國之統計檢定表 ...41

表 4-6 巴西各區間之年獲利率表 ...41

表 4-7 巴西之統計檢定表 ...43

表 4-8 英國各區間之年獲利率表 ...43

表 4-9 英國之統計檢定表 ...45

表 4-10 各國之統計檢定表 ...45

表 4-10 交易費為 0.025%之累積獲利率表...46

表 4-11 交易費為 0.05%之累積獲利率表 ...46

表 4-12 交易費為 0.1%之累積獲利率表...47

(9)

第壹章 緒論

隨著全球各國的經濟發展,通貨膨脹已成為許多國家人民所要面對的問題,

傳統的銀行儲蓄利率,以無法抗衡物價膨脹所造成的幣值問題,由於金融市場的 興起與發展,投資股市已成為許多國家人民用來對抗物價上漲的考量方法之一。

在金融市場中,大眾廣為參與投資理財為證券市場的投資,但證券市場的價格波 動受到許多的因素影響,像是政治、經濟景氣、投資人心理等等。要在有著複雜 規律波動的證券股市中,找出可獲利的買賣策略規來獲取利潤,要預測證券市場 走勢是一項困難的挑戰,但也是眾多專家學者投入此領域的動機與目的。

許多對於金融證卷市場的研究,多數使用了技術分析、基本分析、產業分析、

心理分系等方法,其目的是為了來找出可尋的市場規則以進行投資獲利,其中可 分成基本分析學派及技術分析學派兩大學派。其中基本分析學派是依照企業的本 質進行分析,通常適用於中長期的投資預測;此派認為投資人可以從與公司因 素、市場因素、行業因素等方面來分析企業在未來的市場價值。為了分析企業未 來的價值,基本分析學派以統計為基礎,需建立較多的關係變數和收集大量的公 司資料外,還需對資料可信度進行考量,而在資料取得的時間點也是影響投資者 是否獲利的要素。另外,此學派無法提供明確的買賣點,故無法進行短期的投資。

技術分析學派與基本分析學派的差異,在於主張股票的價格波動是有跡可尋 的,並可清楚地定出股市買賣的買賣決策點,且市場上的循環會一再重演,因此 可以藉由許多的技術指標進行股票價格波動的預測。技術指標又可分成價格型 態、趨勢型態、結構理論等等指標作長短期的觀察股市的依據,進而有效的預測 證券市場未來的走勢,做出可獲利的買賣投資策略。另外,技術分析只需透過市 場歷史資料即可預測證券市場漲跌的趨勢,這也讓技術分析在當今證券市場中獲 得許多大眾的喜愛。

(10)

術已被大量應用於金融領域中,初期以類神經網路最被廣為使用(Kamijo &

Tanigawa, 1990),許多研究也證實了股市的走勢是有機可循的,但類神經網路有 著局部最佳解和過度學習之問題,然而開始將許多學者結合不同的人工智慧的方 法(如模糊理論、基因演算法等)與類神經網路 (Kim, & Han, 2000; Kuo, Chen &

Hwang, 2001; Kim & Lee, 2004),來降低這些問題所造成的影響。

為了提供更好的買賣策略,近年來,支持向量迴歸 (Support vector regression, SVR) 成為繼類神經網路之後,被眾多學者研究所採用的一種技術 (Ince &

Trafalis, 2006; Huang & Tsai, 2008),它以非線性高維度的方法來建置模型,並且 無具部最佳解和過度學習的問題,已被許多學者應用於各種領域。

1.1 研究動機

在全球證券市場中,許多新興市場受投資大眾所重視,有著高度的報酬率。

而其中較為先進的新興市場,由於散戶眾多和法令制度不如歐美先進國家完備,

故股價波動非常劇烈,這意含著投資者將面臨較高的風險,長期利潤報酬率不 佳;然而在市場發展已成熟的國家中,其指數較為穩定且較無超額報酬。所以不 同的投資市場存在不同的獲利與風險,而分析投資市場的可投資性跟風險性變得 更為重要。

在股市分析的研究中,以技術分析學派的技術指標最常被用來分析股市動 態,可藉由過去的股價趨勢來探勘出未來的股市走向,找出潛在循環的交易規 則。而技術指標被許多專家研究於反映股市走向,可釋出技術面、消息面和政策 面等等層面的訊息,但技術指標只是數值上的呈現,無法明瞭的直接反映出股市 的趨勢,且在遇到股市複雜波動的影響時,過去技術指標數據所定出的規則,可 能將無法適用於未來股市大盤的漲跌趨勢之預測。

然而,有許多研究使用模糊化的方式將技術指標轉為具股市之買賣策略程度

(11)

的數據(林耀暄,2001;傅光萬,2005),來提升對股市探勘之效能,但在定義模 糊化中的歸屬函數和模糊法則,往往需自行定義其門檻參數,且定義的函數可能 隨著時間的演變,而無法有效探勘股市。故本研究將技術指標透過 FCM 之自動 模糊化機制的方式,來達到自動且動態依照不同的時間區段,將技術指標模糊 化,以自動定義歸屬函數(membership function)並轉換成具股市之買賣策略程度 的模糊化指標,來提升探勘能力,來應用於探勘股市之動態。

本研究欲透過 FCM 方式來自動建立歸屬函數,並透過模糊關係合成和解模 糊化的方式,將技術指標模糊化成為具股市之買賣策略程度的模糊化指標,並結 合支持向量迴歸方法,建立一個自動模糊化指標的輸入特徵和以非線性具高維度 的支持向量迴歸作為股市探勘之買賣決策模型,並分析多國股市投資的可投資性 與風險性,來提供投資者做買賣決策。

1.2 研究目的

本研究欲以歷史數據為依據,再以本研究提出的方法來對不同國家進行分 析,其目的如下:

(1) 如何動態且自動化來模糊化技術指標。

(2) 結合自動模糊化指標機制與支持向量迴歸方法之模型,應用於多國股市動態 探討。

(3) 分析不同市場的可投資性和風險性。

1.3 研究架構

本研究主要研究內容可分為五個章節,研究架構圖如圖 1-1 所示:

(12)

圖 1-1 研究架構圖

第壹章 緒論:介紹本研究之研究動機、研究目的和研究架構。

第貳章 文獻探討:說明股市的投資理論、模糊理論、支持向量機及支持向量 迴歸的相關文獻。

第參章 研究方法:將技術指標透過模糊化轉換,成為具股市之買賣策略程度 的模糊化指標,並搭配支持向量迴歸,建置動態買賣策略決策模型。

第肆章 實驗:將多國的七年的數據資料,切割為多段訓練區段及測試區段。

以訓練區段資料集用來建置本研究的買賣策略決策模型,而測試時期 資料集作為本研究買賣策略決策模型的測試與進行投資獲利之評

確定研究動機與目的

文獻收集與探討 1. 股市投資理論 2. 模糊理論 3. 支持向量迴歸

方法設計與分析 1. 模糊化指標設計 2. 模型參數設定 3. 支持向量迴歸方法

實驗設計 1. 實驗資料說明 2. 實驗設計與評估 3. 實驗分析

結論與未來展望

第壹章 緒論

第貳章 文獻探討

第肆章 實驗

第伍章 結論

第參章 研究方法

(13)

估,並與其他模型和方法比較。然後對不同國家之實驗結果進行探 討,並與其它模型和方法比較與分析。

第伍章 結論與未來展望: 探討研究結果與貢獻,以及未來展望與建議。

(14)

第貳章 文獻探討

依據第一章節所提的研究問題,本研究結合模糊理論與支持向量迴歸方法,以 目前研究學者所提出的技術指標作為基礎,來建立具有股市買賣策略程度的模糊化 指標之買賣決策模型,並應用於多國股市探討與分析。因此,本章節將對這些相關 技術的文獻加以說明與介紹。

第一節介紹股市相關的分析理論與技術指標,第二節將說明模糊理論的定義與 方法,最後探討支持向量迴歸的特性與定義,以了解各方法的特性與定義。

2.1 股市投資理論

在證券市場中,股價分析主要分成技術分析學派與基本分析學派。這兩種學派 的理論與概念介紹如下:

2.1.1 技術分析(Technical Analysis)

技術分析主要以歷史股價變動來產生技術指標,而股價可能反映出市場基本 面、消息面及心理面的訊息,加上電腦應用與金融證劵市場的蓬勃發展,近年來已 被大量使用。

此學派認為市場的交易機制可由這些股價資料資訊變動中得知,許多理論也證 明了市場有循環的特性,如:艾瑞波特理論,價格循環理論等。藉由這些指標分析 市場過去的軌跡,來找出未來市場買賣雙方的變化,分析交易策略時間點,位於超 買或超賣的可能。

其中這些技術指標主要透過每日股市的股價資料,如開盤價、最高價、最低價、

收盤價或漲跌指數等數據所計算的。此學派認為股市變動可由股價變動中察覺,則 可不必考量市場以外的影響因素。

許多股市分析的文獻使用技術指標(董永寬, 許淑卿,1998;傅光萬,2005),發 現國內學者較常使用的技術指標選擇為 MACD, RSI, KD, PSY, BIAS, MTM & OSC, WMS%R, AR, BR, MA 等,而技術指標說明如下:

(15)

(1) 指數平滑異同移動平均線(Moving Average Covergence and Divergence, MACD)

指數差異指標(MACD)是根據移動平均線(MA) 所延伸的分析方式,此方式 較容易掌握趨勢變動,其利用兩條不同速度的平滑移動平均線,來計算兩條平 滑移動平均線的差離狀態(DIF)。總而言之,指數差異指標就是透過短期移動平 均線和長期移動平均線的計算,來找出其收斂或發散的徵兆,並以兩條線的平 滑處理,得知買賣股票的時機點。其計算方式如下:

1.需求指數(DI) = (最高指數+最低指數+2*收盤指數)/4 2.首日EMA = n日內DI總合/n

3.n日EMA值 = (前一日EMA值*(n-1)+今日DI*2)/ (n+1) 4.差離值DIF = 12日EMA值-26日EMA值

5.n日指數差異指標MACD = (前一日MACD* 8+今日DIF*2)/10 (2) 相對強弱指標(Relative Strength Index, RSI)

相對強弱指標(RSI)是目前市場最普遍使用,也是主要的技術指標之ㄧ,其 利用計算一定期間範圍內,買賣雙方之力量強弱程度,來推測未來價位走向,

以作為日後超買、超賣之參考,並可以透過K線圖和其它技術指標的結合使用,

預防過早進行買進與賣出,而導致賺少賠多的情況發生,其計算方式如下:

1.n日相對強度RS = n日內收盤上漲總數的平均值/n日內下跌總數平均值 2.n日強弱指標RSI = 100*n日內收盤上漲總數的平均值/(n日內收盤上漲總

數的平均值+n日內下跌總數的平均值) (3) 隨機指標 (KD線)

隨機指標(KD線)主要是利用考量當股價上漲時,當日收盤價通常會接近當 日價格變動之最高價,以及當股價下跌時,當日收盤價通常會接近當日價格變 動之最低價的原理,來找出近期內之收盤價,其價格區間的相對位置,故可作 為中短期投資之投資人的參考依據。其計算方式如下:

(16)

1.n日未成熟隨機值RSV = (今日的收盤指數-最近n日內最低指數)/(最近n日 內最高指數-最近n日內最低指數)*100

2.以平滑移動平均法,來計算K與D值,期初K = 50,D = 50 3.當日K值 = 前一日K值*2/3+當日RSV*1/3

4.當日D值 = 前一日D值*2/3+當日K*1/3 (4) 心理線(Psychological Line, PSY)

心理線(PSY)是利用研究投資人心理,當受到行情連續上漲或連續下跌的影 響,造成過度樂觀或過度悲觀的看法,而影響其投資行為。但實際狀況卻是在 連續上漲後,代表著買氣即將用盡;而連續的下跌,代表賣壓即將會變小,因 此,透過連續上漲或連續下跌的天數計算,可以推算目前行情是否會發生買超 或賣超的情形,讓投資人可以作為投資策略的參考依據。其計算方式如下:

n日PSY值 = (n日內上漲天數/n)*100 (5) 乖離率(BIAS)

乖離率(BIAS)主要是將當日股價與移動平均線之間的偏離程度,作為基礎 的一項技術指標:若是股價和平均線相差過遠,短期內還是會有技術性的回檔 或反彈,最後都將回到平均線的平衝狀態。其計算方式為:

n日乖離率BIAS = (今日指數-最近n日平均指數)/最近n日平均指數 (6) 動量指標(Momentom, MTM)與振盪量(Oscillation, OSC)

動量指標(MTM)與振盪量(OSC)主要透過衡量股價上升或下降的速度,來知 道此否達到股市最高峰。反之,股價在達到谷底前,可計算其下降的速度,是 否達到谷底,來作為研判股價超買或超賣現象之用。其計算方式為:

1.n日動量指標MTM = 今天收盤指數/第n日前的收盤指數 2.n日振盪量OSC = (今天收盤指數/第n日前的收盤指數)*100 (7) 威廉指標(Williams Overbought / Oversold Index, WMS)

(17)

威廉指標(WMS),原稱威廉斯超買超賣指標(Williams Overbought / Oversold Index),簡稱WMS%R或%R。WMS%R是利用擺動原理,來評斷股市是否處於 超買或超賣的階段,藉此測量股市週期循環之高點或低點,進而提出有效的投 資訊息。其計算方式如下:

n日威廉指標WMS = (n日內的最高指數-今日收盤指數)/(n日內的最高指數 -n日內的最低指數)*100%

(8) 買氣指標(AR)

買氣指標(AR)是指買賣氣勢程度的測試指標,利用當日開盤價作為基礎,

若是當日股價大於開盤價者,就視為買進氣勢,有股價向上推動的可能,而低 於開盤價者,就視為賣出氣勢,股價有向下跌落的可能,將二者值相除以計算 衡量之相對強度作為評估。計算方式為:

n日買氣指標AR = (最高指數-開盤指數)*n日內累計總數/(開盤指數-最低指 數)*n日內累計總數

(9) 買賣意願指標(BR)

買賣意願(BR)指標為衝量目前市場買賣意願強度的指標,利用前一日的收 盤價作為基礎,來測量當日願意和前一日最高之價格的買進可能和前一日低的 價格買進的可能,作為買賣意願強度評估。其計算方式如下:

n日買賣意願指標BR = (今天最高指數-昨天收盤指數)*n日內累計總數/(昨 天收盤指數-今天最低指數)*n日內累計總數

(10) 移動平均線(Moving Average, MA)

移動平均線(MA)是利用某期間的收市價相加以計算平均數,若將每天大盤 指數收盤價的曲線平滑化,此曲線即為移動平均線,可作為走勢分析,並求出 一個趨勢值。其計算方式如下:

n日移動平均線MA = n日內股價指數合計/n

(18)

2.1.2 基本分析(Fundamental Analysis)

基本分析的概念是利用公司基本面的資訊,如公司的盈餘、股利與前景等,或 對公司的風險進行評估;也就是說股票價格可能從上市公司營運績效反映出未來的 經營狀況,並定位出公司股票在未來可能之合理價格,使投資人在評估後可以決定 投資組合和策略。若公司營運績效好,則股價將會上揚;反之,營運不好,股價則 有下跌的風險。而基本分析所考量的因素有總體經濟、政治情勢、產業展望及公司 營運況等,如股利政策、資本結構、負債比例等來評估其股票的價值,再配合本益 比與流量比率來作為投資的參考依據。

在股價分析的相關研究中,指出基本分析無法預測股價的短期變化,這其中因 為股市涵蓋了太多的人為及心理因素,投資者的決策不見得是理性的。雖然基本分 析的優點可分析公司中長期的價值,但基本分析的資料變化較慢,且取得時間慢,

有些學者也提到基本分析的缺點在於真正的財務報表數據不能即時獲得,導致產業 的展望和成長潛力等多項因素無法將其數據化作為投資決策的參考依據(林耀暄,

2001)。

2.2 模糊理論(Fuzzy Theory)

模糊理論(Fuzzy Theory)是由 L. A. Zadeh 教授於 1965 年所提出,用來表現某些 不確定的模糊性觀念,像是描述人類的自然語言,例如描述“現在大約五點"、“今 天天氣很熱"等,都是根據個人的感覺去判斷,很難有一個明確的定義,所以就具 有模糊性現象。。一般來說,目前所有的知識領域都可以模糊化,只需將傳統的明 確集合模糊化,建構出模糊集合即可。而模糊理論實際上是模糊集合(Fuzzy Set)、

模 糊 數 與歸 屬 函數 (Fuzzy Number and Membership Function)、模糊關係(Fuzzy Relation)、模糊推論(Fuzzy Inference)、模糊控制系統(Fuzzy Control System )等理論 之總稱,是一種以數學模型來描述語意式的模糊資訊的方法。其模糊化的好處包括 可以提供更佳的推廣性、錯誤容忍性、以及可以更適合在現實中的非線性系統,而 模糊理論已被應用於各種不同的領域之中。在近年來,模糊理論也被許多學者應用 於探討財務方面。

(19)

2.2.1 模糊集合(Fuzzy Set)

模糊集合(Fuzzy Set)相較於明確集合論,其最大的差異是模糊集合表達一件事 並非只有是非的方式,而明確集合或稱二分法,亦即一事件屬於是或非,二者只有 一個會成立。其歸屬程度不是 1、就是 0,劃分的相當明確。在傳統的明確集合中,

我們定義一個『特徵函數』來描述此種關係,x 為論域中的元素,則特徵函數λA(x), 定義如下:

1, 0 ( ) 0, 0

A

x x

λ = ⎨ x

⎩ < (2-1) 但在人類口語陳述、經驗的傳承,大多數都是模稜兩可的,並不是非常講究數 據化、明確化,而是相當模糊、概念化的。因此 Zadeh 教授所提出模糊理論即是建 立一套語言分析的數學模式,將那些模稜兩可的事物予以數據化、明確化,進而轉 成機器語言所能接受的運算方式。也就是利用模糊邏輯將傳統只有 0 和 1 的邏輯值 之間,建立一個緩衝區域,以增加非 0 非 1 的邏輯判斷,讓人類有較寬廣且較具彈 性的邏輯推論空間,藉以能表達一些較概念性的理論與經驗。例如有人說”他的體型 很壯”或是”他的體型很瘦弱”等等敘述,都是無法確實知道,體型比例多少才算是 壯,體重要多輕才算是瘦弱,這些都是屬於模糊性現象一種,其值域在[0,1]之間,

所以模糊系統可以調整其歸屬函數去適應各種不同的變異環境(蘇木春, 張孝德,

1997)。

在模糊集合中,像是「年紀有點小」、「天氣有點熱」的數值表現,此種不明確 的個數稱為模糊數,則需利用歸屬函數轉換。以下介紹一些較常見的歸屬函數:

(1) 三角形歸屬函數:

三角形的歸屬函數如圖2-1所示,其數學表示式如下:

(20)

1

1

1 1

2

2 2

2

0

( )

0

A

x b

x b b x a

x a b b x

a x b b a

x b µ

⎧ ≤

⎪ −⎪ < <

= ⎨⎪⎪ − < <

⎪ −⎪ ≥

(2-2)

在公式(2-2)中,a、b 以及1 b 為實數值參數;其中 a 為模糊集合2 A 的中心點,b 、1 b 分別為三角形底邊的左、右兩個點。對於三角形歸屬函數而言,可發現當2 x 值 介於b 到1 b 之間時, x 屬於集合A的歸屬度均不為0。當 x 越靠近 a 時,其歸屬2 度越大;當 x 值為 a 時,其歸屬度為1,也是唯一歸屬度最大且值為1的地方。

三角形的歸屬函數如圖2-1所示。

圖 2-1 三角型歸屬函數 (2) 梯形歸屬函數:

梯形的歸屬函數如圖2-2所示,其數學表示式如下:

1 1

1 1

1 1

1 2

2

2 2

2 2

2

0

( ) 1

0

A

x b

x b b x a

a b

x a x a

b x

a x b b a

x b µ

⎧ ≤

⎪ −

⎪ < <

⎪ −⎪

=⎨ ≤ ≤

⎪ −

⎪ < <

⎪ −

⎪ ≥

(2-3)

其中a 、1 a 、2 b 、以及1 b 為實數值參數,分別為模糊集合2 A 之梯形的四個頂點。

梯形的歸屬函數如圖2-2所示。對於梯形歸屬函數而言,可發現當 x 值介於b 到1 b 之間時,2 x 屬於集合A的歸屬度均不為0。當 x 越靠近[a1,a2]區間時,其歸屬

(21)

度越大;當 x 值在[a ,1 a ]時,其歸屬度為1,是歸屬度最大且值為1的地方。 2

圖 2-2 梯形歸屬函數

(3) 高斯歸屬函數:

高斯歸屬函數如圖2-3所示,其數學表示式如下:

⎟⎟⎠

⎜⎜ ⎞

⎛− −

= 2 2

2 ) exp (

)

( σ

µA x x m (2-4)

其中m表示倒鐘形的中間點,σ代表倒鐘形的寬度;倒鐘形的歸屬函數如圖2-3 所示。先前所介紹的兩種歸屬函數皆屬於線性歸屬函數,對於高斯型歸屬函數 而言,因其為一非線性歸屬函數, x 歸屬度分布形狀類似高斯分配,決定於平 均值m與標準差σ,越靠近平均值m其歸屬度越大。

圖 2-3 高斯歸屬函數

2.2.2 模糊集合的基本運算

模糊集合的運算可以說是由明確集合的運算延伸出來的,而在集合的運算中又 以聯集、交集與補集最為常見,利用這三種運算的組合可以表達任何運算的定義,

接下來我們將先對這三種運算做簡單的說明。假設 A 與 B 為兩個模糊集合,且µA( )x

(22)

與 µB( )x 分別為其歸屬函數,則模糊集合的基本運算如下所示:

(1) 模糊聯集(Union):(A ∪ B )

( ) ( ) max{ ( ), ( )}

A B A x B x A x B x

µ =µ ∨µ = µ µ

其中“ Ú "為模糊運算子,在此取max運算。圖2-4說明模糊集合 A 與 B 的聯 集運算。

圖 2-4 模糊集合 A 和 B 的聯集

(2) 模糊交集(Inter section):(A B ) ( ) ( ) min{ ( ), ( )}

A B A x B x A x B x

µ =µ ∧µ = µ µ

其中“∧ "為模糊運算子,在這裡是取min運算。圖2-5說明模糊集合 A 與 B 的 交集運算。

圖 2-5 模糊集合 A 和 B 的交集

(3) 模糊補集(Complement ):( A ) ( ) 1 A( )

A x x

µ = −µ

其中“ "為模糊運算子,表示補集的運算。圖2-6說明模糊集合 A 與 B 的補集 運算。

(23)

圖 2-6 模糊集合 A 的補集

(4) 模糊集合的基本定律與性質

模糊集合的基本定律與性質整理如下:

1. 恆等律 (Ident ity Law) A∪A=A, A∩A=A 2. 交換律(Commutat ive Law)

A∪B=B∪ , A B=B AA ∩ ∩ 3. 結合律(Associat ive Law)

A∪(B∪C)=(A∪B)∪C, A∩(B∩C)=(A∩B)∩C 4. 分配律(Dist r ibut ive Law)

A∪(B∩C)=(A∪B)∩(A∪C), A∪(B∩C)=(A∪B)∩(A∪C) 5. 狄摩根定律(De Mor gan`s Law)

A∪B=B∩ , A B=B AA ∩ ∪ 2.2.3 模糊關係 (Fuzzy relation)

上述的模糊集合運算都是針對定義於同一論域上的模糊集合,要探討模糊概念 於不同論域時,則以模糊關係表示,是由卡式乘積(Cartesian Product)運算。假設A 和B是分別定義在論域U和V的模糊集合,則兩者的模糊關係可用卡式乘積來表示:

( , ) min[ ( ), ( )] ,

AXB u v A u B v u U v V

µ = µ µ ∈ ∈ (2-5)

(24)

或是

( , ) ( ) ( ) ,

AXB u v A u B v u U v V

µ =µ µ (2-6) 假設目前若R和S分別為定義在卡式乘積空間U´V及卡式乘積V´W上的模糊關係,為 了計算U對W的模糊關係,將使用模糊關係的合成(Composition of Fuzzy Relation)取 得,可由合成運算T = R。S推論出定義在U對´W模糊關係,定義如下:

( , ) max{min[ ( , ), ( , )]} , ,

T R S

v V

u w u v v w u U v V w W

µ µ µ

= ∈ ∈ ∈ (2-7) 或是

( , ) max{ ( , ) ( , )} , ,

T R S

u w v V u v v w u U v V w W

µ µ µ

= ⋅ ∈ ∈ ∈ (2-8) 2.2.4 模糊推論(Fuzzy inference)

模糊推論是模糊輸入集合經由模糊邏輯推論,並透過模糊規則庫結合所有 IF-THEN 規 則 映 射 到 模 糊 輸 出 集 合 的 過 程 , 如 假 設 有 四 個 歸 屬 函 數

1( ), 2( ), 1( ), 1( )

A x A x B x B x

µ µ µ µ ,規則為:

1 1 2 1 1

IF x is A and x is B Then y is y

1 2 2 2 2

IF x is A and x is B Then y is y

其推論的運算主要有以下兩種,主要先計算最小歸屬程度後,對規則的歸屬值進行 推論,如公式(2-9),另一種利用Product來計算規則的歸屬度進行推論,如公式(2-10)。

(1) Min-Min-Max 推論方式

1 1 1 2 1 2 1 2 2 2

max{min[min[ A( ), B( )], ], min[min[ A ( ), B ( )], ]}

y= µ x µ x y µ x µ x y (2-9) (2)Min-Product-Max 推論方式

1 1 1 2 1 2 1 2 2 2

max{ A( ) B( ) , A ( ) B ( ) ]}

y= µ x ⋅µ xy µ x ⋅µ xy (2-10) 2.2.5 解模糊化(Defuzzification)

解模糊化是將模糊推論引擎所推論出的模糊資訊,轉換回外界可接受的明確資 訊,以進行控制或決策。最常用的解模糊化的方法如下:

(25)

(1) 重心法:計算區塊面積的中心點。

1

1

( ) ( )

( )

C

i i

i C

i i

y x y x

x µ µ

=

=

=

(2-11)

其中y 為Y的模糊集合之值, ( )i µi x 為x屬於i之程度, ( )y x 為推論x對y映射函數。

(2) 平均高度法(Mean of Height Method)

平均高度法是將各規則之前題部份的歸屬度乘以所對應的輸出模糊集合之 中心值,然後將其相加再除以前題部份歸屬度的總合即為輸出y,此種方法的優 點為運算效率較高,其表示如下:

1

1

( ) ( )

( )

N

i i

i N

i i

y y y x

y µ µ

=

=

=

(2-12)

其中y 為Y的模糊集合之值,i µ (yi)為對規則i之歸屬程度, ( )y x 為推論x對y映 射函數。

2.2.6 模糊理論相關文獻

模糊理論可應用的範圍相當廣泛,例如決策分析、語音辨識、控制系統、學習 程度評量等。近年來,在財務金融方面也有部分學者將模糊理論應用於其中。有學 者(Chiu & Chen, 2008)結合模糊理論、支持向量機與基因演算法來探索股票市場的變 動。以股市技術指標、期貨技術指標、影響整體經濟的變數作為輸入變數,每個變 數均有其模糊理論之梯形歸屬函數,利用基因演算法來調整這些梯形歸屬函數之參 數值與範圍,並使用支持向量機預測往後的股市變動,找出預測正確率最高之變數 組合。在實驗結果顯示,其建立之模型能產生不錯的預測效果,且加入模糊理論更 能有效提升預測的準確率。

Chang與 Liu (2008)使用TSK (Takagi-Sugeno-Kang)模糊規則系統,以技術指標 作為輸入變數,找出技術指標間的經驗法則,並使用台灣證券交易所之資料作測試。

(26)

其結果顯示其模型能成功地預測股市價格,且具有相當高的準確率。

Fazel Zarandi、Rezaee、Turksen及Neshat (2007)發展出一套模糊規則專家系統來 對股價進行分析。此系統採用技術指標作為輸入變數,先將資料作模糊分群,定義 出幾條模糊規則後,選擇較為重要的變數並計算其歸屬函數,然後以基因演算法挑 選出歸屬函數之參數,再經由模糊規則型態的轉換,調整再轉換型態後的歸屬函數 之參數。這套系統不僅能提供參考,其根均方差(Root Mean Square Error, RMSE)更 較其他模型大幅降低。

Hussein Dourra與Pepe Siy (2002)利用模糊理論與技術分析,將股市價格歷史資 料之技術指標數值作為輸入,然後把技術指標轉成模糊技術指標,並對每個模糊技 術指標之歸屬函數,建立出模糊規則,在輸出結果產生後,定義在什麼樣的規則下 應該做何種決策。故當有股價變動或是股價走向有某種趨勢時,可依據模糊邏輯方 法來規劃出投資買賣的策略。

Yi-Fan Wang (2002) 結 合 模 糊 理 論 與 灰 色 理 論 發 展 出 一 套 稱 為 Fuzzy Grey Pridiction的預測系統。為能更有效預測股市價格,隔年Yi-Fan Wang (2003)將模糊理 論及約略集合理論結合應用於研究中。這個研究除了能觀看當下股市價格或歷史股 市的漲跌情形外,也能幫助投資人做買入賣出的決策;當投資人在某個時間需要做 決策時,把利用模糊理論中的模糊規則所產生以If-Then表示的規則,再使用約略集 合方法找出接下來股市的漲跌程度,供投資人作參考。

2.3 支持向量迴歸

(Support Vector Regression)

支持向量機(Support Vector Machine, SVM)自Vapnik等人提出後(Vapnik,1995),

常應用在圖形辨識、文字分類等領域。其理論是在高維度特徵空間使用線性函數假 設空間的學習系統,它屬於一種來自最優化理論及結構風險最小的學習演算法訓練。

於1997年,Drucker及Burgse等學者提出一個從支持向量機延伸出之新的迴歸技 術,稱為支持向量迴歸(Support Vector Regression, SVR),該技術主要是針對已知的 訊息來預測未知的變數。除此之外,支持向量迴歸對於不同問題的處理,又可以區 分成線性支持向量迴歸(Linear Support Vector Regression)和非線性支持向量迴歸

(27)

(Non-Linear Support Vector Regression)兩種,其詳細說明如下(Huang & Tsai, 2008)。

2.3.1 線性支持向量迴歸

支持向量迴歸主要透過訓練資料(Training Data)定義出一個迴歸方程式,讓測試 資料(Testing Data)達到最小誤差之方法,則迴歸函式(2-13)所示

1

( , ) ,

m

i i

i

f x w x w b

=

=

+ (2-13) 在公式(2-13)其中 w 為權重向量(weight vector),x 為輸入向量(input vector),b 表 示為誤差(bias),m為訓練樣本數。

支持向量迴歸以訓練資料來建立迴歸方程式,但並非每筆訓練資料的資料都是 有幫助的,因為在資料中有可能會存在一些雜訊(Noise)或離群值(Outlier),而這些雜 訊或離群值會影響到支持向量迴歸預測誤差能力,因此若是要找出最佳化的迴歸函 數,可透過損失函數(Loss Function)和懲罰係數(Penalty Parameter)來進行解決。

損失函數主要作為檢測迴歸方程式與訓練資料間的距離,而在支持向量迴歸 裡,ε-Insensitive是最常用的損失函數,如公式(2-14)所示。

( , ) ( , ) 0

y f x w y f x w

Lε otherwise

ε ε

⎧ − − − ≥

= ⎨⎩ (2-14)

為了讓迴歸方程式,可以避免且容忍誤差,假如預測值和實際值的距離小於或 等於我們所設的ε值,則損失函數等於0;相反的,若是預測值與實際值的距離大於 ε,則損失函數不為0,其中,ε之大小則是由使用者自行定義。

在使用損失函數來解決雜訊或離群值,可能會發生訓練資料中有資料未被包含 在公式(2-14)的情行,所以還需要以鬆動變數(Slack Variable)來解決此問題,鬆動變 數以ξi = =i 1,...,m表示。而懲罰係數則可以對雜訊或離群值所產生的問題做處理,

利用C來表示。因此在要解決雜訊或離群值的問題時,就會在迴歸方程式中加入鬆 動變數,再對每個鬆動變數乘上一個懲罰係數,讓支援向量迴歸不會有超覆之問題。

所謂支持向量迴歸,就是以結構性風險誤差最小為目標,來求得 w 的最小值,2

(28)

如公式(2-15):

2 *

1

i

* i

*

Minimize :1 ( ) 2

y

Subjected to y , 0

i

m i i

i i

i i

i i

w C w x b w x b

ξ ξ ε ξ ε ξ ξ ξ

=

+ +

− ⋅ − ≤ +

⎧⎪ ⋅ + − ≤ +

⎨⎪ ≥

(2-15)

此時可以轉換為拉格蘭治乘數(Lagrange Multiplier)最佳化的問題來做處理,其 Lagranger Function如公式(2-16)所示:

( )

( )

2 * * *

p

1 1

1

* *

1

L 1 ( ) ( )

2

i i i i

m m

i i

i i

m

i i i i

i m

i i i i

i

w C

y w x b

y w x b

ξ ξ η ξ η ξ

α ε ξ α ε ξ

= =

=

=

= − + − +

− + − + ⋅ +

− + + − ⋅ −

∑ ∑

(2-16)

對應上述公式,可用公式(2-17)來解:

min max L, ,

subject to , 0

w bξ

α η≥ (2-17)

在求解式中,先考量min的情形,對變數 , ,w bξ以偏積分的方式求解如下:

*

1

L ( ) 0

m

i i

i

b α a

=

∂ = − =

(2-18)

*

1

L ( ) 0

m

i i i

i

w a x

w α

=

∂ = − − =

(2-19)

(*) (*) (*)

L i i 0

i

C α η ξ

∂ = − − =

∂ (2-20)

可將(2-18),(2-19),(2-20)改寫為, *

1

( )

m

i i i

i

w α a x

=

=

,ηi(*)= −C αi(*)帶入公式(2-16),可將 , ,

w b ξ簡化,留下 ,η α ,其最小值公式如公式(2-21)所示:

(29)

* * * * D

, 1 1 1

* *

1

L 1 ( )( ) , ( ) ( )

2

Subjected to ( ) and [0,C]

m m m

i i i j i j i i i i

i j i i

m

i i i j

i

α α α α x x ε α α α α

α α α α

=

= − − − − − + −

− − ∈

∑ ∑ ∑

(2-21)

根據Karush Kuhn-Tucker(KKT)理論(Fletcher, 1987),代入w將可以得到b,最後 可以得到訓練資料所產生的迴歸方程式(2-22)。

*

1

( ) ( ) ,

m

i i i j

i

f x α α x x b

=

=

− + (2-22) 2.3.2 非線性支援向量迴歸

Vapnik(1995)為了解決非線性(Non-linear)函數的問題,以非線性的映射函數 Φ,讓原始空間(Original Space)可轉換到較高維度的特徵空間(Feature Space),然後 在以支援向量迴歸進行對特徵空間進行線性分類,由圖2-7可以得知,原始資料在原 始空間裡(圖左),是找到一個非線性的函式,但經於映射函數的轉換到較高維的空 間(圖右),可用一個線性的函式來解決,來得到更好的結果。

圖 2-7 函數轉換後的高維空間

若將資料轉換到特徵空間中, ( ) ( )ϕ xi ϕ xj 會影響最後的結果,而 ( )ϕ xi 以及 ( )ϕ xj 的內積,則可以利用核心函數(Kernel Function)來取代,其表示式如下:

( ,i j) ( ( j) ( j))

k x x = ϕ x ⋅ϕ x (2-23) 因此非線性支援向量迴歸所處理的最佳化的問題函式,可改寫為:

* * * *

D

, 1 1 1

* *

Maximize:L 1 ( )( ) , ( ) ( )

2

Subjected to: ( ) and [0,C]

m m m

i i i j i j i i i i

i j i i

m

i i i j

k x x

α α α α ε α α α α

α α α α

=

= − − − − − + −

− − ∈

∑ ∑ ∑

(2-24)

(30)

核心函式的使用上,主要有線性(Linear)、多項式(Polynomial)、放射(Radial Basis Function;RBF)等三種方式(Gunn, 1998),其公式如(2-25)、(2-26)、(2-27),有些核 心函式,需要自行設定參數,因此使用者對不同的核心函式,可能因資料性質不同,

需做不同的參數調整。

Linear Kernel: k x x( ,i j)= ⋅x xi Tj (2-25) Polynomial Kernel: k x x( ,i j)= + ⋅(1 x xi j)d (2-26)

Radial Basis Function Kernel (RBF Kernel):k x x( ,i j)=exp(−γ x xij 2) (2-27) 本研究所使用核心函式為放射型(RBF),原因為RBF本身就屬於非線性的,可將 資料從原始空間轉換到較高維度空間來處理非線性的問題,因此當原始資料及屬性 是屬於非線性的,使用此函數有不錯的效果,故本研究選擇此此核心函數。

2.3.3 支持向量迴歸相關文獻

一直以來有學者提出結合多種技術的整合模型應用於財務金融方面的研究,近 年來也有部分學者利用支持向量迴歸中,經由結構化風險最小誤差法降低誤差來提 升預測準確率的特性,將支持向量迴歸結合其它技術來達到更好的預測效果。以下 為支持向量迴歸相關研究的整理:

Cheng-Lung Huang 及 Cheng-Yi Tsai (2008)為了能減少學習演算法於訓練階段 的時間、改善預測正確率和增加電腦的運算效率,因此提出自我組織特徵映射圖 (Self-organizing feature map, SOFM)結合支持向量迴歸之混合模型,並搭配 Filter 屬 性篩選方法,以預測台灣股票指數期貨(FITX)之隔日收盤價格。首先,使用 Filter 屬性篩選方法選擇出重要性較高的輸入屬性,接著經由 SOFM 演算法將訓練資料加 以分群,最後利用支持向量迴歸來達到預測隔日股票收盤價格之目的。

Khemchandani、Jayadeva 與 Chandra (2007)為解決預測財務金融時間序列中的 兩個問題-雜訊(noise)及非固定性(non-stationarity),使用支持向量迴歸結合模糊理 論來建立模型,並採用 S&P500、Google、Microsoft 等六項來自於美國雅虎的股市 資料進行預測實驗。

(31)

Ince 和 Trafalis (2006)嘗試結合參數推估技術(parametric techniques)及無母數推 估技術(nonparametric techniques)在外匯率的預測上獲得更好的預測效果;其中參數 推估技術使用到 ARIMA (autoregression integrated moving average)與 VAR (vector autoregression) , 無 母 數 推 估 技 術 則 使 用 到 支 持 向 量 迴 歸 及 MLP (multilayer perceptron)神經網路,將上述技術交互搭配,利用歐元、英鎊、日圓及澳幣測試作 比較。在實驗比較中顯示支持向量迴歸模型無論使用 ARIMA 或 VAR 作為輸入時,

其結果皆優於 MLP 神經網路之模型。

(32)

第參章 研究方法

本研究以 FCM 之自動模糊化機制結合支持向量迴歸方法,來建立一個自動模 糊化指標之輸入特徵和以非線性具高維度的支持向量迴歸作為股市探勘決策模型,

以此模型來判斷股市的漲跌趨勢,分析各投資股市的可投資性與風險性,提供投資 者做決策。

本研究的的研究架構分為三個階段,第一個階段是前置處理,第二階段利用 FCM 與模糊化技術將技術指標變成具股市之買賣策略程度的模糊化指標,第三階段 為建立支持向量迴歸模型,研究架構如圖 3-1 所示:

圖 3-1 模糊化指標結合 SVR 之股市交易決策模型 訓練資料集

挑選國家與 訓練測試區段

測試資料集

FCM 分群 歸屬函數μcn

計算群之漲跌程度 透過模糊關係合成&解 模糊化產生模糊化指標

測試模糊化指標資料 資

料 前 置 處 理

模 糊 化 指 標 階 段

訓練 SVR Model 測試 SVR Model 計算交易策略獲利率

l SVR

決策 模型

以訓練資料參數正規化 四國原始股市資

料 計算技術指標

評估與比較 訓練模糊化指標資料

技術指標正規化

(33)

3.1 資料前置處理

本研究在資料前置處理之前,會從四國的原始股市資料中,篩選出要分析的國 家與區間之資料。分別依據股市的每日的開盤價、最高價、最低價、收盤價與交易 量來計算所使用的技術指標,然後挑選要分析的國家,將每個國家的資料分成訓練 資料集(Training Set)與測試資料集(Testing Set)資料。其訓練資料集的目的是為了建 置股市的買賣決策模型,而測試資料集的目的在於驗證模型的買賣決策能力,來探 討是否能夠對未來的股市趨勢做出正確的買賣決策。接下來將訓練資料集的技術指 標進行正規化(normalization),正規化公式如下所示:

' min_

max_ min_

x x

x x x

= −

− (3-1)

其中,

max_x為訓練資料集最大值 min_x為訓練資料集最小值 x為原始值

x’為正規化後的值

依此訓練資料集的正規化參數來正規化測試資料集之數據。在此階段之正規化 之目的,在於可將特徵值控制在一定的範圍內,如本研究為轉號到 0~1 之間,避免 不同技術指標間值域上的差別,導致不易計算和分析,使得在支持向量迴歸模型建 置時,有更好的預測效果和訓練效率,這也是許多應用 SVR 模型於股市前常做的前 置處理動作。

3.2 技術指標模糊化

本研究的技術指標模糊化的階段主要是透過 FCM 來建置模糊化指標,達到自 動產生歸屬函數,並且可以快速的在不同區段以及針對不同的技術指標進行模糊 化,來提升指標對股市分析的意義程度,建置其歸屬函數和模糊化指標,將過程主 要分成下面三個步驟:

首先採用 Fuzzy C-mean(FCM)針對各個技術指標加以分群,來找出較密集的群

(34)

聚,有助於找出潛在的買賣策略規則;大多數的研究在定義歸屬函數上,採用的股 市買賣策略程度分別代表為買、持平與賣的程度。故本研究在 FCM 分群上,將群 數設定為三,找出三個最密集之群聚,在透過原始技術指標對群聚程度和群聚程度 對股市之程度來建立模糊化指標,首先計算每一群的買賣策略程度,再利用本研究 所提出的模糊關係合成與解模糊化的方式,來建立具股市之買賣策略程度之模糊化 指標以及訓練並測試模糊化的指標資料來幫助買賣決策模型更容易的找出具意義的 買賣決策規則,其步驟詳細說明如下:

3.2.1 FCM 分群

模糊分群法(fuzzy C-means clustering)簡稱 FCM,1974 年 Bezdek 首先提出該 方法,由 K-means algorithm 衍生而來的分群法,此方法透過模糊邏輯的概念來提升 分群效果。FCM 與 K-means 最大的差異在於加入了模糊的概念,資料不會只歸類於 任何群聚,而是以模糊化的方式來呈現,其模糊化程度值介於 0~1 之間,可用來表 示資料隸屬於各群聚的程度。以下為 FCM 之演算法之過程(Bezdek, J.C., 1974)如下:

(1) 設定分群數目為 C,定義 N 為資料筆數、n 為資料編號、c 為群聚編號、t 為累計之計算次數、x 為資料向量、v 為群聚向量

(2) 定義初始模糊歸屬程度須滿足兩個條件

(2.1) ( )

1

1, 1, 2,..., .

C t cn c

n N

µ

=

= =

,資料 n 對於各群聚的歸屬程度總和為 1

(2.2) ( )

1

0 , 1, 2,... .

N t cn n

N c C

µ

=

<

< = ,每一個群聚內各座標點的歸屬程度總和須 大於 0 小於 N(座標點總個數)

(3) 設定 t 為 0, 定義初始分群效能J( )t

(4) 在第 t 次,以訓練資料 xn 和其歸屬程度µcn,重新計算群聚之中心點

( ) 2

( ) 1

( ) 2 1

( )

, 1,..., ( )

N t

cn n

t n

c N

t cn n

x

v c C

µ µ

=

=

=

=

其中,µcn( )t 為資料 n 在第 t 次對群聚 c 的歸屬程度值,xn

(35)

為資料的向量

(5) 計算各x 對n v 的歸屬程度( )t µcn(t+1)

1 ( )2 ( 1)

( )2 1

C t

n c

t

cn t

k n k

x v x v µ

+

=

= ⎢

(6) 計算分群效能 ( 1) ( 1) 2 2

1 1

( )

N C

t t

cn n c

n c

J + µ + x v

= =

⎡ ⎤

=

∑∑

⎣ ⋅ − ⎦

(7) 若J(t+1)J( )t 小於門檻ε則結束,否則將 t = t + 1 並從步驟(4)繼續開始 在本研究中,利用 Fuzzy C-means clustering 的方式將技術指標進行模糊分群的 動作,將技術指標變成對各群聚的程度值µcn,供模糊關係合成使用。

3.2.2 歸屬函數μc建立

為了使技術指標能轉換成有模糊程度化的數值,故以用 FCM 的中心點當作歸 屬函數之µcnv 向量,再透過此歸屬函數對技術指標c x 進行歸屬程度之計算,得n 到其模糊程度值,其歸屬函數公式如下所示,圖形如圖 3-2。

1 2

2 1

, 1,...,

C n c

c

k n k

x v

c C

x v

µ

=

= =

(3-2)

其中,

n 為資料編號 c 為群聚編號

µcn為資料 n 對群聚 c 的歸屬程度 x 為資料 n 的特徵向量 n

v 為群聚 c 中心點的特徵向量 c

C 為群聚數目

(36)

圖 3-2 歸屬函數μc

利用 FCM 建立歸與函數的好處在於自動化建置,傳統的歸屬函數通常需要自 訂歸屬函數的門檻,所以需要大量的調整與測試,無法自動產生,故在此研究以 FCM 建立技術指標程度化的歸屬函數。

3.2.3.技術指標具買賣策略模糊化

將訓練資料集歸類於歸屬程度最大之群聚後,統計各群聚之資料的股市買賣策 略之比例,作為群聚對買賣策略之程度數據,傳統的歸屬函數轉換需要定義參數,

故轉換後的歸屬程度值已具有買賣策略程度之值,但在本實驗的歸屬函數之程度,

不具有買賣程度,故在此產生群聚對買賣策略之程度後,可直接透過下面兩個方式,

建立技術指標對股市買賣策略之程度,來達到自動化模糊化指標之建立。

(1) 模糊關係合成

模糊關係合成 (Zadeh, 1965)透過μ(資料,群聚)和μ(群聚,買賣策略)的關係 合成,產生μ(資料,買賣策略)的關係 ,其公式如下:

T R S

μ (資料,買賣策略) = max{μ (資料,群聚)×μ (群聚,買賣策略)} (3-3) 其中,

μ (資料,群聚)為資料對群聚之歸屬程度 R

μ (群聚,買賣策略) 為群聚對股市買賣策略程度 S

μ (資料,買賣策略)為資料對股市買賣策略之程度 T

透過合成技術指標對群聚程度值以及群聚對股市買賣策略程度的關係,得到技 術指標的買賣策略程度,其中技術指標對群聚的歸屬函數為

1 ( ) 2 ( 1)

( ) 2 1

c t

J i

t

ij t

k J k

P v P v µ

+

=

= ⎢

參考文獻

相關文件

I-STD 是在資料以漸進式增加的前提下進行資料探勘,在醫院的門診診斷紀 錄中,雖然每個月門診數量不盡相同但基本上仍有一固定總門診數量範疇,因此 由圖

Sharma (1999), “An Intergrated Machine Vision Based System for Solving the Non-Covex Cutting Stock Problem Using Genetic Algorithms,” Journal of Manufacturing Systems, Vol..

[2] Baba N., Inoue N., Asakawa H., Utilization of neural networks and GAs for constructing reliable decision support systems to deal stocks, IJCNN 2000 Proceedings of

C., “Robust and Efficient Algorithm for Optical Flow Computation,” Proceeding of IEEE International Conference on Computer Vision, pp. “Determining Optical Flow.” Artificial

In each window, the best cluster number of each technical indicator is derived through Fuzzy c-means, so as to calculate the coincidence rate and determine number of trading days

The neural controller using an asymmetric self-organizing fuzzy neural network (ASOFNN) is designed to mimic an ideal controller, and the robust controller is designed to

Hwang, “An O (nk)-time algorithm for computing the reliability of a circular consecutive-k-out-of-n:F system,” IEEE Trans on Reliability, Vol.. Shantikumar, “Recursive algorithm

Imamura, “ Fuzzy Decision Analysis on the Development of Centralized Regional Energy Control System,” IFAC Symposium on Fuzzy Information, Knowledge Representation