• 沒有找到結果。

模糊區間距離與賦距空間

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

4

2 研究方法

本章先在2.1 模糊迴歸模式架構中,以區間模糊數建構模糊迴歸模式。而在 2.2 模糊迴歸參數估計中,採用中心與分展度二維度技術,並藉由最小平方法 (Least Squares Estimation)來進行參數估計。2.3 殘差分析 (Residual Analysis) 中,

結合傳統迴歸殘差分析概念,以距離大小來呈現兩區間的差異程度。並提出區間 數區間距離與平均距離的概念。2.4 在財務金融上的應用中,介紹波動率的特性,

及模糊迴歸在財務金融上的相關文獻。2.5 模糊區間距離與賦距空間,驗證區間 模糊數平均距離具有賦距空間等性質。2.6 其它模糊迴歸方法,介紹其它模糊迴 歸參數估計方法與區間數加法和乘法。

2.1 模糊迴歸模式架構

迴歸分析預測法,具有描述、預測與控制獨立變數和應變數之間因果關係的 功能,透過建立變數之間的迴歸方程,可將迴歸方程作為預測模型。因此,迴歸 分析預測是一種重要的市場預測方法。

傳統迴歸分析假設觀察值是由實際應變數影響加上隨機誤差而產生的。亦即,

應變數是一種帶有不確定性的隨機變數。不過在很多實務應用上,此假設無法成 立。以匯率為例,統計數字只能表示單一時間點的資訊,不能完全準確地反應時

間區間下匯率變化。如果利用假性的「精確值」,可能誤導模型的建構,也可能

擴大預測結果和實際狀態之間的誤差。本研究中,將以區間模糊數建構模糊迴歸 模式,如此一來對樣本的解釋方式將更貼近現實。

傳統的統計迴歸模式假設觀測值的不確定性來自於隨機現象,而模糊迴歸則 考慮不確定性來自於多重隸屬現象。當考慮具有模糊性資料時,參數本身具有不

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

5

確定性與模糊性,線性模糊迴歸常表示成:

𝐘(𝐗𝐢) = 𝐀𝟎+ 𝐀𝟏𝐗𝐢𝟏+ 𝐀𝟐𝐗𝐢𝟐+ ⋯ + 𝐀𝐩𝐗𝐢𝐩

(2.1)

Xi = (Xi1, Xi2, … , Xip)′為獨立變數向量 向量元素Xim皆為區間模糊數,m = 1,2 … p Ak為區間模糊參數,k = 1,2 … p

Y(Xi)為區間模糊應變數

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

6

2.2 模糊迴歸參數估計

我們考慮應用最小平方法 (Least Squares Estimation) 來進行參數估計,由於 Y(Xi) , Xim , AK 為區間模糊數,因此採用中心點半徑二維度之技術,將Y(Xi) , Xim , AK 化為中心半徑形式,表示如下:

𝐘(𝐗𝐢) = [𝐘𝐂(𝐗𝐢) − 𝐘𝐒(𝐗𝐢), 𝐘𝐂(𝐗𝐢) + 𝐘𝐒(𝐗𝐢)] = < 𝐘𝐂(𝐗𝐢), 𝐘𝐒(𝐗𝐢) > (2.2)

𝐗𝐢𝐦= [𝐂𝐢𝐦−𝐒𝐢𝐦, 𝐂𝐢𝐦+ 𝐒𝐢𝐦] = < 𝐂𝐢𝐦, 𝐒𝐢𝐦 > (2.3)

𝐀𝐤= [𝐂𝐀𝐤− 𝐒𝐀𝐤, 𝐂𝐀𝐤 + 𝐒𝐀𝐤] = < 𝐂𝐀𝐤, 𝐒𝐀𝐤 > (2.4)

並將方程式(2.1),改寫如下:

𝐘(𝐗𝐢) = 𝐀𝟎+ 𝐀𝟏𝐗𝐢𝟏+ 𝐀𝟐𝐗𝐢𝟐+ ⋯ + 𝐀𝐩𝐗𝐢𝐩

= < 𝐂𝐀𝟎, 𝐒𝐀𝟎 > +< 𝐂𝐀𝟏, 𝐒𝐀𝟏 >< 𝐂𝐢𝟏, 𝐒𝐢𝟏 > +< 𝐂𝐀𝟐, 𝐒𝐀𝟐 >< 𝐂𝐢𝟐, 𝐒𝐢𝟐> + ⋯ +< 𝐂𝐀𝐩, 𝐒𝐀𝐩 >< 𝐂𝐢𝐩, 𝐒𝐢𝐩> = < 𝐘𝐂(𝐗𝐢), 𝐘𝐒(𝐗𝐢) > (2.5)

並藉由二維度技術,將模糊迴歸模式(2.2)改寫成中心迴歸模式與分展度迴歸 模式如下:

中心迴歸模式

𝐘𝐂(𝐗𝐢)=𝐂𝐀𝟎 + 𝐂𝐀𝟏𝐂𝐢𝟏+ 𝐂𝐀𝟐𝐂𝐢𝟐+ ⋯ + 𝐂𝐀𝐩𝐂𝐢𝐩 (2.6)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

7

半徑迴歸模式

𝐘𝐒(𝐗𝐢)=𝐒𝐀𝟎+ 𝐒𝐀𝟏𝐒𝐢𝟏+ 𝐒𝐀𝟐𝐒𝐢𝟐+ ⋯ + 𝐒𝐀𝐩𝐒𝐢𝐩 (2.7)

藉由中心迴歸模式(2.6)與半徑迴歸模式(2.7)分別預測出模糊應變數 Y(Xi) 的應變數中心 YC(Xi) 與應變數半徑 YS(Xi)。

下一節中,我們將提出以距離衡量估計值與實際值之間的誤差程度,並定義 嚴謹的區間數距離測度,以定義的區間數距離測度來衡量樣本與模型的配適性。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

8

2.3 殘差分析

傳統實數值線性迴歸分析之假設 (Assumptions) 如下:

1.應變數 (Response Variable) 是常態分佈 (Normal Distribution) ,且來自隨機取 樣(Random Sampling)

2.獨立變數 (Independent Variable) 是固定的常數或實驗數據,且其量測沒有誤差 3.任意兩獨立變數是獨立事件 (Independent Event)

4.應變數之誤差值 (Error) 在母群體是常態分佈,變異數是一個常數,且平均值 是 0

傳統統計中,殘差是指觀察值與預測值之間的差距,其定義如下式:

𝐞 = 𝐘𝐢− 𝐘̂ 𝐢 (2.8)

在區間模糊迴歸模式下,觀察值與預測值皆為區間數。為保有傳統統計精神,

我們以距離大小來呈現兩個區間之間的差異程度,其定義如下:

定義

2.1 區間模糊數區間距離

假設Ã = [A1, A2] , B̃ = [B1, B2]為兩區間模糊數,則我們定區間模糊數區間

距離

d 如下:

d(Ã, B̃) = < LAB, MAB; CAB> (2.9) 其中LAB= max {A1− B2, B1− A2, 0}為兩區間最小距離

MAB= max {A2− B1, B2− A1}為兩區間最大距離

CAB= −min {max[A1− B2, B1− A2, B1− B2, A1 − A2] , 0}為兩區間重疊距離

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

9

由定義 2.1 區間模糊數區間距離,兩區間的距離並非單一實數值,而是最小 距離與最大距離的區間數。類似的概念,就好比是各行星與太陽之間的距離,隨 著時間週期變化。離太陽最近時,稱為近日點;離太陽最遠時,稱為遠日點。西 元 1596 年,天文學家克卜勒曾寫過一本書<世界的和諧>,書中敘述天球音階 的和諧,以及天體變化與人體的關係。書中有一頁紀載克卜勒第三定律的內容-

行星平均軌道半徑的三次方與其公轉週期的平方比值是固定的。藉由平均軌道半 徑的概念,我們可將區間距離(區間數)轉換成平均距離(實數)。

定義

2.2 區間模糊數平均距離

假設Ã = [A1, A2] , B̃ = [B1, B2]為兩區間模糊數,則我們定區間模糊數平均

距離

D 如下:

D(Ã, B̃) = f。d(Ã, B̃) = f( < LAB, MAB; CAB> ) = LAB+M2AB−CAB (2.10)

其中D為f、d的合成函數

f:IR → [0, ∞) , d:IR × IR → IR , D:IR × IR → [0, ∞) IR 表示實數區間數集合

LAB= max {A1− B2, B1− A2, 0}為兩區間最小距離 MAB= max {A2− B1, B2− A1}為兩區間最大距離

CAB= −min {max[A1− B2, B1− A2, B1− B2, A1 − A2] , 0}為兩區間重疊距離

例 1假設𝐀̃ = [𝟒, 𝟏𝟎] , 𝐁̃ = [𝟏𝟔, 𝟐𝟎]為兩區間模糊數,則區間距離、平均距離為 LAB= max{4 − 20,16 − 10,0} = 6

MAB= max{10 − 16,20 − 4} = 16

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

10

CAB = − min{max[4 − 20,16 − 10,16 − 20,4 − 10] , 0} = 0 D(Ã, B̃)= f。d(Ã, B̃) = 6 + 16 − 0

2 = 11

區間距離 d(Ã, B̃) = < 6,16; 0 > 平均距離 D(Ã, B̃) = 11

例 2:𝐀̃ = [𝟑, 𝟏𝟎] , 𝐁̃ = [𝟓, 𝟐𝟎]為兩區間模糊數,則區間距離、平均距離為 LAB= max{3 − 20,5 − 10,0} = 0

MAB= max{10 − 5,20 − 3} = 17

CAB = − min{max[3 − 20,5 − 10,5 − 20,3 − 10] , 0} = 5 D(Ã, B̃)=f。d(Ã, B̃) =0 + 17 − 5

2 = 6

區間距離d(Ã, B̃) = < 0,17; 5 > 平均距離D(Ã, B̃) = 6

由以上距離的定義,若估計區間與實際區間的平均距離 D(Yi, Ŷ) 越大,表i 示估計出來的模糊應變數 Ŷ 與原本樣本 Yi i 差距越大。在符合傳統統計迴歸精 神下,當距離越小就是差異最小的估計,最能符合所抽取的樣本,也是最佳估計。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

11

2.4 在財務金融上的應用

在金融領域中,波動率 (Volatility) 常被用來量化資產的風險程度。估計波 動率的模型,大約分為三種。最簡單的模型是由該標的過去的指數或價格等歷史 訊息,所計算得到的數據,稱歷史波動率 (Historical Volatility),這是屬於無條件 的波動率;ARCH 及其延伸模型 (GARCH、EGARCH、IGARCH、GARCH-M 等) 則是可以捕捉報酬叢聚性的特徵,屬於條件波動率;而隱含波動率 (Implied Volatility) 是將選擇權市價代入理論評價模型中,所計算出來的波動率。

隱含波動率所代表的是投資人對標的物未來不確定性的意見和看法,且反應 了其它不在定價公式中的因子。例如流動性、買賣價差、錯誤資料、稅負、交易 成本等。因此,一般認為相較於其它波動率模型而言,隱含波動率隱含著較多的 訊息,所以對於預測未來的真實波動率 (Realized Volatility) 而言,隱含波動率是 個預測市場波動較好的代理變數 (Proxy)。然而,Huang (2002) 綜合一些研究指 出隱含波動率有一些衡量的偏誤。因不同模型各有其優缺點,所以模型的爭論一 直都存在,也各有學者支持。

隨著模糊統計與模糊相關性日漸受到重視,近年來也有許多以模糊迴歸預測 價格市場的研究,如:Reza Ghodsi, Mohammadsaleh Zakerinia, Mahdi Joka (2010) 等由差分整合移動平均自迴歸模型 (ARIMA)、人工神經網絡 (ANN)、模糊迴歸 (FR) 三種方法預測電力市場價值。研究中,FR 與 ANN 預測結果較佳[30];

Ghodratollah Emamverdi, Ebrahim Siami Araghi, Fatemeh Fahimifar (2013) 結合 ARIMA 和 FR 兩種方法預測股票市場價值[32]。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

12

2.5 模糊區間距離與賦距空間

賦距空間是指一集合上可定義距離的概念。距離是指集合上定義一函數,集

合中任兩元素可依此賦予一函數值,且此函數滿足某些性質,更具體地說:設X

為一集合,若存在一非負函數d

d: X × X → [0, ∞) 滿足

(a) d(x, y) ≥ 0 ∀x, y ∈ X (b) d(x, y) = 0 ⇔ x = y (c) d(x, y) = d(y, x)

(d) 三角不等式:d(x, y) ≤ d(x, z) + d(z, y) ∀x, y, z ∈ X

我們稱(X, d)為一賦距空間 (Metric Space),d 為 X 上的一個度規 (Metric)。

本章節中,我們將証明若以模糊區間距離測度D定義距離,則區間模糊數可 視為一賦距空間。

設Ã, B̃, C̃ ∈ IR為三個區間模糊數。Ã = [A1, A2] , B̃ = [B1, B2] , C̃ = [C1, C2] D: IR × IR → [0, ∞)為區間數集合 IR 上的一個測度。

D(Ã, B̃)=f。d(Ã, B̃) =LAB+ MAB− CAB 2

其中d: IR × IR → IR定義如下:

d(Ã, B̃) = < LAB, MAB, CAB>

其中f: IR → R定義如下:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

14

Thus, Ã = B̃.

Lemma 3.

𝐃(𝐀̃, 𝐁̃) = 𝐃(𝐁̃, 𝐀̃)

<pf> Since

d(Ã, B̃) = < LAB, MAB, CAB > = d(B̃, Ã),

we have

D(Ã, B̃) =LAB+M2AB−CAB= D(B̃, Ã). (by definition)

Lemma 4. Triangle inequality:𝐃(𝐀

̃, 𝐂̃) ≤ 𝐃(𝐀̃, 𝐁̃) + 𝐃(𝐁̃, 𝐂̃) ∀𝐀̃, 𝐁̃, 𝐂̃ ∈ 𝐈𝐑

(See Appendix)

Theorem 1. IR can be recognized as a metric space with metric D.

<pf> From our discussion in Lemma 1~ Lemma 4, the result follows directly.

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

15

相關文件