• 沒有找到結果。

第二章 研究方法

2.3 模糊熵與區間距離

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

10

君在此時刻下的 80%的快樂程度。在模糊理論中,隸屬度的全距範圍一般都設定 在 0 到 1 之間。這可使“快樂”此一語言變數,成為一感覺性的分布。

應用模糊理論檢定時間數列是否發生轉折時,應先將時間數列分群,找出群 落中心。再運用模糊隸屬度與模糊熵等觀念進行分類。其定義如下:

定義 2.1 模糊隸屬度 (Wu and Chen, 1999)

令一時間數列{ ,t=1,2,…,N},且C1與C2為時間數列的兩個群落中心令

µ , = 1,2,表示時間數列X 中的元素 對C1、 C2的隸屬度,則定義隸屬度為 µ = 1 − | − C |

∑ | − C |

定義 2.2 模糊熵 (Wu and Chen,1999)

令一時間數列{ ,t=1,2,…,N},µ 表 對群落中心Ci ( =1,2,...,k)之隸屬度,

則 的模糊熵定義為

δ( ) = − 1

k [μ ln(μ ) + (1 − μ )ln(1 − μ )]

而熵是熱力學中的一個觀念,它的本意是熱量可以轉變功的程度,統計物理 學給予另一解釋:它是描述分子運動無規則的一種度量。而機率論和訊息論又給 了它更一般的說明:它是隨即變量無約束度的一種度量,是剩餘資訊量大小的一 種度量。所以模糊熵表用來測量模糊集合的不確定性,是處理模糊資料的重要工 具。而模糊隸屬度用來描述元素無法明確界定是否屬於給定集合的集合類。

2.3 模糊熵與區間距離

模糊區間集合可視為連續型的模糊集合,能更進一步表示一不確定性的事 物,例:“評量成績等第”,在外國學校中常中 A、B、C、D 來評量學生的成績,

A 表示為 100-80 分、B 表示 79-70 分、C 表示 69-60 分、D 表示 59-50 分。來代 替以往分數的取向,因為以往我們認為分數高就代表的學得好,但 80 分與 85 分就代表著得 85 分的同學學習能力就更好嗎?答案是不一定的。因此模糊區間 集合,就解決了此一不確定性現象。

當有了區間模糊樣本,我們必須考慮區間的運算,有關區間運算可參考吳 (2005)。但對於其區間距離的測量尚無完備之定義(見,吳 2010)。本節將定義一

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

11

較合適(well-defined)區間距離,並應用此定義計算區間聚落中心、區間模糊隸屬 度。

如何定義一較合適之區間距離呢?首先我們將區間以(c ; r )表示,c 代表中 心點,r 代表半徑。因此區間距離可考慮為中心點的差異加上半徑的差異。其中 中心點差異可視為位置差異,半徑差異可視為廣度(Scale)差異。但是為了避免廣 度差異對位置影響過大,我們將廣度差異化為 ln,再加上 1 為避免使 ln 為負值。

定義 2.3 區間型模糊樣本之距離

設 U 為一論域,令{χ = [a , b ], = 1,2}為自論域 U 中抽出的二個區間模糊 樣本,c = , r = 。定義兩區間模糊樣本χ 與χ 之距離為

d(χ , χ ) = |c − c | + ln (1 + |r − r |)

例 2.1:令兩筆區間資料χ = [2,5]、χ = [3,7]

則χ = 3.5;1.5 ,χ = (5;2)

d χ , χ = |3.5 − 5| + ln(1 + |1.5 − 2|) = 1.9

例 2.2:令兩筆區間資料χ = [3,5]、χ = [4,5]

則χ = 4;1 ,χ = (4.5;1)

d χ , χ = |4 − 4.5| + ln(1 + |1 − 1|) = 0.5

定義 2.4 區間型模糊樣本之預測均方誤差 (mean square error of interval , IMSE) 令{χ = [a , b ], = 1, … , }為一區間時間數列,預測區間為χ =[a , b ],

ε = d χ , χ 為預測區間與實際區間的誤差,則

IMSE = 1

ε 其中 l 代表往前預測期數。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

12

例 2.3:大學生預測薪資如下表

往前期數 預測薪資 實際薪資 1 [3,4] [3,6]

2 [2,6] [4,5]

3 [3,5] [2,6]

4 [5,7] [5,8]

5 [4,5] [3,8]

χ = [3,4] = (3.5; 0.5)、χ =[3,6]=(4.5;1.5)

d χ , χ = |3.5 − 4.5| + ln(1 + |0.5 − 1.5|) = 1.69

χ = [2,6] = (4; 1)、χ =[4,5]=(4.5; 0.5)

d χ , χ = |4 − 4.5| + ln(1 + |1 − 0.5|) = 1.41

χ = [3,5] = (4; 1)、χ =[2,6]=(4;2)

d χ , χ = |4 − 4| + ln(1 + |1 − 2|) = 0.69

χ = [5,7] = (6; 1)、χ =[5,8]=(6.5;1.5)

d χ , χ = |6 − 6.5| + ln(1 + |1 − 1|) = 0.91

χ = [4,5] = (4.5; 0.5)、χ =[3,8]=(5.5;2)

d χ , χ = |4.5 − 5.5| + ln(1 + |0.5 − 2|) = 0.09

則根據定義 2.4 ,IMSE= × (1.69 + 1.41 + 0.69 + 0.91 + 0.09 ) = 2.12

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

13

定義 2.5 區間型時間數列聚落

設Ψ ={χ ,t=1,2,……,N}為一區間時間數列,k ∈N 為群落個數。若存在一集 合 ℐ = {Ι ∈ interval; = 1,2, … , },使得Ψ中的元素 χ 與ℐ中的元素Ι 的距離平方 和為最小,即

Min d(χ , Ι )

則稱集合 ℐ = {Ι ∈ interval; = 1,2, … , },為區間時間數列 Ψ 的聚落區間集合。

例 2.4:我們用失業率(單位:百分比)27 筆區間資料,其分佈圖如圖 2.1 所示

圖 2.1 區間時間數列走勢圖

若我們欲將資料分成兩群,則利用定義 2.5,可得兩個區間聚落Ι = (1.83,2.46),

Ι = (3.71,5.23)其分群結果如下圖

圖 2.2 區間群落結果

0 1 2 3 4 5 6

1 3 5 7 9 11 13 15 17 19 21 23 25 27

區間

0 1 2 3 4 5 6

1 3 5 7 9 11 13 15 17 19 21 23 25 27

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

14

定義 2.6 區間模糊隸屬度

令ψ ={χ ,t=1,2,……,N}為一區間時間數列,且Ι 為聚落區間,令μ 表示區間 時間數列Ψ中的元素 對Ι 的隸屬度, = 1, . . , k,則定義隸屬度為

µ = 1 − d( , Ι )

∑ d( , Ι )

相關文件