• 沒有找到結果。

第四章 類神經模糊缺漏資料探勘模式之建構

4.2 修改 FALCON 內部學習模式-學習缺漏資料法

4.2.2 多維空間式 Kohonen 學習

圖 4.6 只具有兩種屬性之 FALCON 學習網路圖

圖 4.6 所示,即是真正只有屬性 b、c 及決定部 D 之兩種屬性的 FALCON 學習網路圖。將屬性 b、屬性 c 及決定部 D 輸入後,再以 Kohonen 學習法與增強式競爭學習法建構之 FALCON 系統的學習架構 圖。在第二層,同圖 4.4 的單一資料 X,每ㄧ個屬性的模糊分割皆為二,

在第四層的模糊亦切割為四,第三層法則庫依第二層個數有四個神經 元。

因此,若能結合圖 4.4 與圖 4.6,解決圖 4.5 之無法學習之問題,

即可創造出當屬性只有兩種時,就只學習兩種屬性;當屬性有三種時,

就學習三種屬性的系統。

由上述討論中得知,缺漏資料在 FALCON 網路上傳遞時,其訊息 處理之困難發生在 FALCON 網路第三層的法則層。由圖 4.4 與圖 4.6 的分析情形,圖 4.4 之 FALCON 第三層法則擁有八個神經元,圖 4.6 之第三層法則卻只有四個神經元。因此,使系統同時能學習三個屬性 及兩個屬性的關鍵來自 FALCON 網路第三層的模糊交集。

本研究針對上述多種屬性之模糊交集的處理分為兩部份:(1)第 二層學習參數之修正(2)第三層的模糊交集法。並對於第一部份提出 多維空間式 Kohonen 學習,而第二部份提出多重屬性模糊法則。

二層傳統 Kohonen 學習提出多維空間修正模式,使傳統 Kohonen 學習 法則能夠接受缺漏資料而成為多維空間式 Kohonen 學習。

圖 4.7 傳統二維空間 Kohonen 學習平面圖[30]

上圖為傳統二維空間 Kohonen 學習平面圖,X 軸表示屬性 X,Y 軸表示屬性 Y。每ㄧ筆資料表示法如下所示:

( , )X Y =( ,x yi i)( ,x yi i)∈cluster K i=1, 2,...,n K = A B C, , (4.3)

上式中,n 表示資料總數,下標 i 表示為第 i 筆資料,K 表示資料 之族群類別。因此,在二維空間平面,欲決定某一筆資料所屬之族群 時必須同時指定 x 值與 y 值。假設今有一筆資料 Z 如下所示:

( , )X Y =( ,x nanz ) (4.4)

上述方程式中,nan 表示無此數字,意即該屬性缺漏。資料 Z 只具 有 X 值,且 X 值為 3,不具有 Y 值。若 nan 值為未知數,則該點之可 能位置在二維平面中並非為一個點,而是顯一條線。如下圖所示:

圖 4.8 資料 nan 值在二維空間平面圖

資料 Z 之 nan 值在上圖中為一任意數,其因是因為未知數 nan 值 不確定,因此無法在上述二維平面中指定明確點位置。若 nan 值為缺 漏,則資料 Z 無法繪入平面亦無法歸類任何一族群。

由上述分析知道,不管假設 nan 為不存在還是未知數,皆無法繪 入二維平面。本研究針對此問題提出多維空間式思考邏輯。由於資料 Z 具有 X 屬性值,則只針對資料庫之 X 值進行分類。資料 Z 不具有 Y 屬 性值,則 Y 屬性值分類中不具有資料 Z 的值。詳細方程式如下所示:

X =xixi∈ cluster K i=1, 2,...,n K = A B C, , (4.5)

Y = yi =nanignore yi (4.6)

由上述方程式,表示當資料 Z 只具有 X 屬性值,不具有 Y 屬性值 時,二維空間須轉化為一維空間進行族群分類,一維空間表示是 X 屬 性之ㄧ維空間。如同下圖所示:

圖 4.9 屬性 X 之ㄧ維空間平面圖

在上圖之中,資料 Z 之 X 屬性值可以被分類至族群A,並且由於 資料 Z 之加入,可以修改族群 A 之中心點及分離度(m值與σ 值)。修 改後之演算式(algorithm)如下所示:

中心點(m值)

if xnan

wlik+1=lwki +ηk

( )

xwlki

wlkj =wlkj, forj=1, 2,...,n ji (4.7)

end

分離度(σ 值)

if xnan

σi mi mnearest γ

= (4.8)

end

上例中,資料 Z 之 Y 屬性值為 nan,所以不予處理。換言之,屬 性 X 的資料筆數比屬性 Y 之資料筆數多出了一筆資料 Z,在學習之過 程中多ㄧ次被修正之機會,亦即資料筆數在不同屬性中可以容許不同 數量。

上述方法本研究稱之為多維空間式 Kohonen 學習。而利用多維空 間式 Kohonen 學習在 FALCON 資料缺漏上,可以順利將缺漏的資料進 行分類、計算及學習,並且充分利用每ㄧ筆完全或缺漏之資料,使得 隱含在資料內知識可以被發掘出來。