• 沒有找到結果。

第三章 解析編碼之演化式分類演算法

3.1 解析式染色體編碼

本研究提出 GAREC 採用類似解析影像的概念,套用在分類資料中。GAREC 所指的解析度是指將訓練的資料維度空間切割成 K 個等份。如圖 3-1,表示一個 二維度的資料空間,每個維度的解析度為 3,整個資料空間的解析度為 32。圖中 每一個方格稱作一個 “解析方格”(Resolution Lattice)。

資料維度-1

料維度-1 中為[4,5]區間,及資料維度-2 為[b,c]區間,若該解析方格表示一分類 類,別則在該區間的資料點都屬於同一個類別。GAREC 透過解析方格的方式將 訓練資料解析成染色體,其特性如下:

1. 定義解析方格區間:找出訓練資料中各個維度的最大值與最小值,並且以解 析度決定方格區間的大小,使每一個方格的大小一致。每一個解析方格皆擁 有各自的類別。

2. 染色體架構:GAREC 的染色體,是由解析後的解析方格所組成,其排列方 式,如圖 3-2 所示。

1 2 3

4 5 6

7 8 9

1 2 3 4 5 6 7 8 9

圖 3-2 染色體編碼排列圖

3. 在 GAREC 的解析編碼中一條染色體就代表一個問題的分類結果。影響染色 體長度的數值為解析度(DPI)及資料維度(DIM),例如:在 2 維度的資料 空間中,解析度為 4 時,其染色體長度為 4*4,長度為 16;在 3 維度的資料 空間中,解析度為 8 時,則長度為 8*8*8,總長度 512。資料維度則是直接 影響次方數,因此資料維度對於染色體長度具有較大的影響力。計算染色體 長度的如公式(1)

DPI

DIM (1)

4. 定義訓練資料點所屬方格:每一個訓練資料點,皆擁有自己的位置點,因此 以解析區間決定訓練資料點所屬方格。若資料點位於方格範圍內,則該資料

點屬於該資料範圍,以圖 3-1 為例,若一資料點位置為[5.6,f]則該資料點屬 於方格 3,一個資料維度由公式(2)決定其所屬的解析區間。

D/Step

+1 (2)

3.2 解析編碼之演化式分類演算法

每一個 GAREC 解析方格中,可能含有許多不同類別的資料點。GAREC 演 算法針對此問題時,會將該解析方格再次解析,使每一個解析方格得以完整地表 示一個類別,如圖 3-3 所示。其演算法精神有二:

1. 解析訓練資料,使資料成為解析方格,並將此解析方格組成基因型式。以 GA 決定每一方格的類別。

2. 挑出最佳染色體中適應度不佳的基因,將該基因中未能完全分類的方格再次 解析,使其成為新的子工作。所有子工作重新執行基因演算法的演化分類,

如此反覆重新解析的工作,直到滿足停止條件為止。解析度可因應工作狀況 調整大小,通常呈遞減狀態。

GAREC 編碼流程如圖 3-4,圖中範例為一個 2 維度、解析度為 3 的資料,

解析後的像素序列即是染色體,染色體中的解析方格就是一個基因,一個基因可 能無類別或同時擁有許多類別的資料點。圖示中的染色體有許多基因是同時擁有 兩個或兩個以上類別的資料點,這樣的基因無法演化出最佳的適應度,因此會再 將此基因再次解析,產生子工作。工作佇列如圖 3-5。

圖 3-3 類別解析示意圖

訓練資料

解析訓練資料

染色體

解析子工作

圖 3-4 演化式分類演算法編碼流程圖

圖 3-5 工作佇列示意圖

相關文件