• 沒有找到結果。

第四章 實驗與結果比較

4.2 實驗結果

4.2.1 肝病診斷

0% 不設定準確率限制,使用染色體數為100。

實驗 組一

5% 以族群中,分類準確率較低之5%染色體的分類準確率平均值為閥 值。使用染色體數為50。

實驗 組二

10% 以族群中,分類準確率較低之10%染色體的分類準確率平均值為閥 值。使用染色體數為50。

4.2 實驗結果

4.2.1 肝病診斷 實驗一

圖4.1 至圖 4.3 為實驗過程中,染色體族群重心在實驗開始後 20 代、50 代及 100 代內之移動趨勢。圖4.4 及圖 4.5 則為特徵使用率標準差及分類準確率標準差之紀錄圖。

訓練資料 20代

0.6 0.7 0.8 0.9 1

0 0.1 0.2 0.3 0.4 0.5 0.6

特徵使用率

分類準確率

0%

5%

10%

20%

圖4.1 前 20 代趨勢圖(肝病)

訓練資料 50代

0 0.1 0.2

0 50 100 150 200

世代交替數

分類準確率標準

0%

5%

10%

20%

圖4.5 分類準確率變異趨勢圖(肝病)

觀察圖4.1 至圖 4.3,雖然一開始族群的特徵使用率及分類準確率之重心相差不大,

但隨著世代交替數的增加,重心的移動方向卻不盡相同。在不設定準確率限制(0%)的狀 況下,族群的重心快速的朝向左下方前進。在短短的二十代內,染色體族群的平均特徵 使用率已經從50%減少到 12%,不過在分類準確率上,卻沒有上升的趨勢。而設定準確 率閥值後,隨著限制的高低不同,基因演算法的搜尋方向也隨之調整,限制越高,搜尋 方向越往上調整。但此一現象,有可能只是因設定準確率限制,會將分類準確率較差之 染色體踢除,導致重心會有向上偏移的假象,事實上並沒有搜尋到分類準確率較高的特 徵組合。圖4.4.及圖 4.5 顯示準確率閥值越高,分類準確率標準差越低,而於特徵使用 率上則無明顯差別。此點顯示,設置準確率限制,並不會使得染色體族群於特徵使用率 上的分布廣度降低,但會使得染色體族群於分類準確率上的分布廣度降低。

實驗二

在實驗二中,本研究分別針對0%、5%、10%三種不同的準確率限制條件,每種條 件皆重複進行三次演化計算。比較其在經過50 代、100 代、200 代演化後,於各種不同 使用特徵數下,綜合訓練組分類準確率及測試組分類準確率兩種指標,所能找到之最佳 解(圖 4.6 至圖 4.8)。

訓練資料 50代

在不加準確率限制(0%)的情況下,可以明顯的觀察到,使用特徵數大於四的解,其 分類準確率不管在訓練組或在測試組皆表現較差。且隨著世代交替數的增加,此情況會 愈形嚴重,到了200 代時,甚至根本沒有使用特徵數高於四的解。而加上準確率限制後,

隨著限制的升高,將可幫助基因演算法往提升分類準確率的方向搜尋,而非以減少特徵 使用數為優先考量。而在準確率限制為10%的狀況下,其所搜尋到使用特徵數為 1 及 2 的特徵組合,分類準確率似乎越來越差,但使用特徵數為5 及 6 的特徵組合,分類準確 率有稍微的提升。不過在訓練組擁有較高的分類準確率,並不一定在測試組也能有同樣 的表現。

實驗三

實驗三將不設定準確率閥值之實驗,增加其染色體使用數量一倍,其實驗結果如圖 4.9 至圖 4.11。

訓練資料 50代

70.0%

80.0%

90.0%

100.0%

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 使用特徵數

分類準確率

0%

5%

10%

測試資料 50代

70.0%

80.0%

90.0%

100.0%

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 使用特徵數

分類準確率 0%

5%

10%

圖4.9 50 代之最佳解(肝病 實驗三)

訓練資料 100代

相關文件