第四章 實驗與結果比較
4.2 實驗結果
4.2.1 肝病診斷
0% 不設定準確率限制,使用染色體數為100。
實驗 組一
5% 以族群中,分類準確率較低之5%染色體的分類準確率平均值為閥 值。使用染色體數為50。
實驗 組二
10% 以族群中,分類準確率較低之10%染色體的分類準確率平均值為閥 值。使用染色體數為50。
4.2 實驗結果
4.2.1 肝病診斷 實驗一
圖4.1 至圖 4.3 為實驗過程中,染色體族群重心在實驗開始後 20 代、50 代及 100 代內之移動趨勢。圖4.4 及圖 4.5 則為特徵使用率標準差及分類準確率標準差之紀錄圖。
訓練資料 20代
0.6 0.7 0.8 0.9 1
0 0.1 0.2 0.3 0.4 0.5 0.6
特徵使用率
分類準確率
0%
5%
10%
20%
圖4.1 前 20 代趨勢圖(肝病)
訓練資料 50代
0 0.1 0.2
0 50 100 150 200
世代交替數
分類準確率標準差
0%
5%
10%
20%
圖4.5 分類準確率變異趨勢圖(肝病)
觀察圖4.1 至圖 4.3,雖然一開始族群的特徵使用率及分類準確率之重心相差不大,
但隨著世代交替數的增加,重心的移動方向卻不盡相同。在不設定準確率限制(0%)的狀 況下,族群的重心快速的朝向左下方前進。在短短的二十代內,染色體族群的平均特徵 使用率已經從50%減少到 12%,不過在分類準確率上,卻沒有上升的趨勢。而設定準確 率閥值後,隨著限制的高低不同,基因演算法的搜尋方向也隨之調整,限制越高,搜尋 方向越往上調整。但此一現象,有可能只是因設定準確率限制,會將分類準確率較差之 染色體踢除,導致重心會有向上偏移的假象,事實上並沒有搜尋到分類準確率較高的特 徵組合。圖4.4.及圖 4.5 顯示準確率閥值越高,分類準確率標準差越低,而於特徵使用 率上則無明顯差別。此點顯示,設置準確率限制,並不會使得染色體族群於特徵使用率 上的分布廣度降低,但會使得染色體族群於分類準確率上的分布廣度降低。
實驗二
在實驗二中,本研究分別針對0%、5%、10%三種不同的準確率限制條件,每種條 件皆重複進行三次演化計算。比較其在經過50 代、100 代、200 代演化後,於各種不同 使用特徵數下,綜合訓練組分類準確率及測試組分類準確率兩種指標,所能找到之最佳 解(圖 4.6 至圖 4.8)。
訓練資料 50代
在不加準確率限制(0%)的情況下,可以明顯的觀察到,使用特徵數大於四的解,其 分類準確率不管在訓練組或在測試組皆表現較差。且隨著世代交替數的增加,此情況會 愈形嚴重,到了200 代時,甚至根本沒有使用特徵數高於四的解。而加上準確率限制後,
隨著限制的升高,將可幫助基因演算法往提升分類準確率的方向搜尋,而非以減少特徵 使用數為優先考量。而在準確率限制為10%的狀況下,其所搜尋到使用特徵數為 1 及 2 的特徵組合,分類準確率似乎越來越差,但使用特徵數為5 及 6 的特徵組合,分類準確 率有稍微的提升。不過在訓練組擁有較高的分類準確率,並不一定在測試組也能有同樣 的表現。
實驗三
實驗三將不設定準確率閥值之實驗,增加其染色體使用數量一倍,其實驗結果如圖 4.9 至圖 4.11。
訓練資料 50代
70.0%
80.0%
90.0%
100.0%
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 使用特徵數
分類準確率
0%
5%
10%
測試資料 50代
70.0%
80.0%
90.0%
100.0%
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 使用特徵數
分類準確率 0%
5%
10%
圖4.9 50 代之最佳解(肝病 實驗三)
訓練資料 100代