第四章 實驗設計與結果
4.3 不同維度的正確率結果
® 1
¯¯ 20
¯1= °
¯1= ° 0.2
執行次數 100
initfknn kk值 3
kNN
kNN kk值 1
SVM kernel 型態 radial-basis SVM CC/¾¾ 值 CC=1,¾¾=1
QDC r/s 值 r=0.5,s=0
4.3 不同維度的正確率結果
本節中,將探討利用不同的特徵萃取法將各個資料集降維並搭配不同的分類 器來呈現每個維度的正確率。就如第一章提及的,想解決 Hughes phenomena 現 象,所以本研究將呈現當樣本數少的時候在各個特徵萃取法得辨識結果。首先進
36
37
38
資料集 Soybean (small),因為相較於其他資料集它的樣本數比較少,所以在 辨識上半監督式特徵萃取法皆比非監督式特徵萃取法有較好的辨識效果,從表
39
然半監督式特徵萃取法皆比非監督式特徵萃取法有更好的辨識效果,但反觀三種 半監督式特徵萃取法的辨識效果也差異不大,不過 SSFE_PCC 分別在第 5 維和 第 4 維時就有高於其他方法的辨識結果。
總結以上的所有資料集在不同特徵萃取法的辨識結果,可以發現 SSFE_PCC 在約束數目少及低維度情況下進行的辨識結果都比其他特徵萃取法的成效來得 好,甚至從接下來要呈現的折線圖如圖 4.3-1~圖 4.3-3 中可以發現,當高維度 時也可以不失其正確率。而常見的特徵萃取法 LDA 因為受限於少樣本時,較不 容易有好的正確率,所以幾乎在每個資料集中 LDA 皆無法有較好的辨識結果。
40
接著,根據上述的抽樣方式,再以折線圖呈現在同一分類器下,每種特徵萃
取法將資料集之原始維度降維至 的結果。
(a) Iris (b) Balance
(c)Wine (d)Ionosphere
(e) Soybean (small) (f) Sonar
圖 4.3-1 在 1NN 下,資料集在不同維度的辨識結果
41
當約束數目為 5,分類器為 1NN 時,從圖 4.3-1 (a) Iris 資料集中,可以發現 半監督式特徵萃取法幾乎無下滑趨勢,並在第 2 維時,SSFE_PCC 達到所有方法 中最好的正確率;LDA 因為固定在(c ¡ 1)(c ¡ 1)維,所以為平整得直線;雖然非監督式 特徵萃取法也是在第 2 維時,有相對不錯的正確率,但皆不穩定。而在圖 4.3-1 (b) Balance 資料集中,在全維度的情況下,所有特徵萃取法的正確率差異不大,但 SSFE_PCC 在第 2 維時,就達到所有方法中的最佳正確率,且在第 2 維之後也無 明顯下降趨勢。從圖 4.3-1 (c) Wine 資料集中,一樣在半監督式特徵萃取法比非 監督式特徵萃取法有較佳的正確率,而 SSFE_PCC 在第 3 維時,達到所有方法 中的最佳正確率,其他半監督式特徵萃取法大概也都在第 5 維之後達到平滑曲線,
並無下滑趨勢。從圖 4.3-1 (d) Ionosphere 資料集中,可以看到半監督式特徵萃取 法皆優於非監督式特徵萃取法,SSFE_PCC 更在第 6 維時,達到所有方法中的最 佳正確率,其他半監督式特徵萃取法大概也都在第 5 維之後達到平滑曲線,並無 下滑趨勢。在圖 4.3-1 (e) Soybean (small)資料集中,半監督式特徵萃取法皆優於 非監督式特徵萃取法,SSFE_PCC 更在第 3 維時,達到所有方法中的最佳正確率,
而較特別的是,SSDRsp 在第 16 維前都趨於平整的曲線,之後正確率則急速上 升到跟 SSFE_PCC 和 SSDR 差不多的正確率,之後就並無下滑趨勢。在圖 4.3-1 (f) Sonar 資料集中,因為 Sonar 較為難判別,所以正確率普遍不高,但 SSFE_PCC 也在第 5 維時,達到所有方法中的最佳正確率,半監督式特徵萃取法大概也都在 第 5 維之後達到平滑曲線,並無下滑趨勢。
42
(a) Iris (b) Balance
(c) Wine (d) Ionosphere
(e) Soybean (small) (f) Sonar
圖 4.3-2 在 SVM 下,資料集在不同維度的辨識結果
43
當約束數目為 5,分類器為 SVM 時,從圖 4.3-2 (a) Iris 資料集中,可以發 現半監督式特徵萃取法幾乎無下滑趨勢,並在第 2 維時,SSFE_PCC 達到所有方 法中最好的正確率;LDA 因為固定在(c ¡ 1)(c ¡ 1)維,所以為平整的直線;而在非監督 式特徵萃取法中,LLE 也在第 3 維之後達到不錯的辨識效果。而在圖 4.3-2 (b) Balance 資 料 集 中 , 半 監督式 特 徵 萃 取 法 為比較 穩 定 的 特 徵 萃 取 法 , 尤以 SSFE_PCC 在第 2 維時,達到所有方法中的最佳正確率;LPP 和 LE 則是隨著維 度增加,正確率也漸漸的提升,而 LLE 雖然在第 1 維時就有不錯的正確率,但 也在第 1 維後開始下滑。從圖 4.3-2 (c) Wine 資料集中,可見半監督式特徵萃取 法比非監督式特徵萃取法有較佳的正確率,而 SSFE_PCC 在第 3 維時,達到所 有方法中的最佳正確率並且無下滑趨勢,其他半監督式特徵萃取法也隨著維度的 增加,正確率也逐漸提升並無下滑趨勢。從圖 4.3-2 (d) Ionosphere 資料集中,可 以看到 SSFE_PCC 在第 1 維就可以比其他方法有較好的正確率而且在第三維達 到最佳的正確率,但也在第 3 維開始下滑,不過也比其他方法的辨識效果還要好。
在圖 4.3-2 (e) Soybean (small)資料集中,因為約束數目少,所以大部分的方法都 辨識的不好,唯有 SSFE_PCC 在第 3 維時就達到所有方法的最佳正確率,同時 也在第 3 維時開始下滑,到第 9 維時開始以平滑曲線的趨勢前進,因為 Hughes phenomena 現象,又在第 25 維時開始下滑。在圖 4.3-2 (f) Sonar 資料集中,因為 Sonar 較為難判別,所以正確率普遍不高,但 SSFE_PCC 也在第 5 維時,達到所 有方法中的最佳正確率但也在第 5 維之後開始下滑,其他半監督式特徵萃取法大 概第 3 維之後就開始下滑。
44
(a) Iris (b) Balance
(c) Wine (d) Ionosphere
(e) Soybean (small) (f) Sonar
圖 4.3-3 在 QDC 下,資料集在不同維度的辨識結果
45
當約束數目為 5,分類器為 QDC 時,從圖 4.3-3 (a) Iris 資料集中,可以發 現 SSFE_PCC 在第 2 維時達到所有方法的相對最佳正確率,同時也在第 2 維時 開始下滑,但即便到第 4 維仍是比所有方法有更好的辨識結果,而 SSDR 和 SSDRsp 在第一維之後就開始下滑,到第 3 維後下滑至比 LDA 還低的正確率;
LDA 因為固定在(c ¡ 1)(c ¡ 1)維,所以為平整的直線。在圖 4.3-3 (b) Balance 資料集中,
半監督式特徵萃取法和 LDA 為比較穩定的特徵萃取法,尤以 SSFE_PCC 為最佳,
在第 2 維時就達到所有方法的最佳正確率;LE 和 LPP 則是隨著維度增加,正確 率也漸漸的提升。從圖 4.3-3 (c) Wine 資料集圖中,可見半監督式特徵萃取法在 低維度時比非監督式特徵萃取法有較佳的正確率,SSFE_PCC 在第 3 維時,達到 所有方法中的最佳正確率同時也在第 3 維開始下滑,其他半監督式特徵萃取法也 隨著維度的增加,在第 2 維後正確率開始下滑;反觀非監督式特徵萃取法中,
LLE 和 LE 卻隨著維度的增加,而正確率逐漸的提升。從圖 4.3-3 (d) Ionosphere 資料集中,可以看到 SSFE_PCC 在第 1 維到第 5 維間和其他半監督式特徵萃取 法並無多大差異,在第 5 維後正確率便開始上升,直到第 9 維達到所有方法的相 對最佳正確率,同時並隨著維度增加而開始下滑。其他半監督式特徵萃取法則在 第 3 維左右開始下滑;在非監督式特徵萃取法中,LLE 和 LE 卻隨著維度增加反 而正確率逐漸上升。在圖 4.3-3 (e) Soybean (small)資料集中,因為約束數目少,
所以大部分的方法都辨識的不好,唯有 SSFE_PCC 在第 2 維時就比其他方法有 更好的辨識能力,在第 3 維時就達到所有方法的最佳正確率,同時也在第 3 維時 開始下滑,到第 10 維時開始以平滑曲線的趨勢前進,因為 Hughes phenomena 現 象,又在第 23 維時開始下滑。在圖 4.3-3 (f) Sonar 資料集中,因為 Sonar 較為難 判別,所以正確率普遍不高,但 SSFE_PCC 也在第 4 維時,達到所有方法中的 最佳正確率但也在第 4 維之後開始下滑,其他半監督式特徵萃取法大概第 4 維之 後就開始下滑,直至高維度時,所有方法的正確率幾乎並無多大差異。
46