演算法

第三章半監督式特徵萃取

第二節演算法

加入樣本選取之半監督式無加萃

在半監

法，表 4-2 表示分析，

。

半監督式線性區別分析 SLDA

A1 Q=10,K=10

A2 Q=20,K=20

A3 Q=40,K=40

B1 Q=10,K=5

B2 Q=20,K=10 半監督式

無參數加權特徵萃取法

B3 Q=40,K=20

第

、圖 5-1，該實驗的作法是利用

數加權特徵萃取法均分別嘗試萃取 5、10、15 及 20 個特徵，10 個資料

集的平均分類辨識率如表 5-1、表 3。

五章實驗結果

第一節 Indian Pine site 資料集實驗結果

在作為比較基準的實驗中，相同 Indian Pine site 資料集的實驗結果被用來當作本實驗的比較基準，該研究的實驗結果見表 2-1

全部 2521 個樣本進行線性區別分析，並將資料轉換到一個五維的特徵空間中，

再取出 1%的樣本作為訓練樣本。

為了探討所萃取的特徵數的影響，將本研究的半監督式線性區別分析與半監督式無參

2、圖 2、圖

5-0.5 0.55 0.6 0.65 0

DAFE+ALOOC DAFE+ALOOC-EXACT

ABLOOC2 DAFE+ABLOOC-EXACT

0.7 .75

DAFE+

Initial Final

圖 5-1 adaptive classifier(Jackson & Langrebe, 2002)實驗結果

表 5-1 SLDA 下的平均辨識率

Number of features

與 A1~A3 演算法在不同特徵空間

Algorithm Initial5 10 15 20

SLDA 0.692 0.7320.736 0.740 0.744 A1 0.729 0.729 0.784 0.838 0.821

A2 0.729 0.729 0.782 0.833 0.810 A3 0.729 0.729 0.778 0.837 0.792

0.650 0.700 0.750 0.800 0.850

Initial 5 10 15 20

SLDA A1 A2 A3

圖 5-2 SLDA 與 A1~A3 演算法在不同特徵空間下的平均辨識率

在 SLDA 與 A1~A3 的比較上，SLDA 雖在迭代後辨識率有上升，但增加萃取維度之後，SLDA 辨識率增加的相當有限；相對來說 A1~A3 三種方法，在只有萃

取 5 個維度升的相當

明顯，其中又以維度為 15 時的辨識率最佳。

萃取維度數

時辨識率並不會上升，但只要增加萃取的維度數，辨識率上

表 5-2 SLDA 與 B1~B3 演算法在不同特徵空間下的平均辨識率

Number of features AlgorithmInitial 5 10 15 20

SLDA 0.692 0.732 0.736 0.7400.744 B1 0.729 0.729 0.790 0.8190.793 B2 0.729 0.729 0.782 0.8320.810 B3 0.729 0.729 0.782 0.8470.798

0.650 0.700 0.750 0.800 0.850

Initial 5 10 15 20

SLDA B1 B2 B3

萃取維度數

圖 5-3 SLDA 與 B1~B3 演算法在不同特徵空間下的平均辨識率

另外 A 特徵

在視覺上的表現方面，下面是地圖的原始資料如圖 5-6，地面實際狀況如圖 5-7，作為比較基準的是無參數加權特徵萃取法，相比較的是半監督式無參數加權特徵萃取法。

圖 5-6 地圖原始資料

始的無參數加權特徵萃取法。甚至在部分錯誤率相當高的部份，半監督式無參數加權特徵萃取法仍可以修正初始時的錯誤。

無參數加權特徵萃取法與半監督式無參數加權特徵萃取法辨識結果如圖 5-8、圖 5-9，可以發現半監督式無參數加權特徵萃取法的辨識結果在視覺上的效果也是明顯優於原

圖 5-8 使用 NWFE 辨識結果

圖 5-9 使用 B3 演算法辨識結果

圖 5-10 corn-notill 類別分類結果局部放大比較圖

圖 5-12 Grass/Pasture 類別辨識結果局部放大比較圖

圖 5-10、圖 5-11、圖 5-12 則是局部放大比較圖，可以發現在 corn-notill、

Woods、Grass/Pasture 等類別上，右邊的半監督式無參數加權特徵萃取法的結果與左邊的地面實際情況均較為相近。

在圖 5-12 中可以發現，半監督式無參數加權特徵萃取法甚至可以完全修正無參數加權特徵萃取法在辨識時的錯誤，當然在左側中部可以發現 Grass/Pasture 仍有部分錯誤，但與無參數加權特徵萃取法相比已經有所改進。

綜合以上實驗結果，可見加入半監督式樣本的半監督式無參數加權特徵萃取可以增進無參數加權特徵萃取法之效果。

第二節 Washington D.C.資料集實驗結果

在實驗結果上，可能由於半監督式樣本的數量也不多，實驗結果不如實驗一，

但對於辨識率仍有改善作用，可見本研究所提出之半監督式特徵萃取之適用範圍不僅限於有大量測試樣本，若僅加入少量測試樣本作半監督式訓練之用，仍可增加辨識之辨識率，詳細實驗結果見表 5-3。

表 5-3 各演算法平均辨識率

演算法維度數初始辨識率迭代後辨識率

半監督式線性區別分析

6 0.691 0.712

12 0.691 0.718

18 0.691 0.717

24 0.691

24 0.692 0.732

雖然在平均辨識率上，實驗二效果不如實驗一顯著，但在個別的辨識結果上，

圖 5-13 Washington D.C.影像資料

圖 5-14 線性區別分辨識結析果

圖 5-15 半監督式線性區別分析辨識結果

圖 5-16 無參數加權特徵萃取法辨識結果

第三節教育測驗資料集實驗結果

6 0.5645 0.49349 12 0.5645 0.56095 18 0.5645 0.5716 半監督式無參數加權特徵萃取法

Q=10

24 0.5645 0.64497 6 0.5645 0.50178 12 0.5645 0.54645 18 0.5645 0.57278 半監督式無參數加權特徵萃取法

24 0.5645 0.63935 20

6 0.5645 0.47367 12 0.5645 0.54201 18 0.5645 0.57663 半監督式無參數加權特徵萃取法

Q=20,K=10

24 0.5645 0.64852

表 5-5 實驗 3-2 結果(訓練樣本點數 20)

演算法維度數起始正確率經迭代後正確率

6 0.7541 0.6541 12 0.7541 0.72537 18 0.7541 0.75485 半監督式無參數加權特徵萃取法

Q=10

24 0.7541 0.77687 6 0.7541 0.65336 12 0.7541 0.71754 18 0.7541 0.76007 半監督式無參數加權特徵萃取法

Q=20

24 0.7541 0.78769 6 0.7541 0.63097 12 0.7541 0.72276 18 0.7541 0.75187 半監督式無

Q=20,K=10

24 0.7541 0.78881 參數加權特徵萃取法

第一節結論

歸納實驗一、二、三之

1. Jackson & Langrebe ( 002)所提出的 e classifi 是 0.741，而本研究提出使用半監督式特徵取其辨高過此值達

取步驟是有其必要性的。

2. 半監督式無參數加權特徵萃取法的表現大部分下要優於線

以發現參數加萃取法在況

下表現要優於線性區別分析，初始值較高也使半監督式無參數加權特徵萃取法更容易達到較高的辨識率。

3. 參數加權特徵萃取法萃取的維度數

~ 。

. 由於本研究使用的樣本選取策略為加權叢集分析法，其初始點為隨機給定，

使實驗結果有不確

由以上的發現，我們或許可以歸納一個結論出萃

取法著改進識的效半監督式加

權特徵萃取法辨識要比單純在迭代開始前進行取的方法 &

Langrebe, 2002 )效能要來的好。

第六章結論與未來研究方向

結果可以發現一些結論：

2 adaptiv er，效能最好的辨識率

萃識率均，最高可

0.847，可見在半監督式學習過程中加入特徵萃

在的狀況半監督式

性區別分析，事實上由文獻中可無權特徵小樣本狀

本實驗設計下最佳的半監督式無為

) 1 (

3× L− 4× L( −1) 4

定性，為本研究所提出方法之缺憾。

：本研究提的半監督式特徵

在樣本點數極小的狀況下能夠顯辨能；而的無參數

辨識率特徵萃 (Jackson

由本研究中可以發現，樣本選取對於不僅僅是在樣本點數影響時間方面，由於半監督式樣本所取得類別正確與否的不確定性，加

入樣本選取步驟對於半監督式。可考慮方式包含對於加入

作為辨識訓練樣本設定閥值( threshold )，或是類似本研究之作法，以小區域樣本平均數代替單一樣本，如此一來或可避免因錯誤的辨識結果不斷累積，使得迭代

第二節未來研究方向

半監督式學習過程的影響，

學習過程而言相對重要

過程辨識率不減反增。

Arth

WI.

Crook, J. and Banasik, J. (2002). Sample selection bias in credit scoring models.

International Conference on Credit Risk Modeling and Decisioning, Philadelphia, PA.

Fukunaga, K. (1990). Introduction to Statistical Pattern Recognition, San Diego, CA:Academic.

Ghahramani, Z. and Jordan, M.I. (1994). Learning from incomplete data. Technical Report 108, MIT Center for Biological and Computational Learning.

Goldman, S. and Zhou, Y. (2000). Enhancing supervised learning with unlabeled data.

In Proceedings of the Seventeenth International Conference on Machine Learning, pp.327-334, San Francisco, CA.

Hughes, G. F. (1968). On the Mean Accuracy of Statistical Pattern Recognition. IEEE Trans. Information Theory, vol. IT-14, no. 1, pp 55-63.

Kuo, B-C. and Landgrebe, D.A. (2002). Hyperspectral Data Classification Using Nonparametric Weighted Feature Extraction, International Geoscience and Remote Sensing Symposium, Toronto.

Kuo, B-C. and Landgrebe, D.A. (2004). Nonparametric Weighted Feature Extraction

參考文獻

ur, D., Nan L., and Donald R. (1977) Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society, Series B, Vol 39, No. 1, pp. 1–38.

Blum, A. and Mitchell, T. (1998). Combining labeled and unlabeled data with

co-training. In Proceedings of the Workshop on Computational Learning Theory, pp. 92-100, Madison,

2004 Computer Vision & Grap g Conference, Hualien.

Landgrebe, D.A. (2003). Signal Theory Methods in Multispectral Remote Sensing,

Mille

nlabeled data, Advances in Neural Information Processing

Jack

alysis with a Limited Training Data Set, IEEE Trans.

Jack

riance Estimation and Classification, IEEE Trans. on Geoscience and hic Image Processin

John Wiley and Sons, Hoboken, NJ: Chichester.

r, D. and Uyar, S. (1997). A mixture of experts classifier with learning based on both labeled and u

Systems 9, pp. 571-578, MIT Press.

son, Q. and Landgrebe, D.A. (2001). An Adaptive Classifier Design for High-Dimensional Data An

on Geoscience and Remote Sensing, Vol. 39, No. 12, pp. 2664-2679.

son, Q.. and Landgrebe, D.A. (2002). An Adaptive Method for Combined Cova

Remote Sensing. Vol. 40, No. 5, pp 1082-1087.

附錄 A 實驗一迭代過程

程

表 A-1 SDAFE 迭代過

1 2 3 4 5 6 7 8 9 10

0.69226 0.7192 0.7238 0.7266 0.7298 0.7319 0.7319 0.7304 0.7287 0.727 0.69226 0.7193 0.7276 0.7297 0.

1 10 732 0.7347 0.7361 0.7338 0.7324 0.7304 15 0.69226 0.719 0.7303 0.7353 0.7372 0.7375 0.7401 0.7392 0.7391 0.7385 20 0.69226 0.7203 0.7305 0.7361 0.7401 0.7407 0.7428 0.7438 0.744 0.7431

0.66 0.68 0.7 0.72 0.74 0.76

1 2 3 4 5 6 7 8 9 10

5 10 15 20

圖 A-1 SDAFE 迭代結果

1 2 3 4 5 6 7 8 9 10

表 A-2 A1 迭代結果

5 0.729 0.647 0.628 0.613 0.601 0.583 0.567 0.558 0.549 0.547 10 0.729 0.745 0.779 0.783 0.784 0.784 0.781 0.784 0.780 0.779 15 0.729 0.782 0.812 0.824 0.830 0.836 0.837 0.838 0.837 0.838 20 0.729 0.776 0.801 0.804 0.818 0.805 0.819 0.801 0.821 0.791

0.500 0.550 0.600 0.650 0.700 0.750 0.800 0.850 0.900

1 2 3 4 5 6 7 8 9 10

5 10 15 20

圖 A-2 A1 迭代結果

表 A-3 A2 迭代結果

8 9 0

第三章 半監督式特徵萃取

第二節 演算法

第

五章 實驗結果

第一節 Indian Pine site 資料集實驗結果

0.650 0.700 0.750 0.800 0.850

Initial 5 10 15 20

SLDA B1 B2 B3

圖 5-12 Grass/Pasture 類別辨識結果局部放大比較圖

第二節 Washington D.C.資料集實驗結果

演算法 維度數 初始辨識率 迭代後辨識率

6 0.691 0.712

12 0.691 0.718

18 0.691 0.717

24 0.691

6 0.692 0.717

Q= 10 12 0.692 0.728

18 0.692

24 0.692 0.728

6 0.692 0.718

Q= 20 12 0.692 0.731

18 0.692

24 0.692 0.728

6 0.692 0.719

Q=40 12 0.692 0.734

18 0.692

24 0.692 0.732

第三節 教育測驗資料集實驗結果

第一節 結論

第六章 結論與未來研究方向

第二節 未來研究方向

參考文獻

附錄 A 實驗一迭代過程

程

表 A-1 SDAFE 迭代過

圖 A-1 SDAFE 迭代結果

表 A-2 A1 迭代結果

圖 A-2 A1 迭代結果

表 A-3 A2 迭代結果

圖 A-3 A2 迭代結果

表 A-4 A3 迭代結果

圖 A-4 A3 迭代結果

表 A-5 B1 迭代結果

圖 A-5 B1 迭代過程

表 A-6 B2 迭代結果

圖 A-6 B5 迭代結果

表 A-7 B6 迭代結果

圖 A-7 B6 迭代結果

第三章半監督式特徵萃取

第二節演算法

五章實驗結果

演算法維度數初始辨識率迭代後辨識率

第三節教育測驗資料集實驗結果

第一節結論

第六章結論與未來研究方向

第二節未來研究方向