分類器

第二章相關文獻

第四節分類器

本研究設計空間訊息之使用方式，結合頻譜與空間訊息進行分類器設計，然而，在辨識領域中，較為基礎的分類器有

k k

-nearest neighborhood classifier(

k k

NNC) [38]、support vector machine(SVM)[59]、maximum likelihood classifier (MLC)[50]，

由於

k k

NNC、SVM、MLC 皆為單純使用頻譜訊息進行辨識的分類器設計，因此，

本研究選定

k k

NNC、SVM、MLC 作為比較對象之分類器，與本研究提出之分類器進行實驗，探討有無使用空間訊息之分類器，其辨識結果之比較；而 adaptive Bayesian contextual classifier(ABC)[48]為以 MLC 為原型，結合頻譜與空間訊息的分類器設計，因此，本研究選定 ABC 作為比較對象之分類器，與本研究提出之分類器進行實驗，探討不同空間訊息使用方式之分類器，其辨識結果之比較。因此，本節將介紹本研究選定實驗比較對象之分類器：

k k

NNC、SVM、MLC、ABC。

壹、 kk -Nearest Neighborhood Classifier(kk NNC) k

k

NNC[38]是基於貝式法則(Bayes’ rule)設計的分類器，並且使用無參數的距離計算，在所有分類器中，處理方式淺顯易懂也容易操作，至今仍被使用作分類

V

是以

x x

為中心畫出區域範圍的面積、體積或超體積，

k k

^是指區域

V V

涵蓋的訓練樣本點總數，

k k

⁽ⁱ⁾⁽ⁱ⁾則是區域

V V

中第

ii

類訓練樣本點總數。結合公式(2.4) ~ (2.7)，

可將公式(2.3)整理成公式(2.8)

! = arg max

i=1;:::;L

½ k

⁽ⁱ⁾

k

¾

! = arg max

i=1;:::;L

½ k

⁽ⁱ⁾

k

¾

(2.8)

由公式(2.8)可知，

k k

NNC 計算樣本之間的距離判斷其他樣本是否存在區域範圍

V V

內，並以區域範圍

V V

內樣本總數

k k

中，比較各類樣本數

k k

⁽ⁱ⁾⁽ⁱ⁾所占比重，決定樣本點類別。

貳、 Support Vector Machine(SVM)

SVM[59]是目前眾所周知的分類器[61]，因為能夠以少量訓練樣本訓練辨識器，獲得令人滿意的辨識正確率，而廣被應用於文字辨識、影像辨識領域[28], [55], [56], [64]。SVM 主要概念以存在類別邊界附近的訓練樣本作為支撐，找出類別的最佳化邊界，在以最佳化邊界線作為分類的依據（圖 8）。

圖 8 SVM 解最佳化邊界概念示意圖

SVM 解最佳化邊界的方法種類繁多[12]，本研究採用的是

C C

- support vector classification(

C C

-SVC)[15], [18]，給定訓練樣本

x x

2 R 2 R

^d^d

; m = 1; : : : ; N ; m = 1; : : : ; N

^，在兩

15 調整參數。然而 SVM 最初設計適用對象為線性可分割(linearly separable)的資料，

其

w w

表示如下：

假若資料為非線性不可分割(non-linearly inseparable)時，SVM 則利用核函數 (kernel function)[34], [54]將資料投影至高維度空間，或理論上無限維度空間，增強資料的分散程度，使得資料投影後成為線性可分割，以利於類別辨識，而其方

將公式(2.11)代入公式(2.9)後，利用 Lagrange Multi pliers 轉換，推導出

C C

-SVC 解最佳化邊界的對偶型(dual form)公式如下：

16 擴展至解決多類問題，則必須採用一對一(one-against-one, OAO)或一對多(one-against-all, OAA)的方式，以協助解決多類問題[3]。

參、 Maximum Likelihood Classifier(MLC)

MLC[50] 是高斯最大概似分類器 (Gaussian maximum likelihood classifier, Gaussian MLC)亦稱為貝式分類器(Bayes classifier)[27]，其判斷樣本類別的非線性分類器，其判斷方式如下： (Gaussian distribution)如下：

p(xj!⁽ⁱ⁾) = 1

由於形似二次方程式，因此可別稱為 quadratic discriminant classifier(QDC) [2], [19], [32], [38], [48], [50], [51], [57]，而其中

W

⁽ⁱ⁾

= ¡§

^(i)¡1

W

⁽ⁱ⁾

= ¡§

^(i)¡1

(2.16)

w

⁽ⁱ⁾

= 2§

^(i)¡1

¹

⁽ⁱ⁾

w

⁽ⁱ⁾

= 2§

^(i)¡1

¹

⁽ⁱ⁾

(2.17)

a

⁽ⁱ⁾

= ¡ ln

¯ ¯

¯§

⁽ⁱ⁾

¯ ¯

¯ + 2 ln p(!

⁽ⁱ⁾

) ¡ ¹

^(i)T

§

^(i)¡1¹⁽ⁱ⁾

a

⁽ⁱ⁾

= ¡ ln

¯ ¯

¯§

⁽ⁱ⁾

¯ ¯

¯ + 2 ln p(!

⁽ⁱ⁾

) ¡ ¹

^(i)T

§

^(i)¡1¹⁽ⁱ⁾

(2.18)

¹

⁽ⁱ⁾

¹

⁽ⁱ⁾為第

ii

類樣本平均數，

§ §

⁽ⁱ⁾⁽ⁱ⁾為第

ii

類共變異矩陣。而 MLC 的計算過程中，必須注意當遇到樣本數不足時，也就是資料的樣本數小於維度數時，在計算第

ii

類共變異反矩陣§§^{(i) ¡1}^{(i) ¡1}，容易遇到奇異解(singular)的情況。

肆、 Adaptive Bayesian Contextual Classifier(ABC)

ABC[48]是基於 Markov random fields(MRF)，並且使用 iterative conditional mode(ICM)將 MLC 修改而成的分類器，其分類器運作流程如圖 9 所示。

圖 9 ABC 運作流程圖 (節錄自[48])

以下依照圖 9 之順序說明 ABC 之運作流程，首先令

``

為紀錄 ABC 之重複執行次數，則首次執行 ABC(

` = 1 ` = 1

)時，先求出初始樣本平均¹¹⁽ⁱ⁾₁⁽ⁱ⁾₁ 與變異矩陣§§⁽ⁱ⁾₁⁽ⁱ⁾₁ ，亦即統計估計值ÁÁ⁽ⁱ⁾₁⁽ⁱ⁾₁ = f¹= f¹⁽ⁱ⁾₁⁽ⁱ⁾₁ ; §; §⁽ⁱ⁾₁⁽ⁱ⁾₁ gg，分別為公式(2.19)與公式(2.20)

¹

⁽ⁱ⁾₁

=

P

_N⁽ⁱ⁾

n=1

x

⁽ⁱ⁾n

N

⁽ⁱ⁾

¹

⁽ⁱ⁾₁

=

P

_N⁽ⁱ⁾

n=1

x

⁽ⁱ⁾n

N

⁽ⁱ⁾

(2.19)

18 (semi-supervised information)，提供給 maximum a posteriori (MAP) classifier 進行辨識，其公式如下： distribution 可表示成公式(2.23)

p(i(s)j^i(@s)) = 1

其中

Z Z

為分配係數(partition coefficient)，且

P

s⁰2c(s)

f1 ¡ ±(i(s) ¡ i(s

⁰

))g

結束重複執行時，則以最後一次的 MLC 之辨識結果，提供 post-processing (PP) classifier 進行辨識，其公式如下：

! = arg max

的是區辨分析特徵萃取(discriminant analysis feature extraction, DAFE)，或稱線性區辨分析(linear discriminant analysis, LDA) [38], [49], [57]，其方法主要找出具有資料最大分離量所對應之特徵向量構成投影矩陣

W W

，再利用投影矩陣，將樣本在頻譜域的樣本資訊投影至特徵子空間，以利於進行影像辨識

Y = W

X

Y = W

X (2.27)

其中特徵萃取法大致上可分成三種類型[63]：(1)非監督式(unsupervised) 特徵萃取法：使用所有樣本訊息的特徵萃取法設計；(2)監督式(supervised) 特徵萃取法：

僅使用類別已知樣本訊息的特徵萃取法設計；(3)半監督式(semi-supervised) 特徵萃取法：同時使用類別已知樣本訊息與類別未知樣本訊息的特徵萃取法設計。

本研究以 LDA 為原型，進行演算法開發，因此，本研究選定同樣以 LDA 為設計原型的特徵萃取法作為實驗比較對象： nonparametric weighted feature

在文檔中結合頻譜與空間訊息設計於高光譜遙測影像辨識之數學模型研發 (頁 21-27)

第二章 相關文獻

第四節 分類器

k k

k k

k k

k k

k k

壹、 kk -Nearest Neighborhood Classifier(kk NNC) k

k

V

V

x x

k k

V V

k k

V V

ii

! = arg max

½ k

k

¾

! = arg max

½ k

k

¾

(2.8)

k k

V V

V V

k k

k k

貳、 Support Vector Machine(SVM)

C C

C C

x x

2 R 2 R

; m = 1; : : : ; N ; m = 1; : : : ; N

w w

C C

參、 Maximum Likelihood Classifier(MLC)

W

= ¡§

W

= ¡§

(2.16)

w

= 2§

¹

w

= 2§

¹

(2.17)

a

= ¡ ln

¯ ¯

¯§

¯ ¯

¯ + 2 ln p(!

) ¡ ¹

§

a

= ¡ ln

¯ ¯

¯§

¯ ¯

¯ + 2 ln p(!

) ¡ ¹

§

(2.18)

¹

¹

ii

§ §

ii

ii

肆、 Adaptive Bayesian Contextual Classifier(ABC)

``

` = 1 ` = 1

¹

第二章相關文獻

第四節分類器