結論與建議

第二章影像分類理論

隨著遙測影像來源日趨多樣化，且具空間解析度也改進甚多，所衍生的影像分類方法也日益增多，但大體而言，可歸納為兩大類，如圖2-1 所示，一類是單純利用影像所包含的光譜資訊作分類，另一類則是結合光譜和空間資訊來進行分類。本章將說明不同影像分類之理論原理。

圖2-1 影像分類理論結構圖

2-1 波譜型態分類法

單純以光譜資訊作分類的方法，可再簡分為兩大類，一是非監督式，另一個則是監督式分類。非監督式分類（Unsupervised Classification），為人為設定欲分類的類別數、迭代次數等參數，由系統自動給定各類別光譜中心的初始值，經不斷反覆迭代修正，直到達成收歛或超過所設最大迭代次數，得到最終分類成果，

演算法包括包含K-means、ISODATA、Fuzzy C-means 等。

有別於非監督式分類，監督式分類（Supervised Classification）主要為人工

－高斯最大似然法

－歸納決策樹

－倒傳遞神經網路

－支持向量機

影像分類法

波譜波譜及空間相關性

非監督式分類監督式分類紋理特徵

－ECHO

－Definiens professional

－ K-means

－ ISODATA

－ Fuzzy C-means

－統計式

－結構式

－頻譜式

物件導向

介入選取訓練樣本區，依所選取訓練樣本區內的光譜資訊作為影像自動判釋之依據，對整幅影像進行分類，為本研究主要分類方法。

目前監督式分類除了利用統計分析方法進行分類，像是Nearest-Neighbor、

Parallelepiped Classification 及高斯最大似然法（Gaussian Maximum Likelihood Classifier）等外，人工智慧（AI）加入，也成為遙測影像分類的主要研究方向，

而人工智慧分類方法包含決策樹、類神經網路等，因此，本節有關監督式分類主要針對高斯最大似然法、歸納決策樹、倒傳遞神經網路及支持向量機的分類理論作介紹。

2-1-1 高斯最大似然法

高斯最大似然法（Gaussian Maximum Likelihood Classifier）是假設選取的各訓練樣本區之像元值在光譜空間是屬於常態分佈（Normally Distribution），因此，

各類別波譜反應類型與每一種類別的波譜均值及協變方矩陣(Covariance Matrix) 為相關，在此前提下，利用均值及協變方矩陣，便可計算每一像元為特定分類的統計機率，以最大機率當作判斷類別歸屬的標準。

此方法除了考慮訓練區之中值外，同時亦考慮訓練樣本區內光譜的變異量及協變方，但主要的缺點為在分類每個像元時，計算量大。若將此機率值繪於三維的特徵空間上，縱軸表一個像元屬於一種地物分類的機率密度函數，兩水平軸則分別表示兩波段之灰階值，以最大機率當作判斷類別的標準。如圖2-2 所呈現數個鐘形分佈，分別表示都市（Urban）、沙地（Sand）、穀物（Corn）、乾草（Hay）、

森林（Forest）與水體（Water）六種土地覆蓋類別之機率密度函數值。

圖2-2 不同地物之三維特徵空間表示圖（Lillesand & Kiefer，1994）

若於二維特徵空間中描述，呈現出橢圓狀的等機率線，如圖2-3 所示，等機率線的形狀可以表示協變方之情形。以點位1 為例，其在穀物類別的機率較其他類別高，故被歸屬為穀物類別。

圖2-3 不同地物之二維特徵空間表示圖（Lillesand & Kiefer，1994）

2-1-2 倒傳遞類神經網路

倒傳遞類神經網路（Error Back-propagation Network，BP），由 Rumelhart 等人於1986 年提出，是頗具代表性的類神經網路模式，屬於監督式的學習網路，

基本原理是以最陡坡降法（Gradient Steepest Descent Method）來調整神經元間之

( )

dpk為已知期望輸出值（Desired Output），opk為計算而得的輸出值（Computed Output），P 為訓練樣本數，K 為輸出結點數。

圖2-4 倒傳遞類神經網路基本架構

倒傳遞類神經網路基本架構，如圖2-4 所示，包含輸入層、隱藏層及輸出層。

演算法基本上包含三個階段：向前饋入（Feedforward）、誤差倒傳遞（Error back-propagation）及修正權值（Update the weights），整體流程如圖 2-5 所示。

I. 向前饋入（Feedforward）

每個神經元可接收所連結的輸入訊號，並經轉置函數（Transform Function）

II. 誤差倒傳遞（Error back-propagation） III. 修正權值（Update the weights）

修正方式如下所示：其中η 為學習因子（Learning Ratio），α 為動量因子（Momentum ratio），t 為迭代次數。

圖2-5 倒傳遞類神經網路演算流程圖

倒傳遞類神經網路的主要缺點在於不具對其網路權重進行解釋的能力，且在訓練網路時會耗費相當長的時間，學習因子η 可能會造成非系統的收斂。基本的倒傳遞神經網路是採用最陡坡降法調整權值，雖然是以負梯度方向來進行調整，

但未必達到最快的收斂，而共軛梯度法則是沿共軛方向搜尋，相較於最陡坡降法而言，能產生較快的收斂，本研究採用比例共軛梯度法，其由Moller 所發展，

由於共軛梯度法在每一次疊代上都需要一個線搜尋，但線搜尋十分耗時，而比例共軛梯度法可避免耗時的線搜尋，在函數逼近問題上，與近以二階訓練的 Levenberg-Marquardt 一樣快，且具有適度的記憶體需求（羅華強，2001），故本研究採此法來調整權值。

另外，本研究中的倒傳遞類神經網路模式採用兩層隱藏層，如圖2-6，其意義為以圖2-7 作說明。圖 2-7（1）找出兩個類別之分類界線；圖 2-7（2）透過第

隨機初始化權值 W0

向前饋入

計算系統誤差 E

E<ε

誤差倒傳遞

修正權值 Wi=W(i-1)+△W Yes

一個隱藏層，網路學習權重可找出線性的類別界線；圖2-7（3）經第二個隱藏層，

相關的線性類別界線經由一次合併，成為封閉的矩形區塊；圖2-7（4）最後至輸出層，則各矩形區塊再一次合併，得到適當的分類界線（陳承昌，2006）。

圖2-6 本研究倒傳遞神經網路之架構

圖2-7 選用二層隱藏層之示意圖（陳承昌，2006）

2-1-3 支持向量機

支持向量機（Support Vector Machine，SVM）為貝爾實驗室 Vapnik 博士於 1990 年以統計學習理論為基礎，所建構出的機器學習系統，目的是產生一個可預估出測試例之屬性值的模型，其主要原理是在於特徵空間中尋求具最大邊界的超平面以區分二元類別。依訓練樣本在空間中的分佈，支持向量機不但可以處理線性可分問題外，亦可處理非線性問題，其中，線性可分問題又可分為線性可分或線性不可分兩種情況，以下將針對線性、非線性及多類支持向量機作說明（陳承昌，2006）。

（一）

I. 線性支持向量機透過Lagrangian 轉換，可將（2-7）式轉換為：

( ) ( ) { [ ( ) ]

}

Karush-Kuhn-Tucker 條件，可將其轉換為求解下式：

max

( ) _∑ _∑ ( )

min

( ) ( )

⎟

上式C 為懲罰參數（penalty parameter）、

ξ

_i為沉滯變數（slack variable）。

K _i ⁱ ；（3）兩層式類神經網路（two-layer network），

( κ

⋅ −

δ )

（二）多類支持向量機

支持向量機的基本分類原理主要是以二元類別為主，若要將其延伸到多類別的分類問題上，目前有以下幾種方法（陳承昌，2006；黃國矩，2006）：

1. 一對多方法（one-versus-rest）：該方法是先把某一類別的樣本當作一種類別，

其餘類別的樣本當作另一種類別，若有k 種類別，則會產生 k 個支持向量機，

並以具有最大分類函數值的支持向量機為欲分類樣本之所屬類別。

2. 一對一方法（one-versus-one）：若有 k 種類別，則每兩種類別樣本皆會產生一個支持向量機，故將產生 k(k-1)/2 個支持向量機，並以投票策略（voting strategy）決定樣本之類別。

3. DAG method（Directed Acyclic Graph SVM）：此方法的支持向量機產生方式，

與一對一方法相同，同樣會產生k(k-1)/2 個支持向量機。不同之處是此方法共 k(k-1)/2 個節點，分支為單向，每個節點有兩個或無分支，會建立一個二元且無循環的有向圖，如圖 2-9，欲處理 5 種類別時，共有 10 個內部節點及 5 個葉節點，每一個內部節點皆表示一個二元支持向量機，5 個葉節點則表示 5 種類別。

圖2-9 DAG method 處理 5 種類別時之二元且無循環的有向圖(陳承昌，2006)

2-2 結合空間資訊分類法

2-1 節所列的分類理論皆是單純以影像光譜資訊為主所作的分類，未考慮到鄰近像元間的相關性，而加入空間相關性的分類方法有很多，本章主要介紹紋理特徵萃取及物件導向分類法之理論。

2-2-1 紋理特徵

在影像中，不同波段之光譜輻射值、反射值，可描述不同地物。但同時，不同地物之輻射值或反射值，在其鄰近區域之相關性，亦可用以區分不同之地物。

此一空間分佈相關之性質，可以紋理描述，紋理是以基元為基本的組成元素，基元則是指具有某種屬性而彼此相連的單元的集合，屬性包括灰階、局部一致性等，而空間關係包括基元的相鄰性、在一定角度範圍內的最近距離等。一般紋理描述可分成三大類：即方向性紋理、週期性紋理與隨機性紋理。

而要讓電腦能夠運用影像的紋理資訊，則必須針對影像的紋理描述進行量化，常見有三種主要的方法，統計分析方法（Statistical approaches）、結構分析方法（Structural approaches）和頻譜分析方法（Spectral approaches）（林榮章，

1999），依其計算方式又可以被分為一階、二階及高階等。

（一）統計分析方法

統計分析方法著重於紋理特徵的抽取，強調整個紋理給觀察者的印象（林榮章，1999），故其紋理主要描述影像灰階值空間分佈情形的統計特性，如影像灰階值的平均值、直方圖或變異數等，常用的方法有共生矩陣（GLCM）、碎形維度（Fractal Dimension）及半變異元法（Semi-variogram）等。

其中，共生矩陣(GLCM，Gray Level Co-Occurrence Matrix，也可稱為 grey level dependency matrix)為 Haralick 於 1973 年所提出，共十四種紋理統計量，是一種二階的統計方法，可以計求像元對的聯合機率分配的估計值，也就是像元對的灰階值出現在特定相關位置的機率，而本研究以GLCM 為主要紋理萃取方

樣視窗大小及取樣的距離及方向（Marceau et al, 1990）。

（二）結構分析方法

結構分析方法便是著重研究紋理基元及其空間關係，認為紋理是由一個或多個基元呈現透過某一排列規則組合而成的，故結構分析方法係為描述影像紋理基元的分佈規則，此方法需先了解萃取紋理的規則性，對影像解析度甚為敏感，加上，自然環境之紋理多為隨機，故此法於自然環境紋理的萃取上有所限制。

（三）頻譜分析方法

頻譜分析方法則用以描述具方向性和週期性的紋理，常用的有傅利葉轉換

在文檔中高解析度衛星影像分類應用於國土利用調查之研究 (頁 15-83)

第二章 影像分類理論