第二章 理論基礎與文獻回顧
第三節 應用物件式影像分類技術於崩塌地偵測
三、 相關研究所使用的分類器
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
6. 崩塌方向(Collapse Direction):搭配坡向圖。其定義為物件主軸方 向與坡向的小於 180∘的夾角,如式 2-16 (鄭智仁,2010),主軸 方向為屬於較大特徵值的特徵向量(Eigenvector)的方向。
Collapse Direction= |主軸方向 − |180 − 坡向|| --- (2- 16) 7. 物件主軸方向與流向的夾角:搭配流向圖。
三、 相關研究所使用的分類器
主要分為「人工制訂的規則集」與「監督式的機器學習演算法」兩 類,以前者為多數。以下分述其基本概念。
(一) 人工制訂的規則集
又稱「處理程序樹狀目錄(Process Tree)」,如圖 2-8 所示,由使用者自 行設計各節點(規則)的內容與配置。於「分類」之處理程序,常見的設計 有二:
1. 條件指派:以物件特徵門檻值建立搜尋條件,將符合條件的物件 指派為特定類別。
2. 類別描述:預先建立類別,一類別可由多項物件特徵以門檻值或
「歸屬函數(Membership functions,如圖 2-9)」加以描述,設定 各描述特徵的權重,並計算各待分類物件於該類別的隸屬度值,
將隸屬度值高於自訂閾值的物件指派為該類別。
物件特徵、門檻值與歸屬函數的選擇、訂定與定義,皆仰賴先驗知識 的介入。此類分類器多以可移轉性(Transferability)(適用於多影像)為目標。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 2-8 人工制訂的規則集(eCognition reference book)
圖 2-9 定義物件特徵 NDVI 於類別 Vegetation 的歸屬函數
‧
1. k 最鄰近法(k-Nearest Neighbors, KNN):
為非參數式的監督式分類器。將樣本的各項描述特徵正規化
2. 支持向量機(Support Vector Machine, SVM):
為非參數式的監督式分類器。以相同於 KNN 之方式,將所有樣 (Optimal Separating Hyperplane, OSH)指多個分離超平面中、與
「兩類別樣本點群之邊界」距離最大者。「平行於分離超平面、
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
平面(Support hyperplane)」,如圖 2-10。找尋 OSH,同理,即找 尋「間距最大的兩類別之支持超平面」─位於該兩支持超平面 間、且與兩者等距的超平面,即為所求的 OSH。如圖 2-11 所 示,對於線性可分(Linearly separable)的兩類別資料(圖 A),圖 D 中的藍色實線為較適當的分離超平面。
圖 2-10 支持超平面
圖 2-11 分離超平面(Harrington, 2012)
‧
以拉格朗日法(Lagrangian)將式 2-19 的目標函數轉換為二次方程 式,如式 2-20 所示,𝛼𝑖、𝜇𝑖為拉式乘數。
ℒ(𝑤, 𝑏, 𝜉, 𝛼, 𝜇) =12‖𝑤‖2+ 𝐶 ∑ 𝜉𝑖 𝑖− ∑ 𝛼𝑖 𝑖[𝑦𝑖(𝑤𝑇𝑥𝑖− 𝑏) − 1 + 𝜉𝑖]− ∑ 𝜇𝑖 𝑖𝜉𝑖 --- (2- 20) 由式 2-20 可整理得九條件式,稱作「Karush-Kuhn-Tucker (KKT) 條件」,如式 2-21 至 2-24 所示,式 2-22、2-23、2-24 分別為限制 式、拉式乘數限制、與互補寬鬆度。
‧
對偶問題(Dual problem)。目標函數與限制式的最終形式,如式 2-25 所示。Maximize: ∑ 𝛼𝑖 𝑖−12∑ 𝛼𝑖𝑗 𝑖𝛼𝑗𝑦𝑖𝑦𝑗𝑥𝑖𝑇𝑥𝑗 Subject to: ∑ 𝛼𝑖 𝑖𝑦𝑖=0
0≤𝛼𝑖≤𝐶 ∀𝑖
--- (2- 25)
以二次規劃(Quadratic programming)求得式 2-25 之唯一解。其 中,僅少數𝛼𝑖大於 0。𝛼𝑖大於 0 的樣本點,即位於該類別支持超 平面上的樣本點─這些樣本點決定支持超平面的位置,故稱作
「支持向量(Support vectors)」。
由式 2-21-1 可解得𝑤,由式 2-24-1 可解得𝑏,整理可得 OSH 的方
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 2-12 核函數
以核函數ϕ(𝑥𝑖, 𝑥𝑗)取代內積𝑥𝑖𝑇𝑥𝑗,改寫式 2-26 為式 2-27。
f(𝑥) = ∑ 𝛼𝑖 𝑖𝑦𝑖ϕ(𝑥𝑖, 𝑥𝑗)+ 𝑏∗ --- (2- 27) 常 用 的 核 函 數 如 線 性 (Linear) 核 函 數 ( 式 2-28) 、 多 項 式 (Polynomial) 核 函 數 ( 式 2-29) 與 輻 射 基 底 函 數 (Radial Based Function, RBF)核函數(式 2-30),其中,𝑑為使用者自訂的多項式 的次方項,σ為使用者自訂的核函數的寬度參數─寬度過寬,則 核函數近於線性,失去指數「非線性」之意義;寬度過窄,則 OSH 易受訓練資料中雜訊之影響,有過度學習之虞。
ϕ(𝑥𝑖, 𝑥𝑗) = 𝑥𝑖𝑇𝑥𝑗--- (2- 28) ϕ(𝑥𝑖, 𝑥𝑗) = (𝑥𝑖𝑇𝑥𝑗 + 1)𝑑 --- (2- 29) ϕ(𝑥𝑖, 𝑥𝑗) = exp (−‖𝑥𝑖−𝑥𝑗‖
2
2𝜎2 ) --- (2- 30) 將 SVM 擴展至多元分類作業,策略有二:
(1) 一對多(One-against-rest):類別數為 k,於任一類別,建立一 個 OSH、區隔該類別其餘類別,共 k 個 OSH。
(2) 一對一(One-against-one):類別數為 k,於任兩類別,建立一 個 OSH、區隔該兩類別,共𝐶2𝑘個 OSH。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
3. 隨機森林(Random Forest):
為非度量式的監督式分類器。隨機森林由多株決策樹構成,待分 類單元的輸出類別即為各單一決策樹分類成果的眾數。單一決策 樹如圖 2-13 所示。
圖 2-13 決策樹(Harrington, 2012):節點(紅)為特徵、終點(黑)為分類類別
以樣本集(共 a 個樣本)的固定大小隨機子集(b 個樣本,b<a)訓練 各單一決策樹─決策樹的各節點為一「基於物件特徵值的二分 (或多分)決策規則」,於任一節點,由樣本描述特徵集(共 m 個描 述特徵)的固定大小隨機子集(n 個描述特徵,n<m)、測試該節點 的最佳分裂方式;其餘訓練樣本為檢核子集(a-b 個樣本)。於傳統 的單一決策樹預測模型,檢核子集用於輔助該決策樹之修剪 (Pruning) ─ 移 除 其 中 無 關 緊 要 的 枝 節 , 改 善 因 訓 練 資 料 偏 差 (Biased)或無關特徵過多造成的過度擬合(Over-fitting)情形;而於 隨機森林預測模型,各單一決策樹不須修剪,各單一決策樹的檢 核子集用於評估模型的錯誤率、與各描述特徵於分類的重要性。
‧
Characterizing spectral, spatial and morphometric properties of landslides for semi-automatic detection using object-oriented methods
多重解析度分割法+棋盤 (Chessboard)分割法
Stumpf and Kerle (2011)
Object-oriented mapping of landslides using Random forests
(B, R,GRVI,Slope)=(1,1,1,2)
孔繁恩(2013)
物件導向分類法於 DMC
航照影像萃取崩塌地之 多重解析度分割法