第一階段崩塌地向量圖層 - 研究方法 - 研究材料與方法 - 以未經糾正之 DMC 航空影像自動產製崩塌地地理空間資料與資料庫建置

第三章研究材料與方法

第二節研究方法

一、第一階段崩塌地向量圖層

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

一、第一階段崩塌地向量圖層

(一) 製作訓練資料

物件式分類為此階段的核心，本研究期望建立可適用於多影像的物件式分類器，故以拍攝時間、地點各異的多影像為各類別樣本的來源─除類別「崩塌地」外，亦收集易與之混淆的其他類別的樣本，以訓練分類器辨別之能力。訓練類別如表 3-4。

表 3- 4 訓練類別

類別名稱選擇原因

崩塌地研究標的。

陰影下的崩塌地影像中陰影下崩塌地的明亮度低，

不易辨識。

厚雲影像中雲的明亮度高、NDVI 值

低，於此方面與崩塌地不易分辨。

薄雲

陰影下的植被影像中陰影下植被的 NDVI 值低，

於此方面與(陰影下的)崩塌地不易分辨。

目標為建立物件式分類器，可知訓練教材為「特定類別」物件的「物件特徵」─備齊上述五類別的訓練物件集後，本研究計算各訓練物件於 32 項物件特徵(表 3-5)的特徵值，整合為訓練資料。

‧

光譜特徵(19 個) {B/G/R/NIR}均值、{B/G/R/NIR}標準差、明亮度、最大差異、B/G、G/R、R/NIR、GRVI、稱性(Asymmetry)，負值表左偏、正值表右偏，如式 3-1， 𝑛為特定類別樣

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

本數、𝑥_𝑖𝐹為特定類別樣本𝑖於特徵𝐹的特徵值，𝜇_𝐹、𝑠_𝐹分別為特定類別樣本集於特徵𝐹的特徵值平均值與標準差；峰度(Kurtosis)評估分布曲線的陡峭程度，負值表平緩、正值表尖銳，如式 3-2。已知標準常態分布曲線的偏態係數與峰度值皆為 0。

𝑠𝑘𝑒𝑤𝑛𝑒𝑠𝑠 = ^∑ ⁽

𝑥𝑖𝐹−𝜇𝐹 𝑠𝐹 )³ 𝑛𝑖=1

𝑛 --- (3- 1) 𝑘𝑢𝑟𝑡𝑜𝑠𝑖𝑠 =^∑ ⁽

𝑥𝑖𝐹−𝜇𝐹 𝑠𝐹 )⁴ 𝑛𝑖=1

𝑛 − 3 --- (3- 2) (三) 建立基於訓練資料的分類器

1. 策略一：若類別樣本集的特徵值分布曲線呈現常態分布

於規則集之建立，特徵值統計數據可為「分類規則」設計的依據

─可基於機率密度函數(圖 3-11)，以「平均值加減二倍標準差」

為所定義類別歸屬函數的邊界值，如圖 3-12 ；或執行 SEaTH(SEparability and THreshold algorithm)演算法。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 3-12 由類別特徵值統計值定義類別歸屬函數(詹鈞評，2012)

SEaTH 演算法的目標為：於任一「二元分類」，識別其代表性物件特徵─即分離度(SEparability)最大之物件特徵，並計算該項物件特徵的最適門檻值(THreshold)。其基本假設為：各類別訓練物件集於各項物件特徵的特徵值分布曲線皆呈現常態分布。各項物件特徵於「特定類別組合之二元分類」的分離度─由兩類別訓練物件集於該項物件特徵的特徵值常態分布曲線的交集程度推斷而得，如圖 3-13，量化指標為 Jeffries-Matusita 距離，全域為 0 至 2，2 表示完全分離，如式 3-3，以 J 值最大的物件特徵為該二元分類的代表性物件特徵。兩常態分布曲線交於兩點，如圖 3-14，

以位於兩類別特徵值平均值之間者為最適門檻值，如式 3-4。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 3-13 分離度─兩常態分布曲線的交集程度(S. Nussbaum et al., 2006)

J_𝐹12= 2 (1 − 𝑒⁻

8(𝑚_1𝐹−𝑚_2𝐹)² ²

𝜎1𝐹2 +𝜎2𝐹2 +¹₂𝑙𝑛[^𝜎1𝐹^{2 +𝜎}^2𝐹²

2𝜎1𝐹𝜎2𝐹]

) = 2(1 − 𝑒^−𝐵𝐷^𝐹12) -- (3- 3)

圖 3-14 門檻值─兩常態分布曲線的交點(S. Nussbaum et al., 2006)

Threshold=^{(𝑚2𝐹∗𝜎1𝐹}2 )−(𝑚1𝐹∗𝜎2𝐹2 )±(𝜎1𝐹∗𝜎2𝐹∗A) 𝜎1𝐹2 −𝜎2𝐹2

--- (3- 4)

‧

的特徵選擇 (Correlation-based Feature Selection, CFS)」兩演算法，於 32 項物件特徵中，提取於分類較重要的特徵子集，以降低特徵空間之維度。

隨機森林以名為「變數重要性(Variable Importance, VI)」的指標衡量各項描述特徵於分類的重要程度。計算方式如下：於任一單

‧

性不確定性(Symmetrical uncertainty)」，如式 3-6 (Hall, 1999)，由式可知，訓練資料須經離散化(Discretisation)(將連續的實數資料轉化為名目資料)的前處理，方得以此指標衡量各項特徵與類別、與兩兩特徵間的相關性。

𝑀𝑒𝑟𝑖𝑡_𝑆 = ^𝑘𝛾^̅̅̅̅̅^𝑐𝑓

√𝑘+𝑘(𝑘−1)𝛾̅̅̅̅̅𝑓𝑓 --- (3- 5)

symmetrical uncertainty coefficient = 2.0 × [_H(Y)+H(X)^gain ] H(Y) = − ∑y∈Yp(y) log2(p(y))

‧

形，於 eCognition 環境執行；若為機器學習分類器，則執行環境與程序如圖 3-16 所示。

將第一階段崩塌地向量圖層的資料精度以誤差矩陣(Error matrix)的形式描述。誤差矩陣的概念說明如下。

‧

accuracy)如式 3-7 所示─分類地圖生產者的目標為於遙測影像「辨識」目標類別，即「棄真」誤差 D 之最小化；使用者精度(User’s accuracy)如式 3-9。其中，𝑃_𝑜稱為「整體精度(Overall accuracy)」或「觀察一致性(Observed agreement)」，如式 3-10；𝑃_𝑐稱為「期望一致性(Chance agreement)」，如式 3-11。可看出：整體精度僅考量了位於誤差矩陣對角線上的正確分類的像元數；而 Kappa 則額外考量了不在對角線上的誤判(Commission)與漏判 (Omission)的像元數，可較精確地評價分類器的預測精度。Kappa 值大於 0.8 表分類結果具高度的正確性，介於 0.4 至 0.8 表中等的信賴度，小於 0.4 則為相當低的分類精度(Landis and Koch, 1977)。

Kappa =^𝑃_1−𝑃^𝑜^−𝑃^𝑐

𝑐 --- (3- 9)

‧

X=X_L+(Z−Z_L)×m11x+m21y+m31(−f) m13x+m23y+m33(−f) Y=YL+(Z−ZL)×m12x+m22y+m32(−f) m13x+m23y+m33(−f)

--- (3- 12)

在文檔中以未經糾正之 DMC 航空影像自動產製崩塌地地理空間資料與資料庫建置 - 政大學術集成 (頁 56-65)

第一階段崩塌地向量圖層

第三章 研究材料與方法

第二節 研究方法

一、 第一階段崩塌地向量圖層

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧

‧

‧

‧

第三章研究材料與方法

第二節研究方法

一、第一階段崩塌地向量圖層

立政治大學

立政治大學

立政治大學

立政治大學