• 沒有找到結果。

第三章 研究材料與方法

第二節 研究方法

一、 第一階段崩塌地向量圖層

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

一、 第一階段崩塌地向量圖層

(一) 製作訓練資料

物件式分類為此階段的核心,本研究期望建立可適用於多影像的物件 式分類器,故以拍攝時間、地點各異的多影像為各類別樣本的來源─除類 別「崩塌地」外,亦收集易與之混淆的其他類別的樣本,以訓練分類器辨 別之能力。訓練類別如表 3-4。

表 3- 4 訓練類別

類別名稱 選擇原因

崩塌地 研究標的。

陰影下的崩塌地 影像中陰影下崩塌地的明亮度低,

不易辨識。

厚雲 影像中雲的明亮度高、NDVI 值

低,於此方面與崩塌地不易分辨。

薄雲

陰影下的植被 影像中陰影下植被的 NDVI 值低,

於此方面與(陰影下的)崩塌地不易 分辨。

目標為建立物件式分類器,可知訓練教材為「特定類別」物件的「物 件特徵」─備齊上述五類別的訓練物件集後,本研究計算各訓練物件於 32 項物件特徵(表 3-5)的特徵值,整合為訓練資料。

光譜特徵(19 個) {B/G/R/NIR}均值、{B/G/R/NIR}標準差、明亮 度、最大差異、B/G、G/R、R/NIR、GRVI、 稱性(Asymmetry),負值表左偏、正值表右偏,如式 3-1, 𝑛為特定類別樣

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

本數、𝑥𝑖𝐹為特定類別樣本𝑖於特徵𝐹的特徵值,𝜇𝐹、𝑠𝐹分別為特定類別樣 本集於特徵𝐹的特徵值平均值與標準差;峰度(Kurtosis)評估分布曲線的陡 峭程度,負值表平緩、正值表尖銳,如式 3-2。已知標準常態分布曲線的 偏態係數與峰度值皆為 0。

𝑠𝑘𝑒𝑤𝑛𝑒𝑠𝑠 = (

𝑥𝑖𝐹−𝜇𝐹 𝑠𝐹 )3 𝑛𝑖=1

𝑛 --- (3- 1) 𝑘𝑢𝑟𝑡𝑜𝑠𝑖𝑠 = (

𝑥𝑖𝐹−𝜇𝐹 𝑠𝐹 )4 𝑛𝑖=1

𝑛 − 3 --- (3- 2) (三) 建立基於訓練資料的分類器

1. 策略一:若類別樣本集的特徵值分布曲線呈現常態分布

於規則集之建立,特徵值統計數據可為「分類規則」設計的依據

─可基於機率密度函數(圖 3-11),以「平均值加減二倍標準差」

為 所 定 義 類 別 歸 屬 函 數 的 邊 界 值 , 如 圖 3-12 ; 或 執 行 SEaTH(SEparability and THreshold algorithm)演算法。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 3-12 由類別特徵值統計值定義類別歸屬函數(詹鈞評,2012)

SEaTH 演算法的目標為:於任一「二元分類」,識別其代表性物 件特徵─即分離度(SEparability)最大之物件特徵,並計算該項物 件特徵的最適門檻值(THreshold)。其基本假設為:各類別訓練物 件集於各項物件特徵的特徵值分布曲線皆呈現常態分布。各項物 件特徵於「特定類別組合之二元分類」的分離度─由兩類別訓練 物件集於該項物件特徵的特徵值常態分布曲線的交集程度推斷而 得,如圖 3-13,量化指標為 Jeffries-Matusita 距離,全域為 0 至 2,2 表示完全分離,如式 3-3,以 J 值最大的物件特徵為該二元 分類的代表性物件特徵。兩常態分布曲線交於兩點,如圖 3-14,

以位於兩類別特徵值平均值之間者為最適門檻值,如式 3-4。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 3-13 分離度─兩常態分布曲線的交集程度(S. Nussbaum et al., 2006)

J𝐹12= 2 (1 − 𝑒

1

8(𝑚1𝐹−𝑚2𝐹)2 2

𝜎1𝐹2 +𝜎2𝐹2 +12𝑙𝑛[𝜎1𝐹2 +𝜎2𝐹2

2𝜎1𝐹𝜎2𝐹]

) = 2(1 − 𝑒−𝐵𝐷𝐹12) -- (3- 3)

圖 3-14 門檻值─兩常態分布曲線的交點(S. Nussbaum et al., 2006)

Threshold=(𝑚2𝐹∗𝜎1𝐹2 )−(𝑚1𝐹∗𝜎2𝐹2 )±(𝜎1𝐹∗𝜎2𝐹∗A) 𝜎1𝐹2 −𝜎2𝐹2

--- (3- 4)

的 特 徵選擇 (Correlation-based Feature Selection, CFS)」兩演算 法,於 32 項物件特徵中,提取於分類較重要的特徵子集,以降 低特徵空間之維度。

隨機森林以名為「變數重要性(Variable Importance, VI)」的指標 衡量各項描述特徵於分類的重要程度。計算方式如下:於任一單

性不確定性(Symmetrical uncertainty)」,如式 3-6 (Hall, 1999),由 式可知,訓練資料須經離散化(Discretisation)(將連續的實數資料 轉化為名目資料)的前處理,方得以此指標衡量各項特徵與類 別、與兩兩特徵間的相關性。

𝑀𝑒𝑟𝑖𝑡𝑆 = 𝑘𝛾̅̅̅̅̅𝑐𝑓

√𝑘+𝑘(𝑘−1)𝛾̅̅̅̅̅𝑓𝑓 --- (3- 5)

symmetrical uncertainty coefficient = 2.0 × [H(Y)+H(X)gain ] H(Y) = − ∑y∈Yp(y) log2(p(y))

形,於 eCognition 環境執行;若為機器學習分類器,則執行環境與程序如 圖 3-16 所示。

將第一階段崩塌地向量圖層的資料精度以誤差矩陣(Error matrix)的形 式描述。誤差矩陣的概念說明如下。

accuracy)如式 3-7 所示─分類地圖生產者的目標為於遙測影像「辨識」目 標類別,即「棄真」誤差 D 之最小化;使用者精度(User’s accuracy)如式 3-9。其中,𝑃𝑜稱為「整體精度(Overall accuracy)」或「觀察一致性(Observed agreement)」,如式 3-10;𝑃𝑐稱為「期望一致性(Chance agreement)」,如式 3-11。可看出:整體精度僅考量了位於誤差矩陣對角線上的正確分類的像 元數;而 Kappa 則額外考量了不在對角線上的誤判(Commission)與漏判 (Omission)的像元數,可較精確地評價分類器的預測精度。Kappa 值大於 0.8 表分類結果具高度的正確性,介於 0.4 至 0.8 表中等的信賴度,小於 0.4 則為相當低的分類精度(Landis and Koch, 1977)。

Kappa =𝑃1−𝑃𝑜−𝑃𝑐

𝑐 --- (3- 9)

X=XL+(Z−ZLm11x+m21y+m31(−f) m13x+m23y+m33(−f) Y=YL+(Z−ZLm12x+m22y+m32(−f) m13x+m23y+m33(−f)

--- (3- 12)

相關文件