研究方法與流程 - 關鍵詞：Boosting、資料挖掘、監督式分類、樣本特性 - Journal of Photogrammetry and Remote Sensing

關鍵詞：Boosting、資料挖掘、監督式分類、樣本特性

4. 研究方法與流程

影像監督式分類中，先由衛星影像中選取足以代表地物光譜特性的樣本點，將這些樣本進行訓練，再利用最短距離，最大概似法等進行分類。近來許多研究顯示增加分類的樣本特徵，可以解決由單純光譜影像中無法解決的問題，如常見的紋理資訊。透過地物間灰階值的差異計算，可將呈現均質光譜反應的水稻與光譜反應混雜的林地加以分離，進而提昇分類成果；除此之外，一些學者也採用光譜波段指標的計算，將各類別間的差異擴大，

使類別與類別間更易分離，如：NDVI 及 Band ratio 等。

藉由增加特徵資訊來提高分類成果是一般的認知，其前題假設是每一個特徵皆為有效資訊，然

而實際上並非如此，因為在多重資訊產生及導入過程的同時，也引發了很多不確定的因素，甚至引起成果降低的結果。除此之外，在傳統的分類下無法獲得並分析判釋知識是其重要問題。因此，透過決策樹 CART 資料挖掘方法即可達到知識表達的目標。加入 Boosting 法可以透過在訓練過程中，可針對樣本特性模糊、不確定的地方，透過調整樣本權重，改變樣本分配，來降低樣本訓練時的錯誤率。

故本研究先增加影像的光譜特徵資訊及紋理特徵資訊，分別利用傳統的最大概似分類法，

CART 決策樹分類，以及 CART 結合 Boosting 改善樣本學習過程進行分類，以避免在選擇訓練樣本時所產生的同質異譜、同譜異質及混合樣元等各項因素且解決分類情況中模糊不確定之處，最後再進行分類成果的探討，本研究的作業流程圖，如圖五。

圖五研究作業流程圖

陳慧欣、劉致亨、周天穎、楊龍士：以 Boosting 法改進監督式分類於水稻田樣本特性之研究 47

4.1 光譜指標特徵萃取

在原始光譜影像中，以本研究所採用的 QuickBird 影像為例，其包含 B、G、R、IR 四個光譜波段，但是僅以四個光譜特徵進行分類，尚無法達到完全分類，在衛星影像應用於水稻田分類研究中多採用光譜指標，來增加水稻與非水稻的資訊，

輔助分類成果達到有效分離的程度。因此本研究採用波段比(Band Ratioing, BR)及常態化差異植生指標(Normalized difference vegetation index, NDVI)增加影像光譜資訊以增加輔助資訊，BR 及 NDVI 的計 (Fussy Supervised Classification)進行影像分類，其整體分類準確度高達 95.66%。沈育佳及林榮章，於 1998 年及 1999 年分別運用空載多光譜掃描影像及衛星影像，運用 GLCM 進行都會區影像紋理之分析，期能建立紋理結構資料庫。施奕良(2006)除了將 QuickBird 光譜影像視為知識表達的一種方式外，再加入半變異元紋理和碎形幾何紋理特徵，以

航測及遙測學刊第十三卷第一期民國 97 年 3 月 48

段之不同，可分為「單波段紋理」與「多波段紋理」，其中方向半變異元(Direct Semivariogram)與絕對半變異元(Madogram)為計算單波段之模型，交叉半變異元 (Cross Semivariogram) 與虛擬半變異元 (Pseudo-Cross Semivariogram)則可計算兩波段間的紋理資訊(Chica-Olmo & Abaraca-Hernandez, 2000)，

其公式與敘述如下： (Supervised Classification)，主要是將已知地面位置之真實資料的光譜特性為依據，進行影像其他未知

4.4 ^CART ^CART ^CART ^CART

由 Breiman et al.(1983)所提出的 CART 法，是基於樹狀結構產生分類和迴歸模型的過程，是一種產用分類樹(classification trees)，目標變數是連續型的，則可以採用迴歸樹(regression trees)。其是利用 Gini Index 針對數值型態屬性的變項來做分類。集合 T 包含 N 個類別的記錄，那麼其 Gini Index 演算法就是：(Dunham, 2002)

( ) 1 2

陳慧欣、劉致亨、周天穎、楊龍士：以 Boosting 法改進監督式分類於水稻田樣本特性之研究 49

提供最小 Ginisplit 就被選擇作為分割的標準(對於每個屬性都要經過所有可以的分割方法)。

4.5 ^Boosting Boosting ^Boosting ^Boosting

Boosting 由於各家學者翻釋不同，中文釋名除了普適提外，還有學習力的提升(侯昌成，2001)及皮匠法(趙民德，2001)，而本研究為避免翻釋上的岐意，故採原文 Boosting。其基本概念是要找到許多比較粗糙的方法，會比找到單一且具有高預測能力之方法簡單且有效。因此 Schapire(1990)提出 Boosting 驗證強式可學習方法，接著改善 Boosting 演算法為 Adaboost (Adaptively adjusts Boosting)，改善了 Boosting 實際演算的困難(Freund & Schapire, 1996)。另外，在機械學習中 Boosting 是指對於一個要被學習的概念，可能已有一些預測規則，如 Boosting 與 Bagging 兩種方式來重抽樣本。其理想則是將以下三種分類器分類正確之結果加以組的分類準確度。如下所示(Schapire, 1999)：

假定

( x

₁

, y

₁

) ( ^K x

, y

)

航測及遙測學刊第十三卷第一期民國 97 年 3 月

（User’s Accuracy, UA）、生產者精度（Producer’s Accuracy, PA）、整體精度（Overall Accuracy）與 Kappa 統計值四種。樣本地區各類別之光譜特徵值，以 TD(Transformed Divergence)分離度對樣區之適用性加以檢定，以萃

在文檔中 Journal of Photogrammetry and Remote Sensing (頁 48-52)

研究方法與流程

關鍵詞：Boosting、資料挖掘、監督式分類、樣本特性

4. 研究方法與流程

4. 研究方法與流程

4.1 光譜指標特徵萃取

4.4 CART CART CART CART

4.5 Boosting Boosting Boosting Boosting

( x

, y

) ( K x

, y

)

4.4 ^CART ^CART ^CART ^CART

4.5 ^Boosting Boosting ^Boosting ^Boosting

) ( ^K x