• 沒有找到結果。

研究方法與流程

關鍵詞:Boosting、資料挖掘、監督式分類、樣本特性

4. 研究方法與流程

4. 研究方法與流程

影像監督式分類中,先由衛星影像中選取足以 代表地物光譜特性的樣本點,將這些樣本進行訓 練,再利用最短距離,最大概似法等進行分類。近 來許多研究顯示增加分類的樣本特徵,可以解決由 單純光譜影像中無法解決的問題,如常見的紋理資 訊。透過地物間灰階值的差異計算,可將呈現均質 光譜反應的水稻與光譜反應混雜的林地加以分 離,進而提昇分類成果;除此之外,一些學者也採 用光譜波段指標的計算,將各類別間的差異擴大,

使類別與類別間更易分離,如:NDVI 及 Band ratio 等。

藉由增加特徵資訊來提高分類成果是一般的 認知,其前題假設是每一個特徵皆為有效資訊,然

而實際上並非如此,因為在多重資訊產生及導入過 程的同時,也引發了很多不確定的因素,甚至引起 成果降低的結果。除此之外,在傳統的分類下無法 獲得並分析判釋知識是其重要問題。因此,透過決 策樹 CART 資料挖掘方法即可達到知識表達的目 標。加入 Boosting 法可以透過在訓練過程中,可針 對樣本特性模糊、不確定的地方,透過調整樣本權 重,改變樣本分配,來降低樣本訓練時的錯誤率。

故本研究先增加影像的光譜特徵資訊及紋理 特徵資訊,分別利用傳統的最大概似分類法,

CART 決策樹分類,以及 CART 結合 Boosting 改善 樣本學習過程進行分類,以避免在選擇訓練樣本時 所產生的同質異譜、同譜異質及混合樣元等各項因 素且解決分類情況中模糊不確定之處,最後再進行 分類成果的探討,本研究的作業流程圖,如圖五。

圖五 研究作業流程圖

陳慧欣、劉致亨、周天穎、楊龍士:以 Boosting 法改進監督式分類於水稻田樣本特性之研究 47

4.1 光譜指標特徵萃取

在 原 始 光 譜 影 像 中 , 以 本 研 究 所 採 用 的 QuickBird 影像為例,其包含 B、G、R、IR 四個光 譜波段,但是僅以四個光譜特徵進行分類,尚無法 達到完全分類,在衛星影像應用於水稻田分類研究 中多採用光譜指標,來增加水稻與非水稻的資訊,

輔助分類成果達到有效分離的程度。因此本研究採 用波段比(Band Ratioing, BR)及常態化差異植生指 標(Normalized difference vegetation index, NDVI)增加 影像光譜資訊以增加輔助資訊,BR 及 NDVI 的計 (Fussy Supervised Classification)進行影像分類,其整 體分類準確度高達 95.66%。沈育佳及林榮章,於 1998 年及 1999 年分別運用空載多光譜掃描影像及 衛星影像,運用 GLCM 進行都會區影像紋理之分 析,期能建立紋理結構資料庫。施奕良(2006)除了 將 QuickBird 光譜影像視為知識表達的一種方式 外,再加入半變異元紋理和碎形幾何紋理特徵,以

航測及遙測學刊 第十三卷 第一期 民國 97 年 3 月 48

段之不同,可分為「單波段紋理」與「多波段紋理」, 其中方向半變異元(Direct Semivariogram)與絕對半 變異元(Madogram)為計算單波段之模型,交叉半變 異 元 (Cross Semivariogram) 與 虛 擬 半 變 異 元 (Pseudo-Cross Semivariogram)則可計算兩波段間的 紋理資訊(Chica-Olmo & Abaraca-Hernandez, 2000),

其公式與敘述如下: (Supervised Classification),主要是將已知地面位置 之真實資料的光譜特性為依據,進行影像其他未知

4.4 CART CART CART CART

由 Breiman et al.(1983)所提出的 CART 法,是基 於樹狀結構產生分類和迴歸模型的過程,是一種產 用分類樹(classification trees),目標變數是連續型 的,則可以採用迴歸樹(regression trees)。 其是利用 Gini Index 針對數值型態屬性的變項來做分類。集 合 T 包含 N 個類別的記錄,那麼其 Gini Index 演算 法就是:(Dunham, 2002)

( ) 1 2

陳慧欣、劉致亨、周天穎、楊龍士:以 Boosting 法改進監督式分類於水稻田樣本特性之研究 49

提供最小 Ginisplit 就被選擇作為分割的標準(對於 每個屬性都要經過所有可以的分割方法)。

4.5 Boosting Boosting Boosting Boosting

Boosting 由於各家學者翻釋不同,中文釋名除 了普適提外,還有學習力的提升(侯昌成,2001)及 皮匠法(趙民德,2001),而本研究為避免翻釋上的 岐意,故採原文 Boosting。其基本概念是要找到許 多比較粗糙的方法,會比找到單一且具有高預測能 力之方法簡單且有 效。因 此 Schapire(1990)提出 Boosting 驗證強式可學習方法,接著改善 Boosting 演算法為 Adaboost (Adaptively adjusts Boosting),改 善了 Boosting 實際演算的困難(Freund & Schapire, 1996)。另外,在機械學習中 Boosting 是指對於一個 要被學習的概念,可能已有一些預測規則,如 Boosting 與 Bagging 兩種方式來重抽樣本。其理想 則是將以下三種分類器分類正確之結果加以組 的分類準確度。如下所示(Schapire, 1999):

假定

( x

1

, y

1

) ( K x

m

, y

m

)

航測及遙測學刊 第十三卷 第一期 民國 97 年 3 月

(User’s Accuracy, UA)、生產者精度(Producer’s Accuracy, PA)、整體精度(Overall Accuracy)與 Kappa 統計值四種。 樣本地區各類別之光譜特徵值,以 TD(Transformed Divergence)分離度對樣區之適用性加以檢定,以萃