• 沒有找到結果。

支持向量機應用於水稻田辨識之研究

N/A
N/A
Protected

Academic year: 2022

Share "支持向量機應用於水稻田辨識之研究"

Copied!
16
0
0

加載中.... (立即查看全文)

全文

(1)

Volume 12, No.3, September 2007, pp. 225-240

支持向量機應用於水稻田辨識之研究

陳承昌

1

史天元

2

摘要

「支持向量機」是以統計學習理論為基礎,所建構出的機器學習系統。其基本原理是在特徵空間中 尋求具有最大區分度邊界的超平面,以區分不同的二元類別。本研究以「支持向量機」為分類器,進行 水稻田的辨識作業,並採用嘉義地區多時段福衞二號(Formosat-2)影像及新竹地區多時段 SPOT 影像為資料 來源。「支持向量機」可選用不同核函數,而且會因核函數選用的不同,而對分類成果造成差異。因此,

本研究於嘉義及新竹實驗區分別採用線性、多項式、輻狀基底函數及兩層式類神經網路為核函數進行辨 識作業,以分析其影響。

分類實驗成果,將「支持向量機」與高斯最大似然分類法及輻狀基底函數類神經網路,進行分類成 果比較。由實驗成果顯示,「支持向量機」於嘉義實驗區以 2 階多項式所得的分類精度為最佳,其整體精 度為 89.830%、Kappa 值為 0.79303;於新竹實驗區以輻狀基底函數所得的分類精度為最佳,其整體精度為 84.989%、Kappa 值為 0.68269。於兩實驗區中,「支持向量機」的分類精度皆優於高斯最大似然分類法及 輻狀基底函數類神經網路。

關鍵詞:多光譜影像、人工智慧

1.  前言

由於遙感探測感測器解析度與數據方便性的 提升,同時配合分類理論的精進,應用衛星影像進 行土地覆蓋分類作業技術已日趨成熟。鄧敏松

(1997)、陳益凰(1998)、蕭國鑫(1998)及邵泰 璋(1999)等,便以衛星影像分類進行水稻田辨識 作業。其優點為能提高作業之自動化程度,從而有 效減少作業成本,並可減低人為辨識所造成的主觀 差異。而此一作業中,有效之分類器為關鍵重點之 一。本研究以「支持向量機」(Support Vector Machines) 作為辨識方法,並和高斯最大似然分類法及輻狀基 底函數類神經網路進行分類成果比對,以驗證「支 持向量機」在水稻田辨識上是否優於其他分類方 法。

在「支持向量機」應用於光譜影像分類之已有 文獻中,Zhu & Blumberg (2002)以多項式及輻狀 基底函數為核心的「支持向量機」,應用於 15 及 30 公尺解析力的 ASTER 影像分類,在 15 公尺影像 解析力以 5 階多項式之分類成果為較佳;30 公尺 影像解析力則以輻狀基底函數之分類成果為較 佳。Foody & Mathur(2004)分別使用判別分析、

決策樹、前饋式類神經網路及「支持向量機」於 ATM 影像分類之研究,該分類成果以「支持向量 機」為最佳。Melgani & Bruzzone(2004)分別以 KNN(K-nearest neighbors)、輻狀基底函數類神經 網路、支持向量機(分別採線性、多項式及輻狀基 底函數之三種核函數)於 AVIRIS 影像分類之研 究,其中以輻狀基底函數之支持向量機所得的分類 精度為最佳。

1國立交通大學土木工程學系碩士

2國立交通大學土木工程學系教授

收到日期:民國 95 年 09 月 30 日 修改日期:民國 96 年 09 月 18 日 接受日期:民國 96 年 09 月 18 日

(2)

Camps-Valls & Bruzzone(2005)以線性判別分 析、正規化輻狀基底函數類神經網路、輻狀基底函 數與多項式為核函數之支持向量機、輻狀基底函數 之線性判別分析(Kernel Fisher Discriminant,KFD)

及 Regularized AdaBoost 進行 AVIRIS 影像分類研 究,由分類成果顯示,以多項式之支持向量機所獲 得的分類精度為最佳,輻狀基底函數之支持向量機 次之。黃明哲與李良輝(2005 )使用空載光達 (Airborne LiDAR)及同步拍攝的光學影像資料,以最 小距離分類法、最大似然分類法及支持向量機進行 地物分類之研究,該分類成果以支持向量機為最 佳。許晉嘉等(2005)採 Quick Bird 衛星影像,以 高斯最大似然分類法及支持向量機進行水稻田辨 識之研究,並加入方向半變異元(Semivariogram)

及主成分分析法之紋理影像輔助辨識作業,其中支 持向量機的各項分類成果皆優於高斯最大似然分 類法。

2.  支持向量機分類理論 

支持向量機分類之基本理論

支持向量機(Support Vector Machine,SVM)

為依統計學習理論為基礎,所建構出的機器學習系 統,其主要原理是在特徵空間中尋求具最大邊界的 區分超平面以區分不同的二元類別。支持向量機可 分為線性及非線性,倘若訓練樣本在空間中的分佈 呈非線性,則採非線性支持向量機;反之則採線性 支持向量機,而線性支持向量機又可分為線性可分 或線性不可分之情況。以下將分別針對線性及非線 性之支持向量機作說明(Vapnik, 1995;Burges, 1998;Cristianini & Shawe-Taylor, 2000)。

2.1  線性支持向量機

於線性可分之情況,如圖 1,假設存在訓練樣 本(x ,i yi)i=1, 2, . . . ,lxiRnyi{1,+1};支持向 量機會尋求一個具最大邊界(margin)的區分超平 面(separating hyperplane)(wxi)+b=0,將標註為「-1」

及「+1」的訓練樣本完全分離。求解區分超平面過 程可視為求解二次規劃(quadratic programming)問 題。線性可分為求解下式的最小值:

( )

w =

(

ww

)

Φ 2

1

(1)

上式限制條件為 (yi[xiw)+b]1i=1, 2, . . . ,l。 透過拉格朗日(Lagrangian)轉換,可將(1)

式轉換為:

( ) ( ) {[( ) ] 1}

2 , 1 ,

1

+

=

= i i

l i

i x w by

w w b w

L α α

(2)

上 式 αi 為 拉 格 朗 日 乘 子 ( Lagrange multipliers),且αi0

將(2)式對w及 b 作偏微,使上述最佳化問 題轉換為求對偶問題(dual problem):

( )

=

=

=

l

i i i

i x

y w w

b w L

1

, 0

, α α

==

l i

i i

i x

y w

1

α (3)

( )

=

=

=

l

i i

yi

b b w L

1

, 0

, α α

==

l

i i

yi 1

0 α

(4)

將偏微所得的(3)和(4)式代入 (2)式 並考慮 Karush-Kuhn-Tucker 條件,可將(2)式轉換 為求解下式的最大值:

( )

( )

=

= l

i l

j i

j i j i j i

i yy x x

W

1 2,

1 αα α

α

(5)

上限制條件為αi0= =

l

i i

iy

1

α 0

i=1, 2, . . . ,l 。 透過(5)式的求解,可求得一分類函數:

( )

=sign y x x b

x

f() iαi i

(6)

上式中,xi為支持向量;αi 為相應xi之拉格 朗日乘子;b 為一常數門檻值。當f(x)>0時,表示 該樣本與標註為「+1」的樣本屬同一類別,反之則 屬另一類別 。

若為線性不可分之情況,如圖 2,(1)式可改 寫成(7)式,其目標為求解具最大邊界的區分超 平 面 及 使 懲 罰 項 ( =

l

i

C i 1

ξ ) 的 值 為 最 小 :

( ) ( )

+

=

Φ

= l

i

C i

w w w

2 1

,ξ 1 ξ

(7)

上式限制條件為

( )

[ i ] i

i w x b

y + 1ξξi 0i=1, 2, . . . ,l。C 為懲

support vectors

(3)

罰參數(penalty parameter)、ξi為沉滯變數(slack variable)。

圖 1 線性可分(Burges, 1998) 圖 2 線性不可分(Burges, 1998)

2.2  非線性支持向量機

若輸入的訓練樣本無法以線性支持向量機分 離,則可透過映射函數

ϕ

,將原本輸入的訓練樣本 空間

R

n映射至高維度的特徵空間(feature space,

Z),在 Z 中建構最佳區分超平面,以近似線性支 持向量機方式完成分類。在滿足 Mercer 條件下,

映射函數的點乘積可以適當的核函數作取代,得最 終的分類函數為:

( )

=signy Kx x b

x

f( ) iαi i, (8)

上式中,K(xi,x)=ϕ(xi)⋅ϕ(x),為滿足 Mercer 條件的核函數。

研究中常採用的三種核函數(Vapnik, 1995;

Burges, 1998)分別為:(1)多項式(polynomial kernel),K(xi,x)=

(

xix+1

)

d;(2)輻狀基底 函 數 ( r a d i a l b a s i s f u n c t i o n s kernel,RBF),

= 2

2

exp 2 ) ,

( σ

x x x

x

K i i ;(3)

兩 層 式 類 神 經 網 路 ( two-layer network ) ,

(

κ ⋅ −δ

)

= x x

x x

K( i, ) tanh i 。本研究將採上述核函 數進行支持向量機於不同核函數之分類實驗。

多類支持向量機分類法 

支持向量機的基本分類原理主要是以二元類 別為主,若要將其延伸到多類別的分類問題上,目 前有以下幾種方法(Melgani & Bruzzon, 2004;王景

南,2002):

1. 一對多方法(one-versus-rest):該方法是先把 某一類別的樣本當作一種類別,其餘類別的 樣本當作另一種類別,若有 k 種類別,則會 產生 k 個支持向量機,並以具有最大分類函 數值的支持向量機為欲分類樣本之所屬類 別。

2. 一對一方法(one-versus-one):若有 k 種類別,

則每兩種類別樣本皆會產生一個支持向量 機,故將產生 k(k-1)/2 個支持向量機,並以投 票策略(voting strategy)決定樣本之類別。在 此舉一例作說明:假若有三種類別,則 1 和 2 類別、1 和 3 類別及 2 和 3 類別皆各會產生 一個支持向量機,如表 1。倘若現今有一個欲 分類的樣本,並假定其為類別 2,則該樣本會 分別代入三個支持向量機中,且每個支持向 量機會決定該樣本的類別並在該類別的票數 加 1,最終將以具有最多票數的類別為該樣本 的所屬類別,如表 2。

3. DAG method(Directed Acyclic Graph SVM):

此方法的支持向量機產生方式,與一對一方 法相同,同樣會產生 k(k-1)/2 個支持向量機。

不同之處是此方法會建立一個二元且無循環 的有向圖,如圖 3。圖中共有 10 個內部節點 及 5 個葉節點,每一個內部節點皆表示一個 二元支持向量機,5 個葉節點則表示 5 種類別。

support vectors

(4)

表 1 支持向量機之產生方式 表 2 投票策略說明

1 2 3

1 1 2 1 3

2 2 3

3

圖 3 DAG method 處理 5 種類別時之二元且無循環的有向圖(王景南,2002)

3.  影像資料與實驗流程 

3.1  影像資料 

本研究採用兩組實驗數據進行水稻田辨識作 業,第一組實驗數據為 93 年嘉義地區二期稻作,

採用福衞二號(Formosat-2)影像;第二組實驗數據為 89 年新竹地區一期稻作,採用 SPOT 影像。每組實 驗數據皆包含五幅不同時段影像。

不同時段衛星影像會受到衛星感測器及大氣 條件等因素的影響(Smith & Milton, 1999;Yuan &

Elvidge, 1995),而使得地表不變物的光譜反射值 在不同時段具有明顯差異。由於多光譜影像中之大 氣影響資訊不似高光譜影像充分,故於本研究中,

以經驗線法對實驗區的衛星影像進行相對輻射改 正,經驗線法的樣本點選取以光譜反射不隨時間變

動的地表覆蓋物為原則。

檢核資料以農糧署所提供相同年份和相同稻 作期的 1/5000 耕地地籍圖為依據,該資料是以航空 照片經人工判釋方式而得。耕地地籍圖原屬向量格 式,為配合網格式的遙測影像,故須將向量格式轉 換至影像格式,實驗中採優勢法進行轉換作業,優 勢法亦即將網格內較具優勢的特徵值作為網格的 所屬值。

3.1.1  嘉義實驗區

嘉義地區所採用的五幅 Formosat-2 衛星影像,

其影像等級皆為 Level 3(經軌道參數及地面控制 點改正),像元解析力為 8 公尺。表 3 為各幅影像 之 攝 像 日 期 與 對 應 水 稻 生 育 進 度 。 在 多 時 段 Formosat-2 影像中,切割 600×500 像元作為嘉義實 驗區,地理上該實驗區位於嘉義縣溪口鄉及民雄鄉

1 2 3

1 2 1

1 3 1

2 3 1

Vote 0 2 1

(5)

間(實驗區左上角 2∘TM 坐標為 N=2610388m、

E=186272m;右下角 2∘TM 坐標為 N=2605588m、

E=190272m)。圖 4 為五幅經輻射改正後之嘉義實 驗區影像,影像經以調適法(adaptive method)對影像 進行增揚(PCI, 1997)。嘉義實驗區之檢核資料包含 四 張 1/5000 圖 幅 範 圍 ( 9420-II-066 ~ 067 及 9420-II-076 ~ 077),各圖幅經向量轉網格格式後,

需進行影像鑲嵌並切割至與多時段影像相同圖幅 大小及區域,該區檢核影像如圖 5。

3.1.2  新竹實驗區 

新竹地區所採用的五幅 SPOT 衛星影像,其影 像等級皆為 Level 10,像元解析力為 12.5 公尺。該 等級為舊制之產品分級,等級 10 相當於目前 SPOT 產品之等級 3,為正射影像,亦即經過使用數值地 形模型進行正射化作業(中央大學,2005)。就幾何 條件而言,等同 Formosat-2 衛星影像產品之等級 4 (Level 4)。表 4 為各幅影像之攝像日期與對應水稻 生育進度,其中 89 年稻作在插秧至生長期階段因 無法獲取品質良好的衛星影像,故以 88 年同生長 階段的影像取代。在多時段 SPOT 影像中,切割 440

×600 像元作為新竹實驗區,地理上該實驗區位於 新竹市北區及新竹縣竹北市間(實驗區左上角 2∘

TM 坐標為 N=2751943.75m、E=242456.25m;右下 角 2∘TM 坐標為 N=2746443.75m、E=249956.25m)。 圖 6 為五幅經輻射改正後之新竹實驗區影像,影像 亦經以調適法對影像進行增揚。新竹實驗區的檢核 資料則包含六張 1/5000 圖幅範圍(9522-I-058 ~ 060 及 9522-I-068 ~ 070),各圖幅經向量轉網格格式 後,相同於嘉義實驗區需進行影像鑲嵌及切割作 業,該區檢核影像如圖 7。

3.2  實驗流程

3.2.1  訓練樣本擷取流程

嘉義及新竹實驗區之土地覆蓋種類繁雜,且受 限檢核資料僅提供水稻及非水稻類別之資訊,故於

影像上不易選取具代表性的訓練樣本。因此,兩組 實驗區之訓練樣本選取流程,如圖 8,皆先以 ISODATA 分類法將實驗區分為多個群聚類別,再 於各群聚類別上選取訓練樣本。ISODATA 群聚分 析所設定的相關參數分別為:初始群聚類別數為 40、收斂條件為 98%(當 98%像元不再改變其群聚 類別則停止該法)、群聚類別最小像元數為 10。

由該參數設定,嘉義實驗區得 38 個群聚類別;新 竹實驗區得 40 個群聚類別。各群聚類別的訓練樣 本選取以矩形區塊為依據,並以群聚類別內部區域 及避免與其它群聚類別直接相鄰區域為基準。

嘉義及新竹實驗區之各群聚類別並依據檢核 資料及參考多時段衛星影像,合併為水稻及非水稻 2 個群聚類別(1 群聚類別屬非水稻類別;2 群聚 類別屬水稻類別),合併的各群聚類別,則其訓練 樣本也將合併。表 5,為嘉義及新竹實驗區之水稻 及非水稻訓練樣本數。嘉義及新竹實驗區之訓練樣 本並進行分離度計算,其中,嘉義實驗區之最小分 離度值為 1.983883;新竹實驗區之最小分離度值為 1.999142 。 分 離 度 之 計 算 為 採 用 Bhattacharyya Distance 以 PCI 軟體計算,若該值大於 1.9(PCI, 1997),則表示各類別間之訓練樣本具有良好的分 離度,故嘉義及新竹實驗區之訓練樣本具有良好的 分離度。

3.2.2  分類實驗流程

嘉義及新竹實驗區之分類實驗流程,如圖 9,

分別以擷取的訓練樣本,建立高斯最大似然分類 法、支持向量機及輻狀基底函數類神經網路的分類 模式,以對全實驗區域影像進行分類作業並進行精 度分析與成果探討。其中,支持向量機並分別採用 線性、多項式、輻狀基底函數及兩層式類神經網路 為核函數建立分類模式。嘉義實驗區之 12 月 17 日 影像及新竹實驗區之 7 月 25 日,因該時期影像屬 水稻收成後時期,地表覆蓋可能為裸土或改種其它 作物,為避免影響整體分類精度,故實際分類作業 中不採用該時段影像。

(6)

表 3 嘉義地區之攝像日期與水稻生育進度 表 4 新竹地區之攝像日期與水稻生育進度

攝像日期 水稻生育進度 攝像日期 水稻生育進度

93 年 08 月 07 日 插秧~生長期 88 年 03 月 05 日 插秧~生長期 93 年 09 月 29 日 分蘗~幼穗形成 89 年 04 月 18 日 分蘗~幼穗形成 93 年 10 月 12 日 幼穗~抽穗開花 89 年 05 月 09 日 幼穗~抽穗開花 93 年 11 月 08 日 乳熟~黃熟 89 年 06 月 04 日 乳熟~黃熟

93 年 12 月 17 日 收割後或其他植生 89 年 07 月 25 日 收割後或其他植生

圖 4 嘉義實驗區之五個時段影像

08/07 09/29 10/12

11/08 12/17

(7)

圖 5 嘉義實驗區之檢核影像

圖 6 新竹實驗區之五個時段影像

圖 7 新竹實驗區之檢核影像

03/05 04/18

05/09 06/04

07/25

(8)

圖 8 嘉義及新竹實驗區之訓練樣本選取流程 表 5 嘉義及新竹實驗區之水稻及非水稻訓練樣本數

水稻 非水稻 總像元數

嘉義實驗區 310 850 1160

新竹實驗區 481 682 1163

圖 9 嘉義及新竹實驗區之分類實驗流程

4.  實驗成果與分析探討

嘉義及新竹實驗區之輻狀基底函數類神經網 路架構,如表 6,該網路架構以試誤法決定。支持 向量機則以數據正規化及參數優化建立分類模 式。正規化(Normalization)亦即將各屬性值依其 最小值及最大值按比例縮放至 0-1 間,其優點是有

助於支持向量的選取及避免數值上的計算問題。參 數優化則以交叉驗證(Cross-Validation)方式選取 最佳參數。兩實驗區並以 Z-Test 檢定各分類方法所 建立的分類模式是否具有顯著性,在本研究中以 95%信心水準為基準,若 Z 值大於 1.96 則代表兩分 類方法之分類成果具有顯著性。

(9)

4.1  分類成果 

4.1.1  嘉義實驗區 

表 7 為嘉義實驗區之分類成果。多項式之核函 數會因階數的選取,而對分類成果造成影響,故分 類實驗中從 1 階試驗至 5 階,並以分類成果為最佳 的階數作為多項式之階數代表。支持向量機以分類 精度為最佳的核函數,和其它分類方法進行成果比 對。由表 7 之成果顯示,以 2 階多項式之支持向量 機所得的分類精度為最佳,而輻狀基底函數類神經 網路之分類精度次之。

4.1.2  新竹實驗區

表 8 為新竹實驗區之分類成果。在該實驗區,

多項式之階數從 1 階試驗至 6 階,至 5 階後其整體 精度才往下降低。由表 8 之成果顯示,以輻狀基底 函數之支持向量機所得的分類精度為最佳,而輻狀 基底函數類神經網路之分類精度次之。

4.2  分析探討 

圖 10 為嘉義及新竹實驗區之分類成果影像,

嘉義實驗區之支持向量機以 2 階多項式為代表;新 竹實驗區之支持向量機則以輻狀基底函數為代 表。由圖 10 可見,各分類方法於水稻田坵塊邊緣 處易發生誤授及漏授,其原因為檢核資料由向量轉 為影像格式時,受限影像解析力及格式轉換方法,

轉換上可能會喪失部份準確性。圖 11 為將向量格 式及影像格式之檢核資料進行套疊,由該套疊可 見,某些坵塊邊緣有不密合之現象。

將嘉義及新竹實驗區之各分類成果影像與多 時段衛星影像進行比對,其中,各分類方法於建築 物及道路之辨識能力相差甚小,皆能將該坵塊辨識 為非水稻,但高斯最大似然分類法相對於支持向量 機及輻狀基底函數類神經網路則易於將水稻辨識 為非水稻。

以嘉義實驗區為例,各分類方法於某些坵塊皆 有辨識錯誤之情形,如圖 10 所標示之紅框,故以

此假設檢核資料在人為判釋過程中,有誤判之情 形。圖 12 所標示之紅框,於多時段影像上,該坵 塊應屬非水稻,但於檢核資料中該坵塊判釋為水 稻,故該坵塊明顯屬人為判釋錯誤。

嘉義及新竹實驗區並以 Z-Test 檢定各分類方 法所建立之分類模式是否具有顯著性。表 9 為嘉義 實驗區各分類方法之 Z-Test,由表 9 可見,各 Z 皆 大於 1.96,故各分類方法間皆具有顯著性。表 10 為新竹實驗區各分類方法之 Z-Test,由表 10 中可 見,各 Z 皆大於 1.96,故各分類方法間之成果差異 皆具有顯著性。

5.  結論與建議 

本研究為以「支持向量機」進行水稻田的辨識 作業,經由兩組實驗數據之實驗成果與分析探討,

得出以下之結論與建議:

1. 支持向量機於不同核函數之分類成果,於嘉義 實驗區以 2 階多項式之分類成果為最佳,輻狀 基底函數次之;於新竹實驗區則以輻狀基底函 數之分類成果為最佳,5 階多項式次之。線性及 兩層式類神經網路的分類成果則相對於前述兩 者為低,故較不適用於本研究。在多項式之階 數試驗中,新竹實驗區需試驗至 5 階才具有最 佳成果,而嘉義實驗區僅 2 階即可求得,故以 此推斷新竹實驗區之地表覆蓋較嘉義實驗區為 複雜,可藉由比對兩實驗區之影像得到驗證。

2. 嘉義及新竹實驗區之各分類方法的分類成果皆 以支持向量機為最佳,輻狀基底函數類神經網 路次之。輻狀基底函數類神經網路於兩實驗區 所得之分類成果與支持向量機近似,原因為類 神經網路若能謹慎的選取網路架構,其分類能 力將能相似於支持向量機,但類神經具有無法 對其網路權重進行解釋的缺點。反觀,支持向 量機在分類上具有良好的解釋能力,且支持向 量機在參數決定也較類神經網路模式為容易,

僅需考量 C 及γ參數。

3. 新竹實驗區所採用的多時段影像為 SPOT 影

(10)

像,其影像解析力為 12.5 公尺,相較 Formosat-2 影像之 8 公尺解析力為低,且由影像可見,新 竹實驗區的土地覆蓋類型較嘉義實驗區為複雜 且其水稻田坵塊也較不規則。上述有可能是造 成該區分類成果相較嘉義實驗區為差的原因。

訓練樣本的選取優劣,也可能是造成該區分類 精度較差的成因之一。

4. 檢核資料為以航空照片經人工判釋方式獲取,

故判釋過程中可能會有誤判之情形。於本研究 中,將檢核資料與多時段衛星影像進行比對,

也證實某些坵塊存有人為誤判,故各分類方法 所得之分類成果,也可提供查核是否有人為誤 判之情形。檢核資料僅提供水稻及非水稻類別 之資訊,若其提供的類別資訊可再細化,將使 得在評估各分類模式之優劣能有更深入的探 討。

參考文獻

工研院,2005。應用高時間與空間解像力遙測影像 於水稻田耕作調查(1/3),工研院能資所報告。

中央大學,2005。國立中央大學太空及遙測研究中 心資源衛星接收站使用者手冊(第四版),

URL:http://www.csrsr.ncu.edu.tw/chin.ver/c7downl oad/2005user.pdf,最近查詢:2007-05-21。

王景南,2003。多類支向機之研究,元智大學資訊 管理學系研究所碩士論文。

邵泰璋,1999。類神經網路於多光譜影像分類之應 用,國立交通大學土木工程研究所碩士論文。

陳益凰,1998。應用多時段衛星影像辨識水稻田之 研究,國立成功大學測量工程研究所碩士論 文。

許晉嘉、雷祖強、周天穎,2005。應用支援向量機 法於衛星影像分類之研究,農業工程研討會論 文集。

黃明哲、李良輝,2005。支持向量機應用於空載雷 射掃瞄資料地物分類之研究,電子計算機於土 木水利應用研討會。

葉怡成,1998。類神經網路模式應用與實作,五版,

儒林書局有限公司。

鄧敏松,1997。多時段遙測影像、耕地坵塊與領域 知識之區域式影像辨識法於水稻田耕作調查 之應用,國立成功大學測量研究所碩士論文。

蕭國鑫,1998。多時遙測光學與雷達資料於水稻田 辨識之研究,國立交通大學土木工程研究所碩 士論文。

羅華強,2001。類神經網路 MATLAB 的應用-類 神經網路的介紹,清蔚科技出版。

Bischof, H., W. Schneider, and A. J. Pinz, 1992.

Multispectral Classification of Landsat-images Using Neural Networks, IEEE Transactions on Geoscience and Remote Sensing, 30(3):482-490.

Burges, C. J. C., 1998. A Tutorial on Support Vector Machines for Pattern Recognition, Data Mining Knowl. Discov., 2:121-167.

Cristianini, N., and J. Shawe-Taylor, 2000. An Introduction To Support Vector Machines and other kernel-based learning methods, Cambridge University Press.

Camps-Valls G., and L. Bruzzone, 2005. Kernel-Based Methods for Hyperspectral Image Classification, IEEE Transactions on Geoscience and Remote Sensing, 43 (6): 1351-1362.

Duda, R. O., and P. E. Hart, 1973. Pattern Classification and Scene Analysis, Wiely, New York.

Foody, G. M., and A. Mathur, 2004. A Relative Evaluation of Multiclass Image Classification by Support Vector Machines, IEEE Transactions on Geoscience and Remote Sensing, 42 (6):

1335-1343.

Gonzales, R. C., and R. E. Woods, 2002. Digital Image Processing, Addison-Wesley Publishing Company.

Hughes, G. F., 1968. On the Mean Accuracy of Statistical Pattern Recognizers, IEEE Transactions on Information Theory, vol. IT-14, pp. 55-63.

Hagan, M. T., H. B. Demuth, and M. Beale, 1995.

(11)

Neural Network Design, PWS Publishing Company, Boston.

Hsu, C. W., C. C. Chang, and C. J. Lin. A Practical Guide to Support Vector Classification, http://www.csie.ntu.edu.tw/~cjlin/libsvm/index.htm l.

Landgrebe, D. and L. Biehl, 2001. An Introduction To MultiSpec, Purdue University.

Lillesand, T. M., R. W. Kiefer, J. W. Chipman, 2004.

Remote Sensing and Image Interpretation, Fifth Edition, John Wiley & Sons, Inc.

Lin, C. J., 2004. Support Vector Machines for Data Classification and Regression, http://www.csie.ntu.edu.tw/~cjlin/.

MathWorks, 2001. Matlab Neural Network Toolbox 4.0 User's Guide, V6.1, MathWorks.

Melgani, F., and L. Bruzzone, 2004. Classification of Hyperspectral Remote Sensing Images with Support Vector Machines, IEEE Transactions on Geoscience and Remote Sensing 42 (8):

1778-1790.

PCI, 1997. Using PCI Software, V9.1, PCI, Canada.

Schowengerdt, R. A., 1997. Remote Sensing: Models and Methods for Image Processing, Second Edition, Academic Press.

Smith, G. M. and E. J. Milton, 1999. The Use of the Empirical Line Method to Calibrate Remotely Sensed Data to Reflectance, Int. J. Remote Sensing, 1999, vol. 20, no. 13, 2653-2662.

Vapnik, V., 1995. The Nature of Statistical Learning Theory, Springer-Verlag, New York.

Yuan, D., and C. D. Elvidge, 1996. Comparison of Relative Radiometric Normalization Techniques, ISPRS Journal of Photogrammetry and Remote Sensing, Volume 51, Number 3, pp. 117-126(10)

Zhu, G., and D. G. Blumberg, 2002. Classification Using ASTER Data and SVM Algorithms; The Case Study of Beer Sheva, Israel, Remote Sensing of Environment, 80 (2): 233-240.

(12)

表 6 嘉義及新竹實驗區之輻狀基底函數類神經網路架構

輸入層節點 隱藏層節點 輸出層節點

嘉義實驗區 12 636 2

新竹實驗區 12 672 2

表 7 嘉義實驗區之分類成果

ML RBF-NN RBF-SVM Linear-SVM tanh-SVM

C 8 32768 32768

γ 0.5 0.001953125

PA% UA% PA% UA% PA% UA% PA% PA% UA% PA%

水稻 74.593 95.922 89.943 90.940 91.346 90.423 84.331 93.530 83.041 94.750 非水稻 95.887 74.426 88.379 87.140 87.454 88.626 92.435 81.978 94.035 81.021

交叉

驗證% 100 95.6897 95.5172

OA% 83.864 89.262 89.651 87.859 87.813 Kappa 0.68228 0.78195 0.78919 0.75661 0.75659 ML:高斯最大似然分類法

RBF-NN:輻狀基底函數類神經網路

RBF-SVM:輻狀基底函數之支持向量機 Linear-SVM:線性之支持向量機

tanh-SVM:兩層式類神經網路之支持向量機

Poly1-SVM Poly2-SVM Poly3-SVM Poly4-SVM Poly5-SVM

C 8192 128 8 2 0.5

γ 2 0.5 0.5 0.5 0.5

PA% UA% PA% UA% PA% UA% PA% UA% PA% UA%

水稻 84.296 93.550 91.174 90.846 91.233 90.770 91.315 90.633 91.065 90.805 非水稻 92.463 81.950 88.086 88.500 87.969 88.555 87.761 88.626 88.041 88.370

交叉

驗證% 95.8621 100 100 100 100

OA% 87.852 89.830 89.812 89.768 89.748 Kappa 0.75649 0.79303 0.79262 0.79165 0.79140 Poly1-SVM:1 階多項式之支持向量機

Poly1-SVM:2 階多項式之支持向量機

Poly3-SVM:3 階多項式之支持向量機 Poly4-SVM:4 階多項式之支持向量機 Poly5-SVM:5 階多項式之支持向量機

(13)

表 8 新竹實驗區之分類成果

ML RBF-NN RBF-SVM Linear-SVM tanh-SVM

C 128 128 2048

γ 0.5 0.03125

PA% UA% PA% UA% PA% PA% UA% PA% UA% PA%

水稻 76.129 80.059 89.842 87.925 85.259 90.595 76.726 92.985 77.107 93.118 非水稻 87.714 83.856 75.704 81.420 84.516 76.621 89.874 68.821 90.031 69.212

交叉

驗證% 100 99.4841 99.4841

OA% 80.343 84.321 84.989 81.508 81.808 Kappa 0.60052 0.67190 0.68269 0.62504 0.63074

Poly1-SVM Poly2-SVM Poly3-SVM Poly4-SVM Poly5-SVM Poly6-SVM

C 32768 512 128 32 32 512

γ 0.0078125 0.5 0.5 0.5 0.5 0.125

PA% UA% PA% UA% PA% UA% PA% UA% PA% UA% PA% UA%

水稻 76.26 3

92.88 1

82.27 2

91.30 9

83.71 1

91.08 9

82.69 2

91.34 9

83.13 4

91.25 3

82.67 7

91.33 1 非水稻 89.77

5

68.37 3

86.30 0

73.56 3

85.67 4

75.04 0

86.29 8

74.02 4

86.06 0

74.46 8

86.27 2

74.00 5 交叉

驗證% 99.5701 100 100 100 100 100

OA% 81.177 83.737 84.004 84.198 84.425 83.985 Kappa 0.61889 0.66120 0.66624 0.66961 0.67341 0.66586

表 9 嘉義實驗區各分類方法之 Z-Test 表 10 新竹實驗區各分類方法之 Z-Test

ML RBF-NN Poly2-SVM ML RBF-NN RBF-SVM ML 54.925 61.473 ML 23.741 27.392

RBF-NN 6.639 RBF-NN 3.713

Poly2-SVM RBF-SVM

(14)

嘉義實驗區

RBF-NN ML Poly2-SVM

新竹實驗區

RBF-NN ML

RBF-SVM

圖 10 嘉義及新竹實驗區之分類成果影像

核 資 料

水稻

分 類 成 果

非水稻

水稻 非水稻

(15)

圖 11 向量及影像格式之檢核資料套疊

RBF-NN ML Poly2-SVM 檢核資料 衛星影像(93/10/12)

圖 12 檢核資料之人為判釋錯誤區域

(16)

Rice Paddy Identification Using the Support Vector Machine

C. C. Chen

1

T. Y. Shih

2

ABSTRACT

This study investigates the application of the Support Vector Machine (SVM) for image classification. The images used for the experiment include multi-temporal Formosat-2 images of the Chiayi area and multi-temporal SPOT images of the Hsinchu area. There are a number of kernel functions to be selected with SVM.

In experiment, Gaussian Maximum Likelihood Classification and Radial Basis Function (RBF) neural network are used for comparison. The Polynomial Kernel Function is the best for Chiayi and RBF is the best for Hsinchu. The overall accuracy is 89.830% for Chiayi and 84.989% for Hsinchu.

The kappa index is 0.79303 for Chiayi and 0.68269 for Hsinchu. In terms of the classification accuracy, Support Vector Machine is shown to be better than Gaussian Maximum Likelihood Classification and Radial Basis Function (RBF) neural network.

Key Words: Multispectral images, Artificial intelligence

1 M.Sc., Department of Civil Engineering, National Chiao-Tung University

2 Professor, Department of Civil Engineering, National Chiao-Tung University

Received Date: Sep. 30, 2006 Revised Date: Sep. 18, 2007 Accepted Date: Sep. 18, 2007

數據

表 1  支持向量機之產生方式                                                表 2  投票策略說明  1  2  3  1  1 2  1 3  2  2 3  3  圖 3 DAG method  處理 5 種類別時之二元且無循環的有向圖(王景南,2002)  3.  影像資料與實驗流程  3.1  影像資料  本研究採用兩組實驗數據進行水稻田辨識作 業,第一組實驗數據為 93 年嘉義地區二期稻作, 採用福衞二號(Formosat-2)影像;第二組實驗數據
表 3  嘉義地區之攝像日期與水稻生育進度                    表 4  新竹地區之攝像日期與水稻生育進度  攝像日期  水稻生育進度  攝像日期  水稻生育進度  93 年 08 月 07 日  插秧~生長期  88 年 03 月 05 日  插秧~生長期  93 年 09 月 29 日  分蘗~幼穗形成  89 年 04 月 18 日  分蘗~幼穗形成  93 年 10 月 12 日  幼穗~抽穗開花  89 年 05 月 09 日  幼穗~抽穗開花  93 年 11 月 08 日
圖 5  嘉義實驗區之檢核影像  圖 6  新竹實驗區之五個時段影像  圖 7  新竹實驗區之檢核影像 03/05 04/1805/0906/0407/25
圖 8  嘉義及新竹實驗區之訓練樣本選取流程  表 5  嘉義及新竹實驗區之水稻及非水稻訓練樣本數  水稻  非水稻  總像元數  嘉義實驗區  310  850  1160  新竹實驗區  481  682  1163  圖 9  嘉義及新竹實驗區之分類實驗流程  4.  實驗成果與分析探討 嘉義及新竹實驗區之輻狀基底函數類神經網 路架構,如表 6,該網路架構以試誤法決定。支持 向量機則以數據正規化及參數優化建立分類模 式。正規化(Normalization)亦即將各屬性值依其 最小值及最大值按比例縮放至
+4

參考文獻

相關文件

2 Distributed classification algorithms Kernel support vector machines Linear support vector machines Parallel tree learning?. 3 Distributed clustering

Keywords Support vector machine · ε-insensitive loss function · ε-smooth support vector regression · Smoothing Newton algorithm..

support vector machine, ε-insensitive loss function, ε-smooth support vector regression, smoothing Newton algorithm..

A convenient way to implement a Boolean function with NAND gates is to obtain the simplified Boolean function in terms of Boolean operators and then convert the function to

“Transductive Inference for Text Classification Using Support Vector Machines”, Proceedings of ICML-99, 16 th International Conference on Machine Learning, pp.200-209. Coppin

Lecture 1: Large-Margin Linear Classification Large-Margin Separating Hyperplane Standard Large-Margin Problem Support Vector Machine.. Reasons behind

3 Distilling Implicit Features: Extraction Models Lecture 14: Radial Basis Function Network. RBF

3. Works better for some tasks to use grammatical tree structure Language recursion is still up to debate.. Recursive Neural Network Architecture. A network is to predict the