• 沒有找到結果。

第三章 頻譜與空間距離分類器

第二節 實驗設計

本部分研究目標藉由改變空間訊息的使用方式,增加空間訊息量的使用效能,

使分類器能以較少量樣本訓練,便可獲致不錯的辨識正確率,因此,本節將實驗 設計分成四部份說明,第一部份呈現本部分研究之實驗流程;第二部分說明對於 所選用的高光譜遙測影像資料,設計兩種符合小樣本情境的訓練樣本數量之隨機 抽樣設計;第三部分說明本部分研究實驗比較對象之分類器的參數設定;第四部 分則說明本部分研究對於實驗結果的分析方式。

壹、 實驗流程

本部分研究旨在結合頻譜與空間訊息於分類器設計,目標藉由改變空間訊息 的使用方式,增加空間訊息量的使用效能,使分類器能以較少量樣本訓練,便可 獲致令人滿意的辨識正確率。因此,本節說明本部分研究之實驗架構圖與流程圖,

如圖 11 所示:

28

(a) (b)

圖 11 分類器研究之實驗架構與流程 其中(a)為分類器研究之實驗架構圖與(b)流程圖。

本部分研究實驗比較對象之分類器選定

k k

NNC、SVM、MLC、ABC,與本研究提 出結合頻譜與空間訊息分類器(SSDC)進行辨識結果比較。

貳、 抽樣方式

本研究之實驗對象為高光譜影像資料:Indian Pines、Salinas、Pavia University。

本節呈現本研究針對小樣本情境,並對本研究之實驗對象,使用兩種將資料分成 訓練樣本(training sample, Tr)與測試樣本(test sample, Te)的隨機抽樣設計:(1)等先 驗機率隨機抽樣(case 1):設定每類別之訓練樣本為相同個數,隨機抽取訓練樣本 後,令其剩餘樣本為測試樣本;(2)不等先驗機率隨機抽樣(case 2):設定各類別訓 練樣本數佔該類別樣本數之比值,隨機抽樣抽取訓練樣本後,令其剩餘樣本為測 試樣本。

29

本研究對 Indian Pines 進行 case 1 的隨機抽樣時,選定訓練樣本數為每類隨 機抽取 10 個樣本;由於 Indian Pines 本身在第 1、7、9 類樣本數過少,為避免訓 練樣本數過少,導致分類器無法辨識,因此,在進行 case 2 的隨機抽樣時,控制 其訓練樣本數為 5,其餘類別則選定訓練樣本數佔該類別樣本數之比值10010055 ,其樣 本數如下表所示。

表 6 Indian Pines 之抽樣樣本數與其樣本情境

類別 樣本數 case 1 case 2

Tr Te 樣本情境 Tr Te 樣本情境

1 46 10 36 ill-posed 5 41 Poorly posed

2 1428 10 1418 ill-posed 72 1356 Poorly posed 3 830 10 820 ill-posed 42 788 Poorly posed 4 237 10 227 ill-posed 12 225 Poorly posed 5 483 10 473 ill-posed 25 458 Poorly posed 6 730 10 720 ill-posed 37 693 Poorly posed

7 28 10 18 ill-posed 5 23 Poorly posed

8 478 10 468 ill-posed 24 454 Poorly posed

9 20 10 10 ill-posed 5 15 Poorly posed

10 972 10 962 ill-posed 49 923 Poorly posed 11 2455 10 2445 ill-posed 123 2332 Poorly posed 12 593 10 583 ill-posed 30 563 Poorly posed 13 205 10 195 ill-posed 11 194 Poorly posed 14 1265 10 1255 ill-posed 64 1201 Poorly posed 15 386 10 376 ill-posed 20 366 Poorly posed

16 93 10 83 ill-posed 5 88 Poorly posed

總和 10249 160 10089 529 9720

由表 6 可知,case 1 中各類別的訓練樣本數之樣本情境皆為 ill-posed,而 case 2 中各類別的訓練樣本數之樣本情境皆為 poorly posed。

30

本研究對 Salinas 進行 case 1 的隨機抽樣時,選定訓練樣本數為每類隨機抽 取 10 個樣本;在 case 2 的隨機抽樣時,則選定類別訓練樣本數佔該類別樣本數 之比值10010011 ,其樣本數如下表所示。

表 7 Salinas 之抽樣樣本數與其樣本情境

類別 樣本數 case 1 case 2

Tr Te 樣本情境 Tr Te 樣本情境

1 2009 10 1999 ill-posed 21 1988 Poorly posed

2 3726 10 3716 ill-posed 38 3688 Poorly posed

3 1976 10 1966 ill-posed 20 1956 Poorly posed

4 1394 10 1384 ill-posed 14 1380 Poorly posed

5 2678 10 2668 ill-posed 27 2651 Poorly posed

6 3959 10 3949 ill-posed 40 3919 Poorly posed

7 3579 10 3569 ill-posed 36 3543 Poorly posed

8 11271 10 11261 ill-posed 113 11158 Poorly posed

9 6203 10 6193 ill-posed 63 6140 Poorly posed

10 3278 10 3268 ill-posed 33 3245 Poorly posed

11 1068 10 1058 ill-posed 11 1057 Poorly posed

12 1927 10 1917 ill-posed 20 1907 Poorly posed

13 916 10 906 ill-posed 10 906 Poorly posed

14 1070 10 1060 ill-posed 11 1059 Poorly posed

15 7268 10 7258 ill-posed 73 7195 Poorly posed

16 1807 10 1797 ill-posed 19 1788 Poorly posed

總和 54129 160 53969 549 53580

由表 7 可知,case 1 中各類別的訓練樣本數之樣本情境皆為 ill-posed,而 case 2 中各類別的訓練樣本數之樣本情境則皆為 poorly posed。

31

本研究對 Pavia University 進行 case 1 的隨機抽樣時,選定訓練樣本數為每 類隨機抽取 10 個樣本;在 case 2 的隨機抽樣時,則選定類別訓練樣本數佔該類 別樣本數之比值10010011 ,其樣本數如下表所示。

表 8 Pavia University 之抽樣樣本數與其樣本情境

類別 樣本數 case 1 case 2

Tr Te 樣本情境 Tr Te 樣本情境

1 6631 10 6621 ill-posed 67 6564 Poorly posed

2 18649 10 18639 ill-posed 187 18462 well posed

3 2099 10 2089 ill-posed 21 2078 Poorly posed

4 3064 10 3054 ill-posed 31 3033 Poorly posed

5 1345 10 1335 ill-posed 14 1331 Poorly posed

6 5029 10 5019 ill-posed 51 4978 Poorly posed

7 1330 10 1320 ill-posed 14 1316 Poorly posed

8 3682 10 3672 ill-posed 37 3645 Poorly posed

9 947 10 937 ill-posed 10 937 Poorly posed

總和 42776 90 42686 432 42344

由表 8 可知,case 1 中各類別的訓練樣本數之樣本情境皆為 ill-posed,而 case2 則除了第 2 類的訓練樣本數之樣本情境為 well posed 之外,其他類別的訓 練樣本數之樣本情境為 poorly posed。

本研究實驗對象之影像資料集 Indian Pines、Salinas、Pavia University,以上 述六種樣本集為抽樣設計,分別重複 10 次,產出抽樣資料集,進行研究實驗,

記錄其結果,並計算辨識正確率。

32

參、 參數設定

本部分研究之實驗中,選定比較對象之分類器:

k k

NNC、SVM、MLC、ABC。

設定

k k

NNC 之近鄰參數

k = 1 k = 1

;SVM 使用 OAA 之 C-SVC,並設定公式(2.9)所需 參數

C = 1 C = 1

,且設定所使用核函數為 radial-basis function(RBF),其中 RBF 所需 參數

¾ ¾

以f2f2¡ 4¡ 4; 2; 2¡ 1¡ 1; : : : ; 2; : : : ; 244gg為範圍,使用交叉驗證法(cross validation, CV),從中 搜尋相對最佳參數;MLC 無需參數設定;ABC 依照原文獻之參數設定[48],首 先於公式(2.22)與公式(2.23)使用 fourth-neighborhood system 搜尋空間域近鄰樣本,

並於公式(2.21)與公式(2.23)設定所需之控制參數¯ = 32¯ = 3 2,且設定重複執行 3 次。

另外,本研究提出分類器 SSDC 公式(3.1)之調配參數

® ®

,以{0, 0.1, …, 1}為範圍,

從中找出相對最佳調配參數,作為分類器研究之實驗參數設定。

肆、 分析方式

本部分研究使用混淆矩陣(confusion matrix)[38]記錄分類器之辨識結果,用來 計算各類別辨識正確率之平均(average accuracy, AA)、整體辨識正確率(overall accuracy, OA),以及分類器辨識的內部一致性(

· ·

)[14],其計算方式以表 9 為範例 說明:

表 9 混淆矩陣示意表 真實類別

總和 類別

1 1 ¢ ¢ ¢ ¢ ¢ ¢ L L

被 辨 識 類 別

1

1 c c

1111

¢ ¢ ¢ ¢ ¢ ¢ c c

1L1L

g g

11

... ... . . . . . . ... ...

L

L c c

L1L1

¢ ¢ ¢ ¢ ¢ ¢ c c

LLLL

g g

LL

總和

f f

11

¢ ¢ ¢ ¢ ¢ ¢ f f

LL

33 變情形,以及使用主題地圖(thematic maps)呈現辨識結果之實際分布情形。

34

相關文件