實驗設計

第三章頻譜與空間距離分類器

第二節實驗設計

本部分研究目標藉由改變空間訊息的使用方式，增加空間訊息量的使用效能，

使分類器能以較少量樣本訓練，便可獲致不錯的辨識正確率，因此，本節將實驗設計分成四部份說明，第一部份呈現本部分研究之實驗流程；第二部分說明對於所選用的高光譜遙測影像資料，設計兩種符合小樣本情境的訓練樣本數量之隨機抽樣設計；第三部分說明本部分研究實驗比較對象之分類器的參數設定；第四部分則說明本部分研究對於實驗結果的分析方式。

壹、實驗流程

本部分研究旨在結合頻譜與空間訊息於分類器設計，目標藉由改變空間訊息的使用方式，增加空間訊息量的使用效能，使分類器能以較少量樣本訓練，便可獲致令人滿意的辨識正確率。因此，本節說明本部分研究之實驗架構圖與流程圖，

如圖 11 所示：

(a) (b)

圖 11 分類器研究之實驗架構與流程其中(a)為分類器研究之實驗架構圖與(b)流程圖。

本部分研究實驗比較對象之分類器選定

k k

NNC、SVM、MLC、ABC，與本研究提出結合頻譜與空間訊息分類器(SSDC)進行辨識結果比較。

貳、抽樣方式

本研究之實驗對象為高光譜影像資料：Indian Pines、Salinas、Pavia University。

本節呈現本研究針對小樣本情境，並對本研究之實驗對象，使用兩種將資料分成訓練樣本(training sample, Tr)與測試樣本(test sample, Te)的隨機抽樣設計：(1)等先驗機率隨機抽樣(case 1)：設定每類別之訓練樣本為相同個數，隨機抽取訓練樣本後，令其剩餘樣本為測試樣本；(2)不等先驗機率隨機抽樣(case 2)：設定各類別訓練樣本數佔該類別樣本數之比值，隨機抽樣抽取訓練樣本後，令其剩餘樣本為測試樣本。

本研究對 Indian Pines 進行 case 1 的隨機抽樣時，選定訓練樣本數為每類隨機抽取 10 個樣本；由於 Indian Pines 本身在第 1、7、9 類樣本數過少，為避免訓練樣本數過少，導致分類器無法辨識，因此，在進行 case 2 的隨機抽樣時，控制其訓練樣本數為 5，其餘類別則選定訓練樣本數佔該類別樣本數之比值₁₀₀₁₀₀⁵⁵ ，其樣本數如下表所示。

表 6 Indian Pines 之抽樣樣本數與其樣本情境

類別樣本數 case 1 case 2

Tr Te 樣本情境 Tr Te 樣本情境

1 46 10 36 ill-posed 5 41 Poorly posed

2 1428 10 1418 ill-posed 72 1356 Poorly posed 3 830 10 820 ill-posed 42 788 Poorly posed 4 237 10 227 ill-posed 12 225 Poorly posed 5 483 10 473 ill-posed 25 458 Poorly posed 6 730 10 720 ill-posed 37 693 Poorly posed

7 28 10 18 ill-posed 5 23 Poorly posed

8 478 10 468 ill-posed 24 454 Poorly posed

9 20 10 10 ill-posed 5 15 Poorly posed

10 972 10 962 ill-posed 49 923 Poorly posed 11 2455 10 2445 ill-posed 123 2332 Poorly posed 12 593 10 583 ill-posed 30 563 Poorly posed 13 205 10 195 ill-posed 11 194 Poorly posed 14 1265 10 1255 ill-posed 64 1201 Poorly posed 15 386 10 376 ill-posed 20 366 Poorly posed

16 93 10 83 ill-posed 5 88 Poorly posed

總和 10249 160 10089 529 9720

由表 6 可知，case 1 中各類別的訓練樣本數之樣本情境皆為 ill-posed，而 case 2 中各類別的訓練樣本數之樣本情境皆為 poorly posed。

本研究對 Salinas 進行 case 1 的隨機抽樣時，選定訓練樣本數為每類隨機抽取 10 個樣本；在 case 2 的隨機抽樣時，則選定類別訓練樣本數佔該類別樣本數之比值₁₀₀₁₀₀¹¹ ，其樣本數如下表所示。

表 7 Salinas 之抽樣樣本數與其樣本情境

類別樣本數 case 1 case 2

Tr Te 樣本情境 Tr Te 樣本情境

1 2009 10 1999 ill-posed 21 1988 Poorly posed

2 3726 10 3716 ill-posed 38 3688 Poorly posed

3 1976 10 1966 ill-posed 20 1956 Poorly posed

4 1394 10 1384 ill-posed 14 1380 Poorly posed

5 2678 10 2668 ill-posed 27 2651 Poorly posed

6 3959 10 3949 ill-posed 40 3919 Poorly posed

7 3579 10 3569 ill-posed 36 3543 Poorly posed

8 11271 10 11261 ill-posed 113 11158 Poorly posed

9 6203 10 6193 ill-posed 63 6140 Poorly posed

10 3278 10 3268 ill-posed 33 3245 Poorly posed

11 1068 10 1058 ill-posed 11 1057 Poorly posed

12 1927 10 1917 ill-posed 20 1907 Poorly posed

13 916 10 906 ill-posed 10 906 Poorly posed

14 1070 10 1060 ill-posed 11 1059 Poorly posed

15 7268 10 7258 ill-posed 73 7195 Poorly posed

16 1807 10 1797 ill-posed 19 1788 Poorly posed

總和 54129 160 53969 549 53580

由表 7 可知，case 1 中各類別的訓練樣本數之樣本情境皆為 ill-posed，而 case 2 中各類別的訓練樣本數之樣本情境則皆為 poorly posed。

本研究對 Pavia University 進行 case 1 的隨機抽樣時，選定訓練樣本數為每類隨機抽取 10 個樣本；在 case 2 的隨機抽樣時，則選定類別訓練樣本數佔該類別樣本數之比值₁₀₀₁₀₀¹¹ ，其樣本數如下表所示。

表 8 Pavia University 之抽樣樣本數與其樣本情境

類別樣本數 case 1 case 2

Tr Te 樣本情境 Tr Te 樣本情境

1 6631 10 6621 ill-posed 67 6564 Poorly posed

2 18649 10 18639 ill-posed 187 18462 well posed

3 2099 10 2089 ill-posed 21 2078 Poorly posed

4 3064 10 3054 ill-posed 31 3033 Poorly posed

5 1345 10 1335 ill-posed 14 1331 Poorly posed

6 5029 10 5019 ill-posed 51 4978 Poorly posed

7 1330 10 1320 ill-posed 14 1316 Poorly posed

8 3682 10 3672 ill-posed 37 3645 Poorly posed

9 947 10 937 ill-posed 10 937 Poorly posed

總和 42776 90 42686 432 42344

由表 8 可知，case 1 中各類別的訓練樣本數之樣本情境皆為 ill-posed，而 case2 則除了第 2 類的訓練樣本數之樣本情境為 well posed 之外，其他類別的訓練樣本數之樣本情境為 poorly posed。

本研究實驗對象之影像資料集 Indian Pines、Salinas、Pavia University，以上述六種樣本集為抽樣設計，分別重複 10 次，產出抽樣資料集，進行研究實驗，

記錄其結果，並計算辨識正確率。

參、參數設定

本部分研究之實驗中，選定比較對象之分類器：

k k

NNC、SVM、MLC、ABC。

設定

k k

NNC 之近鄰參數

k = 1 k = 1

；SVM 使用 OAA 之 C-SVC，並設定公式(2.9)所需參數

C = 1 C = 1

，且設定所使用核函數為 radial-basis function(RBF)，其中 RBF 所需參數

¾ ¾

以f2f2^{¡ 4}^{¡ 4}; 2; 2^{¡ 1}^{¡ 1}; : : : ; 2; : : : ; 2⁴⁴gg為範圍，使用交叉驗證法(cross validation, CV)，從中 搜尋相對最佳參數；MLC 無需參數設定；ABC 依照原文獻之參數設定[48]，首先於公式(2.22)與公式(2.23)使用 fourth-neighborhood system 搜尋空間域近鄰樣本，

並於公式(2.21)與公式(2.23)設定所需之控制參數¯ = 32¯ = 3 2，且設定重複執行 3 次。

另外，本研究提出分類器 SSDC 公式(3.1)之調配參數

® ®

，以{0, 0.1, …, 1}為範圍，

從中找出相對最佳調配參數，作為分類器研究之實驗參數設定。

肆、分析方式

本部分研究使用混淆矩陣(confusion matrix)[38]記錄分類器之辨識結果，用來計算各類別辨識正確率之平均(average accuracy, AA)、整體辨識正確率(overall accuracy, OA)，以及分類器辨識的內部一致性(

· ·

)[14]，其計算方式以表 9 為範例說明：

表 9 混淆矩陣示意表真實類別

總和類別

1 1 ^{¢ ¢ ¢} ^{¢ ¢ ¢} L L

被辨識類別

1 1 c c

₁₁₁₁

^{¢ ¢ ¢} ^{¢ ¢ ¢} c c

_1L_1L

g g

₁₁

... ... ^{. . .} ^{. . .} ... ...

L

L c c

_L1_L1

^{¢ ¢ ¢} ^{¢ ¢ ¢} c c

_LL_LL

g g

_L_L

總和

f f

¢ ¢ ¢ ¢ ¢ ¢ f f

33 變情形，以及使用主題地圖(thematic maps)呈現辨識結果之實際分布情形。

在文檔中結合頻譜與空間訊息設計於高光譜遙測影像辨識之數學模型研發 (頁 35-42)

第三章 頻譜與空間距離分類器

第二節 實驗設計

壹、 實驗流程

k k

貳、 抽樣方式

參、 參數設定

k k

k k

k = 1 k = 1

C = 1 C = 1

¾ ¾

® ®

肆、 分析方式

· ·

1 1 ¢ ¢ ¢ ¢ ¢ ¢ L L

1

1 c c

¢ ¢ ¢ ¢ ¢ ¢ c c

g g

... ... . . . . . . ... ...

L

L c c

¢ ¢ ¢ ¢ ¢ ¢ c c

g g

f f

¢ ¢ ¢ ¢ ¢ ¢ f f

第三章頻譜與空間距離分類器

第二節實驗設計

壹、實驗流程

貳、抽樣方式

參、參數設定

肆、分析方式

1 1 ^{¢ ¢ ¢} ^{¢ ¢ ¢} L L

^{¢ ¢ ¢} ^{¢ ¢ ¢} c c

... ... ^{. . .} ^{. . .} ... ...

^{¢ ¢ ¢} ^{¢ ¢ ¢} c c