• 沒有找到結果。

實驗描述

第四章 實驗設計

第二節 實驗描述

本節將會完整介紹教育測驗資料集與影像資料集的實驗流程,實驗中所搭配 的分類器為 k 最近鄰分類器中的 1NN (Kuo, Li & Yang, 2009;Kaya, Ersoy &

Kamasak, 2011),與使用核函數為 RBF 的支撐向量機(Baudat & Anouar, 2000;

Camps & Bruzzone, 2005;Melgani & Bruzzone, 2004;Wu & Wang, 2009;紀明宏,

2007)。在使用核函數為 RBF 的支撐向量機時會有兩個參數 C 與

,為了找出最 佳的參數,本研究在參數 C 是使用了交互驗證法搭配網格法,其中網格是設定為

0 9 10

, 2 , , 2 2

C

,而參數

則是運用了由 Li 等人所開發的一種對於支撐向量機之

自動挑選參數法來自動選擇(Li, et al., 2012)。

壹、教育測驗資料集

由於教育測驗資料集總樣本數太少,導至所有的未標記樣本都會使用到,使 得未標記樣本與 k-未標記樣本是一樣的,故本實驗對教育測驗資料集只有比較使 用 SELD 與 ASELD 這兩種特徵萃取法,搭配 1NN 與 SVM 兩種分類器的分類成 果。在實驗中會將整份資料的百分之五十當成是測試樣本(Testing Sample),也就 是說分成測試樣本個數為 178,再將剩下樣本的百分之七十當成是標記樣本,百 分之三十當成是未標記樣本,故標記樣本個數為 124,未標記樣本個數為 54。最 後將標記樣本與未標記樣本運用 SELD 和 ASELD 去計算轉換矩陣。算出轉換矩 陣後,將標記樣本經過轉換矩陣降維後放入分類器去作訓練;經過轉換矩陣降維 後的測試樣本放入分類器作分類。為了降低隨機誤差,本實驗會將此種資料集做 10 次運算後取出平均值當成是最後的分類正確率。

貳、影像資料集

由於影像資料集總樣本數量夠多,所以會比較不同數量的未標記樣本對於分 類正確率的影響,故本實驗對於影像資料集將會比較 SELD、ASELD、kSELD 與 kASELD 四種特徵萃取法,搭配 1NN 與 SVM 兩種分類器的分類成果。

本實驗為了評估訓練樣本大小對於維度之影響,因此使用了二種不同的方案 來分析探究:

N

i

10 N d

(方案一)、

N

i

40 d N

(方案二),

N

i代表第 i 類的 標記樣本數量,N 代表的是標記樣本的總數,也是訓練樣本的總數。方案一與方 案二分別代表不良的狀況(ill-posed)以及不足的狀況(poorly-posed),這兩種情況皆 會導至統計估計不準確,例如共變異數矩陣之反矩陣發生奇異。所謂的 ill-posed 是指訓練樣本總數 N 小於訓練樣本的維度 d,即

N

i

Nd

。由於樣本數目太少 使其統計估計會不準確,例如此方案下的共變異數矩陣不是滿秩的情況,進而導 致共變異數矩陣的反矩陣出現了奇異的情形,因而無法計算出共變異數矩陣之反

矩陣。而 poorly-posed 則是指訓練樣本數 N 大於訓練樣本維度 d,但每個類別的 訓練樣本數

N

i還是小於訓練樣本維度 d,即

N

i

dN

,也就是說在此條件下之 整體統計估計是準確地,但各類別的統計估計會不準確。例如共變異矩陣是屬於 滿致的情形,也能計算出其反矩陣;而各類別的共變異矩陣則處於不是滿秩的情 形況下,使得類別內之共變異矩陣的反矩陣會出現奇異。

而測試樣本的總數則是佔整份影像資料集的百分之三十,至於所使用的四種 特徵萃取法中,所需之未標記樣本或是 k-未標記樣本,則是從整份資料集中扣除 測試樣本與標記樣本後去做隨機選取或是依照挑選 k-未標記樣本的方式來選取,

整個資料集內樣本的分配如圖 4-2-1 所示。在影像資料集中,本實驗也是把標記 樣本與未標記樣本或 k-未標記樣本運用 SELD、ASELD、kSELD、kASELD 去計 算轉換矩陣。將標記樣本透過轉換矩陣降維後放入分類器去作訓練;經過轉換矩 陣降維過的測試樣本放入分類器中作分類。為了降低隨機誤差,本實驗會將此種 資料集作 10 次運算後取出平均值當成是最後的分類正確率。而本實驗亦會討論 未標記樣本(k-未標記樣本)的數量對於特徵萃取的影響。Indian Pine Site 與 Pavia University Scene 影像資料的各種實驗方案之不同樣本數量如表 4-2-1 所示。

圖 4-2-1 資料集內樣本分配圖 表 4-2-1

影像資料各種實驗方案之不同樣本的數量

影像資料 實驗方案

標記樣本數 (N)

測試樣本數 未標記樣本數

Indian Pine Site

方案一 100 2881 400, 800 , … , 6400 方案二 400 2881 400, 800 , … , 6000 Pavia

University

方案一 90 12829 360, 720 , … , 7200 方案二 360 12829 360, 720, … , 7200

相關文件