第四章 實驗結果與評估
4.1 實驗步驟
4.1.1 前置處理
第四章 實驗結果與評估
4.1 實驗步驟
本研究使用華盛頓大學之Groundtruth影像註解資料庫1進行作為實驗之訓練與測試 資料集。該影像註解資料庫中所有影像均已具透過人工方式給予適當之註解,註解結果 廣泛受到研究學者所認可與採用,因此本研究採用此影像註解資料庫進行本研究之實驗 資料庫。此資料庫依據其影像內容共分別分為二十一個類別共 1109 張影像。本研究將 所有影像及其註解依 3.1 節所述方法轉換為特徵向量。雖然該影像資料集中影像之大笑 並非相同,但本研究經過正規化處理後可克服此問,轉換後之影像特徵向量之長度為 512,而註解特徵向量長度為 435。而後我們透過GHSOM分別對所有影像與註解之特徵 向量進行訓練,本研究將資料集分別各 1109 份之影像與註解文件作為研究之訓練資料。
本研究使用Rauber的研究團隊所開發的GHSOM套件2進行影像與註解階層關聯性發 掘,影像與註解分別經過GHSOM訓練後可別得到影像關聯階層與註解關聯階層。而後 再依 3.3 節所述之方法進行註解群集與影像群集進行對應。本研究於訓練資料集中選取 百分之二十之影像作為測試集合。最後則依 3.4 節的方法進行新進影像註解測試。
4.1.1 前置處理
本研究前置處理部分包括影像特徵向量擷取以及註解特徵向量擷取,本研究採用空 間向量模型做為特徵向量表達模式,其中影像特徵向量擷取過程包括影像色彩直方圖計 算以及能量頻譜計算之向量轉換過程,而註解特徵向量擷取過程則包括重複註解去除以 及向量空間轉換過程。首先介紹影像特徵向量擷取過程,以下圖 4-1-1(a)為測試資料庫 中影像 australia1 為例:
1 http://www.cs.washington.edu/research/imagedatabase/groundtruth/
圖 4-1-1 測試 australia1 影像資料
本研究所採用之影像資料庫內容種類繁多,下圖為此影像經過 3.1 節所描述之轉換 方式所得到之能量頻譜圖:
圖 4-1-2 測試影像 australia1 之能量頻譜圖
在經過 3.1 節所描述之方法將原始影像與轉換為能量頻譜圖影像進行色彩直方圖 與能量頻譜轉換後可得到一長度為 512 之影像專屬特徵向量,下圖為測試影像 australia1 之影像特徵向量:
圖 4-1-3 測試影像 australia1 特徵向量
接著說明註解特徵向量擷取過程,以影像 australia1 所對應到之註解文件為例。首 先針對所有影像之註解進行重複字詞篩選,將所有重複字詞去除得到一包含有所有影像 註解且不重複之字彙集,在本研究中,字彙集長度為 435。接著進行註解向量轉換。在 經過 3.1 節所說明之處理過程後可得到此註解文件之特徵向量如下圖 4-1-5
圖 4-1-5 註解文件 australia1 之特徵向量
重複執行上述步驟直到將所有本研究採用之影像與註解文件之特徵向量均計算完成 後,前置處理過程即宣告完成,之後接續進行對前置處理後的資料進行分群處理。