第四章 材質影像分類實驗
4.1 原始取樣定義描述子的材質分類
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
27
第四章 材質影像分類實驗
此章節要說明的是以本研究所提出的特徵描述子與其他三種主要的特徵描 述子(LBP、CS-ELTP、LTP)在各種不同的條件之下的辨識效果做比較,材質影 像來源是芬蘭 Oulu 大學一個稱為 Outex 的影像資料庫[12]其中的一個 test suite,
共有 24 種不同類別的材質影像(圖 4.1),且每張影像大小同為 128x128 像素,光 源位置、旋轉角度皆固定,性質最單純的一組材質影像,實驗結果將在接下來的 各小節呈現。
圖 4.1 Outex 影像資料庫中做為實驗影像的部分影像
4.1 原始取樣定義描述子的材質分類
在實驗設定方面,本次實驗的材質影像分為 24 種不同的類別,每種類別有 20 張影像,所以總共有 480 張影像,再將每種類別的 20 張影像取其中 10 張為
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
28
訓練樣本,另外的 10 張為測試影像,因此可得到 240 張的訓練樣本,以及 240 張的測試影像。
在實驗方法方面,分別以 LBP、CS-LBP、LTP、CS-LTP2特徵描述子對每張 影像做取樣,取得每張影像以上述四種特徵描述子所描述的特徵編碼。本次實驗 中,所取得的編碼將不經過任何降維的方法,僅比較描述子本身取樣方式對於影 像的描述力,經過降維的描述子通常使用了各自定義的降維方法,如 uniform pattern、直接直方圖合併、Spectral clustering 分群等,所得到的辨識率摻雜了降 維方法影響,並無法單純代表取樣方法的優劣。
其中必須特別強調的是,本實驗中使用的為 LTP 及 CS-LTP,切勿與 ELTP 及 CS-ELTP 發生混淆,未降維的取樣方式在 ELTP 及 CS-ELTP 中是沒有定義的,
因此在本次實驗中未降維的三元編碼方式,只能分別稱為 LTP、CS-LTP,並非 ELTP、CS-ELTP。
在影像辨識方面,為了將效能比較的重點放在特徵描述子上,所以不採用分 類器,而採用最近鄰點(Nearest Neighbor, NN)演算法,排除因為分類器帶來的效 果。利用 Nearest Neighbor 演算法,算出每張測試影像(圖 4.2)與 240 張的訓練樣 本的 Chi square distance,距離最近的影像若為同類別的影像(圖 4.3),即代表辨 識正確。
圖 4.2 測試影像
2 因本次實驗使用原始的編碼定義,未經過降維方法,因此稱 LTP,而不稱 ELTP。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
29
圖 4.3 10 張同類別的訓練樣本
在影像屬性方面,本次實驗所選擇的影像皆為沒有雜訊的影像,且影像的光 源及旋轉的角度皆為固定的,因此本次實驗環境非常單純,沒有其他外在的變數,
得到的測試結果應可代表特徵描述子本身對於影像的描述力。
本次的實驗結果如圖 4.4 所示,四種特徵描述子的辨識率由高到低分別為:
LTP(91.25%)、LBP(91.25%)、CS-LTP(88.33%)、CS-LBP(77.92%)。由此實驗結 果可看出,CS-LTP 與 CS-LBP 由於較少的取樣數,影響了對影像的描述力,得 到了較低的辨識率,的確符合實驗前的推測,但 CS-LTP 的辨識率仍舊優於 CS-LBP。
‧
ELTP 同樣先利用 Uniform Pattern 將維度降成一千多維之後,再利用 Spectral Clustering 將相似的樣式分成 128 群,也就是最後剩下 128 維;CS-ELTP 雖然在 先前 uniform pattern 實驗的結果不甚理想,沒有很明顯的 uniform pattern,但在 本次實驗中依舊使用第四章中定義二的 uniform pattern 觀察辨識率的變化,經降
91.25 91.25
88.33
LTP-6561 LBP-256 CS-LTP-81 CS-LBP-16