第四章 比例式降維法之實驗結果
4.2 人臉辨識
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖4.6 CDR-ELTP 中使用不同分群演算法的於紋理影像辨識的準確率比較圖
從圖4.6 中可以看出,樣式以 spectral clustering 分群,在辨識率上高於利用 k-medoids clustering 分群之樣式,對照表 3.7 中的分群指標來看,雖然後者具有較好的分群結果,
但對描述子卻沒有正面的影響。討論其原因,有可能所使用的分兩個分群指標確實不適 用在評估本研究中的樣式分群。
4.2 人臉辨識
本實驗將比較各種描述方法,於人臉辨識的準確率。實驗依照ELTP 人臉辨識實驗的方 法[6],採用 Yale Face Database B 中的共 10 人的臉部影像,且在 9 種姿勢中選出較接近 正面的6 種,在每種姿勢中,則又包含 64 種光源效果。部分樣本如圖 4.7 所示。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖4.7 人臉辨識實驗中所使用的部分臉部影像
在實驗中,我們從每種姿勢的64 張影像中,隨機取出 32 張作為訓練樣本,其餘為 測試樣本。而特徵描述的方式,參考了A. Hadid 等學者所提出的 LBP 應用於人臉辨識 的方法[14],將人臉影像切成 7x5 個區塊,並對不同區塊賦予不同的權重,如圖 4.8 所 示。其中,由於人臉影像在眼睛周圍的部分較為複雜,也較重要,因此這些區塊被賦予 較高的權重(圖中的白色區塊),而角落的部分,則因可能不屬於臉部範圍,而給予較低 的權重(圖中的黑色區塊)。如此劃分後,分別計算各區塊的特徵直方圖,再將各區塊的 直方圖串接起來,作為人臉影像特徵,串接的方法如圖4.9 所示。
圖4.8 臉部區域劃分及權重分配示意圖
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖4.9 特徵串接示意圖
由於串接後的直方圖維度相當大,以LBP(8,1)為例,每個區塊產生一個 256 維的直 方圖,共有7x5 個區塊,串接後的直方圖維度將是 256x7x5=8960,因此在效能考量下,
我們使用Chi-square KNN 進行分類。
實驗中將比較LBP、使用 uniform pattern 降維的 LBP,維度 59 維的 ELTP,以及維 度在59、128 及 256 維的 CDR-ELTP。而除了測試原始影像的辨識準確率外,也會在影 像中加入數種程度的雜訊,再做比較。實驗結果如表4.5 及圖 4.10 所示。
表4.5 人臉辨識準確率表
SNR LBP ULBP-58+1 ELTP-58+1 CDR-ELTP-59 CDR-ELTP-128 CDR-ELTP-256
w/o noise 95.31 94.48 94.22 94.64 94.84 94.95
40.14 93.39 90.78 84.53 84.48 85.31 87.03
30.99 86.77 81.56 72.76 74.27 74.01 77.08
26.67 76.77 65.26 55.78 58.75 59.9 65.31
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖4.10 人臉辨識準確率比較圖
由實驗結果可以看出,在未加雜訊的情況下,各種描述方式均有很高的準確率,但 在影像加入雜訊後,ELTP 有較大幅度的下滑,其中 ELTP-58+1 下滑的幅度最大,而在 CDR-ELTP 中,取的維度較高者,下滑的幅度較小。整體來說的話,ELTP 的表現沒有 LBP 理想,而 LBP 在未降維的情況下,辨識率下降的幅度為最小。
而針對在以上實驗中,ELTP 表現不如 LBP 的情形,推測可能的原因,是由於原始 影像中,有相當比例的影像過暗,如此整張影像的像素值將會偏低,甚至接近於0,如 此將不利於ELTP 使用的三元的編碼方式,進而影響其表現,如將輸入影像進行前處理,
使平均亮度一致化,應可改善此狀況。