• 沒有找到結果。

姿勢相似值計算

三、 實驗方法

3.3 結合身體與臉部相似資訊

3.3.2 姿勢相似值計算

本論文的重點即是如何提升人臉辨識的準確度,而其中所使用的資訊就是姿勢相似 值的計算。根據第二章內容所提到的,若能事先將資料庫的影像以固定座標角度來校正,

能夠明顯的提升辨識的正確率。而現今就有許多學者們致力於這個領域,但所用的方法 計算量越來越大,而對於座標 (人臉特徵) 的偵測卻沒有非常高的可信賴度。最常見的 方式如眼睛嘴巴的偵測,此方法的優點是能精確的校正臉的位置以及角度,但最大的問 題即是若發生偵測錯誤,對於後續辨識造成的反效果讓人難以接受。

在本實驗中所用的方法為姿勢的判定,根據[25]的實驗結果,我們可以透過所謂的 Gabor Wavelet Transform Filter 來對臉部影像作遮罩,目的是取的此臉部的紋理,但在從 他的實驗中可以知道,透過不同方向及頻率的 Gabor Wavelet Transform 作遮罩,再將取 得的資訊作 PCA(Principle Component Analysis) 降低維度,投影至三個維度後,可以看 見不同旋轉角度的人臉均勻且分散的座落在此三維空間中。圖 3-9 是對同一張臉使用不 同角度及頻率的遮罩結果,可以看見取得紋理的強度是根據頻率的大小。

圖 3-9 共 12 種不同方向及頻率大小的 Gabor Transform 以及其結果。

在左上方的為原始圖型,每一行都代表正弦波的一種方向,不同列則是相 異的頻率變化,由上至下頻率越來越大,在此限定高斯只包含兩個完整的 正弦波波型。

(8)

公式(8)為 Gabor Wavelet Transform 的計算公式,而此公式只包含實數部分,因在計 算數值時,我們將虛數忽略不處理。其中 代表此遮罩中的正弦波之係數,本實驗 以高斯所涵蓋的區域限制兩個正弦波大小。而 代表此 Gabor Wavelet Transform 中 波的行進方向,本實驗使了 0、45、90、135 共四種角度, 是指正弦波的偏移量,

一般而言將原點為波峰或是設在零點都可以,在此設為 。 是高斯函數的變異 量係數,用來控制其分部寬度。而 是此遮罩的寬高比例參數,在本實驗中因只使 用圓形遮罩,故將此值設為 1 即可。

在[25]中投影的基底大小為 3,但在經過簡單的實驗測詴後,發現若是要得到如此 偏文章中如此完美的數據,勢必是在資料庫中作了非常優良的一般化,意思即是這些人 臉影像可能在拍攝時都是使用同一台攝影器材,同樣的背景,同樣的光源。在圖 3-10 中的彩色符號為我自行收集的人臉資料下所呈現之分布圖。經過觀察,不難發現這些數 據點的前進方向與人臉的轉動方向一致,也就是除了在其他文章中提到可以使用此方法 分辨出最接近正面的人臉,我利用這特性將不同角度的臉以數字來呈現相似程度。本實 驗利用自行收集的人臉來測詴,發現實際在複雜背景及增加臉部配件的情況下,三維空 間的分布會呈現兩種進行方向。此現象發生的可能原因之二即是前面提到的情況,因此 在我們實驗後,發現若將投影空間維度降至一維,所得到的空間分布會比三維還要穩定。

其優點是不同角度的人臉能在一維空間穩定的分布,但不像三維空間中可以有額外資訊 來分辨左側臉、正臉及右側臉。由於本實驗目的是取得兩張臉之間的相異度(相似度),

故採取一維空間的投影,再用歐式距離來計算兩張臉的相似度。

圖 3-10 最上方為人臉旋轉角度與顏色變化的示意圖。

中間的座標圖為投影至三維空間,而可看出相對距離較為混雜。

下圖為投影至一維空間,縱坐標是群組代號,橫坐標是一維空間的數值。

經過以上的實驗,於是我利用此一維空間的特性,使用兩張臉之間的距離來計算相 似度。根據指數函式,我們可以輕易的將相異程度透過公式轉成相似值。

; (9)

公式(9)中的 代表兩張臉之間姿勢的相似度。 表示歐式距離,在此 因為我最後採納的是投影到一維度空間的方式計算,所得到的單一數值直接相減後取絕

對值即可。利用指數的公式將相似度限制在 0 到 1 間,而 1 代表完全相同。經過以上所 有步驟,我們透過了 Gabor Wavelet Transform 的紋理提取,經過 PCA(Principle Component Analysis) 將空間維度降至 1 維,再透過指數函數將距離轉換為相似度後,對於每兩張 臉之間都可以計算出彼此間姿勢的相似程度,在後面章節會以此為附加資訊來整合臉部 辨識。

相關文件