姿勢相似值計算

三、實驗方法

3.3 結合身體與臉部相似資訊

3.3.2 姿勢相似值計算

本論文的重點即是如何提升人臉辨識的準確度，而其中所使用的資訊就是姿勢相似值的計算。根據第二章內容所提到的，若能事先將資料庫的影像以固定座標角度來校正，

能夠明顯的提升辨識的正確率。而現今就有許多學者們致力於這個領域，但所用的方法計算量越來越大，而對於座標 (人臉特徵) 的偵測卻沒有非常高的可信賴度。最常見的方式如眼睛嘴巴的偵測，此方法的優點是能精確的校正臉的位置以及角度，但最大的問題即是若發生偵測錯誤，對於後續辨識造成的反效果讓人難以接受。

在本實驗中所用的方法為姿勢的判定，根據[25]的實驗結果，我們可以透過所謂的 Gabor Wavelet Transform Filter 來對臉部影像作遮罩，目的是取的此臉部的紋理，但在從他的實驗中可以知道，透過不同方向及頻率的 Gabor Wavelet Transform 作遮罩，再將取得的資訊作 PCA(Principle Component Analysis) 降低維度，投影至三個維度後，可以看見不同旋轉角度的人臉均勻且分散的座落在此三維空間中。圖 3-9 是對同一張臉使用不同角度及頻率的遮罩結果，可以看見取得紋理的強度是根據頻率的大小。

圖 3-9 共 12 種不同方向及頻率大小的 Gabor Transform 以及其結果。

在左上方的為原始圖型，每一行都代表正弦波的一種方向，不同列則是相異的頻率變化，由上至下頻率越來越大，在此限定高斯只包含兩個完整的正弦波波型。

(8)

公式(8)為 Gabor Wavelet Transform 的計算公式，而此公式只包含實數部分，因在計算數值時，我們將虛數忽略不處理。其中代表此遮罩中的正弦波之係數，本實驗以高斯所涵蓋的區域限制兩個正弦波大小。而代表此 Gabor Wavelet Transform 中波的行進方向，本實驗使了 0、45、90、135 共四種角度，是指正弦波的偏移量，

一般而言將原點為波峰或是設在零點都可以，在此設為。是高斯函數的變異量係數，用來控制其分部寬度。而是此遮罩的寬高比例參數，在本實驗中因只使用圓形遮罩，故將此值設為 1 即可。

在[25]中投影的基底大小為 3，但在經過簡單的實驗測詴後，發現若是要得到如此偏文章中如此完美的數據，勢必是在資料庫中作了非常優良的一般化，意思即是這些人臉影像可能在拍攝時都是使用同一台攝影器材，同樣的背景，同樣的光源。在圖 3-10 中的彩色符號為我自行收集的人臉資料下所呈現之分布圖。經過觀察，不難發現這些數據點的前進方向與人臉的轉動方向一致，也就是除了在其他文章中提到可以使用此方法分辨出最接近正面的人臉，我利用這特性將不同角度的臉以數字來呈現相似程度。本實驗利用自行收集的人臉來測詴，發現實際在複雜背景及增加臉部配件的情況下，三維空間的分布會呈現兩種進行方向。此現象發生的可能原因之二即是前面提到的情況，因此在我們實驗後，發現若將投影空間維度降至一維，所得到的空間分布會比三維還要穩定。

其優點是不同角度的人臉能在一維空間穩定的分布，但不像三維空間中可以有額外資訊來分辨左側臉、正臉及右側臉。由於本實驗目的是取得兩張臉之間的相異度(相似度)，

故採取一維空間的投影，再用歐式距離來計算兩張臉的相似度。

圖 3-10 最上方為人臉旋轉角度與顏色變化的示意圖。

中間的座標圖為投影至三維空間，而可看出相對距離較為混雜。

下圖為投影至一維空間，縱坐標是群組代號，橫坐標是一維空間的數值。

經過以上的實驗，於是我利用此一維空間的特性，使用兩張臉之間的距離來計算相似度。根據指數函式，我們可以輕易的將相異程度透過公式轉成相似值。

， ; (9)

公式(9)中的代表兩張臉之間姿勢的相似度。表示歐式距離，在此因為我最後採納的是投影到一維度空間的方式計算，所得到的單一數值直接相減後取絕

對值即可。利用指數的公式將相似度限制在 0 到 1 間，而 1 代表完全相同。經過以上所有步驟，我們透過了 Gabor Wavelet Transform 的紋理提取，經過 PCA(Principle Component Analysis) 將空間維度降至 1 維，再透過指數函數將距離轉換為相似度後，對於每兩張臉之間都可以計算出彼此間姿勢的相似程度，在後面章節會以此為附加資訊來整合臉部辨識。

在文檔中根據姿勢與外貌整合的影像人臉註記 (頁 24-28)

三、 實驗方法

3.3 結合身體與臉部相似資訊

3.3.2 姿勢相似值計算

三、實驗方法