第四章 人臉辨識演算法
4.1 影像的前置處理
4.1.1 人臉正規化
人臉的五官會隨著體形的高矮胖瘦不同而有所差異,即使是相同身材 的人,其臉孔五官往往也有明顯的差異,而這些差異也就是辨識身份的個 人重要特徵。因此,為了要達到提高辨識率的目標,除了要有強健的辨識 演算法之外,我們可將收集到的雜亂無章的資料,整理成比較有規則的情 況,例如目標物在不同圖片的位置都不一樣,我們可找出正確的位置並將 其擷取出來,用來減少輸入影像資料間的差異性,以得到標準的影像形式。
以Yale_B 人臉資料庫為例,我們將影像切成 88 × 112的大小,進行人臉辨 識。
4.1.2 色彩空間轉換
由於影像的色彩很容易受到光源強弱的影響而有所變化,所以直接在 RGB 色彩空間做處理時,會產生嚴重的誤差,因此我們採用可對光源處理 的YCbCr 色彩空間。
4.1.2.1 RGB
RGB 為彩色影像的三原色(Primary Color),R 代表紅色光成份、G 代 表綠色光成份、B 代表藍色光成份。而一般所謂的全彩色是由 R、G、B 三 種不同成份所組成,其全彩影像為24 位元(若是灰階影像為 8 位元),也 就是R、G、B 分別佔 8 位元,其值域範圍為 0-255。以錐狀體為例,來說 明三種顏色對光線的靈敏度,其主要負責眼睛彩色視覺的感應器,人眼中 大約有600-700 萬個錐形體,其中 65%可以感應紅光,33 %可以感應到綠 光,2%可以感應藍光;可見光的波長範圍為:400-700nm,紅光的波長範 圍為:450-700nm,綠光的波長範圍為:430-680nm,藍光的波長範圍為:
310-560nm;在可見光與 R、G、B 波長範圍對人眼的感應,得知人眼對藍 光比較不靈敏。
4.1.2.2 YCbCr
YCbCr 色彩空間用於數位視訊中,其中 Y 代表亮度成份,Cb 代表是藍 色成份與參考值的差距、Cr 代表是紅色成份與參考值的差距。如(4-1)式 為RGB 與 YCbCr 色彩空間轉換公式。
(4-1)
0.299 0.587 0.114 0
0.1687 0.3313 0.5 128 0.5 0.4187 0.0813 128
Y R
Cb G
Cr B
⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤
⎢ ⎥ ⎢= − − ⎥ ⎢ ⎥ ⎢+ ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ ⎥ ⎢ − − ⎥ ⎢ ⎥ ⎢ ⎥
⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦
4.1.3 區域性對比增強
由於每張影像被拍攝的光線常常是不均勻的,而眼睛對亮度相對之間 的感覺較亮度之間的絕對差值有較大的靈敏度,與真實的亮度強度絕對值 沒有關聯。若光以亮度來看,並不是整張影像都一樣,而是根據亮度強度 的變化會群聚成小塊區域來分佈。如圖 4-1 所示,我們對影像以區域性的 contrast enhancement,可以增強區域性的影像對比,若以 5 × 5 像素為一 個區塊,計算此區塊的平均亮度( )如(4-2)式,為了避免(4-3)
式的分母為 0,若是小於
Lavg
θ則將 設為 0。否則可以利用(4-3)式算出 平均值與中心點( )的差異,為了不讓亮暗差異過大,可以選在logarithm domain 下做處理,最後將結果正規化回來之後,可將影像的細節保存下來。
因此前處理可以將這些可能影響辨識結果的變因做某個程度的去除,可以 強化對於辨識有幫助的特徵且能夠在訓練工作執行時更容易把我們所要的 特徵取出來,因此可以使辨識的效果更好。
value Li
∑∑
(4-2)= =
= 5
1 5
1
i j
Lij
Lavg
) / log(Li Lavg
value= (4-3) 其中Li為中心點的亮度,Lavg為 5×5 區塊的平均亮度
threshold Yes N o
Log(center/avg) 0
Norm alize local contrast Li
Norm alize local contrast Size :5 x 5 log(Li Lavg
threshold Yes N o
Log(center/avg) 0
Norm alize local contrast Li
Norm alize local contrast Size :5 x 5 log(Li Lavg
圖4-1 區域對比增強流程示意圖