第二章、 人臉偵測與特徵點擷取
2.1. 人臉偵測
本研究之人臉偵測包含人臉區域決定,與人臉區域正規化二個部份。藉由攝 影機擷取解析度為640 × 480之影像,偵測其中之人臉,以取得人臉區域。為了 避 免 人 臉 大 小 遠 近 影 響 擷 取 之 特 徵 , 本 研 究 對 人 臉 區 域 進 一 步 正 規 化 至 200 × 240之人臉影像。
2.1.1. 人臉區域決定
本研究人臉區域之決定,使用 Viola 與 Jones 所提出名為 AdaBoost[30]之方 法從輸入影像中,取得人臉區域範圍,此範圍即為情緒辨識特徵擷取之依據。
AdaBoost 演算法主要概念在於透過多個弱分類器組成一個強分類器,藉由數個 分類特徵對目標物做分析,分析哪些特徵能夠清楚分類目標物,分類目標物正確 率愈高之特徵則被選定為弱分類器,經由數個弱分類器之組合,若分類目標物之 正確率達到需求以上,則停止尋找弱分類器。因此欲利用 AdaBoost 演算法分類 人臉與非人臉,則必須找出適當之輸入特徵。
17
a. Haar-like 矩形特徵:
利用矩形特徵可以簡單描述圖形的結構,當然也可以用來當作檢測人臉之特 徵模版,最早由[30]所提出之矩形特徵,如圖 2-1 所示。矩形特徵主要藉由分析 物體表面亮度變化會造成明亮區塊與灰暗區塊,對物件做偵測。因此利用已知偵 測目標之矩形特徵與目標做比對,可用來判斷是否為目標物。應用於人臉偵測方 面,矩形特徵可以分析臉部之陰影變化,有效分類人臉與非人臉,例如:眼睛與 眼皮產生之陰影如圖 2-2(b)所示,鼻梁與眼窩產生的陰影如圖 2-2(c)所示,又或 者是嘴巴與其周圍產生的陰影如圖 2-2(d)所示等,亦即可利用白色區域像素與黑 色區域像素的差值,做為偵測人臉特徵。
Lienhart 與 Maydt[31]將[30]所提出之矩形特徵推廣至旋轉 45 度之 Haar-Like 矩形特徵,共包含 15 個矩形特徵模版如圖 2-3 所示,本研究以此特徵做為人臉 偵測之依據,Adaboost 訓練與分類之方法如下所述。
圖 2-1、Viola 與 Jones 提出之 Haar-like 矩形特徵。
(a) (b)
18
(c) (d)
圖 2-2、人臉偵測之矩形特徵範例。(a)原始人臉影像樣本,(b)眼睛與眼皮灰階值 色差,(c)眼窩與鼻樑灰階值色差,(d)嘴巴周圍灰階值色差。
(a)
(b)
(c) (d)
圖 2-3、Lienhart 與 Maydt 提出之 Haar-like 矩形特徵。 (a)邊緣特徵,(b)線特徵,
(c)中心環繞特徵,(d)特殊對角特徵。
19
b. Adaboost 訓練演算法:
Adaboost 之訓練可從一個很大的特徵,集中選擇很小一部分之關鍵特徵,產 生有效之分類器。透過提高數個簡單之弱分類器,最後組成強分類器,其訓練錯 誤率可以說幾乎為零,具備良好之推廣性。
Adaboost 應用於人臉偵測方面,需要有足夠數量之樣本,進行人臉特徵之搜 尋。此處樣本影像分為人臉與非人臉兩種,非人臉影像數量需大於人臉影像數量,
使搜尋之結果收斂到辨識率較佳之特徵上。
c. 串接分類器:
Adaboost 演算法雖然可藉由強分類器,有效區分人臉與非人臉,但事實上大 多數的影像皆為非人臉,且大部份非人臉皆可利用更簡單的方法做區別,故並非 所有影像皆需由強分類器做人臉與非人臉之判斷。
由[30]所提出的串聯式偵測架構,如圖 2-4 所示,透過分級分類器對影像逐 步做分析,級數愈前面,可用愈少的計算量排除大多數非人臉,級數較後者則愈 難判斷人臉與非人臉,必須使用強分類器做分類,如此之系統架構則可以有效提 高辨別速度。
All sub-windows
Reject sub-window
Further processing
1 2 3
F F F
T
T T
圖 2-4、串接分類器架構圖。
20
2.1.2. 人臉影像正規化
本研究藉由雙線性內插之方法[35],將人臉區域影像正規化至200 × 240,
重新計算人臉影像之像素(Pixel)值,以降低人臉遠近大小等因素之影響。雙線性 內插法利用鄰近已知 Pixel 值f(x, y),計算新影像之 Pixel 值f(x′, y′),其計算方式 如(2-1)所示。雙線性內插方法示意如圖 2-5 所示,白點為原解析度 Pixel 值,黑 點為預估測新解析度 Pixel 值。
f(x′, y′) = (1 − λ) × [(1 − u) × f(x, y) + u × f(x, y + 1)]
+λ × [(1 − u) × f(x + 1, y) + u × f(x + 1, y + 1)], λ = x′− x
(x + 1) − x, u = y′− y
(y + 1) − y, (2 − 1)