人臉偵測

第二章、人臉偵測與特徵點擷取

2.1. 人臉偵測

本研究之人臉偵測包含人臉區域決定，與人臉區域正規化二個部份。藉由攝影機擷取解析度為640 × 480之影像，偵測其中之人臉，以取得人臉區域。為了避免人臉大小遠近影響擷取之特徵，本研究對人臉區域進一步正規化至 200 × 240之人臉影像。

2.1.1. 人臉區域決定

本研究人臉區域之決定，使用 Viola 與 Jones 所提出名為 AdaBoost[30]之方法從輸入影像中，取得人臉區域範圍，此範圍即為情緒辨識特徵擷取之依據。

AdaBoost 演算法主要概念在於透過多個弱分類器組成一個強分類器，藉由數個分類特徵對目標物做分析，分析哪些特徵能夠清楚分類目標物，分類目標物正確率愈高之特徵則被選定為弱分類器，經由數個弱分類器之組合，若分類目標物之正確率達到需求以上，則停止尋找弱分類器。因此欲利用 AdaBoost 演算法分類人臉與非人臉，則必須找出適當之輸入特徵。

a. Haar-like 矩形特徵：

利用矩形特徵可以簡單描述圖形的結構，當然也可以用來當作檢測人臉之特徵模版，最早由[30]所提出之矩形特徵，如圖 2-1 所示。矩形特徵主要藉由分析物體表面亮度變化會造成明亮區塊與灰暗區塊，對物件做偵測。因此利用已知偵測目標之矩形特徵與目標做比對，可用來判斷是否為目標物。應用於人臉偵測方面，矩形特徵可以分析臉部之陰影變化，有效分類人臉與非人臉，例如：眼睛與眼皮產生之陰影如圖 2-2(b)所示，鼻梁與眼窩產生的陰影如圖 2-2(c)所示，又或者是嘴巴與其周圍產生的陰影如圖 2-2(d)所示等，亦即可利用白色區域像素與黑色區域像素的差值，做為偵測人臉特徵。

Lienhart 與 Maydt[31]將[30]所提出之矩形特徵推廣至旋轉 45 度之 Haar-Like 矩形特徵，共包含 15 個矩形特徵模版如圖 2-3 所示，本研究以此特徵做為人臉偵測之依據，Adaboost 訓練與分類之方法如下所述。

圖 2-1、Viola 與 Jones 提出之 Haar-like 矩形特徵。

(a) (b)

圖 2-2、人臉偵測之矩形特徵範例。(a)原始人臉影像樣本，(b)眼睛與眼皮灰階值色差，(c)眼窩與鼻樑灰階值色差，(d)嘴巴周圍灰階值色差。

(a)

(b)

圖 2-3、Lienhart 與 Maydt 提出之 Haar-like 矩形特徵。 (a)邊緣特徵，(b)線特徵，

(c)中心環繞特徵，(d)特殊對角特徵。

b. Adaboost 訓練演算法：

Adaboost 之訓練可從一個很大的特徵，集中選擇很小一部分之關鍵特徵，產生有效之分類器。透過提高數個簡單之弱分類器，最後組成強分類器，其訓練錯誤率可以說幾乎為零，具備良好之推廣性。

Adaboost 應用於人臉偵測方面，需要有足夠數量之樣本，進行人臉特徵之搜尋。此處樣本影像分為人臉與非人臉兩種，非人臉影像數量需大於人臉影像數量，

使搜尋之結果收斂到辨識率較佳之特徵上。

c. 串接分類器：

Adaboost 演算法雖然可藉由強分類器，有效區分人臉與非人臉，但事實上大多數的影像皆為非人臉，且大部份非人臉皆可利用更簡單的方法做區別，故並非所有影像皆需由強分類器做人臉與非人臉之判斷。

由[30]所提出的串聯式偵測架構，如圖 2-4 所示，透過分級分類器對影像逐步做分析，級數愈前面，可用愈少的計算量排除大多數非人臉，級數較後者則愈難判斷人臉與非人臉，必須使用強分類器做分類，如此之系統架構則可以有效提高辨別速度。

All sub-windows

Reject sub-window

Further processing

1 2 3

F F F

T T

圖 2-4、串接分類器架構圖。

2.1.2. 人臉影像正規化

本研究藉由雙線性內插之方法[35]，將人臉區域影像正規化至200 × 240，

重新計算人臉影像之像素(Pixel)值，以降低人臉遠近大小等因素之影響。雙線性內插法利用鄰近已知 Pixel 值f(x, y)，計算新影像之 Pixel 值f(x^′, y^′)，其計算方式如(2-1)所示。雙線性內插方法示意如圖 2-5 所示，白點為原解析度 Pixel 值，黑點為預估測新解析度 Pixel 值。

f(x^′, y^′) = (1 − λ) × [(1 − u) × f(x, y) + u × f(x, y + 1)]

+λ × [(1 − u) × f(x + 1, y) + u × f(x + 1, y + 1)], λ = x^′− x

(x + 1) − x, u = y^′− y

(y + 1) − y, (2 − 1)

在文檔中基於時間強化設計之情緒辨識方法 (頁 26-30)

第二章、 人臉偵測與特徵點擷取