人臉偵測

第二章文獻探討

第一節人臉偵測

學者們對於人臉偵測已有相當多且成熟的研究，Yang [1] 有統合整理，將人臉偵測方法分為四類：Knowledge-Based、Feature Invariant、Template Matching 與 Appearance-Based，如表一所列。

(1) Knowledge-Based

靠著臉部的外觀型態來作人臉的定義，例如人臉對稱的眼睛、鼻子與嘴巴，互相之間的距離、相對位置關係來建立人臉規則，有助於將人臉資訊簡單化。但人臉會因為人種、性別等相異的變化因素，使得資訊差距相當大，

建立規則不容易，要考慮制定的方式是否符合所有人臉的五官特性。如果要求過於嚴苛，勢必會降低辨識率；反之，則降低準確度。

表 1、Yang [1] 整理之人臉偵測方法與本研究所用之方法。

類型 使用方法

Knowledge-Based

Multiresolution rule-based method [2]

Feature Invariant

- Facial Features Grouping of edges [3] [4]

- Texture Space Gray-Level Dependence matrix (SGLD) of face pattern [5]

- Skin Color Mixture of Gaussian [6] [7]

- Multiple Features Integration of skin color, size and shape [8]

Template Matching

- Predefined Face Templates Shape template [9]

- Deformable Templates Active Shape Model (ASM) [10]

Appearance-Based

- Eigenface Eigenvector decomposition and clustering [11]

- Distribution Based Gaussian distribution and multilayer perception [12]

- Neural Network Ensemble of neural networks and arbitration schemes [13]

- Support Vector Machine(SVM) SVM with polynomial kernel [14]

- Naive Bayes Classifier Joint statistic of local appearance and position [15]

- Hidden Markov Model (HMM) Higher order statistic with HMM [16]

- Information Theoretical Approach Kullback relative information [17] [18]

- AdaBoost Learning Algorithm A machine learning algorithm [19]

(2) Feature Invariant

Feature Invariant 演算法為尋找特徵的結構特性，包括姿勢、視覺上的紋理描述、視覺上的五官分佈位置與顏色變化等來偵測人臉位置。因為每一種特徵都易受到不同狀態的外在環境干擾而降低辨識率，所以通常會使用一個以上的特徵資訊來做人臉偵測，但在某些環境下還是有無法避免干擾的狀況發生。

(3) Template Matching

Template Matching 為一種直觀尋找臉部的方法也常被廣為應用，如 Lanitis、C.J. Taylor 和 Cootes [10]使用 Active Shape Model (ASM)將臉部特徵定義為一種或多種臉部樣本，主要特徵為顯現的臉部輪廓或五官形狀等，人工定義出一個標準樣本，計算出此標準樣本的相關數值，人臉輪廓、眼睛、

鼻子及嘴巴。然後計算輸入影像基於此標準樣本的相關數值，逐一比對與樣本之間的相似度。優點是此方法較簡單且易實踐，但只適用於與樣本相對位置差異不大的影像，無法處理臉部朝向、旋轉等情況。

(4) Appearance-Based

圖 3、Viola 與 Jones [19]提出的方法之結果。

Appearance-Based 靠著從影像資料庫中作學習，訓練代表人臉的特徵來建立模型，利用訓練完成的模型將臉部與非臉部影像作分群作人臉偵測。如

Viola 與 Jones 提出基於積分影像方法(Integral Image)計算 Haar-Like Features，

再使用 AdaBoost Learning Algorithm 挑選出弱分類器組合而成為一個強分類器去建立模型作人臉偵測，其效能在人臉偵測領域極佳，快速且辨識率高，

常被廣泛使用。但是，此方法需要大量的非人臉樣本來作事先訓練，才能得到較好的偵測效果，這些大量的非人臉樣本，會造成 AdaBoost Learning 在訓練模型時，需要花非常多的時間，成果的好壞也會因為訓練的樣本不同，

而有很大的差異。

在文檔中可應用於學生專注度之人眼開闔偵測研究 (頁 12-16)

第二章 文獻探討

第一節 人臉偵測