第二章 文獻探討
第一節 人臉偵測
學者們對於人臉偵測已有相當多且成熟的研究,Yang [1] 有統合整理,將人 臉偵測方法分為四類:Knowledge-Based、Feature Invariant、Template Matching 與 Appearance-Based,如表一所列。
(1) Knowledge-Based
靠著臉部的外觀型態來作人臉的定義,例如人臉對稱的眼睛、鼻子與嘴 巴,互相之間的距離、相對位置關係來建立人臉規則,有助於將人臉資訊簡 單化。但人臉會因為人種、性別等相異的變化因素,使得資訊差距相當大,
建立規則不容易,要考慮制定的方式是否符合所有人臉的五官特性。如果要 求過於嚴苛,勢必會降低辨識率;反之,則降低準確度。
表 1、Yang [1] 整理之人臉偵測方法與本研究所用之方法。
類型 使用方法
Knowledge-Based
Multiresolution rule-based method [2]Feature Invariant
- Facial Features Grouping of edges [3] [4]
- Texture Space Gray-Level Dependence matrix (SGLD) of face pattern [5]
- Skin Color Mixture of Gaussian [6] [7]
- Multiple Features Integration of skin color, size and shape [8]
Template Matching
- Predefined Face Templates Shape template [9]
- Deformable Templates Active Shape Model (ASM) [10]
Appearance-Based
- Eigenface Eigenvector decomposition and clustering [11]
- Distribution Based Gaussian distribution and multilayer perception [12]
- Neural Network Ensemble of neural networks and arbitration schemes [13]
- Support Vector Machine(SVM) SVM with polynomial kernel [14]
- Naive Bayes Classifier Joint statistic of local appearance and position [15]
- Hidden Markov Model (HMM) Higher order statistic with HMM [16]
- Information Theoretical Approach Kullback relative information [17] [18]
- AdaBoost Learning Algorithm A machine learning algorithm [19]
(2) Feature Invariant
Feature Invariant 演算法為尋找特徵的結構特性,包括姿勢、視覺上的紋 理描述、視覺上的五官分佈位置與顏色變化等來偵測人臉位置。因為每一種 特徵都易受到不同狀態的外在環境干擾而降低辨識率,所以通常會使用一個 以上的特徵資訊來做人臉偵測,但在某些環境下還是有無法避免干擾的狀況 發生。
(3) Template Matching
Template Matching 為一種直觀尋找臉部的方法也常被廣為應用,如 Lanitis、C.J. Taylor 和 Cootes [10]使用 Active Shape Model (ASM)將臉部特徵 定義為一種或多種臉部樣本,主要特徵為顯現的臉部輪廓或五官形狀等,人 工定義出一個標準樣本,計算出此標準樣本的相關數值,人臉輪廓、眼睛、
鼻子及嘴巴。然後計算輸入影像基於此標準樣本的相關數值,逐一比對與樣 本之間的相似度。優點是此方法較簡單且易實踐,但只適用於與樣本相對位 置差異不大的影像,無法處理臉部朝向、旋轉等情況。
(4) Appearance-Based
圖 3、Viola 與 Jones [19]提出的方法之結果。
Appearance-Based 靠著從影像資料庫中作學習,訓練代表人臉的特徵來 建立模型,利用訓練完成的模型將臉部與非臉部影像作分群作人臉偵測。如
Viola 與 Jones 提出基於積分影像方法(Integral Image)計算 Haar-Like Features,
再使用 AdaBoost Learning Algorithm 挑選出弱分類器組合而成為一個強分類 器去建立模型作人臉偵測,其效能在人臉偵測領域極佳,快速且辨識率高,
常被廣泛使用。但是,此方法需要大量的非人臉樣本來作事先訓練,才能得 到較好的偵測效果,這些大量的非人臉樣本,會造成 AdaBoost Learning 在 訓練模型時,需要花非常多的時間,成果的好壞也會因為訓練的樣本不同,
而有很大的差異。