人臉偵測與辨識

第二章文獻探討

第一節人臉偵測與辨識

近年來以人臉為特徵的偵測與辨識技術發展速度十分迅速，人臉偵測與辨識的前置作業為人臉自動辨識系統的第一步，人臉偵測為後續的人臉分類提供了待辨識人臉的具體資訊，其偵測及辨識的最後結果足以影響人臉自動辨識系統的效能，而人臉偵測與辨識的準確率和速度，為人臉自動辨識系統能夠實際應用完善的重要兩個重要關鍵因素。

一、常用的人臉偵測與辨識的方法

現今的電腦執行速度及儲存能力的提升，使我們能夠運用這些科技，

將人臉偵測與辨識所取得的數位影像，儲存在資料庫中，並透過了電腦快速的執行速度分析這些儲存在資料庫中的許多資訊，而這些分析出來的資訊，其所呈現出來的效果，幾乎是和人類肉眼所看到的真實世界的情境相同。以人臉影像來說，人類透過大腦對人臉特徵的分析邏輯，能夠輕易的辨認出該人臉是屬於哪一位其所熟識的人物，人類要如何透過大腦對人臉影像的特徵的分析呢？這是因為人臉中具有包括眼睛、鼻子及嘴巴等特徵，所以人類在透過大腦分析後，可以容易的辨認出來。而在電腦的視覺分析系列中，利用與人類大腦對人臉影像的特徵分析相同的邏輯，同樣有可能取得正確的人臉影像範圍，並能夠在該人臉影像範圍中取得正確的眼睛、鼻子及嘴巴等特徵位置進行分析。

人臉偵測與辨識是指在任意影像中，採用一定的策略對其影像進行搜尋與演算，以確定影像中是否有人臉存在，進而可標定出其位置、大小與數量等資訊。以下我們將逐一介紹目前常用的人臉偵測與辨識的四種方法：（Yang & Huang, 1994）

（一）基於知識的方法（Knowledge-Based）

這種基於習慣規則的方法，主要是將構成典型人臉的知識來進行編碼，通常這些規則的獲得來自於人臉特徵，而且此方法主要設計用來進行人臉的局部化。黃登淵、莊國楨、楊晏和、陳南樺與王嘉宏（2007）

所使用的人臉影像區域標定法，即是利用人臉圖形之幾何性質來進行最後人臉區域之標定，欲標定之人臉區域假設均具有類似橢圓形之外觀，

再利用橢圓長短軸之比例來標定人臉，此方法不僅能夠正確的標定出人臉，更可大幅降低系統演算的時間，其中運用人臉幾何關係來標定人臉區域，即為運用人臉知識的一種方法。

（二）基於特徵的方法（Feature-Based）

基於特徵演算法的目標在於找出人臉存在的結構特徵，即使當姿勢、視角、或者是環境光線變化的時候，依然能夠運用基於特徵的方法來找出人臉確定的位置，而且此方法更可運用來進行人臉區域之局部化，此方法的運用包含有人臉特徵、人臉結構組織、以及膚色色彩等分析，黃登淵等人（2007）使用的膚色分析方法，可以適當地解決光線強弱對影像色彩之影響，並配合膚色色彩等特徵，可快速的將人臉膚色和其他色彩分割開來，以利於系統後續之運算。且配合非膚色區域進行光線補償之觀念，也獲得相當不錯的結果。

（三）板模匹配的方法（Template-Based）

板模匹配的作法是先將數個標準的人臉樣本圖案儲存起來，並用它來描繪整個人臉或是個別的臉部特徵，同時計算輸入影像與儲存樣本圖案間之相互關聯性，以進行人臉偵測，此方法亦可同時用來進行人臉特徵之局部化。

（四）基於表像的方法（Appearance-Based）

基於表像的方法和版模匹配的方法，在做法上是相類似的，只是基於表像方法之模型必須透過擷取大量訓練影像之臉部外觀變化來進行學習，此種學習的模型常被用來做為人臉偵測的方法。雖然此種演

算法比版模匹配法具有較高的人臉偵測率，但是這種方法在人臉即時偵測系統上實現較困難，此外這種演算法也需要耗費比較大量的計算時間以及記憶體空間。

由於科技技術的提升，以及理論發展趨於成熟，利用電腦作影像處理的研究越來越多，如 Paul 和 Michael（200l）利用動態輪廓的技術將人的五官與貓臉作結合，使得貓的表情栩栩如生。Sung 與 Poggio

（1995）是根據輸入影像和「人臉」及「非人臉」兩個群集之間的距離來判斷是否為人臉。Leung、Burl 與 Perona (1995)結合了一組區域特徵偵測器，藉由統計的方式找出人臉，優點是不會因為位移、旋轉及縮放因素而影響辨識。Rowley、Baluja 與 Kanade (1998)利用一個搜尋視窗在多重解析的影像中移動，之後將其輸入到類神經網路確認。國內亦有許多影像追蹤的相關研究。吳良杰(1999)由攝影機擷取到連續影像，經由樣板比對的方式找出移動物體的位置，並求出影像基底的誤差量，做為控制伺服馬達的依據，完成一個封閉迴路的影像追蹤系統。

1999 年，李建緯研製平面物體的追蹤系統。同年，譚永恆(1999)利用橢圓形頭部追蹤法，判別出眼睛和嘴巴構成的平面方向。鍾維哲(2000) 利用從 CCD 所擷取的影像資訊來計算影像光流(Optical flow)，從而獲取移動物體的即時位置和速度，完成影像追蹤目的。

二、人臉偵測與辨識之技術：

目前很多人臉自動辨識系統都是假定影像中的人臉已經被偵測和定位，而為了設計出自動人臉識別系統，如前述的快速而高效率的人臉偵測是極需要解決的一個關鍵問題。人臉偵測與辨識就是其中不可缺少的一個重要環節，因而成為近年來學界研究的重點，所以人臉偵測技術也陸續出現了許多新的演算方法。

而目前在人臉自動辨識系統中最常使用的人臉偵測與辨識之技術為顏色分割技術方式（Color Segmentation），最直接的分類方式就是將影像的長條圖（Color histogram）裡作多重閥值（Color Threshold），再根據顏色分佈的不同，進行選擇性的過濾，將所需要的顏色區域從影像中分離出來。

要從影像中找出人臉的區域，就需要想辦法定義出膚色的顏色，一般來說膚色與週遭環境的色彩會有顯著的差異，在 RGB 空間裡定義的影像顏色會因背景的光線強弱的不同而有深淺的變化，因此在 RGB 空間上做顏色的分割常有很大的誤差產生。因此許多研究就選擇了對光線強弱較不敏感的色彩空間對顏色作分割，有正規化 RGB、HSL、YCrCb、YIQ、YMC 等色彩空間技術，其色彩空間演算方法說明如下：（蔡沛勳，2006）

（一）正規化 RGB（Normalized RGB）

RGB 三原色在色彩空間所表示的影像很容易因為光源的亮度強弱

線的敏感度，在針對膚色給定適合的門檻值區間，就能夠將膚色由影像中分離出來。

（二）YCrCb 與 RGB 空間的轉換

YCrCb 色彩空間廣泛用於數位視訊中。在此格式中，照度資訊以單一成分表示，而色彩資訊則儲存為兩種色差成分，即 Cb（Blueness）與 Cr（Redness）。Cb 的成分是藍色成分與一參考值的差距，Cr 則是紅色成分與一參考值的差距 Y。YCrCb 與 RGB 之間的關係如下：系統的需求。由於電腦大部分都是以RGB三原色來表示， RGB與HSI在轉

換色彩空間時需要透過下列公式進行轉換：知的黃色 Yellow、綠（G）+藍（B）則是生青色 Cyan，藍（B）+紅（R）

為洋紅色 Magenta；三者相混而成白色 White。然而在物體的顏色或染料的情況並非如此。由於實物的色彩是經由光照反射入眼而被人腦認知

 ^Black ^K 

在文檔中人臉偵測應用於學習專注力與群組參與度之分析 (頁 15-22)

第二章 文獻探討

第一節 人臉偵測與辨識

 Black K 

第二章文獻探討

第一節人臉偵測與辨識

 ^Black ^K 