• 沒有找到結果。

人臉偵測的相關研究

2-1 色彩空間

要找出膚色區域必須先定義什麼是皮膚顏色,首先要選擇一種合適的色 彩空間,這樣才能用色彩參數將皮膚顏色具體化描述。在過去的許多研究 中,曾經用過的色彩空間有RGB、HSV、YCbCr、XYZ、YIQ、與YES等,

由於環境光線變化對膚色的影響很大,通常會選擇能夠從色彩中分離出亮度 因素的色彩空間,其中最常見的是RGB、HSV與YCbCr色彩空間,分別介紹 如下:

2-1-1 正規化RGB(normalized RGB)

人眼感測器只能檢測到波長介於400nm至700nm之間的可見光,這些感 測器稱為圓錐細胞,具有三種不同的類型:紅光圓錐細胞、綠光圓錐細胞和 藍光圓錐細胞。如果單波長的光可見,這三種感測器的相對反應能使我們鑒 別出光的顏色。該現象極具實用價值,因為這意味著我們只需簡單地按不同 比例將上述三種光混合,就能產生各種顏色的光。這就是著名的三色原理,

它在彩電系統中獲得了廣泛的應用。

RGB為最普遍使用的色彩空間之一。其中R代表紅色,G及B則各為綠色 與藍色。此系統和我們熟知的(色)光三原色相似,愈混合後會得到愈明亮的 色光。如圖2.1。

(a) (b)

圖2.1 光三原色(a)由白光所分出之三原色光; (b)由三原色所混合出之顏色。

(資料來源:COULEUR.ORG)

在RGB空間裡表示的影像,會因光的亮度不同而使本來實物相同顏色的

圖2.2 HSV的色彩空間(資料來源:COULEUR.ORG)

2-1-3 YCbCr色彩空間

利用RGB格式處理圖像時,每個圖素由3個分別對應於三原色的8位元或 10位元字確定,因而這不是一種最高效的處理方法。這種格式下,必須在所 有的紅色、綠色和藍色通道上對圖素進行作業,所需的儲存空間和數據頻寬 毫無疑問將比其它可供選擇的色彩格式更大。為了解決這個問題,許多廣播 標準(如歐洲的PAL和北美的NTSC電視系統)均採用亮度和色度視頻信號。因 此,不同的色彩格式之間需要一種能互相轉換的機制。最通用的一種轉換是 由RGB格式轉換至YCbCr格式(反之則從YCbCr格式轉換至RGB 格式)。其中 Y表示亮度(而Cb 與Cr 代表另外二個色度(chrominance)。研究顯示,人眼察 覺到的光亮度資訊(Y)的60%至70%來自綠色光。紅色和藍色通道實際上只 是亮度資訊的複制,因此這些重覆資訊完全可以去除掉。最終的結果是圖像 可用表徵色度和亮度的信號來表示。在這種格式下,8位元系統規定亮度的 取值範圍介於16至235之間,而Cb和Cr信號的取值範圍介於16至240之間,並 規定128表示亮度為0或255。

YCbCr 色 彩 空 間 是 修 改 YUV 色 彩 空 間 所 得 到 的 , 分 為 亮 度 元 素 luminance(Y)與blueness(Cb)、redness(Cr)兩個彩度元素,對亮度的分離性高,

方便與彩度分開操作,適合影像處理使用。它也是REC601-1(CCIR 601-1)所

2-2 相關研究

人臉偵測的研究已經風行了多年,從一開始的灰階影像到現在的彩色影 像,人臉偵測即是判斷影像中是否有人臉圖案如果有的話,則標出人臉的位 置、大小與數目等資料。此問題長久以來一直都是一個困難且熱門的研究課 題,有相當多的研究人員投入這個領域當中,也獲得了相當豐碩的成果。,

使用的方法有許多種,也有結合多種方法的人臉偵測,大致上可以分為三大 類如圖2.4所示:

圖2.4 人臉偵測的分類

2-2-1 基於特徵法 (feature-based methods)

此類方法是根據人臉結構上之特徵,諸如眼睛、嘴巴、鼻子、眉毛等等,

先將其定位出來,再利用統計或是上述特徵與人臉結構上之比例來定出人臉 的位置。此類的做法容易受到外在因素的影響,燈光的強度以及顏色,背景 的複雜度,都會影響到偵測出來的結果。很多研究人員會針對膚色下手,先 將顏色空間轉換,再建立膚色模 型用以偵測人臉區域,最後結合人臉特徵 來確認人臉區域是否為人臉。

例如邊緣分析[2,3,4],尋找影像中物件的邊緣,利用人臉的邊緣屬於圓 形或是橢圓來定位人臉,不過在複雜背景之下會有誤判的產生。Nara Yusuke 和 Jianming Yang[3]使用邊緣偵測和膚色偵測兩個模型來偵測人臉,在一個 複雜背景的影像中現做sodel的邊緣偵測,再對同一張圖做膚色偵測尋找有膚 色又有橢圓邊緣的地方,定位為人臉所在,不過這方法在光線的影響下雖然 可以偵測出人臉邊緣,不過無法偵測正確的人臉膚色範圍。Stan Brichfield [4]

提出一種利用橢圓為基礎的臉部輪廓搜尋模型,並且檢測橢圓內的色彩分佈 來追蹤人臉。利用此兩種模型的交互使用,能在複雜的環境中達到穩健的追 蹤效果。此系統對於物體的轉動、暫時遮蔽、接近與離開皆有穩定的追蹤效 果。不過橢圓偵測的缺點在於容易受到光源及背景影響,並且需要大量的運 算量而難以達到即時性人臉追蹤。

色彩分析[6-10],使用色彩的資訊統計膚色的範圍達到人臉定位,不過 色彩資訊對於光線很敏感在過暗或過亮的狀況下會影響偵測率。Rein-Lien Hus[7]提出使用光線補償後再統計出膚色範圍建立出膚色模型,使用膚色模 型找出人臉範圍,再使用型態學運算找出臉特徵眼睛和嘴唇,最後使用霍氏 轉換找出人臉的橢圓輪廓。這方法是目前人臉偵測在色彩分析中引用次數較 多的方法,不過此方法不適用於即時的人臉偵測。S.H. Kim and H.G. Kim[10]

利用動態偵測及膚色以實現人臉偵測。首先,利用兩張連續影像相減,並且 設定一閥值,當差值大於此閥值的話則為1,反之則為0。得到差值影像之後,

再利用膚色特徵在群集(Grouping)的範圍裡面判斷此區域是否為人臉。雖 然此方法結合了動態及膚色可以快速的找出人臉的位置,不過作者是在理想 的光源之下偵測膚色,如果膚色受到光源的影響而造成色偏,則此方法恐怕 會失敗。為了得到差值影像,所以此系統必須使用固定式攝影機對著不變的 背景,因此,此方法比較適用於特定場合,當有動態的物體,例如人體,出 現在影像當中即可將移動的物體和背景分離。

特徵分析[11-15],此類方法試圖找出人臉影像結構上的一些特徵來偵測 人臉區域。此類方法主要用在找出人臉所在的區域。這方法多侷限在正面的 人臉,在側面以及臉部特徵遮蔽的狀況效果不盡理想。Carlos[14]提出利用 人的瞳孔做為人臉追蹤時的特徵。他們使用主動式紅外線(Infra-ray)照射 特定的區域,當此區域出現人的臉時,人眼的瞳孔受到紅外線的照射而產生 反射,所以當攝影機照到人臉時,瞳孔相對之下會變亮許多,他們也就是利 用此特性並且加上啟發式規則來偵測及追蹤人臉。此方法的缺點只能偵測正 面的人臉,因為當眼睛瞳孔特徵不存在時,則此系統就無法進行人臉追蹤;

另外,當背景光源很亮時此方法恐亦不適用。C. C. Han[15]提出一種利用眼 睛來偵測影像點中是否有人臉的方法。眼睛為一穩定的特徵,即使受到光線 的影響,眼睛灰階值會小於鄰近的灰階值,利用形態學(Morphology)中開 啟(Open)與閉合(Close)運算元的特性,找出圖形中可能為眼睛的區域,

再配合臉部特徵的幾何關係與類神經網路完成最後的人臉偵測。此方法可快 速偵測人臉位置,但只使用臉部特徵(眼、口、鼻…等)作為判別是否為人臉,

容易受到擁有相似特徵的物體影響而產生誤判。

這些方法都不需要事前訓練,都是利用臉部的資訊或是型態學的運算來 找出人臉的位置,直接使用膚色和臉部特徵的幾何特性以及人臉的輪廓呈現 橢圓形來做分析,因為運算簡單且不需要建立龐大的資料庫所以常常被使用 在即時的系統上,雖然運算的速度快不過其可靠度卻也比需要事前訓練的系 統差。本文人臉偵測也是屬於此類的。

2-2-2 模板比對法 (template matching methods)

模板比對[16-19],此類方法用一些事先定義好代表人臉的patterns或人臉 各個器官的patterns與輸入影像間的關係來偵測人臉區域。此類方法可以找出 人臉區域並且判斷此區域是否為人臉,這方法對於戴眼鏡或是落腮鬍的人不

適用,且針對不同角度的人臉要建立不同人臉模板。Sakai et al. [17] 使用眼 睛、鼻子、嘴巴與臉的輪廓的 patterns 來描述人臉,每個 pattern 是由一條 條的線條區段所組成。將灰階影像轉成由線條所組成的圖形,然後找出與 patterns 相似的區域。Young Ho Kwon[18]建立了五個不同的人臉模版分別是 人臉由左到右的五個角度,在使用Fuzzy的方法建立膚色和髮色的模型,用 這兩個模型先尋找膚色和髮色的所在位置,找到之後再跟先前建立的五個人 臉模版做Fuzzy的比對,這方法對於光頭和有戴帽子或是頭巾的人無法偵 測,且髮色的定義是針對哪種髮色也未加說明,這方法對於太小的人臉也會 有偵測上的困難。

此類方法必須先事先定義好人臉 (face patter) 做成模板,而這些人 臉 大部分皆是正面,藉由這些模板去對整張灰階影像做全搜尋,以判斷被掃描 的區域是否為人臉。此類方法的優點就是較容易實作。不過對於非正面的人 臉用模板比對的方法可行性就降低許多,而且對於整張影做搜尋對於大張的 影像就會降低偵測速度,且影響中的人臉大小不固定也會對偵測造成影響。

除了使用事先定義好的template外,也有許多研究人員利用大小與外型 (deformable template)可以變動模型,成功地偵測人臉。

2-2-3 影像分析法 (image-based methods)

與模板比對法不同的是影像分析法藉由統計分析 (statistical analysis) 與機器學習 (machine learning)來找出人臉影像有意義的樣式,然後藉由不同 大小的視窗對整個灰階影像作地毯式的掃描一一與人臉樣式比對,以判斷被 視窗掃描到的區域是否為人臉。由於此類方法須以各種大小的視窗掃描影像

與模板比對法不同的是影像分析法藉由統計分析 (statistical analysis) 與機器學習 (machine learning)來找出人臉影像有意義的樣式,然後藉由不同 大小的視窗對整個灰階影像作地毯式的掃描一一與人臉樣式比對,以判斷被 視窗掃描到的區域是否為人臉。由於此類方法須以各種大小的視窗掃描影像

相關文件