臉部特徵偵測及辦識

第二章文獻探討

第二節臉部特徵偵測及辦識

在臉部特徵偵測及辨識這區塊，主要偵測及辨識的臉部特徵部位為眼睛及嘴巴，而人眼偵測是從人臉臉部區塊中，人眼可能的位置之最大範圍，計算此範圍中影像 RGB 轉 HSV 後之 V 值，將可能的人眼區塊找出。人眼辨識則是自人眼辨識區塊中，計算中心矩（Center Moment）、角度及人眼與眉毛之重心構成的矩形等方式，完成人眼辨識。而在嘴巴特徵的偵測中，所使用的幾乎都是以嘴巴特徵，如顏色、形狀或利用上下嘴唇之間的暗線來達到偵測的目的。取得眼睛特徵及嘴巴特徵有相當多的演算法，以下將介紹幾種常被使用取得該特徵的偵測方式：

一、眼睛特徵偵測

人的眼睛是靈魂之窗，只要看一個人的眼睛，就可以知道這個人所要表達的情感，甚至可以知道他是否說謊，或是正呈現疲勞狀態。過去有人研究利用眼動來做測謊的系統（黃孟隆，1994），它是利用眼睛的瞳孔，當人在有說謊的情況，就會有瞳孔變大與眨眼頻繁等情形，此外，眼動也可為我們偵測是否有疲勞狀態（Ueno, Kaneda, & Tsukino,1994），因為當有疲勞狀態產生，就會有眨眼頻繁，或是產生睡意，閉眼搖晃頭部等狀態，

當一個人正對一種東西產生喜好，也會有專心注視等行為狀態產生。取得眼睛特徵有相當多的演算法，以下將介紹幾種常被使用的偵測方式：

（一）眨眼偵測

所謂眨眼偵測就是在前後兩張影像的時間點內，當使用者頭部並沒有轉動並屬於靜止狀態時，將這兩張影像做灰階化處理後再進行相減，從較大變化的地方將可以決定為可能的眼睛位置。（Grauman, Betke, Gips, &

Bradski, 2001）

（二）瞳孔特徵

不論那一個人種，在臉部特徵中，眼睛瞳孔、鼻孔及嘴角為最偏黑色的地方，在可能眼睛位置的區域中，將影像進行灰階化之後，再調整出適當的門檻值之後，就可以找出最暗的點來表示瞳孔，此時便可以定義出可能的眼睛位置，在其它相關研究中也使用到相同的方法來取得眼睛位置。

（Lee, S. K. Park, & Mignon Park, 2005）

（三）人臉水平及垂直投影

在取得人臉的區域後，若將影像進行二值化或灰階化，並計算水平方向及垂直方向的像素亮度的加總，將可以在垂直面上發現眼睛鄰近的分佈會比其它垂直軸上面分佈更廣，主要是因為眼球不論在二值化或灰階化後都能夠得到偏黑色的結果。相同原理，若以水平面上的像素亮度進行加總，

也大致可以發現眼睛鄰近的分佈比其它水平軸的分佈更多。於是，利用這樣的特性，將可以由水平谷峰及垂直谷峰的交集區域得到可能的眼睛區域。（Dong & Wu, 2005）

以上說明了幾種常被使用取得該特徵的偵測方式，而另外偵測眼睛是否在動作狀態的方法則可區分為侵略式和非侵略式兩種方法，在非侵略式方法中，

又可以分為使用光線投射之主動式方式和利用純影像處理技術，以下詳述說明這些方法所使用的技術。

（一）侵略式方法

搜尋線圈法（Search Coil, SC）（Kenyon,1995），此偵測眼動的方向，

是屬於侵略式身體的眼動偵測方法，此方法將感應線圈包在矽膠製成的軟式鏡片中，然後再讓受測者佩帶，當眼睛有移動的時後，就會產生磁場的變化，以此可以得知受測者的眼球偏轉的角度，並且可以記錄分析眼球的運動，但是此方法，不適合長久使用，因為軟式鏡片具有雙層架構，會影響使用者的視力，而且也很容易受到眼球分泌物所影響。

另一種侵略式眼動方法是眼電圖法（Electro-Oculography, EOG）（Hsu, Mottaleb, & Jain, 2002），此方法是使用電極原理偵測眼球移動，若同時使用四個電極，並將它們貼在眼球附近，上、下、左、右四個方向的皮膚上，當眼球有移動時，就會產生不同的訊號，就可以根據這些訊號的資訊，來觀察眼球移動的方向，例如，當眼球向右偏轉時，電極間會有一個正的電壓差，向左偏轉時電極間便會產生一個負的電壓差，以此電壓差的大小即可判斷眼球上下、左右轉動的角度。但是此方法的缺點是，

當皮膚產生不斷的角質的分泌物，就會造成眼動訊號的不穩定。

（二）非侵略式的主動式方法

非侵略式的主動式方法，是有別於侵略式方法，是為了不接觸到身體任何部分，較不會造成長期配帶不舒適的情況，在非主動式的方法中，

主要是透過光線投影在眼睛上產生閃爍點，來做偵測的，所以，在主動式光線投射法的研究中，Zhiwei 和 Qiang（2004）、Dong 與 Myung（2005）

運用紅外線方法在眼睛區域造成閃爍光，偵測出眼睛的位置，運用紅外線方式偵測出瞳孔位置，來偵測出眼動的方向。但長期投射紅外線光線到眼睛上，會造成眼睛的傷害。因此不適用於偵測學生學習時的眼動情形。

（三）非侵略式的被動式方法

被動式影像處理法的研究，辨識眼睛可分三種偵測方法 1. Template based methods（Xie, Sudhakar, & Zhuang,1994）。2. Appearance based methods（Huang,& Wechsler, 1999)。3. Feature based methods（Jalal, Sara, &

Hamid, 2007），若只各別使用這三種方法，是不夠強健的，容易受到背景影像的影響，或是較費時，所以，目前偵測瞳孔的研究，都是結合這三種方法。Mayumi、Osamu 與 Kazuhiro（2004）分析偵測瞳孔使用 Template

和 Feature 的優缺點，給了優缺分析的量表，於是他將這兩種方法混合使用，達到準確度的需求。若是使用此方法，當瞳孔的移動到偏向眼角時，

就無法用卵形偵測，或是使用亮點與黑點的最大差異量來偵測出瞳孔位置。Kun、Liming、Su 與 Georgy（2005）也提出使用 Template 和 Feature 的方法來偵測瞳孔位置，但是由於他使用梯度運算，雖然可以減少 Template 比對範圍跟時間，但是此方法卻無法使用於複雜的環境。另外，

在 Mayumi（2004）等人的文獻中，探討對 Template 比對方法和卵形偵測方法的比較，將比較結果詳細說明表示，用 Template 比對方法偵測眼睛位置準確度，較弱於使用卵形偵測方法。王鴻勳（2010）則改良了 Kun

（2005）等人提出的方法，是利用眼睛裡的瞳孔具有亮度最暗特性，研究出 Valley-Mask Template，來找尋出眼睛粗略的區域，此法將不會受到人臉大小不同，與人臉遠近的不同，造成偵測眼睛位置失效。另外，再修改 Otsu 方法來偵測瞳孔的位置與閉眼情形，該眼動分析系統能做到即時且準確的偵測。

偵測眨眼的方法則是在前後兩張影像的時間點內，當使用者頭部並沒有轉動並屬於靜止狀態時，將這兩張影像做灰階化處理後再進行相減，從較大變化的地方將可以決定為可能的眼睛位置（Grauman 等人，

2001; 譚永桓，1999）。

利用瞳孔特徵定出眼睛的位置。不論那一個人種，在臉部特徵中，

眼睛瞳孔、鼻孔及嘴角為最偏黑色的地方，Stiefelhagen（1996）提出在可能眼睛位置的區域中，將影像進行灰階化之後，在調整出適當的門檻值之後，可以找出最暗的點來表示瞳孔，此時便可以定義出可能的眼睛位置，在其它相關研究中也使用到相同的方法來取得眼睛位置（Lee, Park,

& Mignon,2005;Miyakawa, Takano, & Nakamura, 2004）。

二、嘴巴偵測

在嘴巴特徵的偵測及辨識中，所使用的幾乎都是以嘴巴的特徵，如顏色、形狀或利用上下嘴唇之間的暗線來達到偵測的目的。以下列出幾個能夠快速運算取得該特徵的方法：

（一）唇色偵測（Lip Color Detection）

在絕大部分的人臉中，通常膚色和唇色會有一定的區隔，即唇色會比膚色更偏於紅色。有相當多的研究中，在嘴巴的偵測上所使用的是針對唇色的不同，來取得該區域的影像。黃泰祥（2000）在修改了 Soriano、

Martinkauppi、Huovinen 與 Laaksonen（2000）提出的膚色空間後，得到的演算法將可以取得有別於一般膚色的唇色像素。另外在 Rongben

（2004）的研究中所使用的是類神經網路的方式，在收集一定量的下半臉部影像後進行訓練，由於唇色和周圍的膚色不盡相同，所以可以成功的區隔開唇色及膚色像素之間的關係。

（二）嘴角暗點偵測（Lip Corner Detection）

當人臉影像被灰階化或二值化之後，我們發現在嘴角上可以得到較暗的像素值，利用這個特徵將可以定義出可能的嘴巴位置。在 Smith

（2004）的研究中就是利用這個方式，先取得人臉的灰階影像後，再給定某個門檻值，取得影像中最暗的像素位置作為可能的嘴角位置。

（三）人臉水平及垂直投影

人臉中上下嘴唇之間的縫隙通常會產生一條暗線，當影像進行灰階化或二值化之後，該縫隙將會更顯的清楚，在這樣的特性之下，利用水平及垂直投影來取得黑色像素的分佈，而谷峰的交界處可能就代表嘴唇位置。

在文檔中人臉偵測應用於學習專注力與群組參與度之分析 (頁 22-27)

第二章 文獻探討

第二節 臉部特徵偵測及辦識

第二章文獻探討

第二節臉部特徵偵測及辦識