• 沒有找到結果。

第一章 緒論

1.2 相關研究

在人臉辨識方面,近年來有相當多的研究和方法不斷的改善辨識率,而 在技術不斷的突破和經驗的累積,其相關的研究也漸漸成熟,所以有非常多 的論文都針對人臉辨識會遇到的問題提出說明與他們的解決方法。雖然有這 麼多的方法被提出與使用,但是由於人臉辨識需要考慮的因素實在太多,例 如:運算複雜度高,因而必須實現在高效能的電腦【18】【19】【20】【21】

【22】。人臉辨識會遭遇到的問題如下所示:

(1) 臉部大小:影像中人臉的大小,因為大小的人臉不同,因此會產生

些許的差異,很容易會導致辨識率下降,因此可以利用一些前置處 理,來避免此情況的發生。

(2) 姿勢與位置:重疊、遮住等等,都會影響到系統的辨識。

(3) 旋轉角度:人的臉部特徵,在當面對相機作不同角度方向旋轉後會 有極大的變化。例如:左轉與右轉後臉上的特徵就會少掉一大半。

上仰的話,臉的上半部就會消失不見;反之俯視的話,臉下半部就 看不到。最重要的是,不管是什麼角度,在影像中特徵的相對位置 都會改變,導致無法辨識。

(4) 光源環境:光源的強度、角度等等,都會影響到臉上色彩分佈與強 度的散佈。

(5) 人臉的差異:雖然人的臉大部分就是由眼睛、鼻子、眉毛、嘴唇、

耳朵等特徵組成,但是不同人之間還是有相當大的差異。這樣的差 異就是人在這些器官上的彈性相當大,如突顯程度與位置,甚至戴 眼鏡與髮型遮蓋的問題。

(6) 表情:由於人的五官是彈性的。不同的表情下,人臉會有很大的差 異。

(7) 其他:相機的鏡頭特性、CCD 的增益、曝光時間、光圈調整、自動 白平衡、色彩校正等都會影響到畫面。

基於上述的幾點就有非常多的文獻去研究以解決上述的問題。Zhao et al.

【1】認為人臉辨識的方法,基本上可以分為以下四類:

(1) Feature-based methods:這類的方法主要目標是以人臉特徵點的距離 與角度、人臉特徵的形狀或特徵的亮度關係進行辨識。

(2) Template-matching methods:此類方法會事先定義好的代表人臉的 patterns。藉由比對整個輸入影像與樣板間 correlation value 的來做人

臉辨識,當correlation value 值越高,表示這個輸入 pattern 與人臉 template 之間越像。

(3) Neural Network methods:此類的方法主要是嘗試去模仿人類的神經 系統,利用神經元和運算單元間的眾多連結來做平行且分散的方式 運算,因此可以同時處理大量的資料。其主要方法是以疊代的方式 不斷修正神經網路中的輸入值與期望輸出值之間的誤差,直到誤差 小於一定的臨界值。

(4) Statistics-based methods:此類的方法主要是利用數學轉換取得人臉 影像中最重要的特徵向量,並利用該重要的特徵向量與資料庫中的 向量來進行比較。

1.2.1 Feature-based methods

Li et al.【2】提出了 NFL(Nearest Feature Line)的方法進行人臉辨識,

作者認為在同一個人臉部分的影像任取兩個特徵點所連成的特徵線是一致 的,因此利用臉部特徵點來針對每一個特徵線做最近距離的計算。實驗中分 為二大部份:第一部份利用 NFL 的方法來與傳統的特徵臉(Eigenface)方 法來進行比較,使用混合多種常用的人臉資料庫,共計132 人 1079 張影像,

結果顯示NFL 的方法錯誤率較特徵臉的方法低,錯誤率改善了 43.7~65.4%。

第二部份則是利用 NFL 的方法與迴旋類神經網路來進行比較,人臉資料庫 採用ORL 資料庫,每人 10 張影像,共有 40 人 400 張影像,實驗結果 NFL 的方法錯誤率僅3.125%,較迴旋類神經網路的錯誤率 3.83%來的更低,錯誤 率改善了81.59%。

1.2.2 Template-matching methods

Brunelli et al. 【3】比較特徵式及模板式運用在人臉辨識中的方法,並 採用47 個人的正面人臉影像(包含男性 26 人、女性 21 人,每人 4 張),並 利用這兩種方法發展出新的演算法來進行實驗。其中特徵式的方法是計算人 臉的幾何特徵值(如眼睛、鼻子及嘴巴);模板式的方法則是在灰階中進行 眼睛、鼻子、嘴巴及臉部等4 個臉部遮罩的模板來進行比對。經過實驗結果,

特徵式的方法辨識率僅達到90%,而模板式的方法辨識率則達到 100%。

1.2.3 Neural Network methods

Er et al. 【4】對於人臉辨識提出了二個論點:

(1) 使用類神經網路進行人臉辨識前,特徵擷取的方法是相當重要的。

(2) 輻射基底函式(Radial Basis Function)類神經網路僅需要訓練少量的樣 本數,就可以達到一定的分類程度。

作者在前置處理中,利用主成份分析(Principal Component Analysis,

PCA)的方法來降低影像的維度,再利用 FLD(Fisher’s Linear Discriminate)

對不同的類別擷取特徵,再將擷取出來的特徵使用輻射基底函式類神經網路 來做最後的分類,人臉資料庫採用 ORL 資料庫,每人有 10 張影像,有 40 人共400 張,200 張為訓練另外 200 張為測試,共實驗了六次,平均辨識率 為98.02%。

1.2.4 Statistics-based methods

Bicego et al.【5】用 Canny 濾鏡來抽取影像中人臉的邊緣並利用多階層

B-spline曲線來取得人臉的特徵值,以降低人臉影像的維度,最後再給支持

向量機完成分類。實驗中採用多種人臉資料庫進行比較辨識率,其中ORL 資料庫辨識率為97.25%,Bern 資料庫中辨識率為 95.33%,Yale 資料庫的辨 識率為98.89%。

相關文件