人臉辨識演算法研究

(1)

行政院國家科學委員會專題研究計畫成果報告

人臉辨識演算法研究

研究成果報告(精簡版)

計畫類別：個別型計畫編號： NSC 95-2221-E-151-044- 執行期間： 95 年 08 月 01 日至 96 年 09 月 30 日執行單位：國立高雄應用科技大學電子工程系計畫主持人：潘正祥共同主持人：朱淑娟、謝欽旭、陳聰毅計畫參與人員：博士班研究生-兼任助理：李君寶碩士班研究生-兼任助理：呂永茂、張志平、林錦瑞報告附件：出席國際會議研究心得報告及發表論文處理方式：本計畫可公開查詢

中華民國 97 年 03 月 03 日

(2)

行政院國家科學委員會專題研究計畫成果報告

人臉辨識演算法之研究

Study on the Face Recognition Algorithms

計畫編號：NSC 95-2221-E-151-044

執行期限：95 年 8 月 1 日至 96 年 7 月 31 日

主持人：潘正祥

國立高雄應用科技大學電子工程系

E-mail : [email protected]

一、中文摘要人臉辨識研究已經成為電腦視覺和模式識別領域最活躍、最有吸引力的研究領域。人臉辨識技術也廣泛地被利用到身份驗證、人機介面等領域。隨著第四代計算與資訊技術的到來，作為最自然、最友好的身份驗證方法，人臉識別將成為新一代計算技術的關鍵部分。本計畫中，我們提出及研究三個人臉識別演算法。1)線性映射子空間人臉識別方法：我們應用三個具有代表性的人臉識別方法（PCA, LDA 和 LPP），首先我們分析它們在提取判別資訊上的貢獻，然後以其子空間維數為軸，組建三維參數模型。我們可以通過搜索充分利用三維參數空間，而不是像常規的 PCA, LDA 和 LPP 方法只限於線上或者局部區域內搜索參數。最後，基於三維參數空間，我們為 PCA, LDA 和 LPP 建立統一的系統框架。2) 非線性映射子空間人臉識別方法：我們利用核機（kernel-machine）的方法，提出新的核判別分析方法，亦即核優化判別分析。3)Gabor 小波核分析人臉識別方法：該方法的主要創新點主要在特徵提取的第一階段，應用 Gabor 小波提取恰當的面部特徵資訊，這些特徵有空間頻域，空間位置與方向可選擇性的特點，而這些特徵有助於處理光照和面部表情的變化，其可以提高人臉辨識效能；在特徵提取的第二階段，採用最近提出的功能強大的判別器（CKFD），其通過兩種判別資訊來增強判別能力；將 FPP 模型應用到 CKFD 中來增加演算法效能。在本計畫中，我們即將應用標準的性能評估方法和標準的資料庫來評價提出的方法。這樣，我們可以評價演算法在解決人臉識別中的姿態、光照和表情（PIE）問題。關鍵詞：人臉辨識、線性映射子空間方法、非線性映射子空間方法、核方法、Gabor 小波 Abstract

Face recognition research has become one of the most active and exciting research areas in computer vision and pattern recognition, and face recognition techniques are more and more widely used in identity verification, human-computer interface and so on. With the coming of the fourth generation of computing and information techniques, as the most natural and friendly identity verification method, face recognition will also become a key component of the new generation of computing techniques.

In this Project, we propose and investigate three novel face recognition algorithms as follows.1) the linear mapping subspace face recognition method: we apply three representative methods of subspace-based face recognition approaches, i.e., PCA, LDA and

(3)

LPP. We analyze their contributions of extracting the discriminating information respectively firstly, and then we construct a 3D parameter space using three subspace dimensions as axes. We can take advantage of the three subspaces through searching over the whole 3D parameter space instead of searching only in lines or local regions as the standard subspace methods. Finally based on the 3D parameter space, we propose a unified framework for PCA, LPP and LDA. 2) the nonlinear mapping subspace face recognition method: we apply the kernel-machine method. We propose a novel kind of kernel discriminant analysis, namely Kernel Optimization-based Discriminant Analysis (KODA). 3) the Gabor-based kernel method face recognition method: The novelty comes from Gabor wavelets, is employed to extract desirable facial features characterized by spatial frequency, spatial locality and orientation selectivity to cope with the variations in illumination and facial expressions, which improves the recognition performance; a recently proposed powerful discriminator CKFD, which enhances its discriminatory ability using two kinds of discriminant information (i.e., regular and irregular information), is employed to further extract the features in the second feature extraction stage; the fractional power polynomial models, are employed to CKFD analysis to enhance the recognition performance.

In the project, we will also apply the standard performance evaluation method and standard databases to evaluate the proposed methods. Thus, we can evaluate the performance of proposed algorithms in solving the pose, illumination, and expression (PIE) problems of face recognition.

Keywords : Face Recognition 、 Linear

Mapping Subspace Methods 、 Nonlinear Mapping Subspace Methods 、 Kernel Methods、Gabor wavelets 二、緣由與目的人臉識別技術[1-19]具有廣泛的應用前景，在現代社會中，對個人身份識別的需求可以說無處不在，並與日俱增。其中，自動人臉識別技術作為一種極為有效的身份鑒別途徑，在國家安全、金融、執行司法等社會各個領域都具有巨大的市場需求。例如，金融領域包括銀行卡持有人的身份驗證、電子商務的網上交易身份認證等，在國家機關及社會安全領域包括視頻監控、緝拿罪犯、司法認證、海關出入安檢、國安反恐、各類證件持有人的身份驗證、門禁系統等。此外，隨著整個計算、資訊技術的快速發展，人臉識別技術已不再局限於上述傳統的應用領域。包括可穿戴電腦、智慧環境和普適計算（Pervasive Computing）在內的“第四代計算與資訊技術＂及相關的設備將會遍佈人類生活中的每個角落：家庭，辦公室，汽車，衣服，眼鏡等等。它們對經濟和文化的影響將可能使前三代技術相形見絀。新一代計算技術的一個關鍵特徵就是具有身份識別的感知能力，只有獲得關於動作和行為的發起者及其周圍人的身份的上下文資料，這些動作、行為和意圖才能被正確理解，包括他們的話語、手勢及無意識的身體語言。作為最自然的、最友好的身份識別方式，自動人臉識別已成為下一代計算技術的重要組成部分。雖然人類能毫不費力地識別出人臉及其表情，但機器自動人臉識別卻是一個極具難度的課題。國外的人臉識別研究早在 19 世紀後期就已開始。但總的來說，

(4)

20 世紀 90 年代之前的人臉識別方法都需要人的大量干預。真正的機器自動識別始於 Kohonen、Kirby、Pentland 等[4][5][6] 在 90 年代左右所做的工作，他們提出並實現了基於特徵人臉方法的實驗系統。自此，人臉識別研究重新引起了人們前所未有的重視。人臉識別可描述為模式識別中的“n 類＂(n-classes)問題，即在已知有 n 類（n 個人）及每類的一個或若干個樣本的情況下，如何對被識別樣本（待測人臉圖像）進行歸類。近年出現了很多人臉辨識演算法，其中，最成功之方法為根植於面部之方法（appearance-based method） [1]，特徵子空間方法（Subspace-based method），尤其是主成分分析（Principal Component Analysis）方法[2]和線性辨別分析（Linear Discriminant Analysis）方法[3]為著名的方法。在這些方法中，原始資料空間與特徵空間的映射（ mapping ）為線性映射（ linear mapping）。同時，研究人員利用非線性映射（nonlinear mapping）將原始資料空間映射至特徵空間，並採取核分析方法（Kernel-based method）來解決非線性映射（nonlinear mapping）問題。作為模式分析研究領域的里程碑的技術-核分析方法成為模式識別研究熱點，並且被廣泛應用於各個領域，尤其是人臉辨識領域。研究表明，核分析方法有效地解決模式分析中的非線性分析，並取得巨大成功。研究人員也把核分析應用於人臉辨識中，並取得了良好的效果，提高辨識正確率，並且可以有效解決光照、姿態、以及表情問題。本計畫針對模式分析中的也核方法進行深入研究，並將其應用於人臉辨識中。三、結果與討論本計畫主要發展下列三種技術: 1. 根植於非線性映射子空間演算法在理論上，可以克服現有核判別分析演算法中所存在的缺陷，從理論上可以提高核判別演算法本身的性能，將優化的核分析演算法應用於人臉辨識中，提高人臉辨識系統的性能，同時解決人臉辨識中所面臨的光照、姿態和表情等問題。 2. 根植於 Gabor 小波核分析之人臉辨識 演算法研究 Gabor 小波被廣泛應用於人臉辨識中，可以有選擇地提取空域位置和方向特徵，而這些特徵有助於處理人臉圖像中的光照和臉部表情問題。因此，此方法的使用有利於解決人臉辨識中的光照、表情問題，從而提高人臉辨識的性能。本計畫採用的完整核 Fisher 判別分析（ Complete Kernel Fisher Discriminant Analysis）採用了兩種判別資訊，其增強了演算法的性能。因此本演算法有利於提高人臉辨識系統性能。 FPP(fractional power polynomial) 模型被證明了有助於提高 kernel-machine 的性能，在本計畫使用 FPP 模型，將其應用於 CKFD 中，有助於提高 CKFD 的性能，並將其應用於人臉辨識中，因而提高人臉辨識系統的性能。 3. 根植於線性映射子空間演算法研究 根植於特徵子空間之人臉識別方法採用 PCA 、LDA 和 LPP 是三個具有代表性的子空間人臉識別方法。本計畫中，我們首先分析每個子空間人臉識別方法在提取判別資訊上的貢獻，然後建立一個以子空間維數作為坐標軸的三位參數空間。使用這種方法進行識別，我們可以在三維空間內進行選擇參數，而標準的子空間方法（PCA 、LDA 和 LPP）只在局部的線或者面內進行搜索參數。我們提出利用三維參

(5)

數子空間（3D parameter subspace）模型之人臉辨識演算法得到很好之結果。四、計畫成果自評本計畫使得老師及學生在人臉辨識上瞭解各樣各式以核為基礎之辨識方法，對人臉辨識之困難點能徹底體會。因本計畫經費的支持，使得計畫執行能發表人臉辨識相關期刊論文 9 篇，會議論文 8 篇，並已申請 7 項專利，正在審查中。參考文獻

[1]Qingshan Liu, Hanqing Lu, and Songde Ma, “Improving kernel Fisher discriminant analysis for face recognition,＂ IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 14, no. 1, pp. 42-49, Jan. 2004.

[2]P.N. Belhumeur, J.P. Hespanha, and D.J. Kriegman, “Eigenfaces vs. Fisherfaces: Recognition Using

Class Specific Linear

Projection,＂ IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 19, no. 7, pp. 711-720, July 1997.

[3]A.U. Batur and M.H. Hayes, “Linear Subspace for Illumination Robust Face Recognition,＂ Proc. IEEE Int＇l Conf. Computer Vision and Pattern Recognition, Dec. 2001. [4]T. Kohonen, "Self-Organization and

Associative

Memory",Springer-Verlag, Berlin, 1989

[5]M. Kirby, L. Sirovich. Application of the Karhunen-Loeve Procedure for the Characterization of Human Faces. IEEE Transactions on Pattern Analysis and Machine Intelligence,Jan.1990,pp.103-10.

[6]Matthew Turk and Alex Pentland. Eigenfaces for recognition. Journal of Cognitive Neuroscience, vol. 3, no. 1, pp.71–86,1991. [7]4 Huilin Xiong, M.N.S. Swamy, and

M. Omair Ahmad, “Optimizing the Kernel in the Empirical Feature Space,＂ IEEE Trans. Neural Networks, vol. 16, no. 2, pp. 460-474, March 2005.

[8]Xiaogang Wang, and Xiaoou Tang, “A Unified Framework for Subspace Face Recognition,＂ IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 26, no. 9, pp. 1222-1228, Sep. 2004.

[9]G. Baudat and F. Anouar, “Generalized Discriminant Analysis Using a Kernel Approach,＂ Neural Computation, vol. 12, no. 10, pp. 2385–2404, 2000.

[10] S. Mika, G. Ratsch, and J. Weston, “Fisher discriminant analysis with kernels,＂ in Proc. Neural Networks for Signal Processing Workshop, Madison, WI, pp. 41–48, Aug. 1999.

[11] Jian Yang, Alejandro F. Frangi, Jing-yu Yang, David Zhang, and Zhong Jin, “KPCA Plus LDA: A

Complete Kernel Fisher

Discriminant Framework for Feature Extraction and Recognition,＂ IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 27, no. 2, Feb.2005.

[12] Chengjun Liu, “Gabor-Based Kernel PCA with Fractional Power Polynomial Models for Face Recognition,＂ IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 26, no. 5, pp. 572–581.MAY 2004.

(6)

[13] P Jonathon Phillips, Harry Wechsler, Jeffery Huang, and Patrick J Rauss. The FERET database and evaluation procedure for face recognition algorithms. Image and Vision Computing, vol. 16, no. 5, pp. 295– 306, 1998.

[14] P Jonathon Phillips, Hyeonjoon Moon, Syed A Rizvi, and Patrick J Rauss. The FERET evaluation methodology for face recognition algorithms. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 22, no. 10, pp. 1090–1104, 2000. [15] K. Messer, J. Matas, J.

Kittler, J.Luettin, and G. Maitre. XM2VTSDB: The Extended M2VTS Database. In Proceedings of International Conference on Audio- and Video-based Biometric Person Authentication. pp. 72-77, 1999. [16] P.N. Belhumeur, J.P. Hespanha,

and D.J. Kriegman, “Eigenfaces vs. Fisherfaces: Recognition Using

Class Specific Linear

Projection,＂ IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 19, no. 7, pp. 711-720, July 1997.

[17] F. Samaria and A. Harter, “Parameterisation of a stochastic

model for human face

identification,＂ Proceedings of 2nd IEEE Workshop on Applications of Computer Vision, 1994.

[18] P.N. Belhumeur, J.P. Hespanha, and D.J. Kriegman, “Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection,＂ IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 19, no. 7, pp. 711-720, July 1997.

[19] Xiaofei He, Shuicheng Yan, Yuxiao Hu, Partha Niyogi, and

Hong-Jiang Zhang, “Face

Recognition Using

Laplacianfaces＂ IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 27, no. 3, pp. 328-340, March 2005.

(7)

ICICIC 2007 國際學術研討會報告

潘正祥撰

高雄應用科技大學於 9 月 5 日至 9 月 7 日與日本熊本 ICIC

International 及日本東海大學共同主辦 ICICIC 2007 國際學術研討

會，與會人士共有約 650 人來自世界各國。大會邀請高雄應用科技大

學林仁益校長擔任大會榮譽主席並發表演講。透過共同主辦此次國際

學術研討會，提升台灣國際能見度及知名度，加強行銷全世界，獲得

無比收益。台灣同仁參與發表論文約 200 篇。論文集由 IEEE 出版。

圖一 ICICIC 2007 國際學術研討會開幕典禮林仁益校長致詞

(8)

圖二議程主席潘正祥主任致詞

(9)

圖四各國與會人士互相交流

概括此次議程， ICICIC 2007 國際學術研討會提供平台讓各國

人士研討交流，同時會議也透過自由討論的方式，供與會者商討各種

解決的可能方法，激發出各種不同的想法與創意。

(10)

人臉辨識演算法研究

行政院國家科學委員會專題研究計畫成果報告

人臉辨識演算法研究

研究成果報告(精簡版)

中華民國 97 年 03 月 03 日

行政院國家科學委員會專題研究計畫成果報告

人臉辨識演算法之研究

Study on the Face Recognition Algorithms

計畫編號：NSC 95-2221-E-151-044

執行期限：95 年 8 月 1 日至 96 年 7 月 31 日

主持人：潘正祥

國立高雄應用科技大學電子工程系

E-mail : [email protected]

ICICIC 2007 國際學術研討會報告

潘正祥撰

高雄應用科技大學於 9 月 5 日至 9 月 7 日與日本熊本 ICIC

International 及日本東海大學共同主辦 ICICIC 2007 國際學術研討

會，與會人士共有約 650 人來自世界各國。大會邀請高雄應用科技大

學林仁益校長擔任大會榮譽主席並發表演講。透過共同主辦此次國際

學術研討會，提升台灣國際能見度及知名度，加強行銷全世界，獲得

無比收益。台灣同仁參與發表論文約 200 篇。論文集由 IEEE 出版。

圖一 ICICIC 2007 國際學術研討會開幕典禮林仁益校長致詞

圖二議程主席潘正祥主任致詞

圖四各國與會人士互相交流

概括此次議程， ICICIC 2007 國際學術研討會提供平台讓各國

人士研討交流，同時會議也透過自由討論的方式，供與會者商討各種

解決的可能方法，激發出各種不同的想法與創意。

會議的安排方面，採用同一時段於不同議場同時進行多種不同主

題的會議模式；會議內容豐富多樣，是本次 ICICIC 2007 國際學術

研討會的最大特色。因此，與會者有充分選擇有興趣聽講的主題會議

之機會，也能更深入探討每一個議題。此外，此次研討會與會人員參

與踴躍，雖然每日的研討行程非常緊湊，但與會人員均認真研習，各

場研討均準時開始，且評論者也會給與發表人很多專業的意見及想

法，讓來自各國的與會人士受益良多，期許此次 ICICIC 2007 國際

學術研討會能為學術界留下一個重要的里程碑。

人臉辨識演算法研究

行政院國家科學委員會專題研究計畫 成果報告

人臉辨識演算法研究

研究成果報告(精簡版)

中 華 民 國 97 年 03 月 03 日

行政院國家科學委員會專題研究計畫成果報告

人臉辨識演算法之研究

Study on the Face Recognition Algorithms

計畫編號：NSC 95-2221-E-151-044

執行期限：95 年 8 月 1 日至 96 年 7 月 31 日

主持人：潘正祥

國立高雄應用科技大學電子工程系

E-mail : [email protected]

ICICIC 2007 國際學術研討會報告

潘正祥撰

高雄應用科技大學於 9 月 5 日至 9 月 7 日與日本熊本 ICIC

International 及日本東海大學共同主辦 ICICIC 2007 國際學術研討

會，與會人士共有約 650 人來自世界各國。大會邀請高雄應用科技大

學林仁益校長擔任大會榮譽主席並發表演講。透過共同主辦此次國際

學術研討會，提升台灣國際能見度及知名度，加強行銷全世界，獲得

無比收益。台灣同仁參與發表論文約 200 篇。論文集由 IEEE 出版。

圖一 ICICIC 2007 國際學術研討會開幕典禮林仁益校長致詞

圖二 議程主席 潘正祥主任致詞

圖四 各國與會人士互相交流

概括此次議程， ICICIC 2007 國際學術研討會提供平台讓各國

人士研討交流，同時會議也透過自由討論的方式，供與會者商討各種

解決的可能方法，激發出各種不同的想法與創意。

會議的安排方面，採用同一時段於不同議場同時進行多種不同主

題的會議模式；會議內容豐富多樣，是本次 ICICIC 2007 國際學術

研討會的最大特色。因此，與會者有充分選擇有興趣聽講的主題會議

之機會，也能更深入探討每一個議題。此外，此次研討會與會人員參

與踴躍，雖然每日的研討行程非常緊湊，但與會人員均認真研習，各

場研討均準時開始，且評論者也會給與發表人很多專業的意見及想

法，讓來自各國的與會人士受益良多，期許此次 ICICIC 2007 國際

學術研討會能為學術界留下一個重要的里程碑。

行政院國家科學委員會專題研究計畫成果報告

中華民國 97 年 03 月 03 日

圖二議程主席潘正祥主任致詞

圖四各國與會人士互相交流