第三章 人臉辨識系統
3.5 人臉判別
在測試階段,將測試影像輸入,做完人臉偵測,然後選擇好待尋的人臉之後,接下 來就是辨識出這個人是誰。將待尋人臉先經過特徵抽取的步驟轉成影像特徵向量,然後 再輸入到在建立人臉資料庫時,所訓練好的類神經網路,會得出一組輸出結果,這組輸 出結果的值就是對應於人臉資料庫中各人臉的相似程度。如果越接近訓練時某人物的人 臉目標值,就代表越有可能是此人物,依照相似度的高低來排列,就可以判別待尋人臉 為何人。
Chapter 4
第四章
實驗結果與分析
在本章中會討論本論文所提出的人臉辨識系統對於測試影像的人臉偵測率、人臉辨 識率與系統效能,在4.1 節會說明用來測試系統效能所採用的實驗機制;在 4.2 節會展 示實驗結果及與其他方法的比較;在4.3 節會對實驗結果做討論。
4.1 實驗機制
在4.1.1 節中會介紹實驗用的硬體架構以及程式處理效能速度;在 4.1.2 節中會定義 用來評估系統效能的方式。
4.1.1 實驗設備
本研究實驗用的設備是中央處理器為AMD Athlon 64 3000+ 2.0GHz 而且記憶體為 1GB 的個人桌上型電腦,使用 Matlab 2007a 的軟體來編寫程式以實現人臉辨識系統。在 人臉偵測的部分,類神經網路訓練時所使用的訓練資料庫在3.4 節已經介紹過,是卡內 基美隆大學的PIE 資料庫[28][29],從其中選用了總共包含了有 30 個人、5 種不同的姿 勢及8 種照明環境,總共 1200 張的人臉影像樣本,再加上 2400 張非人臉影像樣本,總 共 3600 張影像樣本。在人臉辨識的部分,建立人臉資料庫與測試階段中所使用的測試
相片則包含自己拍攝的以及同學與朋友所提供的照片。
4.1.2 效能評估
人臉辨識系統的主要目的是尋找輸入相片裡是否有人臉存在,所以在系統的效能評 估方面分為人臉偵測與人臉辨識的結果兩種。根據人臉偵測的可能情形,可以將結果分 為以下四種,如表4.1 所示:
1. 正確肯定(true positives, TP):意思是所偵測到的人臉全都是正確的,也就是成功 的偵測到人臉。
2. 正確否定(true negatives, TN):意思是沒有把非人臉誤認為人臉的情形,也就是 沒有誤判的非人臉。
3. 錯誤肯定(false positives, FP):意思是沒有出現人臉卻把某個區域認定為人臉,
也就是偵測錯誤的人臉。
4. 錯誤否定(false negatives, FN):意思是出現了人臉但沒有偵測到,也就是未被偵 測到的人臉。
= FP 100%
測到錯誤的人臉為2 張。因此在人臉特徵因為照明關係不太清楚的時候,系統的偵測效
(a)
(b)
圖4.1 人臉偵測的部分實驗結果,(a)大多數為正面的人臉,(b)臉部 特徵不明顯的正面人臉,(c)有遮擋的正面人臉,(d)各種角度的人臉。
(c)
(d) 圖4.1(續) 人臉偵測的部分實驗結果。
表4.2 三種人臉偵測方法的實驗結果比較。
人臉總數:764 TP FN FP 正確率 錯誤率 誤判率 本論文的結果 676 88 89 88.48% 11.63% 20.75%
Huang 的結果 641 123 61 83.90% 8.69% 22.30%
Kadoury 的結果 658 106 84 86.13% 11.32% 22.41%
4.2.2 人臉辨識的實驗結果與分析比較
在人臉辨識的實驗結果部分,測試相片是從自己拍攝及同學與朋友所提供的照片中 選出20 個人物,總共 96 張照片來做測試,包含了各種場景及不同人臉角度與大小的照 片,一共有 402 張人臉。圖 4.2 是人臉辨識實驗的部分結果。圖 4.2(a)是測試照片做完 人臉偵測後的結果,將這些截下來的人臉送入類神經網路做辨識,辨識後的結果對照在 人臉資料庫中的人物,將其由左至右依序展示在圖4.2(b)。
人臉辨識的實驗結果分為兩個部分,第一部分是測試訓練樣本數多寡下的辨識率,
隨機抽取不同數量的訓練樣本,這樣可以模擬實際應用情況下,可能會發生訓練樣本數 不足的情況,測試結果如表4.3 所示。第二部分是測試各種維度下的辨識率,這樣可以 找出區域保留投影所降低的維度與人臉辨識率之間的關係,由於本論文的方法是對 24 種賈伯小波做降維,因此降低後的維度會以 24 為基數增加來測試辨識率,測試結果如 表4.4 所示。
從表4.3 中可看出,訓練樣本數越多,辨識率也會隨之增加,但又不是絕對,這是 因為隨機選擇訓練樣本並不一定能找到足夠代表性的樣本,也就是說,訓練樣本是否具 代表性才是影響辨識率的關鍵。
從表4.4 中可看出,維度越高,辨識率同樣的也會增加,但是增加的幅度會越來越 小。當維度到達192 維時有最佳的辨識率與維度的平衡,也就是對於每一個賈伯濾波器,
使用區域保留投影做降維,只需要8 個維度就足以表示了。
(a)
(b)
圖 4.2 人臉辨識實驗的部分結果,(a)人臉偵測後的結果,(b)人臉 辨識的結果,由左至右取出資料庫的人臉做展示。
接下來將本論文的方法和兩篇相關的論文做比較,這兩篇論文分別是Wang 等人[36]
所提出的方法與You[37]等人所提出的方法。Wang 的方法是使用二維賈伯小波視窗的方 法去抽取局部特徵向量,用這個向量來表示人臉並且做辨識;而You 的方法是屬於流形 學習中的方法,稱之為鄰域識別投影(neighborhood discriminant projection, NDP),此方法 是從局部線性嵌入的方法修改而來。主要思想是保留分類內部的幾何關係,透過不同類 別之間的差異而有識別的能力。選擇這兩個方法來比較是因為Wang 的方法與本論文都 是使用賈伯濾波器來得到人臉的特徵,但Wang 是使用局部的人臉特徵來辨識人臉,不 像本論文使用的是人臉的整體特徵;You 的方法則是直接將人臉影像經過鄰域識別投影 來學習,不像本論文是使用賈伯濾波器來得到人臉的特徵。用這兩種方法對本論文所使 用的測試相片分別對不同訓練樣本數與不同維度的情形做人臉辨識,結果如圖4.3 與圖 4.4 所示。
表4.3 不同訓練樣本數的人臉辨識實驗結果。
訓練樣本數 辨識正確 辨識錯誤 辨識率
2 47 355 11.69%
4 128 274 31.84%
6 182 220 45.27%
8 269 133 66.92%
10 334 68 83.08%
12 361 41 89.80%
14 376 26 93.53%
16 373 29 92.79%
18 375 27 93.28%
20 368 34 91.54%
22 373 29 92.79%
24 369 33 91.79%
26 371 31 92.29%
28 374 28 93.03%
30 367 35 91.29%
由圖 4.3 中同樣可看出本論文的方法是較優於另外兩種方法,Wang 的方法與本論 文相近,但是效果仍然沒有像本論文的方法這麼好,雖然特徵與本論文所使用的很類 似,但由於Wang 使用局部的特徵,因此在辨識上對於不同表情與角度的變化,就沒有 那麼好的容忍度;另外從圖上可以很明顯的看出來,You 的方法是需要比較多的訓練樣 本才能夠達到足夠的辨識率。
表4.4 不同維度下的人臉辨識實驗結果。
維度 辨識正確 辨識錯誤 辨識率
24 140 262 34.83%
48 217 185 53.98%
72 289 113 71.89%
96 325 77 80.85%
120 341 61 84.83%
144 353 49 87.81%
168 361 41 89.80%
192 366 36 91.04%
216 369 33 91.79%
240 371 31 92.29%
264 372 30 92.54%
288 373 29 92.79%
312 373 29 92.79%
336 374 28 93.03%
360 374 28 93.03%
384 374 28 93.03%
408 375 27 93.28%
432 375 27 93.28%
456 375 27 93.28%
480 376 26 93.53%
圖4.3 不同訓練樣本數的人臉辨識實驗結果比較。
圖4.4 不同維度下的人臉辨識實驗結果比較。
由圖4.4 中可看出本論文的方法是較優於 Wang 的方法,但是比 You 的方法稍差。
Wang 的方法雖然也是用賈伯濾波器來得到人臉特徵,但 Wang 是使用局部的人臉特徵 與主成份分析做降維來辨識人臉,不像本論文使用的是人臉的整體特徵與區域保留投 影;雖然Wang 的方法是將人臉局部特徵分開做主成分分析來降維,但是效果仍然沒有 像本論文的方法這麼好;You 的方法的最大優點是只需要比較少的維度就能有不錯的辨 識率,但是需要較多的訓練樣本才能達到效能,因此在訓練樣本不足時,辨識率反而會 較低。
4.3 結果討論
本論文提出的人臉偵測與人臉辨識的方法,是針對日常生活中隨意拍攝所得到的相 片,在對於相片的來源及數量都沒辦法掌握的情況下,已經具有基本的偵測成功率及辨 識率。在相片來源的方面,由於偵測成功率的高低在進一步的人臉辨識上有很大的影 響,從以上的實驗結果中可得知,本論文的方法在人臉特徵明顯時有較好的偵測成功 率,同時也會有較好的辨識率。在相片數量的方面,想要有較好的辨識率,就要有足夠 的訓練影像樣本才能夠達到,但是由實驗結果可得知,是否有足夠的代表性訓練樣本才 是能否提高辨識率的關鍵。以下分為人臉偵測與人臉辨識兩個部分做結果討論與分析。
4.3.1 人臉偵測的結果討論
在人臉偵測的部分,針對本論文系統的人臉偵測結果做整理,根據影響人臉特徵的 因素,可分為照明、角度與遮擋三種,表4.5 列出了在這三種因素組合下的可能情形。
情形(a)指的是在光線足夠環境且人臉上沒有陰影,人臉角度為正面對鏡頭的人臉,沒有 受到任何遮擋的情形,此時人臉的特徵最為清楚,因此正確率也達到了100%;情形(b) 為人臉僅單純受到照明影響,人臉角度為正面,沒有受到任何遮擋的情形,在這種情形 下人臉的特徵有部分受到照明影響而變的不清楚,正確率為次高的 96.05%;情形(c)為 人臉僅有角度變化,沒有受到照明與遮擋影響的情形,這種情形下人臉的特徵會因為某
些角度而消失,正確率為 93.86%;情形(d)為人臉僅有受到遮擋的影響,沒有受到照明 影響,人臉角度為正面的情形,從表中可看出,在這幾種影響人臉特徵的因素中,遮擋 影響的程度最大,不但會使得人臉特徵消失,同時還可能被誤判為非人臉,因此正確率 只有87.23%;接下來情形(e)為同時包含情形(b)及情形(c),也就是同時有照明及角度影 響,但是沒有遮擋的情形,這時候的正確率是 77.93%;情形(f)為同時包含情形(c)及情 形(d),也就是同時有角度及遮擋影響,但是沒有照明影響的情形,這時候的正確率是 55.32%;情形(g)為同時包含情形(b)及情形(d),也就是同時有照明及遮擋影響,但是人 臉角度為正面對鏡頭的情形,這時候的正確率是60.42%;最後是情形(h),同時有照明、
角度與遮擋三種因素影響的情形,在這種情形下很難正確偵測到人臉,因此正確率是最 低的,僅有11.11%;而由表中可看出,本論文的系統對於照明有較好的容忍度,其次是 角度,最後是遮擋,也就是受到遮擋時容易對系統的偵測正確率造成很大的影響。
表4.5 人臉偵測結果分析。
表4.5 人臉偵測結果分析。