• 沒有找到結果。

機率圖模型之人臉辨識

第四章中,我們先對本研究所提出之機率圖模型做說明,使得我們可以公式 化的描述在影片上的人臉辨識問題,而後,再將本研究方法所碰到的問題分成三 個子問題來討論,最後,則總結此研究之事前訓練步驟以及整體架構之演算法。

4-1 機率圖模型與公式推導

傳統的狀態空間模型(state space model)之人臉辨識的主要架構如圖 4-1 所 示。假定在此人臉辨識的架構中共有 K 個人,而x (state vector)代表在時間點 t,t 此人臉辨識的結果,將x1,...,x 集合起來,t X ={x1,..., }xt 代表在時間點 1 到時間 點 t 所辨識出來的結果之集合;z (observation)代表在時間點 t,於觀測到的資料t 中所截取出的人臉影像,將z1,...,z 的影像集合起來,t Z ={z1,..., }zt 代表在時間 點 1 到時間點 t 從有序影像中所截取出來的人臉影像之集合。

當有序影像所截取出來的人臉影像,有姿勢(pose)的改變時,傳統的狀態空 間模型(state space model)需要使用大量的狀態(state)才足以描述每個人不同姿勢

(pose)的情況。例如:一個系統內有 20 個人,每個人有 7 種姿勢,則需要 140 個 狀態才能夠含蓋所有可能發生的情況,否則無法得到正確的辨識結果。如此一 來,傳統的狀態空間模型在碰到有姿勢變化的有序影像時,便會很複雜。因此,

本研究主要的目的,就是建造一個機率圖模型 (a Probabilistic Graphical model for video-based Face Recognition , PGFR) ,如圖 4-2,依照事前資訊,得知人臉的姿

勢(pose)可能有哪些變化,來建立新的節點,H ={h1,...,hR},並將此新節點 H 加

在時間點 t,狀態x 的事後機率(posterior probability),可由以下定理求得: t

1

依照圖 4-2 的貝式網路(Bayesian network),結合 Eq.(1)和 Eq.(2),以及運用 d-分割性質(d-separation property)[25],列出以下四種獨立情況:

-p(xt|Xt1,H)= p(xt |xt1,H) (13) -

p ( z

t

| x

t

, Z

t1

, H ) = p ( z

t

| x

t

)

(14)

-

p ( x

t

| X

t1

, Z

t1

) = p ( x

t

| X

t1

)

(15)

的相似度,因而求得在時間點1時的辨識結果。

另一方面,在進行人臉辨識前,必須先滿足兩個假設:第一點,在有序影像 中,藉由實行人臉偵測方法,假定每張影像都能截取出完整的人臉位置;第二點,

假定每張影像所截取出的人臉,都可被歸類成某個人的某個姿勢變化,換言之,

即是在所有訓練或測試的人臉影像裡,每張影像都可被歸屬到 R 個姿勢中的其 中一個,在本研究中,我們採用 K-means 分群法,粗略的將人臉影像分成 R 個 子群,並且手動的檢查這些人臉影像之分類是否有錯誤。

本小節先以公式化的機率形式來描述我們的人臉辨識方法(PGFR),接著將 此方法分成三個子問題,在以下各小節內,會詳細敘述三個子問題的解決方法。

4-2 相似度之計算

在 Eq.(12)中, ( | )p z x ,即是估計在時間點 t,此張人臉影像t t z 和每個在資t 料庫中的人之相似程度。然而,雖然我們取得的是一串有序影像,但在此我們不 考慮時間的因素,只考慮空間上的分佈情況,因此我們可以把它視作單張影像之 人臉辨識。在本研究裡,我們採用二維線性鑑別分析法(2DLDA)[31]來做特徵摘 取,而後實行單張影像之人臉辨識。

給定 K 個人訓練用之人臉影像,我們利用二維線性鑑別分析法(2DLDA),

將所有訓練用之人臉影像(

m n ×

像素大小)降維至 p q× 的子空間內,並且能夠有 效的將這些訓練用之人臉影像分割成 K 群(K 個人)。在本研究中,原始的人臉影

像大小經過二維線性鑑別分析法(

2DLDA)降維後

,每張影像都降維到

b b ×

維,

值。在計算遞移機率時,我們將p x x( t| t1,H)轉換如下:

似度,計算方式如下:

再來,我們必須事前估計人臉姿勢變化之遞移機率,Eq.(22)採用統計的方式

但是由於我們處理的是一串有序的人臉影像,因此我們可以將時間的資訊加入其

圖 4-5 本研究之訓練步驟

圖 4-6 本研究之人臉辨識演算法

相關文件