• 沒有找到結果。

第二章 文獻探討

近年來,以自動化性別辨識已成為一個熱門的研究主題。為了使電腦認知人 類的性別,越來越多學者提出各種新穎的特徵擷取方法。隨著硬體的高度發展,

部分學者為了精確度與實用性,開始研究更複雜、資料量更大的分析方法。步態 分析有許多方式,大多數的論文,在前處理部份幾乎是大同小異,最大的差異在 於時間模板(temporal templates)對影像靜態與動態部分的結合方式不同,在第二 章中將介紹幾種既有的時間模板演算法與其變形。本章將針對不同特徵擷取的方 法應用於性別辨識之相關文獻進行探討。

2.1 以步態能量影像為基準的性別分類

從一段行人行走的資料庫影片中,取其一段週期後,將此段週期中的前景影 像,皆對齊其質心,再除以週期中所包含影像的張數,最後即可得到 GEI 的值。

步態能量影像(gait energy image, GEI),亦稱為平均輪廓法,類似的概念最早是由 Bobick 和 Davis 提出[2],用於行為識別上,之後是 Zhou 和 Bhanu[3]與 Han 和 Bhanu[4]以人的輪廓為基礎將其應用在步態辨識上,得到了很好的效果。此方法 獲取的影像通常會使用主成分分析法(principal component analysis, PCA)[5]或線 性鑑別分析法(linear discriminant analysis, LDA)[6]等方法進行分析特徵維度的降 維處理;此外,一般在使用 GEI 時,會以側面(90 度)影像進行分析,因為在 90 度以外的其它角度(例如:36 度),會有週期取得不易與 GEI 正規化等問題[7]。

Zhang 等人[8][9]在兩篇論文中提出一種很特別的方法,是在 GEI 的基礎上 延伸,將不同拍攝角度所得到的 GEI 融合之後,利用多重線性主成份分析法 (multilinear principal component analysis, MPCA)降低特徵資訊的維度當作特徵值,

最後應用在 CAISA Gait Dataset B 和自行蒐集的步態視訊上進行辨識。

Wang[10]以輪廓為基礎步行擷取出步態能量影像,再結合以紋理為基礎的區 域區塊差異圖樣(local block-difference pattern, LBDP)增加對雜訊的容忍度。LBDP

4

是從多重區塊區域二元之圖樣(multi-block local binary pattern, MBLBP)[11]衍生 而來,計算方式是取得貼片的區域特徵資訊後,得到這些貼片的差異圖樣,計算 雖然看似比傳統的 LBP 和 MBLBP 複雜許多,但在計算的過程中,因為 LBDP 一次計算的像素點較多,所以即使一次的計算略為複雜,但總計算次數減少很多,

使得總計算時間也相對減少許多,效能有略微提高。

Fan[12]以紋理為基礎的區域二元圖樣(local binary pattern, LBP)[13]和以輪廓 為基礎的 GEI 結合,以此改善 GEI 在面臨非 90 度的拍攝影像時,會產生辨識率 明顯下降的不穩定情況。他們的方法是先將原始影像分割成頭部、身體、和腿部 三個區塊,然後分別進行區域膚色偵測與去除,再擷取各個區塊的 LBP 當特徵 值後利用一致圖樣理論[14]將此特徵值進行降維以減少後續的計算時間,此為紋 理 的 部 分 。 接 著 將 GEI 的 特 徵 向 量 使 用 變 異 數 分 析 (analysis of variance, ANOVA)[15]來進行降維得到輪廓的部分,最後再將降維後的 LBP 特徵值與降維 後的 GEI 值進行串接作為完整的特徵表示。

Shan 等人[16][17]認為 Lee and Grimson[18]提出的方法只考慮到步態影像的 動態資訊是不夠完善的,所以將重點擺在動態特徵與結構特徵,也就是將步態影 像與臉部紋理的特徵結合[19][20]。但是,單純的串接結合仍是不夠完善,因為 人臉與步態雖然具有某種程度上的關聯,但是本質上相異,所以需要使用典型相 關分析(canonical correlation analysis, CCA)建立兩者間有效的關聯性。因此 Shan 等人先將臉部紋理特徵與步態能量影像分別取出,再使用 CCA 建立關係並融合 特徵值,最後交由支援向量機(support vector machine, SVM)進行性別分類。

2.2 以其他步態影像為基準的性別分類

Lai 等人參考步態片刻影像(gait moment image, GMI)[21]的觀念提出一種全 新 的演 算法 ,稱為向 前 參考 差異歷 史 影像 (forward difference history image, FDHI)[22]。有別於 GMI 是將整段影片同時提取所有的週期進行分析,FDHI 則

5

是在一個步態週期上進行切割,將一個週期切成四等份來分析。相較之下,可以 在擷取週期的處理上節省較多的時間,之後再使用 K-最近鄰域分類演算法 (k-nearest neighbor, KNN)[23]進行分類。FDHI 與 GMI 在分析的程序中,當影像 經過前處理後,人體的上半部通常處於靜態,此兩種方法會因為前述理由而將人 體的上半部部分影像視為不需要的資訊予以去除以降低計算量。

Lu 等人[24]認為目前的性別分類方法普遍用於固定且受控制的條件下,例如:

背景固定,如此一來降低了實用性,因此提出新方法。他們參考[25]使用的背景 相減法,接著使用平均步態影像(averaged gait image, AGI),再使用 K-means 分群 演算法[26]尋找最佳特徵值,最後使用 K-最近鄰域分類演算法進行分類。

Sabir 等人[27]提出了一套結合空間域和頻率域的方法,首先在前處理的部分 採用[28]提出的背景相減法取出人形的輪廓,接著分別對手、腳、膝蓋、肩膀和 身高等部分進行間距的量測,再使用時空模型(spatio-temporal model, STM)[29]

來獲得第一組的特徵值,然後將背景相減法取出的輪廓影像再分別做一階哈爾小 波轉換(Haar wavelet filter)和三階哈爾小波轉換獲得頻率域的資訊,之後取水平 低頻與垂直低頻的部分當作第二組跟第三組的特徵值,最後將三組特徵混合串接,

再使用 LDA 來降低維度得到最後的特徵值。

6

相關文件