文獻探討

第二章文獻探討

近年來，以自動化性別辨識已成為一個熱門的研究主題。為了使電腦認知人類的性別，越來越多學者提出各種新穎的特徵擷取方法。隨著硬體的高度發展，

部分學者為了精確度與實用性，開始研究更複雜、資料量更大的分析方法。步態分析有許多方式，大多數的論文，在前處理部份幾乎是大同小異，最大的差異在於時間模板(temporal templates)對影像靜態與動態部分的結合方式不同，在第二章中將介紹幾種既有的時間模板演算法與其變形。本章將針對不同特徵擷取的方法應用於性別辨識之相關文獻進行探討。

2.1 以步態能量影像為基準的性別分類

從一段行人行走的資料庫影片中，取其一段週期後，將此段週期中的前景影像，皆對齊其質心，再除以週期中所包含影像的張數，最後即可得到 GEI 的值。

步態能量影像(gait energy image, GEI)，亦稱為平均輪廓法，類似的概念最早是由 Bobick 和 Davis 提出[2]，用於行為識別上，之後是 Zhou 和 Bhanu[3]與 Han 和 Bhanu[4]以人的輪廓為基礎將其應用在步態辨識上，得到了很好的效果。此方法獲取的影像通常會使用主成分分析法(principal component analysis, PCA)[5]或線性鑑別分析法(linear discriminant analysis, LDA)[6]等方法進行分析特徵維度的降維處理；此外，一般在使用 GEI 時，會以側面(90 度)影像進行分析，因為在 90 度以外的其它角度(例如:36 度)，會有週期取得不易與 GEI 正規化等問題[7]。

Zhang 等人[8][9]在兩篇論文中提出一種很特別的方法，是在 GEI 的基礎上延伸，將不同拍攝角度所得到的 GEI 融合之後，利用多重線性主成份分析法 (multilinear principal component analysis, MPCA)降低特徵資訊的維度當作特徵值，

最後應用在 CAISA Gait Dataset B 和自行蒐集的步態視訊上進行辨識。

Wang[10]以輪廓為基礎步行擷取出步態能量影像，再結合以紋理為基礎的區域區塊差異圖樣(local block-difference pattern, LBDP)增加對雜訊的容忍度。LBDP

是從多重區塊區域二元之圖樣(multi-block local binary pattern, MBLBP)[11]衍生而來，計算方式是取得貼片的區域特徵資訊後，得到這些貼片的差異圖樣，計算雖然看似比傳統的 LBP 和 MBLBP 複雜許多，但在計算的過程中，因為 LBDP 一次計算的像素點較多，所以即使一次的計算略為複雜，但總計算次數減少很多，

使得總計算時間也相對減少許多，效能有略微提高。

Fan[12]以紋理為基礎的區域二元圖樣(local binary pattern, LBP)[13]和以輪廓為基礎的 GEI 結合，以此改善 GEI 在面臨非 90 度的拍攝影像時，會產生辨識率明顯下降的不穩定情況。他們的方法是先將原始影像分割成頭部、身體、和腿部三個區塊，然後分別進行區域膚色偵測與去除，再擷取各個區塊的 LBP 當特徵值後利用一致圖樣理論[14]將此特徵值進行降維以減少後續的計算時間，此為紋理的部分。接著將 GEI 的特徵向量使用變異數分析 (analysis of variance, ANOVA)[15]來進行降維得到輪廓的部分，最後再將降維後的 LBP 特徵值與降維後的 GEI 值進行串接作為完整的特徵表示。

Shan 等人[16][17]認為 Lee and Grimson[18]提出的方法只考慮到步態影像的動態資訊是不夠完善的，所以將重點擺在動態特徵與結構特徵，也就是將步態影像與臉部紋理的特徵結合[19][20]。但是，單純的串接結合仍是不夠完善，因為人臉與步態雖然具有某種程度上的關聯，但是本質上相異，所以需要使用典型相關分析(canonical correlation analysis, CCA)建立兩者間有效的關聯性。因此 Shan 等人先將臉部紋理特徵與步態能量影像分別取出，再使用 CCA 建立關係並融合特徵值，最後交由支援向量機(support vector machine, SVM)進行性別分類。

2.2 以其他步態影像為基準的性別分類

Lai 等人參考步態片刻影像(gait moment image, GMI)[21]的觀念提出一種全新的演算法，稱為向前參考差異歷史影像 (forward difference history image, FDHI)[22]。有別於 GMI 是將整段影片同時提取所有的週期進行分析，FDHI 則

是在一個步態週期上進行切割，將一個週期切成四等份來分析。相較之下，可以 在擷取週期的處理上節省較多的時間，之後再使用 K-最近鄰域分類演算法 (k-nearest neighbor, KNN)[23]進行分類。FDHI 與 GMI 在分析的程序中，當影像經過前處理後，人體的上半部通常處於靜態，此兩種方法會因為前述理由而將人體的上半部部分影像視為不需要的資訊予以去除以降低計算量。

Lu 等人[24]認為目前的性別分類方法普遍用於固定且受控制的條件下，例如:

背景固定，如此一來降低了實用性，因此提出新方法。他們參考[25]使用的背景 相減法，接著使用平均步態影像(averaged gait image, AGI)，再使用 K-means 分群 演算法[26]尋找最佳特徵值，最後使用 K-最近鄰域分類演算法進行分類。

Sabir 等人[27]提出了一套結合空間域和頻率域的方法，首先在前處理的部分採用[28]提出的背景相減法取出人形的輪廓，接著分別對手、腳、膝蓋、肩膀和身高等部分進行間距的量測，再使用時空模型(spatio-temporal model, STM)[29]

來獲得第一組的特徵值，然後將背景相減法取出的輪廓影像再分別做一階哈爾小波轉換(Haar wavelet filter)和三階哈爾小波轉換獲得頻率域的資訊，之後取水平低頻與垂直低頻的部分當作第二組跟第三組的特徵值，最後將三組特徵混合串接，

再使用 LDA 來降低維度得到最後的特徵值。

在文檔中以步態影像之貼片式區域紋理圖樣為基準的性別分類 (頁 11-14)

第二章 文獻探討

2.1 以步態能量影像為基準的性別分類

2.2 以其他步態影像為基準的性別分類

第二章文獻探討