第二章 表情辨識相關研究
2.3 區域二元圖樣相關研究探討
自 1960 年以來,紋理的分析已應用在各類的研究主題,並開始有學者提出 各種取出具有鑑別度的紋理方法。一般來而言,這些方法可分為四類:統計、幾 何、基於模型、與信號處理[37]。其中,最廣泛被使用的是二階灰度統計的共生 矩陣方法(Co-occurrence Matrices of Second Order Gray Level Statistics)[38]、以信 號處理為基礎的局部線性轉換(Local Linear Transforms)[39]、多通道 Gabor 濾波 器(Multichannel Gabor Filtering)[40]、小波(Wavelets)[41]及馬可夫隨機場(Markov Random Fields)[42]。但是這些方法若應用在現實世界中的紋理現象,有時無法表
現出優秀的效能;更因為這些方法的計算過於複雜,無法符合即時設備上的需求。
因此,近幾年來具有識別能力及計算效率的局部紋理表示法被提出,像是區 域二元圖樣[43][44]。此方法應用在各種以紋理方法為基礎的電腦視覺問題有重 要的進展,研究的焦點也從 2D 紋理擴大至 3D 紋理[45-47]。其應用範圍包括:
臉部及臉部表情辨識[36]、物件辨識[48]、背景相減[49]、視覺語音辨識[50]、與 動作及步態的辨識[51]。
在臉部表情辨識研究中基於外觀特徵的方法,由於 LBP 對光照的變化及低 解析度都具有較佳的強韌性,辨識效果比 Gabor 小波佳。因此目前已有一些學者 將區域二元圖樣應用在表情辨識系統中,也得到相當不錯的結果,例如 Feng 等 人[25]使用 LBP 進行臉部表情特徵提取,並運用線性規劃進行七種表情的分類,
由實驗結果得知,此方法表現出相當優異的效能。Viola 等人[36]的研究更表明 LBP 的方法相較於 Gabor 小波表示法,其運算速度較快,且在低解析度的表情影 像中,能取出具鑑別度的臉部資訊。
由於以整張臉部影像進行特徵擷取將導致計算量過大及擷取到不必要的資 訊,針對這些問題,Liu 等人[52]比較區域 LBP 與全域 LBP 對於表情辨識的準確 度;其中區域 LBP 指的是針對眼睛、嘴角、眉毛區域,全域則是整張臉部影像,
實驗結果顯示全域 LBP 的效能較佳。為了能更準確的選出那些不同表情容易造 成變化的區域,Shan 等人[53]藉由在人臉影像上通過移動和縮放子區窗口,並以 AdaBoost 演算法選出較具鑑別能力的子區域,再將這些子區域進行 LBP 運算 後,其辨識率與傳統直接將臉部影像切割為許多個子區塊的 LBP 方法比較,大 約提升 2.5%。此外,除了直接在人臉影像中提取子區域,Shan 等人[54]提出以 AdaBoost 演算法在 LBP 直方圖中透過學習來取得具有鑑別能力的資訊。近年 來,臉部表情辨識大多應用於視訊會議中。為了使影像能夠即時傳遞,必須降低 影像的解析度;因此,許多學者開始研究在低解析度的影像上進行表情辨識,以 驗證其方法的實用性。Shan 等人[55]將臉部區域分為六種不同的解析度,實作 LBP 及 Gabor 兩種方法,並與 Tian 等人[27]所提的方法進行比較;其中,Tian
等人使用 Gabor 濾波器擷取出不同影像臉部特徵的改變,送入支持向量機 (Support Vector Machine, SVM)對六種表情進行辨識,並與特徵追蹤[8]及特徵偵 測[57]兩種基於幾何特徵的方法進行比較。從一些論文的結果可以看出幾何特徵 的方法並不適用於低解析度的影像辨識,因為低解析度的影像會導致追蹤臉部元 件(例如:眼睛、嘴巴等)變得困難。此外,從 Shan 等人[55]及 Tian 等人[27]所得 到的結果中顯示,LBP 更適合於低解析度的影像中進行表情辨識。此與 Liao 等 人[58]以 LBP 及 Gabor 小波對 JAFFE 資料庫[59]進行低解析度影像的表情辨識結 果相吻合。所以,LBP 在一定範圍的低解析度下較具強韌性與穩定性,能應用於 真實世界中特別是低解析度影像的輸入。