第二章 相關研究
2.1 區域二元化圖型
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第二章 相關研究
在本章節中,將針對區域二元化圖型與區域三元化圖型這兩組特徵描述子,以實例介 紹其的計算方式與應用時機,並討論其限制與可能的解決方案。
2.1 區域二元化圖型
區域二元化圖型(local binary patterns, LBP)是由芬蘭的 Oulu 大學 Ojala 等研究學者 所提出的[8],是一種區域紋理變化的特徵描述方式。原始的 LBP 演算法是在一塊 3x3 的區塊內,藉由中心點g 與參考點c gp像素值的比較,將區塊內像素轉化為二元化表示 後,再轉為十進位值。LBP 的計算流程如圖 2.1 所示,首先將 3x3 區塊中心點的像素 值設為閥值,當周圍八個參考點的像素值小於閥值時,則將該點的值設為 0,反之則 設為 1,之後再將 thresholding 後的結果乘上對應的權重,即可算出區塊中心點的 LBP 值,而要描述一個影像區域時,則對區域內所有點進行 LBP 運算,再統計累加出影像 的區域二元特徵直方圖(LBP Histogram),作為圖像的特徵描述子。
圖 2. 1 : 基本的 LBP 定義與運算方式
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
上面所介紹的原始區域二元特徵所參考的區域只是一個 3x3 的區塊,支援的空間 範圍較小,沒有辦法描述出較大的紋理結構,因此 Ojala 等學者把 LBP 的定義延伸,
在延伸定義的 LBP 中,對於參考的區域大小以及參考點數不再局限於 3x3 的區塊中,
使用者可依需求來改變參考的區域半徑 R 以及參考點數的點數(圖 2.2)。假設中心點的 座標為(0,0),則參考點的座標為
Rsin(2p/P),Rcos(2p/P)
,R 為區域半徑,P 為 參考點數,若是所算出的座標沒有落在像素的中心點,則使用內插法來計算其像素值。圖 2. 2 : (4,1), (8,2)與(12,3)的 LBP。其中第一個數字表示參考點數,第二個數字為參考 半徑。
LBP 最早被應用於材質分析(texture analysis),之後陸續在人臉辨識、表情識別、
多媒體搜尋、背景建模、動作分析等方面都有相當不錯的效果,由於 LBP 兼具效率與 準確性的特點,也因此後續有若干的延伸或改善的版本,例如可處理不同角度的 LBP (rotation-invariant LBP)[8]、多重解析度的 LBP(multi-scale LBP)[11]、內含機率資訊的 Bayesian LBP[12]等。
在觀察 LBP 的計算過程中,我們可以發現幾個問題,第一是關於對雜訊的敏感 度,假設圖 2.1 的內容受到了雜訊的干擾而有了微幅的改變(中間偏左的像素值由 53 改為 54,如圖 2.3),依照 LBP 的定義,得到的二元樣式為 11001011,和原樣式的 Hamming distance 為 1,但化為十進位時卻有相當大的差距 (75 vs. 203),這也代表著
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 2. 3 : LBP 的抗噪力詴驗
第二個問題則是樣式的個數與分群的方式,以最簡單的 LBP(8,1)來說,其區域二 元特徵直方圖會有 28= 256 個 bin,而 LBP(16,2)的區域二元特徵直方圖則遽增為 65536 個 bin,若處理的區塊大小為 32x32,在直方圖上得到的通常是極為稀疏的結果(如圖 2.4),是否具描述力與代表性值得探討,雖然類似的問題可以透過 uniform pattern 的概
念稍微紓緩1,然而當樣式的種類過多時,仍有樣式過多而樣本不足的根本問題。
圖 2. 4 : 稀疏的正規化直方圖分佈
除了上述的兩個問題外,LBP 在平滑影像(例如:天空或海洋)的效果也不理想,
這是因為 LBP 作 thresholding 的策略與平滑影像上的灰階值過於接近的緣故。在圖 2.5 中,兩個區塊中心像素值皆為 54,但是其中一個區域內所參考的像素值皆為 54,一個
1根據統計,(8,1) 的 LBP 約有 90%為 uniform patterns, (16,2) 的 LBP 約有 70%為 uniform patterns。
Binary:
11001011 Decimal: 203
‧
Ternary Pattern,LTP)[13],LTP 的主要作法,是將目前像素值與中心點像素值的關係,分為略大於(設為 1)、略小於(設為-1)和接近(設為 0)等三種狀況,亦即