• 沒有找到結果。

第二章 相關研究

2.1 二維區域影像特徵

到使用較精簡之區域二元描述子(Local Binary Descriptors, LBD),如 BRIEF[5]、

BRISK[6]、ORB[7]等。近年來,特徵描述子的發展趨勢漸漸朝向低位元表示法、

使用簡易的距離公式,在不影響辨識準確度的前提下,來降低計算量,預期達到 更佳的效果。此章節,我們將過去的相關區域影像特徵擷取方法依照編碼方式歸 類,分別進行討論:

2.1.1 基於區域梯度統計

在找尋影像中區域特徵點的時候,如 SIFT、SURF、DAISY 等特徵描述方法,

則是使用此類的編碼方式來計算影像中的區域特徵點。此方法為計算特徵點附近 區域的梯度大小和方向的分佈,並且依照矩形的區域進行分割,如圖 2.1,或對 數極(Log-polar)座標分割(如圖 2.2)的方式去統計,而形成特徵向量,以其當作影 像區域特徵。此類的編碼方式的特徵向量加入了權重考量,通常以實數方式表示,

距離的定義則是採用𝐿2-norm (Euclidean distance)計算方式,如式( 2.1)所計算。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

9

D(x,y) = √∑𝒏𝒊=𝟏(𝒙𝒊− 𝒚𝒊)𝟐 ( 2.1)

圖 2.1 矩形分割區域以及梯度統計

圖 2.2 對數極座標分割方式

2.1.2 基於點對關係

此類編碼方式為比較區域影像中,兩點之間的大小關係而決定其編碼為何。

著名的區域二元圖型(Local Binary Patterns, LBP)[8] 即為此類編碼方式的典型例 子,原始的 LBP 演算法是在一塊 3x3 的區域內,藉著中心點與鄰近的像素值的 比較,將其區域內像素轉換為二元表示後,再轉換為十進位表示。其方法流程為,

以中間像素值當作基準值,對區域中的每個像素,與其周圍八個鄰近像素進行比

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

10

較,可以按照順時鐘或逆時鐘方向進行比較,對中間像素值小於鄰近像素值設為 1,反之設為 0。進而可以得到一串二進位值,再將其值轉換為十進位值,作為其 位置像素的特徵,統計區域中各個像素所對應到的十進位值,累計形成直方圖,

再串聯所有區域的直方圖,即可得到影像的特徵向量。

以圖 2.3 為例,假設圖中數值為某影像的區域像素值,以中間 45 為基準,

按照上述的方法,得到二進位值(如下圖中間),接著,以順時鐘方向依序代表為 27,26,…,20之係數,產生二進位字串:11101001,轉換成十進位值為 233,則在直 方圖中所對應到的地方(此對應的是 233)進行加一的動作。

圖 2.3 LBP 計算方法之示意圖

前述所提到的區域二元描述子(LBD)也是屬於此類的編碼方式,將其像素值 轉換成二元編碼(0、1)表示,但是不同的是在距離計算上,此計算則是使用 Hamming Distance 方式。LBD 則會因為點對的取樣方式不同,而有不一樣的方 法出現,如:BRISK(圖 2.4)、FREAK[10] (圖 2.5)等等。

圖 2.4 BRISK 以特徵點為圓心,藍圓為取樣點位置,紅圓為對應用來平滑取樣點的

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

11

Gaussian kernel 的標準差,依照同心圓的方向取樣,互相不重疊

圖 2.5 FREAK 也是以同心圓方式取樣,每個圓為使用相對應取樣點的 Gaussian kernel 平滑取樣點,依照特定方式重疊

2.1.3 基於點群關係

點群關係與2.1.2 節所提到的點對關係相比較,最大的不同點是此方法同時 考慮鄰近多個點之間的關係。在考量多點之間的關係時,可能會因為排列組合數 過多,不利於計算,因此過去較少有利用點群關係建構的區域描述子, LIOP[11]

即為少數例子。

相關文件