• 沒有找到結果。

在確定了分析的主體區域後,需要對目標區域提取特徵值或者特徵向量。目前 有關圖像特徵向量提取的較主流、成熟的研究有 T. Ojala 等人在 1994 年提出的 LBP(Local Binary Pattern)[16, 17]及之後被陸續提出的一系列 LBP 變形等,

David Lowe 在 1999 年提出並於 2004 年進行了改良和完善的 SIFT (Scale-invariant feature transform)[13, 14] 以及 N. Dalal 等人在 2005 年提出的 HOG

(Histograms of Oriented Gradients)[5]。

2.2.1. LBP Descriptor

LBP 是一種描述圖像局部紋理特徵的 descriptor,它具有局部光照不變性的優 勢。LBP 應用廣泛,在指紋識別、人臉識別、脣語識別、表情檢測、車牌識別 等領域有着不錯的表現。其基本原理則如圖 2-2 所示,是通過待測像素點與周 圍 8 個像素的值比較大小,從而確定周圍像素點的二進制數值(0 或 1),並以 統一的順序排列成串,最後轉換成十進制數得到。在圖 2-2 中,3*3 的圖像區域 中,灰度值爲 136 的點最後計算得到的 LBP 值爲 199,我們可以觀察到該方法 只關心被檢測像素與周圍像素的值的強弱,而不關心其強弱的差值,這樣的紋

立 政 治 大 學

Na tiona

l Ch engchi University

6

理表示法對於光線變化較不敏感,但是對於雜訊卻會比較敏感。推及動漫網頁 中的圖像,這些圖像在網路上流傳,往往會被不同的使用者保存為不同的顏色 格式(RGB,CYMK 等),容易出現一定程度的顏色微弱變化(相當於明暗的 變化),此時 LBP 對光線變化較不敏感的特性就能夠確保將這類動漫圖像重新 識別爲同一張。

圖 2-2 LBP 特徵值的提取

2.2.2. SIFT Descriptor

SIFT 可以處理兩幅圖像之間發生平移、旋轉、仿射變換情況下的匹配問題,具 有很強的圖形匹配能力。在 Mikolajczyk[15]對包括 SIFT 在內的十種 local descriptors 所做的不變性對比實驗中,SIFT 及其擴展演算法已被證實在同類描 述子中具有最強的健壯性。由此可見 SIFT 適用性非常廣泛。總體而言,SIFT 同時具備以下優點:1)穩定性好;2)多量性(幾個 object 即可產生大量 SIFT 特徵向量),3)可擴展性強(方便與其他形式的特徵向量結合)等。

相較於 SIFT 因其龐大計算量不用與行人檢測而言,Yan Ke 等人在 2004 年 提出的 SIFT[10]過濾了較多維資訊而只保留了 20 個主分量, 因此 PCA-SIFT 較適用于行為變化不大的物體檢測。而另一種方法,H. Bay 等人於 2006

立 政 治 大 學

Na tiona

l Ch engchi University

7

年提出的SURF[1],基於 integral image,利用 determination of Hessian matrix 來 描述極值點(可能的特徵點)來表述被檢測物。Luo Juan 等人對這三種演算法

(SIFT,PCA-SIFT,SURF)進行了實驗比較[9],闡述了各自的優劣如表 2-1 所示。

表 2-1 SIFT、PCA-SIFT、SURF 優劣比較

Method Time Scale Rotation Blur Illumination Affine SIFT common best best common common good PCA-SIFT good good good best good best SURF best common common good best good

2.2.3. HOG Descriptor

HOG 統 計 圖 像 局 部 出 現 的 方 向 梯 度 次 數 , 該 方 法 和 Edge Orientation Histograms[3, 4]有些類似,其核心思想是被檢測物的外形能夠被光強梯度或邊 緣方向的分佈所描述。通過將被檢測物切割為一個個的小單元(Cell),每個 Cell 中將所有 Pixel 的梯度量化為一定的數量的組合 descriptor;但與 SIFT 等方 法不同之處在於,HOG 將數個 Descriptor 組成 Block,通過滑動 Block 來獲取重 疊的區域特徵向量;最後把區域特徵向量組合為全域特徵向量用以表示被檢測

8

相關文件