國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第一章 緒論
本章節將開宗明義的說明本研究的背景及目的,透過簡單介紹先前學者們的 相關研究,以及實務面之應用,讓閱讀者先初步了解何謂物件辨識,以及特徵描 述子為何在物件辨識中佔有重要的地位,並闡述本論文希望達成的目標。
1.1 研究背景
物件辨識是電腦視覺裡相當重要的一門分支,以物件辨識作為基礎的應用在 日常生活中已經十分常見,如人臉辨識、文字辨識、監視系統、圖片搜尋等,皆 整合在各種型式的軟硬體產品中。
物件辨識一般的作法,是透過將影像中的特徵取出,再利用取出的特徵進行 辨識,而此特徵的描述方式,稱為特徵描述子(Descriptor)。物件辨識發展至今,
已有許多研究提出各種不同的特徵描述子,常見的如 Scale-Invariant Feature Transform (SIFT)[1] 、 Local Binary Patterns (LBP)[2] 、 Histogram of Oriented Gradients (HoG)[3]、Haar-like features[4]、Edge Histogram (EH)[5]等,以上這些 特徵描述子在抗噪性、描述力、處理效率方面互有優劣。
1.2 研究目的
物件辨識的應用,首重其辨識率以及處理效率,因此,仍有許多研究紛紛提 出改善的特徵描述子。其中一種稱為 Extended Local Ternary Patterns (ELTP)[6]
的特徵描述子,針對 LBP 在抗噪能力上的不足做改善,ELTP 除了將二元編碼方 式改成三元編碼之外,編碼過程中,也將計算影像中區域像素值的標準差來取得 門檻值(threshold),相較於 LBP 僅僅比較像素值大小的編碼方式,所取得的特徵
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
2
編碼更具描述力,經其實驗證明,在多數情況下,ELTP 的確可以避免雜訊對於 辨識力的影響。
雖然 ELTP 改善了 LBP 的抗噪能力,同時卻也產生了另外的問題。ELTP 將 LBP 的編碼方式,從二元 (Binary)改為三元 (Ternary),使得編碼的維度大幅上 升,即 LBP(8,1)維度為 28= 256,而 ELTP(8,1)的維度上升到 38=6561,維度過高 使得運算效能低落。為解決此問題,ELTP 使用了 Uniform Pattern[2]以及分群 (clustering)的方式降低維度,但降維後卻又不免犧牲了描述力。
另有研究提出稱為 Center Symmetric LBP (CS-LBP)的特徵描述子,同樣也是 建立在 LBP 的架構上,它改變 LBP 原本的編碼方式,樣式編碼長度可以從八碼 減少到四碼,以達到降維的目的。以 CS-LBP 的方法取得的編碼維度是 24=16,
相較於 LBP 的維度是 28=256,可看出維度大幅下降,可以減少大量的運算時間,
但 CS-LBP 同樣存在抗噪能力不足的問題,容易受到雜訊的影響,導致辨識時的 誤差。
綜合上述所提到的特徵描述子,在抗噪性、描述力、運算效率等方面互有優 劣,顧此則失彼,難以取得平衡。本論文的貢獻有二,首先我們提出一種稱為 Center Symmetric Extended Ternary Pattern (CS-ELTP)的特徵描述子,結合以上各 特徵描述子的優點,CS-ELTP 主要的特色如下:
1. 改變 LBP 的二元編碼方式,使用三元編碼得到更好的抗噪能力。
2. 利用對稱取樣的方式降維,捨棄 ELTP 降維時複雜的分群演算法以提升 處理效率。
3. 三元編碼改善 CS-LBP 維度過低造成的辨識率不佳問題。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
3
4. 改用 Nearest Neighbor algorithm 作為辨識方法,可以專注於比較描述子 的效果,排除分類器帶來的干擾。
5. 在抗噪性、描述力、運算效率三者之間取得皆能接受的平衡。
其次,我們嘗試整合了不同描述子的特點,提出混合式描述方式(Hybrid binary and ternary descriptor)的構想,想法來自於描述子不同的取樣方式,所描述 的像素變化關係也會不同,若將兩者加以整合應可得到更完整的影像特徵描述。
除此之外,描述子的編碼方式也不同,以二元編碼的描述子搭配三元編碼的描述 子所得到的影像特徵,應能提升二元編碼抗噪能力不足的缺點,在經本研究的實 驗驗證之後,肯定了這樣的想法。
1.3 論文架構
本論文第一章為緒論,簡略地說明研究的背景及研究的目的;第二章為相關 研究,將探討幾個與本論文相關的特徵描述子、數個針對特徵描述的降維方式;
第三章將介紹 CS-ELTP 的定義,並利用實例說明 CS-ELTP 的編碼方式,討論 CS-ELTP 是否如同 LBP 及 ELTP 存在 uniform pattern;第四章為材質影像辨識實 驗,除了比較 CS-ELTP 與其他幾個相關的特徵描述子降維前後的辨識力,也針 對它們在被不同程度雜訊干擾環境之下所呈現的抗噪能力做測試,最後總結辨識 錯誤發生的原因;第五章說明混合式描述方式的概念,以及呈現混合式描述子在 各種條件下的實驗結果;最後,第六章為結論及未來進一步改善的可能方向。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
4