緒論 - 中心對稱式延展區域三元化圖型特徵描述子

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第一章緒論

本章節將開宗明義的說明本研究的背景及目的，透過簡單介紹先前學者們的相關研究，以及實務面之應用，讓閱讀者先初步了解何謂物件辨識，以及特徵描述子為何在物件辨識中佔有重要的地位，並闡述本論文希望達成的目標。

1.1 研究背景

物件辨識是電腦視覺裡相當重要的一門分支，以物件辨識作為基礎的應用在日常生活中已經十分常見，如人臉辨識、文字辨識、監視系統、圖片搜尋等，皆整合在各種型式的軟硬體產品中。

物件辨識一般的作法，是透過將影像中的特徵取出，再利用取出的特徵進行辨識，而此特徵的描述方式，稱為特徵描述子(Descriptor)。物件辨識發展至今，

已有許多研究提出各種不同的特徵描述子，常見的如 Scale-Invariant Feature Transform (SIFT)[1] 、 Local Binary Patterns (LBP)[2] 、 Histogram of Oriented Gradients (HoG)[3]、Haar-like features[4]、Edge Histogram (EH)[5]等，以上這些特徵描述子在抗噪性、描述力、處理效率方面互有優劣。

1.2 研究目的

物件辨識的應用，首重其辨識率以及處理效率，因此，仍有許多研究紛紛提出改善的特徵描述子。其中一種稱為 Extended Local Ternary Patterns (ELTP)[6]

的特徵描述子，針對 LBP 在抗噪能力上的不足做改善，ELTP 除了將二元編碼方式改成三元編碼之外，編碼過程中，也將計算影像中區域像素值的標準差來取得門檻值(threshold)，相較於 LBP 僅僅比較像素值大小的編碼方式，所取得的特徵

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

編碼更具描述力，經其實驗證明，在多數情況下，ELTP 的確可以避免雜訊對於辨識力的影響。

雖然 ELTP 改善了 LBP 的抗噪能力，同時卻也產生了另外的問題。ELTP 將 LBP 的編碼方式，從二元 (Binary)改為三元 (Ternary)，使得編碼的維度大幅上升，即 LBP(8,1)維度為 2⁸= 256，而 ELTP(8,1)的維度上升到 3⁸=6561，維度過高使得運算效能低落。為解決此問題，ELTP 使用了 Uniform Pattern[2]以及分群 (clustering)的方式降低維度，但降維後卻又不免犧牲了描述力。

另有研究提出稱為 Center Symmetric LBP (CS-LBP)的特徵描述子，同樣也是建立在 LBP 的架構上，它改變 LBP 原本的編碼方式，樣式編碼長度可以從八碼減少到四碼，以達到降維的目的。以 CS-LBP 的方法取得的編碼維度是 2⁴=16，

相較於 LBP 的維度是 2⁸=256，可看出維度大幅下降，可以減少大量的運算時間，

但 CS-LBP 同樣存在抗噪能力不足的問題，容易受到雜訊的影響，導致辨識時的誤差。

綜合上述所提到的特徵描述子，在抗噪性、描述力、運算效率等方面互有優劣，顧此則失彼，難以取得平衡。本論文的貢獻有二，首先我們提出一種稱為 Center Symmetric Extended Ternary Pattern (CS-ELTP)的特徵描述子，結合以上各特徵描述子的優點，CS-ELTP 主要的特色如下：

1. 改變 LBP 的二元編碼方式，使用三元編碼得到更好的抗噪能力。

2. 利用對稱取樣的方式降維，捨棄 ELTP 降維時複雜的分群演算法以提升處理效率。

3. 三元編碼改善 CS-LBP 維度過低造成的辨識率不佳問題。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

4. 改用 Nearest Neighbor algorithm 作為辨識方法，可以專注於比較描述子的效果，排除分類器帶來的干擾。

5. 在抗噪性、描述力、運算效率三者之間取得皆能接受的平衡。

其次，我們嘗試整合了不同描述子的特點，提出混合式描述方式(Hybrid binary and ternary descriptor)的構想，想法來自於描述子不同的取樣方式，所描述的像素變化關係也會不同，若將兩者加以整合應可得到更完整的影像特徵描述。

除此之外，描述子的編碼方式也不同，以二元編碼的描述子搭配三元編碼的描述子所得到的影像特徵，應能提升二元編碼抗噪能力不足的缺點，在經本研究的實驗驗證之後，肯定了這樣的想法。

1.3 論文架構

本論文第一章為緒論，簡略地說明研究的背景及研究的目的；第二章為相關研究，將探討幾個與本論文相關的特徵描述子、數個針對特徵描述的降維方式；

第三章將介紹 CS-ELTP 的定義，並利用實例說明 CS-ELTP 的編碼方式，討論 CS-ELTP 是否如同 LBP 及 ELTP 存在 uniform pattern；第四章為材質影像辨識實驗，除了比較 CS-ELTP 與其他幾個相關的特徵描述子降維前後的辨識力，也針對它們在被不同程度雜訊干擾環境之下所呈現的抗噪能力做測試，最後總結辨識錯誤發生的原因；第五章說明混合式描述方式的概念，以及呈現混合式描述子在各種條件下的實驗結果；最後，第六章為結論及未來進一步改善的可能方向。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中中心對稱式延展區域三元化圖型特徵描述子 - 政大學術集成 (頁 10-13)

緒論

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第一章 緒論

1.1 研究背景

1.2 研究目的

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

1.3 論文架構

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

立政治大學

第一章緒論

立政治大學

立政治大學

立政治大學