抗噪性實驗 - 比例式降維法之實驗結果 - 延展式區域三元化圖形特徵描述子之比例式降維法

第四章比例式降維法之實驗結果

4.3 抗噪性實驗

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖4.10 人臉辨識準確率比較圖

由實驗結果可以看出，在未加雜訊的情況下，各種描述方式均有很高的準確率，但在影像加入雜訊後，ELTP 有較大幅度的下滑，其中 ELTP-58+1 下滑的幅度最大，而在 CDR-ELTP 中，取的維度較高者，下滑的幅度較小。整體來說的話，ELTP 的表現沒有 LBP 理想，而 LBP 在未降維的情況下，辨識率下降的幅度為最小。

而針對在以上實驗中，ELTP 表現不如 LBP 的情形，推測可能的原因，是由於原始影像中，有相當比例的影像過暗，如此整張影像的像素值將會偏低，甚至接近於0，如此將不利於ELTP 使用的三元的編碼方式，進而影響其表現，如將輸入影像進行前處理，

使平均亮度一致化，應可改善此狀況。

4.3 抗噪性實驗

在這個實驗中，將對紋理影像加入不同程度的雜訊後，取出其特徵，再與從原始影像中得到的特徵做比較，計算影像加入雜訊前後，其特徵發生變化的次數，以及發生變化後，

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

前後樣式編碼的Hamming distance 平均值。本實驗中將不會做後續的辨識，只單純比較各個描述法的抗噪性。

使用的影像為紋理影像辨識實驗中的 36 張影像。而在此對每張影像，隨機取出大小為64x64 的 patch 各 16 張，如圖 4.11，為其中兩張所取出的 patch。而實驗將對所有的patch，計算每張 patch 中的特徵發生變化的平均次數，以及每個發生變化的像素，前後樣式編碼的Hamming distance 平均值。結果如圖 4.12 及圖 4.13 所示。

圖4.11 於影像中隨機取出的 patch 示意圖

在圖4.12 中，縱座標表示特徵發生變化的次數，在此可以看出，在輕微雜訊的情況下，ELTP 特徵發生變化的次數，明顯少於 LBP。而雖然在雜訊較大的情況下，結果則呈現相反的情況，然而，此時影像已遭到相當程度的破壞，比較也較無實際意義。

另外可以看出，使用uniform pattern 降維之 LBP 及 59 維之 ELTP，變化次數明顯小於其他描述方法，此實為一合理的現象，這時由於其將非uniform pattern 之樣式合併成一個維度後，即使原始的樣式受到影響而改變了編碼，也很有可能因為降維的關係，又被分配至該維度中，而在此實驗中即表示未受雜訊影響；而同樣的道理，也可以說明 CDR-ELTP 中，維度較小者變化次數較低的原因。

‧

Hamming distance 平均值，為一標準化後的值。由於考慮到 ELTP 使用了三元編碼，換句話說，在樣式長度相同的條件下，使用三元編碼的 ELTP，其最大 Hamming distance

0 44.25 40.88 37.68 34.78 32.19 29.89 27.82 25.98

SNR

LBP ULBP‐58+1 ELTP‐58+1

CDR‐ELTP‐59 CDR‐ELTP‐128 CDR‐ELTP‐256

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

將為LBP 的兩倍，因此我們對於計算出的距離，令其除以其最大 Hamming distance 值。

也就是說LBP 樣式的距離降被除以 8，ELTP 樣式的距離將被除以 16，如此將使 LBP、

ELTP 的樣式間距離均介於 0 與 1 之間。而從結果來看，影像受到雜訊影像後，前後 ELTP 樣式變化的平均距離，明顯地小於LBP，而不同維度間的平均距離變化情形，則與前述的原因相同。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第五章

結合模糊理論與 ELTP

在前兩章中，我們介紹了CDR-ELTP 與其實驗結果，本章將探討 ELTP 另一個值得研究的問題，即其編碼方式本身具有的不連續性。如圖5.1 所示，橫軸為周圍參考點與中心

點的像素值差，縱軸代表相應的編碼，可以看出函式在時為不連續的，也就是說，

利用做為門檻值將編碼三元化的方式，會使的當像素值差在接近於時，若受到雜

訊干擾，即有可能對編碼結果造成影響。

圖5.1 ELTP 的編碼方式

對此，本研究將以兩種方式結合模糊理論的概念於 ELTP 中，期能改進上述缺點，

並將與fuzzy LBP 在紋理影像辨識及抗噪性的表現上做出比較。第一種方法將應用模糊理論在編碼的過程中，改用成員函式的方法進行編碼。第二種方法則是應用於分群的階

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

段，即用模糊化的分群法取代原ELTP 中的分群法。此外，由於模糊化的編碼方式使的 histogram 的計算複雜度大幅提昇，本研究也對此提出透過多核心的圖形運算單元（GPU）

達到平行運算的實作方式，以下是針對這些方法的詳細說明。

5.1 模糊化的成員函式

如圖5.1 所示之 ELTP 的編碼方式，當周圍參考點與中心點的像素值差在附近時，若影像受到雜訊干擾，則其編碼很有可能受到影響而改變。針對此點，本研究將延伸fuzzy LBP 的概念，將 ELTP 的編碼方式改以成員函式的表示法定義成如圖 5.2 及式(5.1)到式 (5.3)所示，並稱之為 fuzzy ELTP。

圖 5.2 模糊化的 ELTP 成員函式

f

⁰、

f

¹與

f

1 , , 0 ,

5.1

‧

而在計算histogram 時，也類似於 fuzzy LBP 的 soft histogram，必須考慮到每一個模糊樣式都有可能不再屬於唯一一個三元樣式，而是以不同比例貢獻給許多個三元樣式。

也就是說，在計算histogram 時，雖然每個模糊樣式可能對多個三元樣式均有貢獻，

但其貢獻的總值必為 1。此外，在式(5.4)中，似乎每一個模糊樣式都有可能貢獻給多達

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

而以上說明了fuzzy ELTP 的編碼方式及 histogram 計算方式後，為了要評估其效能，

本研究也對其在紋理影像辨識及抗噪性等方面，與CDR-ELTP、fuzzy LBP 等做出比較，

將在後面的章節中說明結果。

5.2 利用 GPU 平行運算加速計算時間

本節將透過 NVIDIA 所推出的平行運算平台 CUDA （ Compute Unified Device Architecture），利用 GPU 的運算能力，降低 fuzzy ELTP 在計算 histogram 花費的時間。

以下將說明本研究使用的平行化方式，及其計算時間與使用 CPU 運算時間的比較。而在此使用的CUDA 版本為 CUDA 4.2。

在CUDA 的架構中，其利用 thread hierarchy 的概念來規劃平行處理的方式，即 thread block 與 grid of thread block 兩階層的概念。在擷取影像特徵的部分，我們的實作方式如圖5.4 與 5.5 所示。在圖 5.4 中，我們規劃每個 block 含有 16x16 個 thread，分別計算影像中一個 16x16 之區塊的特徵值，而在圖 5.5 中，則是利用一個 grid 包含

x （H、W 為影像之高度與寬度）個 block 以計算整張影像之特徵值。

圖5.4 計算模糊化特徵時的一個 thread block 示意圖

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖5.5 計算模糊化特徵時的一個 grid 示意圖

在計算histogram 方面，以 Fuzzy LBP(8,1)或 Fuzzy ELTP(8,1)為例，影像中每個點算出的特徵值有可能分配給2⁸=256 個樣式，因此如圖 5.6 及圖 5.7 所示，我們將一個 block 規劃成一維的 256 個 thread，計算單一像素點的 histogram，而同樣利用單一 grid 包含 HxW 個 block 計算整張影像的 histogram。

圖5.6 計算 soft histogram 時的一個 thread block 示意圖

圖5.7 計算 soft histogram 時的一個 grid 示意圖

‧

Fuzzy LBP 與 Fuzzy ELTP 在擷取特徵與計算 histogram 的計算時間做比較，結果如表 5.1、

表5.2 所示。本測試使用的電腦 CPU 為 Intel Core 2 6300，顯示卡為 NVIDIA Geforce GT

‧

個群集，而是分別屬於多個群集之中。如此，在計算 histogram 時，亦將貢獻給多個群集，達到模糊化的目的。而這樣的好處是，只要事先計算出分群結果，在每個點計算出 clustering 演算法中，以 fuzzy C-means 演算法取代原本的 K-means 演算法。

4. 依照 fuzzy C-means 分群得到的 membership function，可算出每個樣式對這 K 個群集的貢獻度。

‧

ELTP 中，除了編碼時要依照成員函式計算，在統計 histogram 時，還要考慮每個模糊樣式是否要分配給所有三元樣式的情形，如此，可大大降低計算的複雜度。而此方法，我

而針對以上問題，我們嘗試以fuzzy K-medoids clustering 演算法取代原來的分群演算法，如此原先的步驟將改變如下：

1. 選定取樣的個數 P，以及降維後希望得到的維度 K。

2. 針對此 3^P 個樣式，利用 fuzzy K-medoids clustering 演算法分群，得到一個 membership function，如此可知每個樣式對 K 個群集的貢獻值。

3. 利用步驟 2 結果，即可計算影像的 K 維 soft histogram 為其特徵。

上述步驟2 中，雖可得到每個樣式對於 K 個群集的貢獻值，但為了進一步加速計算時間，我們只取權重最大的前10 名，捨去其餘的，然後再重新分配權重至總和為 1。

‧

以上即為在分群過程中結合模糊化機制的作法，由於以fuzzy K-medoids cluster 取代原來的fuzzy C-means clustering，因此另將此方法稱為 FKM-ELTP，在下一節中，將與其他方式比較此方法在紋理影像辨識的效果。 spectral clustering。

表5.3 fuzzy ELTP 在紋理影像實驗中的準確率

SNR Fuzzy ELTP Fuzzy LBP CDR-ELTP

w/o noise 99.98 99.96 99.96

44.30 99.96 99.96 99.98

42.11 99.96 99.96 99.93

39.63 99.98 99.96 99.74

37.34 99.93 99.96 98.11

35.06 99.81 99.96 95.48

33.49 99.76 99.94 93.83

30.74 99.20 99.93 90.59

29.16 97.85 99.81 88.56

27.85 95.65 99.46 86.50

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖5.8 fuzzy ELTP 在紋理影像實驗中的準確率比較圖

從圖5.8 中可以看出，相較於 CDR-ELTP，使用模糊化特徵樣式編碼的兩個方法，

在影像受到較高的雜訊干擾時，仍有相當高的辨識率，然而其代價則是在計算直方圖時的多花的256 倍的計算量。而在另一方面，fuzzy ELTP 的效果則不如 fuzzy LBP。討論其原因，可能由於fuzzy ELTP 中的 H 值，為參考 fuzzy LBP 中影響模糊化程度的 d 值得來，而該值是經由實驗所得的最佳值，但未必能完全適用於fuzzy ELTP。此外，fuzzy ELTP 延用ELTP 的方式決定 d 值，而在 ELTP 中，d 由計算中心點與周圍參考點像素值的標準差而來，為一變動的門檻值，若應用在fuzzy ELTP 中，則可能因為太接近 H，使的模糊化的程度下降，此時便與ELTP 差不多。因此，以下的實驗，將 d 值固定在 10，測試 H 值對 fuzzy ELTP 的影響。實驗結果如表 5.4 與圖 5.9 所示。

‧

由於在雜訊程度不高的情況下，fuzzy ELTP 均有相當高的辨識率，故僅列出雜訊程度較高的部份。由表中可以看出H 值的選定，的確對 fuzzy ELTP 的效能有所影響，而

SNR H=20 H=30 H=40

25.7 91.78 96.48 97.74

24.81 82.96 89.63 93.89

24.03 74.37 79.78 87.41

23.35 69.24 73.29 81.83

22.66 64.93 67.18 74.18

21.51 56.11 56.70 67.54

20.45 48.50 48.31 55.35

‧

CDR-ELTP 做對照。圖中可以看出，FKM-ELTP 的表現不如 CDR-ELTP。討論其可能的原因，或許以K-medords clustering 為基礎的分群方式，並不是非常適用於位元樣式的分群。如在之前的實驗中，曾以K-medoids clustering 取代原來的 Spectral clustering，而結果顯示在紋理影像的辨識率上，不如原分群方式的效果。若要實作模糊化的分群方式，

需再做其他嘗試。

表5.5 FKM-ELTP 於紋理影像辨識之準確率

圖5.10 FKM-ELTP 於紋理影像辨識準確率比較圖

SNR FKM-ELTP

w/o noise 99.98

44.30 99.94

‧

在這個情況下，其前後樣式編碼的Hamming distance。我們想以類似的方式，評估 fuzzy LBP 與 fuzzy ELTP 的抗噪性，不過這時每個點的特徵在計算 histogram 時，會貢獻給多個維度，因此無法以之前的方式，計算其由某個維度改變至另一維度的次數。而兩個模糊化的樣式編碼，也無法直接計算Hamming distance，但考慮到每個模糊化樣式，是由

‧

在文檔中延展式區域三元化圖形特徵描述子之比例式降維法 - 政大學術集成 (頁 50-0)

抗噪性實驗

第四章 比例式降維法之實驗結果

4.3 抗噪性實驗

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

0

44.25 40.88 37.68 34.78 32.19 29.89 27.82 25.98

LBP ULBP‐58+1 ELTP‐58+1

CDR‐ELTP‐59 CDR‐ELTP‐128 CDR‐ELTP‐256

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第五章

結合模糊理論與 ELTP

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

f

f

f

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧

‧

‧

第四章比例式降維法之實驗結果

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學