第二章 相關研究
2.7 Fuzzy K-medoids Clustering
在ELTP 降維的過程中,除了利用 uniform pattern 之外,也使用了樣式間的相似度 將樣式分群,而相似度的定義是以Hamming distance 為依據。若以長度為 8 的三元樣式 為例,相異樣式間的兩兩距離最小為1、最大為 16,即相異樣式間相似度僅有 16 種可 能,不足以將樣式分成所需的維度,而產生了部分相似的樣式被分在不同群集中的可能 性。而若在分群過程中加入模糊化的概念,則應能避免上述情形發生。
2.7 Fuzzy K-medoids Clustering
K-medoids clustering 是一個類似於 K-means clustering 的分群演算法,其間最大的差 異在於,K-means 在分群時所選擇的中心點,可以是座標空間中的任一點,這表示資料 點必須能夠表示於某個座標系統中才能使用。而本研究中要分群的對象,位元樣式,即 無座標概念,故不適用。相較之下,K-medoids 在分群時所選擇的中心點必須是資料點 本身,根據這個性質,只要能夠取得所有樣式兩兩之間的距離,就能計算出分群了,故 可利用來對樣式作分群。
前述之Fuzzy C-means clustering 較類似於 K-means clustering,需資料點分布於某個 座標系統方能使用,因此僅利用其來替代在spectral clustering 中,以 K-means clustering 分群的步驟,而無法直接套用在表示特徵的樣式上。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
而Krishnapuram 等學者所提出的 Fuzzy C-medoids clustering 演算法[13],就較類似 於K-medoids clustering,資料點不需要有絕對座標,僅用相對距離、或者相似度就能計 算分群。其演算法說明如下。
若X={xi|i=1,2,…,n}表示某個資料點集,r(xi,xj)表示兩資料點的相異度,X 的某個子 集合V={vi|i=1,2,…,c},c 為分群數,則 Fuzzy C-medoids clustering 所要達到的目標函式 為:
j V; X u r x , v 2.7
其中u 為權重矩陣,可利用式(2.6)求得,m 為大於 1 的實數。該式同樣可以利用疊 代的方式,計算至誤差在容忍的範圍內,其演算法步驟如下:
1. 初始化,選定分群數 c,從資料點中隨機取一組中心點 V={vi|i=1,2,…,c}。
2. 計算權重矩陣 U,計算方式同式(2.6)。
3. 令 Vold = V,並重新計算各群中心點。第 i 群的中心點計算方式如下:
q argmin u r x , x 2.8
之後令第i 群的中心點 vi=xq。
4. 若 V=Vold則停止,否則回到步驟2 繼續疊代。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
此模糊分群法需要資料點間的相異度進行分群。在本研究中,可以利用樣式間的距 離做為相異度。而分群結果,將可與前述利用 Fuzzy C-means clustering 取代 spectral clustering 中的 K-means clustering 步驟所得到的分群做比較,並討論其分群結果是否能 夠進一步改善原ELTP 的分群方式。
‧
用或者可改進之處。本研究的目的,即是針對ELTP 以 uniform pattern 為主的降維方式 提出改善。進一步來說,為了避免遺失非uniform 之樣式所提供的資訊,我們將影像中 uniform pattern 及非 uniform 之樣式出現的比例加入考量,依據此比例在降維過程分配適 當之維度,而這樣的做法在本研究中即稱為比例式降維法(Commensurate Dimensionality Reduction, CDR)。此外,本研究也將進一步探討在樣式分群的部分,提出其他可行的方 式,並討論不同分群方式對描述力、抗噪性等造成的影響。以上問題與本論文提出的對 策將於本章各節分別說明。3.1 統計 ELTP 中 uniform pattern 於影像中出現比例
ELTP 定義了四個等級的 uniform pattern,以 ELTP(8,1)來說,其 38=6561 個樣式中,這 四類uniform pattern 佔有的比例各有不同,整理如表 3.1。
表3.1 ELTP(8,1)各類 uniform pattern 於全部 6561 個樣式中佔有的比例
類型 UELTP1 UELTP2 UELTP3 UELTP4
總數 115 171 1067 1767
比例 1.75% 2.60% 16.26% 26.93%
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
回顧ELTP 中 uniform pattern 之定義,可以看出四類 uniform pattern 乃由嚴格至寬鬆,
且存在著 ELTP1⊂UELTP2⊂UELTP3⊂UELTP4 的包含關係。我們將這個關係,以及表 3.1 的統計結果,以集合示意圖來加以說明,如圖 3.1 所示。其中各類 uniform pattern 所 佔面積,表示其在所有樣式中佔有的比例。
圖3.1 ELTP(8,1)各類 uniform pattern 之集合示意圖
接著統計的是這些uniform pattern 在影像中出現的比例,我們對 Brodatz 紋理資料 庫中的所有影像進行統計,得到各類uniform pattern 出現的平均比例,如表 3.2 所示。
類型
UELTP1 UELTP2 UELTP3 UELTP4平均比例 31.25% 34.3% 78.58% 82.88%
表3.2 ELTP(8,1)各類 uniform pattern 在 Brodatz 紋理影像中出現的平均比例
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
我們將表3.2 的結果,同樣以集合示意圖的方式加以說明。如圖 3.2 所示,
可以看出 uniform pattern 在紋理影像中佔有相當的比例,的確比其他樣式更具有代表 性。
圖3.2 ELTP(8,1)各類 uniform pattern 在 Brodatz 紋理影像中出現的平均比例圖
此外,本研究也針對VOC2012 的測試影像共 16135 張,統計在這些影像中,各類 uniform pattern 出現的比例,結果可見於表 3.3。這些影像包含了紋理以外數種不同類型 的影像(參考圖 3.3),也由於影像的種類變多了,導致 uniform pattern 在個別影像間出現 比例的變動幅度也大了許多。不過,如結果所示,平均來說,仍佔有相當的比例。因此,
在這裡我們可以得到一個初步結論,即uniform pattern 在紋理影像以外的各種不同類型 的影像中,還是具有相當的代表性,值得適度地保留。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
類型
UELTP1 UELTP2 UELTP3 UELTP4平均比例 33.62% 36.03% 73.51% 79.35%
表3.3 ELTP 中各類 uniform pattern 在 VOC2012 影像中出現的平均比例
圖3.3 VOC2012 的部分測試影像[16]
3.2 樣式間的距離定義
ELTP 在定義 uniform pattern 時,需牽涉到樣式間距離的計算,而在樣式分群的部份,也 利用了樣式間距離以定義相似度。在這兩個部分,ELTP 均採用了樣式間的 Hamming distance 做為距離的定義,如此將存有一個潛在的問題,將在以下說明。
從分群的角度來看,ELTP(8,1)共有 6561 個樣式,而相異樣式間的距離,最近者為
‧
1,如 11111111 與 11111112;最遠者為 16,即 00000000 與 22222222,也就是說,樣式 間的距離僅有 16 種變化,而既然許多樣式間的相似度是一樣的,如此分群,將會造成 這些相似的樣式,被分在不同群中的情形,如此將很有可能影響到後續應用的準確性。
此外,從ELTP 之定義來看,考慮影像受到些微雜訊干擾時,其特徵樣式的任一位 數由0 轉為 2 或由 2 轉到 0 的可能性是比較小的,因此,這類樣式在分群後便不應在同 一群組中。舉例來說,影像中某一點的特徵樣式為00000000,其受到雜訊影響後,特徵 樣式轉為00000011 的可能性將大於轉變為 00000002 的可能性,若要將這三個樣式分成 兩群,則00000000 與 00000002 便不應被分於同一群組,然而在以 Hamming distance 做 為樣式間距離的定義下,此三者彼此的距離均為2,因此任兩者被分在同一群的機率將 uniform pattern,並統計 ELTP(8,1)中,重新定義後的 uniform pattern 的個數,及其在所 有樣式中的比例,結果如表3.4 所示,與表 3.1 比較,僅 UELTP3 有所不同,其餘的則 沒有變動。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
類型
UELTP1 UELTP2 UELTP3 UELTP4總數 115 171 731 1767
比例 1.75% 2.6% 11.14% 26.93%
表3.4 ELTP(8,1)以 H2 distance 定義之 uniform pattern 在 6561 個樣式中之比例
同時,也針對重新定義後的uniform pattern,在 Brodatz 紋理影像資料庫中出現次數 的比例做出統計,結果如表3.5 所示,同樣地,由於僅 UELTP3 的個數變少,僅有其在 影像中出現的比例略微下降,其餘則無變動。
類型
UELTP1 UELTP2 UELTP3 UELTP4平均比例 31.25% 34.3% 67.82% 82.88%
表3.5 重新定義後的各類 uniform pattern 在 Brodatz 紋理影像中出現的平均比例
在後續的實驗中,本文將討論以Hamming distance 計算樣式間距離、以及使用上述 H2 distance 定義,兩者在分群結果以及對於描述子辨識率等是否產生影響。
3.3 比例式降維法
回顧ELTP 的降維過程,可歸納成以下幾個步驟:
1. 選定參考點數 P、及欲取之維度 K(亦即降維之後之維度)
2. 取出 uniform pattern。而長度為 P 的三元樣式共有 3P個,依照ELTP 中定義的 uniform
‧
pattern,取出第三種定義之 uniform pattern(UELTP3),建立相似度矩陣。而樣式間 的Hamming distance 則為定義兩兩相似度之依據。
3. 利用 spectral clustering 將 uniform pattern 分成 K-1 群。如此,同一群中的樣式在統 計直方圖時即計算至同一維度中,而非uniform 的樣式則全部合併成 1 個維度,故 所有樣式中的1.75%,相較於其他 98.25%的樣式來說,UELTP1 在影像中出現的比 例才是所有樣式中最高的,其在描述力上的意義亦十分重要。
UELTP3 出現的比例約在 80%左右,與原始 LBP 定義的 uniform pattern 所佔的比例 相近,而若從Hamming distance 的觀點來看,環狀 LBP(8,1)樣式內的最大距離為 8(如 01010101),而其 uniform pattern 容許的距離為 2;對於環狀 ELTP(8,1)而言,樣式內 的最大距離為16(如 02020202),為 LBP 的兩倍,而 UELTP3 容許的距離為 4,亦為
‧
整合前述的初步實驗結果,我們可以發現到,ELTP 各類 uniform pattern 在不同影像 中出現的比例均落在一定的範圍內,我們將以此為根據定義一個系統化的降維方式。首 先,回顧 LBP 的作法,當決定要使用 uniform pattern 作為降維的方式後,因為其將非 uniform pattern 的資訊合併成為一個維度,因此等同於捨棄了這部份將近 20%的資訊,
此訊息量亦不在少數,或許在某些情況下正是關係到辨識結果正確與否的關鍵。另一方 面,若決定不使用uniform pattern 作為降維方式時,意謂著這些在影像中大量存在的樣 式,與其他樣式被同等地看待,也就無法利用到uniform pattern 背後代表的描述力。而 考慮了以上的情形,我們所定義出來的降維方式,將能夠兼顧到uniform pattern 的特殊 地位,同時保留非uniform pattern 樣式中的資訊。
以 上 述 概 念 發 展 出 的 降 為 方 式 , 我 們 命 名 為 比 例 式 降 維 法(Commensurate Dimensionality reduction, CDR),方法即是根據各類 uniform pattern 在影像中出現比例之 統計資料,決定這些樣式所應分配的維度。具體來說,由於在前述的觀察中,我們發現 UELTP2 比起 UELTP1 來說,在影像中出現的比例之增幅不大,同樣地,UELTP4 比起 UELTP3 也有相同情形,因此我們將以 UELTP1 與 UELTP3 為主來做區分並分配其維度。
以下由圖3.4 來做說明,圖中由內而外,紅色區域表示 UELTP1 之樣式、藍色區域表示 UELTP3-UELTP1 之樣式,灰色區域表示其他樣式。為了方便稱呼,我們將這三個區域 另外命名為 S1、S2、S3。而三個區域的面積,約略表示其包含的樣式在影像中出現的 比例。若使用H2 distance 做為距離的定義,則由表 3.5 得知,UELTP1 及 UELTP3 在紋 理影像中出現的比例為31.25%與 67.82%,換句話說,S1、S2、S3 的樣式出現比例分別 是31.25%、36.57%(67.82-31.25)及 32.18%(100-67.82)。接下來便按照此比例分配維度,
也就是說,降為後,S1、S2、S3 的樣式將獲得 31.25%、36.75%及 32.18%的維度。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖3.4 依出現比例將樣式分組的示意圖
依照上述規則,即可將ELTP 的維度降至任意的需求上。以下表 3.6 舉例說明欲取 59、128、256 等維度時,依比例降維的維度分配方法。
表3.6 ELTP 以比例式降維法的舉例
樣式集合 S1 S2 S3
樣式集合 S1 S2 S3