• 沒有找到結果。

第三章 延展式區域三元化圖型

3.2 樣式編碼與轉換方式

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 3.3 為 ELTP 編碼的流程,為了決定門檻值,我們先算出區塊內中心點與參考

點的標準差,再將所算出的標準差乘以 ,算出的值即為門檻值,利用此門檻值即可

得到一組 ternary code。所以,因此圖 3.3 的門檻值為 25.94×0.3=7.7 ( 設為 0.3)。

圖 3. 4 : ELTP 編碼流程

3.2 樣式編碼與轉換方式

在將區域內容轉換為三元表示法後,得到的是一組 ternary code,若直接用這組 ternary code 來統計累加直方圖,會產生直方圖過於稀疏的問題。以 ELTP(8,1)為例,

所得到的三元樣式會高達38 6561種,為了避免這種問題,我們把直方圖內的 bins 做 合併來降低直方圖的維度。以下提出數種直方圖的降維方法,並一一討論其妥適性。

第一種方式是把每固定數個 bin 合併來降維,如圖 3.4 所示,這是最簡單且直覺 的方式,但若使用這種方式做降維,我們無法合理的去把 bin 做合併,主要原因在於 直方圖上相鄰的 bin 並不一定是樣式相近的 pattern,舉例而言,111111113(=437310)和 200000003(=437410) 在直方圖上是相鄰的,但若以 Hamming distance 計算其樣式距 離,結果為 8,假使強迫將此合併,必然造成後續處理的問題。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

若照這種方式合併,我們可以得到如圖 3.5 的直方圖,圖 3.5 顯示每個二進位 bin 值對應的三進位 bin 的個數,我們可以的觀察到當 H3的值越大,就有越多的樣式被對 應到同一個 H,這樣的合併方法主要會有兩個問題,首先是新合成的 bin 大小不一,

若一張含有較多低值 ternary code 的影像與一張含有較多高值 ternary code 的影像相 比,這種分群法會對它們的抗噪與描述能力會造不同程度的影響。再來是對於直方圖 要降的維度會有所限制,這是因為我們是把直方圖的範圍壓縮至[0,2n 1],所以我們 只能把直方圖降到2 維。 n

圖 3. 6 : 每個二進位 bin 值對應的三進位 bin 的個數

最後一種方式則是利用 bin 跟 bin 的關係來做合併,也就是把關係密切的 bin 視為 同一群,以達到降維的效果。由於每一個 bin 代表一個 ternary code,對 bin 作分群就 等同於對 ternary code 作分群,因此我們把每一個 ternary code 視為一個 pattern,依據 pattern 與 pattern 間的相似度來做分群,而分群的數目就是我們要降的維度。使用這種 方式來做降維,對我們所要降的維度不會有所限制 ,而所分出來的群之間有著不同的 大小,也因為是利用 pattern 間的相似度來合併 bins 而有了合理的解釋。

由於資料表示方法的特殊性,資料分群中常用的 k-means 或 mean-shift 等演算法 並不適用於字串型態的輸入樣本。一般針對的字串型態的資料,由於缺乏幾何空間的 對應,因此多採取 graph representation 的作法(如圖 3.6),將每一字串視為 graph 上的 節點,而節點與節點間的連結強度,則是字串間的相似度。因此我們使用只需相似矩

陣就可進行分群的 spectral clustering 相關演算法進行分群(spectral clustering 會於 3.3 中詳細說明) 。

同樣的算法,其實也適用於兩組 ternary pattern,只不過原來距離範圍介於[0,n],換成 ternary pattern 後距離範圍變成[0,2n]。舉例而言,110020223 和 010020103的 Hamming distance=4,000000003和 222222223的 Hamming distance=16。

用 spectral clustering 的方法分成 128 群,所得到的分群結果之間的比較結果。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

根據表 3.1 與表 3.2,我們可以觀察到,用式 3.8 來定義相似度所得的分群結果,

其群內的平均距離較使用式 3.7 來定義相似度的分群結果要來的小,較為接近我們所 期望的結果。

在算 ELTP 的三元編碼時,根據 local statistics 來設定門檻,可避免像素受到雜訊 干擾而影響編碼的結果,若是所得的三元編碼受到雜訊的影響而改變了編碼的結果,

也可經由 spectral clustering 的分群降維,把受到干擾與未受到干擾的三元編碼分為同 一群,使得在統計特徵向量直方圖時不會受到影響。

相關文件