利用基因演算法進行紋理特徵編碼最佳化及其在影像分群之應用

全文

(1)國立高雄大學電機工程學系碩士論文. 利用基因演算法進行紋理特徵編碼最佳化及其在影像分群之應用 Genetic-based optimal encoding for image clustering with texture-based features. 研究生: 盧立偉撰指導教授: 吳志宏. 中華民國一百零二年六月.

(2) 利用基因演算法進行紋理特徵編碼最佳化及其在影像分群之應用指導教授: 吳志宏博士學生: 盧立偉國立高雄大學電機工程學系. 摘要影像分群的目的是對以特徵 (feature) 描述的影像像素進行分割 , 將具同質性特徵的像素群聚成同一集合。特徵同質程度的計算 , 通常是以特徵間的歐幾里德距離 (Euclidean distance) 作為衡量標準。因此以距離為依據的分群方式 , 對具有連續變化的影像特徵 , 像是顏色、亮度、飽和度等 , 皆能獲得良好的效果。紋理 (texture) 也常常作為分群的特徵依據 , 以往的研究通常直接將紋理以固定形式編碼 , 造成紋理編碼的歐幾里德距離變化量不具連續的一致性 , 造成分群結果的不穩定。本論文提出一套以基因演算法 (genetic algorithm, GA) 為基礎的編碼方式 , 來處理上述問題中 , 並以區域二元圖樣 (local binary pattern) 為例 , 說明其在影像分群的影響。本研究中以兩階段的 GA 實現 LBP 的最佳化編碼 , 使 LBP 式樣間相似的式樣具相對較短的距離 ; 反之亦然。第一階段 GA 安排所有的 LBP 的順序 , 使全部圖樣在排列上呈現連續變化 ; 第二階段 GA 分配每個圖樣一個唯一的整數編號 , 讓相似 (相異) 的圖樣在歐幾里德距離衡量上 , 具有較短 (長) 的距離。本論文以 Fuzzy C-means 作為分群方式 , 並比較多種不同的編碼方式。藉由多張影像測試與實驗結果分析得知 , 本方法可以找出一組可行的編碼 , 並提升了以 LBP 紋理為特徵的影像分群品質。關鍵字 : 影像分群、特徵、區域二元圖樣、編碼、基因演算法。.

(3) Genetic-based optimal encoding for image clustering with texture-based features Advisor: Dr. WU, CHIH-HUNG Student: LU, LI-WEI Department of Electrical Engineering, National University of Kaohsiung. ABSTRACT For image clustering, homogeneous and meaningful image pixels with specific features are clustered. The homogeneity of various features is usually calculated by the Euclidean distances among features. For features that have continuous variations, such as color, luminance, saturation, gradient of intensity, distance-based clustering can give effective results. When textures are used as features for clustering, an encoding scheme that describes the variations of textures in terms of distances can produce effective clustering results. This study proposes a genetic-based encoding method to deal with the abovementioned problem where the local binary pattern (LBP) is employed as the texture for clustering. The genetic algorithm (GA) is used to implement the optimal encoding scheme of LBP-based textures. In the encoding scheme, similar LBP-textures are required to have shorter distances, and vice versa. The GA process is separated into two stages. The first stage arranges the locations for all LBP patterns so that they can have continuous variations. The second stage assigns each LBP pattern a unique integer in a manner that similar (dissimilar) patterns have short (long) distances in the same Euclidean scale. A fitness function describing these requirements is defined. In this study, fuzzy c-means is used as the clustering method. Various encoding methods are compared with the proposed method. From the experimental results, the genetic-based encoding method finds a feasible set of encodes for LBP-based textures and improves the quality of image clustering. Some images are tested and the results are analyzed. Keywords: image clustering, feature, local binary pattern (LBP), encoding scheme, genetic algorithm.

(4) 目錄摘要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. i. 英文摘要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ii. 緒論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. 1.1 研究背景與動機 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. 1.2 研究目的及方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. 1.3 研究架構 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. 文獻探討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.1 影像的分群方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.1.1. K-means 分群演算法 . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.1.2. Fuzzy C-means 分群演算法 . . . . . . . . . . . . . . . . . . . .. 8. 2.1.3. 影像分群相關文獻 . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 1. 2. 2.2 紋理特徵編碼. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11. 2.2.1. LBP 編碼與相關演變 . . . . . . . . . . . . . . . . . . . . . . . 11. 2.2.2. 其他區域描述的紋理編碼 . . . . . . . . . . . . . . . . . . . . . 15. 2.3 基因演算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3. 影像特徵差異與編碼距離 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.1 RGB特徵距離 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.2 LBP特徵距離 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23. 4. 紋理特徵編碼策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 4.1 圖樣連續排列的可行性 . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 4.2 因應的編碼策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.2.1. 紋理的連續性考量 . . . . . . . . . . . . . . . . . . . . . . . . . 28. iii.

(5) 4.2.2. 對應的紋理編碼 . . . . . . . . . . . . . . . . . . . . . . . . . . 30. 4.3 編碼複雜度處理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 5. 演化式編碼最佳化設計 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 5.1 二階段之基因演算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 5.1.1. 染色體編碼 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33. 5.1.2. 適應性函數設計 . . . . . . . . . . . . . . . . . . . . . . . . . . 34. 5.1.3. 交配 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36. 5.1.4. 突變 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39. 5.1.5. 重新啟動機制 . . . . . . . . . . . . . . . . . . . . . . . . . . . 39. 5.2 特徵編碼概念整理與流程 . . . . . . . . . . . . . . . . . . . . . . . . . . 39 6. 實驗與結果分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 6.1 實驗 A - 基因編碼之參數選擇 . . . . . . . . . . . . . . . . . . . . . . . 42 6.2 實驗 B - 基因編碼與其他編碼之比較 . . . . . . . . . . . . . . . . . . . 45 6.3 實驗 C - 基因編碼於影像分群驗證 . . . . . . . . . . . . . . . . . . . . . 46. 7. 6.3.1. 實驗設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46. 6.3.2. 分群效果的評估方式 . . . . . . . . . . . . . . . . . . . . . . . . 50. 6.3.3. FCM 分群實驗 . . . . . . . . . . . . . . . . . . . . . . . . . . . 51. 6.3.4. KM 分群實驗 . . . . . . . . . . . . . . . . . . . . . . . . . . . 63. 結論與未來展望 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 7.1 結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 7.2 未來展望 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76. 參考文獻 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77. iv.

(6) 圖目錄 1.1 研究架構 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 2.1 K-means 分群演算法流程 . . . . . . . . . . . . . . . . . . . . . . . . .. 7. 2.2 Fuzzy C-means 分群演算法流程 . . . . . . . . . . . . . . . . . . . . . 10 2.3 紋理單元及其編碼範例 . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.4 LBP 編碼範例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.5 LBP 特徵對應之意義 . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.6 不同(P, R)所定義的圓形 LBP 區域 . . . . . . . . . . . . . . . . . . . . 14 2.7 由U(LBPP,R )定義的明暗均勻程度 . . . . . . . . . . . . . . . . . . . . 15 2.8 LBIIP 之相關對照圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.9 三元判別範例. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17. 2.10 8 種方向遮罩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.11 區域方向數字紋理編碼實例 . . . . . . . . . . . . . . . . . . . . . . . . 18 2.12 基因演算法流程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.1 灰階特徵的距離與顏色差異關係 . . . . . . . . . . . . . . . . . . . . . . 22 3.2 RGB 特徵的距離與顏色差異關係 . . . . . . . . . . . . . . . . . . . . . 22 3.3 同權重對於 LBP 編碼距離之影響 . . . . . . . . . . . . . . . . . . . . . 24 3.4 特徵距離與 LBP 紋理圖樣的對應關係 . . . . . . . . . . . . . . . . . . . 25 4.1 LBP 圖樣以 8 bit 編碼呈現 . . . . . . . . . . . . . . . . . . . . . . . . 27 4.2 圖樣連續性變化編排示意 . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.3 環狀空間中央位置與鄰近位置示意 . . . . . . . . . . . . . . . . . . . . . 29 4.4 環狀空間上所有排列間距 1、2 的考量 . . . . . . . . . . . . . . . . . . . . 29 v.

(7) 4.5 不考慮排列間距為 2 的鄰近位置 . . . . . . . . . . . . . . . . . . . . . . 29 4.6 套用最大及最小編號的兩種圖樣 . . . . . . . . . . . . . . . . . . . . . . 31 5.1 第一階段染色體編碼方式 . . . . . . . . . . . . . . . . . . . . . . . . . . 33 5.2 第二階段染色體編碼方式 . . . . . . . . . . . . . . . . . . . . . . . . . . 34 5.3 記錄主要基因在父代之中的染色體位置 . . . . . . . . . . . . . . . . . . 37 5.4 銜接於主要基因後方的候選基因 . . . . . . . . . . . . . . . . . . . . . . 37 5.5 自基因集合中挑選的候選基因 . . . . . . . . . . . . . . . . . . . . . . . 37 5.6 候選基因銜接示意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 5.7 合理的基因編碼對應示意 . . . . . . . . . . . . . . . . . . . . . . . . . . 40 5.8 兩階段基因編碼流程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 6.1 三個階段的實驗流程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 6.2 CT 影像 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 6.3 一般光學影像. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48. 6.4 衛星空照圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 6.5 紋理圖案 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 6.6 測試點及視窗示意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 6.7 橫向及縱向計算範例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 6.8 CT 影像使用 GA 編碼的 FCM 分群結果 . . . . . . . . . . . . . . . . . 52 6.9 CT 影像使用 LBP 編碼的 FCM 分群結果 . . . . . . . . . . . . . . . . 53 6.10 CT 影像使用人工編碼的 FCM 分群結果 . . . . . . . . . . . . . . . . . 53 6.11 一般光學影像使用 GA 編碼的 FCM 分群結果 . . . . . . . . . . . . . . 55 6.12 一般光學影像使用 LBP 編碼的 FCM 分群結果 . . . . . . . . . . . . . . 55 6.13 一般光學影像使用人工編碼的 FCM 分群結果 . . . . . . . . . . . . . . . 56. vi.

(8) 6.14 衛星空照圖使用 GA 編碼的 FCM 分群結果 . . . . . . . . . . . . . . . 58 6.15 衛星空照圖使用 LBP 編碼的 FCM 分群結果 . . . . . . . . . . . . . . . 58 6.16 衛星空照圖使用人工編碼的 FCM 分群結果 . . . . . . . . . . . . . . . . 59 6.17 紋理圖案使用 GA 編碼的 FCM 分群結果 . . . . . . . . . . . . . . . . . 59 6.18 紋理圖案使用 LBP 編碼的 FCM 分群結果 . . . . . . . . . . . . . . . . 61 6.19 紋理圖案使用人工編碼的 FCM 分群結果 . . . . . . . . . . . . . . . . . 61 6.20 CT 影像使用 GA 編碼的 KM 分群結果. . . . . . . . . . . . . . . . . . 63. 6.21 CT 影像使用 LBP 編碼的 KM 分群結果 . . . . . . . . . . . . . . . . . 64 6.22 CT 影像使用人工編碼的 KM 分群結果 . . . . . . . . . . . . . . . . . . 64 6.23 一般光學影像使用 GA 編碼的 KM 分群結果 . . . . . . . . . . . . . . . 66 6.24 一般光學影像使用 LBP 編碼的 KM 分群結果 . . . . . . . . . . . . . . 67 6.25 一般光學影像使用人工編碼的 KM 分群結果 . . . . . . . . . . . . . . . 67 6.26 衛星空照圖像使用 GA 編碼的 KM 分群結果 . . . . . . . . . . . . . . . 69 6.27 衛星空照圖像使用 LBP 編碼的 KM 分群結果 . . . . . . . . . . . . . . 69 6.28 衛星空照圖像使用人工編碼的 KM 分群結果 . . . . . . . . . . . . . . . 70 6.29 紋理圖案使用 GA 編碼的 KM 分群結果 . . . . . . . . . . . . . . . . . 70 6.30 紋理圖案使用 LBP 編碼的 KM 分群結果 . . . . . . . . . . . . . . . . . 72 6.31 紋理圖案使用人工編碼的 KM 分群結果 . . . . . . . . . . . . . . . . . . 72. vii.

(9) 表目錄 6.1 GA 參數設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 6.2 不同 GA 參數的演化結果 . . . . . . . . . . . . . . . . . . . . . . . . . 44 6.3 權重係數設定. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45. 6.4 不同權重係數的演化結果 . . . . . . . . . . . . . . . . . . . . . . . . . . 45 6.5 不同編碼方式之比較 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 6.6 影像分群採用的分群群數 . . . . . . . . . . . . . . . . . . . . . . . . . . 47 6.7 CT 影像於不同編碼的 FCM 分群效果評估 . . . . . . . . . . . . . . . . 54 6.8 一般光學影像於不同編碼的 FCM 分群效果評估 . . . . . . . . . . . . . 57 6.9 衛星空照圖於不同編碼的 FCM 分群效果評估 . . . . . . . . . . . . . . . 60 6.10 紋理圖案於不同編碼的 FCM 分群效果評估 . . . . . . . . . . . . . . . . 62 6.11 CT 影像於不同編碼的 KM 分群效果評估 . . . . . . . . . . . . . . . . . 65 6.12 一般光學影像於不同編碼的 KM 分群效果評估 . . . . . . . . . . . . . . 68 6.13 衛星空照圖於不同編碼的 KM 分群效果評估 . . . . . . . . . . . . . . . 71 6.14 紋理圖案於不同編碼的 KM 分群效果評估 . . . . . . . . . . . . . . . . . 73. viii.

(10) 第1章緒論 1.1 研究背景與動機影像所夾帶的訊息往往是大量且複雜 , 對人類而言大量的訊息其實並不容易分析判別 , 故將影像進行分割處理是極具意義。影像分割 (segmentation) 是依據影像內含的特徵 , 將其切割為多個區塊 , 並藉由此種對影像劃分歸類的呈現方式 , 使影像更具意義並有利於分析。例如將農村的空照影像分割 , 將可能會獲得房舍、農田、道路三種簡明的區塊 , 當目的是想尋找農舍位置時 , 原始的空照影像便需要人類謹慎地確認 , 而經由影像分割處理後的影像 , 由於房舍被劃分出來 , 呈現一特定色塊 , 因能輕鬆判斷。在眾多的方法裡 , 分群是實現影像分割的一種技術 , 其中非監督式的分群作法 , 僅需要事先確定分群數量 , 不用對分群的區塊有所認知 , 完全由特徵決定區塊的劃分。透過這樣的影像分群技術 , 在許多領域上都被廣泛地運用 , 除了一般數位影像的分群、抗雜訊處理處理 [1, 2, 3, 4] ; 用於醫學能輔助判斷影像中的身體組織是否產生病變 [5] [6] ; 在衛星空照圖中能判別地形建築 [7] [8] ; 也可以應用在臉部 [9] [10] 、指紋辨識等 [11] 。無論應用於何種領域 , 作為分群依據的特徵是必須要在最初便決定好 , 形式上可以只包含一種特性 , 以單一維度表示 ; 或者具備多種特質 , 呈現多維度形態。透過適當的選擇 , 影像每個像素包含的資訊 , 或是像素之間的空間關係 , 可以作為代表影像的特徵。這些被採用的特徵 , 便能幫助分群演算法 , 將每個像素都分群歸類 , 使同一個群集內的像素 , 會具有相似的特徵。普遍常見的特徵是 RGB 、 HSI [12]這類型的色彩空間 , 單純涵蓋顏色、或是亮度、飽和度等資訊。其中的 RGB 可以說是最基本的一種顏色描述方 1.

(11) 式 , 該特徵的三個維度分別為光的三原色 : 紅光(Red) 、綠光 (Green) 、藍光 (Blue) , 是藉由加法混色的方式 , 將三種光依照不同比例疊加 , 以產生不同的顏色。現今的電子設備如 : 顯示器、數位相機、個人電腦等 , 大多都是以此種方式對顏色進行定義 , 如 24 bit 的 RGB 色彩模式。此種色彩模式以 24 個位元進行編碼 , 描述一個像素的顏色。因. 此 , 紅光、綠光、藍光將各自擁 8 位元的描述空間 , 對應到十進制的編碼表示 , 即是一種色光能獲得 0 到 255 的編碼表示 , 也就是被區分成 256 種強度。至於更進階的 RGB 編碼模式 , 還有 32 bit 以及 48 bit 。而像 RGB 這類與顏色相關的特徵資訊 , 也多數存在一個特性 : 顏色特徵的變化與特徵間的歐幾里德距離 (Euclidean distance) 存在連續性與一致性。換句話說顏色特徵相似的像素 , 其特徵具有較短的歐幾里德距離 ; 而顏色特徵差異大得像素 , 則特徵的歐幾里德距離較長。因此 , 藉由特徵之間歐幾里德距離的遠近 , 將可以用於衡量特徵的同質程度 , 這表示以距離為依據的分群方式 , 能對此種特徵達到合理且有效的分群。除了色彩空間 , 整合表面的平滑及粗糙程度資訊的影像紋理 , 也是經常被使用且相當有效的影像特徵。紋理特徵能表現出影像各個部位的結構資訊 , 提供周遭強度的變化趨勢 , 對於影像中區塊同質性的判斷很有幫助。表現紋理的方法很多 , 如以數學統計的方式導出紋理圖樣的分布模型 [13, 14, 15] , 此種方式可以說相當具有效果 , 但相對的計算複雜度也相當的高 ; 另外也有以小波轉換的方式 [16, 17, 18] , 對影像紋理進行分析 ; 或者是以區域角度 , 依照區域結構的明暗變化 , 定義不同的紋理 , 如區域二元圖樣 (Local Binary Pattern, LBP) [19] 。 LBP 具有抵抗明暗變化的能力 , 且具有低計算量的優. 點 , 因此相關的延伸研究不少。如 [20]將 LBP 予以圓形區域定義 , 並解除鄰近像素數量限制 , 再搭配明暗均勻程度的判斷 , 延伸出灰階旋轉不變LBP ; 而 [21]則以灰階旋轉不 2.

(12) 變 LBP 為基礎 , 再搭配梯度的判斷 , 發展出一個適應性的 LBP ; 與梯度相關的相關延伸還有 [22] , 其利用 LBP 對明亮區域的梯度方向指引, 並對應查表, 在梯度指向之處能對照出所屬的紋理編碼。除了 LBP , 從區域著手的的其他紋理表使方式也不少 [23, 24, 25, 26, 27] , 其中 [23]便是針對一3 × 3區域 , 以8 種遮罩反應出八個方向的方向數字 , 接著在. 由數字中挑選最大的正值與負值的方向作為代表, 並以 6 位元編碼之 ; 而 [24]是以 [28]的三元方式進行分析, 然後再藉由與灰階旋轉不變LBP 相同的均勻判斷進行化減 , 最後查表對應出該圖樣所屬編碼。不過 , 雖然紋理特徵的研究發展相當廣泛 , 卻鮮少強調紋理特徵的變化與歐幾里德距離之間的連續性、一致性關係。缺少連續變化的特性 , 相近的紋理圖樣將不一定對應到較短的歐幾里得距離 ; 反之亦然。 LBP 便是其中一個缺乏此特性的紋理 , 其特徵編碼方式仰賴一組與區域中像素相互對應的權重 , 而某些像素擁有較大的權重往往便是問題所在 , 它使得特徵編碼數字的變動非常劇烈 , 當然也影響到特徵距離的計算 , LBP 遭遇的此種狀況將詳述於第三章。顯然地 , 若直接將這類型的特徵應用在以距離為依據分群演算法上 , 達成正確分群是頗有難度。若要使 LBP 特徵能被有效的分群 , 重新考慮圖樣差異與特徵距離的關係是必須的。. 1.2 研究目的及方法 LBP 紋理特徵為本論文的研究對象 , 為了使 LBP 圖樣差異與特徵距離呈現連續性 ,. 且能被以距離為依據的演算法正確分群。研究將著重於 LBP 紋理特徵的編碼方式 , 針對 LBP 所缺乏的特性 , 賦予一個全新的編碼 , 使 LBP 的編制帶有正確的距離描述 , 並實. 踐於影像分群。本篇論文所提出的特徵編碼 , 以傳統的區域二元圖樣作為基礎 , 並透過. 3.

(13) 兩階段的基因演算法進行編排 , 達成上述需求。各個階段的編碼方式要求如下 : A. 第一階段 • 負責紋理圖樣排列。 • 所有圖樣以環狀排列呈現 , 圖樣的變化呈現連續性。 • 每個圖樣與鄰近圖樣的差異需具有一致性。 B. 第二階段 • 負責圖樣對應的編碼安排。 • 對應環狀排列的紋理圖樣 , 其編碼距離呈現連續性變化 • 每個圖樣編碼與鄰近圖樣編碼的距離需有一致性。. 基因編排的過程亦搭配多組不同的參數設定 , 包括交配機率、突變機率、以及適應性函數中的權重安排 , 以實現 LBP 紋理特徵的最佳化編碼。而最終的編碼成果將交由分群演算法進行測試與驗證 , 證實能於影像分群上呈現良好的效果。. 1.3 研究架構整體的研究架構分成四大部分 , 分別為問題定義階段、紋理編碼階段、影像分群階段、結論等部分。 1. 問定義階段 : 包含研究背景整理 , 並進一步確立問題癥結、研究動機及目的。方向. 確定後 , 著手蒐集相關的研究、技術文獻 , 這部分包含影像分群的介紹與應用、影像進行編碼的實例、基因演算法等。 4.

(14) ୢᚒ‫ۓ‬က ໘ࢤ. દ౛ጓዸ ໘ࢤ. ቹႽϩဂ ໘ࢤ. ࣴ‫୏ز‬ᐒ ዴҥ. ᄽᆉ‫ݤ‬ ೛ी. ϩဂჴᡍ ่ፕ. ࣬ᜢࣴ‫ز‬ ௖૸. ‫ٿ‬໘ࢤ ጓዸჴᡍ. ਏ݀ᡍ᛾. ϸᙟෳ၂. 圖 1.1: 研究架構 2. 紋理編碼階段 : 針對 LBP 既有問題 , 以兩階段的基因演算法重新編碼處理 , 期中. 考量圖樣變化及編碼距離的連續性與一致性。基因編碼對多種不同的參數進行測試 , 以獲得適當的編排結果。 3. 影像分群階段 : 對於不同類別的影像、分群演算法進行分群實驗 , 並將結果評估且. 加以分析。若分群效果仍有改善的空間 , 則回到上一階段重新檢視演算法設計的合理性 , 或進行參數調整 , 以求最佳的結果。 4. 結論 : 依據反覆測試求得的最佳結果 , 說明基因編碼的各項優點 , 並解釋採用兩階. 段編碼的原因與益處。最後提議可改善的方向以及未來發展。本篇論文結構如下所示 : 第一章說明研究動機及目的。第二章主軸在相關技術的背景知識及文獻。第三章對 LBP 所遭遇的問題進行更詳盡的探討。第四章依照上一張定義的問題 , 說明對應的策略。第五章為 LBP 基因編碼的演算法設計 , 描述基因演算法在運用上的詳細規劃。第六章為實驗設計與分析。第七章說明研究的成果與未來發展。 5.

(15) 第2章文獻探討 2.1 影像的分群方法 2.1.1 K-means 分群演算法 K-Means (KM) 是 1967 年由學者 J.B. MacQueen 所提出的分群演算法 [29] , 在分. 割式分群方法之中使用最為廣泛。演算法需事先給定分群的群集數量 , 而分群的依據是建立在歐幾里得距離上 , 藉由反覆的迭代運算 , 目標函式呈現的數值將逐漸下降至穩定 , 待該函式值停止變化 , 將顯示最終的分群結果。. J=. K X N X. kxi − νk k2. (2.1). k=1 i=1. 其中xi 為資料點 , νk 代表群集中心 , k∗k是歐幾里得距離的計算 , K 與N 分別為預先給定的群數以及資料點的數量。 KM 演算法的目標在於計算每一個資料點到所屬的群集中心點的距離 , 使距離總合即J 值達愈小。愈小的J 值 , 所表示的是群集內資料點分佈愈為密集 , 得到的分群結果也將愈好。 KM 演算法步驟簡述如下 , 圖 2.1則是其流程圖 : Step 1: 使用者預先決定群集數K 。 Step 2: 初始化K 個群集中心點。通常以隨機的方式選擇資料集中K 個資料點為初始中心. 點。 Step 3: 計算資料集中N 個資料點到K 個中心點的距離 , 依據距離的遠近 , 將資料點分配. 到最接近的群集內。 6.

(16) KM໒‫ۈ‬. ᒧ‫ۓ‬ϩဂኧ‫ܭ‬. ߃‫ۈ‬ϯౢғ‫ঁܭ‬ύЈᗺ. ीᆉၗ਑ᗺᆶဂ໣ύЈ‫ޑ‬ຯᚆ. ϩဂ ਥᏵၗ਑ᗺᆶဂ໣ύЈ‫ޑ‬നอຯᚆ. ख़ཥीᆉဂ໣‫ޑ‬൳ՖύЈ. ࢂ. ဂ໣ύЈ ࢂց‫୏׳‬ ց ᒡрϩဂ่݀. ϩဂ่‫״‬. 圖 2.1: K-means 分群演算法流程 Step 4: 重新計算每一個群集新的幾何中心。 Step 5: 當群集中心點不再變更 , 則停止。否則反覆執行 Step 3 到 Step 5 。. 7.

(17) 2.1.2 Fuzzy C-means 分群演算法 1973 年 Dunn 在 [30]一文中 , 率先提出 Fuzzy C-means (FCM) 的最初概念 , 接. 著在1981 年 , Bezdek 發表針對該演算法的改良方式 [31] , 便是現今常被提及與使用的 FCM 演算法。 FCM 演算法是由 KM 演算法衍生而來 , 相較於 KM 在分群的判斷上過. 於絕對 , FCM 因為使用模糊邏輯 (fuzzy logic) 的思維 , 造就每一個資料點與各個群集中心之間的關係 , 不再只是只有隸屬與否的問題。換言之 , 資料點不再完全歸屬於任何群集 , 而是利用歸屬函數表示資料點對於群集中心的歸屬程度。舉例來說 , 對於點x將分配至群集 A 或群集 B 的判斷情況 , KM 只能做出點x屬於群集 A 而不屬於群集 B 的判決 ; FCM 則能表示點x具0.8 的程度歸屬在群集 A , 僅 0.2 的程度屬於群集 B 。如此不為生硬的判斷方式 , 讓 FCM 充滿較多的彈性與空間 , 是此演算法的優點。初始化後的 FCM 會不斷地反覆運算 , 修正個群集中心點位置以及資料點與中心的歸屬關係。在目標函式Jm 逐漸收斂的情況下 , 最後吻合Jm 變化量小於門檻值ε此終止條件 , 便視為達到穩定狀態 , 結束 FCM 並得到最終的分群結果。 Jm =. N X K X. 2 µm ik kxi − νk k , m ∈ [1, ∞). (2.2). i=1 k=1. 其中xi 代表資料點 , νk 代表群集中心 , m為權重係數 , 為歐幾里得距離之計算 (Euclidean distance) , µik 是每個資料點xi 對於每個群集中心νk 的歸屬程度值。 µik 的公式如下 : µik =. " K #−1 2 X kxi − νk k m−1 j=1. kxi − νj k. (2.3). 而當中的νk 群集中心點公式如下 : νk =. PN. i=1 µik × xi P N i=1 µik. 8. (2.4).

(18) FCM 法步驟簡述如下 , 流程圖為圖 2.2 : Step 1: 設定分群數量K 、權重係數m(通常m ≥ 2) , 終止條件ε初始化U 矩陣 , U[µik ], (i = 1, 2, · · · , N; k = 1, 2, · · · , K) , 並且必須滿足以下條件 : • µik ∈ [0, 1], i = 1, 2, · · · , N; k = 1, 2, · · · , K •. PK. k=1. • 0<. µik = 1, ∀i = 1, 2, · · · , N. PK. k=1. µik < N, ∀k = 1, 2, · · · , K. Step 2: 利用公式 (2.4) , 計算K 個群集中心點νk Step 3: 利用公式 (2.2) , 計算目標函式Jm 假如 , 則停止計算 , 否則繼續執行 Step 4 Step 4: 利用公式 (2.3) , 計算新的 U 矩陣 , 更新其值。回到 Step 2. 2.1.3 影像分群相關文獻. 影像分群可以應用的層面非常館泛 , 用以分群的方式也不盡相同。 Sulaiman 及 Isa 在 KM 、 FCM 、 Moving KM 中加入抗雜訊的判斷機制 [2] , 使影像分群較不受胡椒鹽雜訊影響。 Saha 和 Bandyopadhyayy 在 [5]之中 , 使用多目標的模擬退火來完成腦部 MR 影像的分群工作。而其使用的目標函數結合XBI-index 與 Sym-index 兩種指標搭. 配 , 此兩種指標雖然沒互補 , 但也指出了不同的分群特性 , 幫助分群更為精確 ; 而 Santhalakshmi 和 Bharathi 則提出 [1] , 利用像素的灰階資訊 , 搭配該像素周遭的空間資. 訊 , 以強化 FCM 演算法。其結果顯示能抵抗胡椒鹽雜訊 , 並且對於彩色影像分割也有很好的效果。 Hasanzadeh 和 Kasaei 則提出一個對於多光譜影像進行分割的作法 [7] 。在分群之前 , 資料須先經過降低維度的處理 , 接著再以Sobel 的方式取得梯度資訊 , 並用 9.

(19) FCM໒‫ۈ‬. ϩဂኧ‫ܭ‬ ៾ख़߯ኧ݉ ಖЗచҹߝ. ߃‫ۈ‬ϯᘜឦ‫ڄ‬ኧߤ. ीᆉဂ໣ύЈ‫ݒ‬. ीᆉҞ኱‫ڄ‬ኧ‫ܬ‬. ख़ཥीᆉᘜឦ‫ڄ‬ኧߤ. ಖЗచҹ ‫ ܬ‬െ ‫ ܬ‬൏ ߝ ࢂցԋҥ. ց. ࢂ ᒡрϩဂ่݀. ϩဂ่‫״‬. 圖 2.2: Fuzzy C-means 分群演算法流程於進行分水嶺轉換 , 轉換後的資料方能進入 FCM 分群。為了提升分群效果 , FCM 加入權重的方式加以改良 , 而分群的接果將送入 Membership Connectedness 完成最後影像的分割。 Zhang 等學者則是將 FCM 分群用於合成孔徑雷達影像 [8] , 目的在於消除影像的雜點。其中 , 重要的邊界資訊會先使用 Canny 邊界偵測探知並加以分離 , 待分群結束再整合回去。而邊界分離的影像接著會以小波轉換的方式 , 分離出高頻區域並加以分群。 Ma, Lu 以及 Zhu 則是使用 FCM 搭配多種尺度整合的 LBP , 為多種紋理拼接的影像進. 行分群 [32] 。. 10.

(20) 2.2 紋理特徵編碼描述紋理的方式相當繁多 , 在區域的形式下描述影像結構便是其中一種。其概念是藉由對區域內像素之間的關係分析 , 歸納出可依循的特性 , 相同特性的結構將配置同一種編碼 , 以描述該種紋理結構。這類型的紋理表示方式 , 由於計算複雜度不高且在應用上呈現不錯的效果 , 因此相關研究十分地廣泛。以下便介紹數種區域的紋理描述 , 當中包含廣為運用的 LBP , 以及一些衍生或相關的紋理編碼方式。 2.2.1 LBP 編碼與相關演變 LBP 編碼的發展 , 最初是參考 Wang 和 He 於1990 年所提出的 [28] 。這篇研究利. 用3 × 3像素的區域 , 比較周圍鄰近像素與中心像素 , 得出三元的關係並加以編碼。在3 × 3的區域內 , Vi (i = 1, 2, · · · , 8)表示周遭8 個鄰近像素的強度 , V0 則是中心像素的強度 ,. 二者之間的關係對應周遭位置的Ei (i = 1, 2, · · · , 8)定義如下 :     0, if Vi < V0      Ei = 1, if Vi = V0        2, if Vi > V0. (2.5). Ei 是組成紋理單元的成分 , 8 個Ei 合成一個紋理單元T U = {E1 , E2 , · · · , E8 } , 由圖 2.3 (a) 表示。接著 , 每個T U 便可藉由公式 (2.6) 編碼 , 獲得屬於自己的標籤編號。由於每. 個成分都擁有三元的變化 , 因此 8 個成分總計能編制38 = 6561種紋理。實際的範例由圖 2.3(b) 所示。 NT U =. 8 X i=1. 11. Ei · 3i−1. (2.6).

(21) ͵ ൈ ͵୔ୱ. E1. E2. E3. E8. x. E4. E7. E6. E5. દ౛ൂϡ. 63. 28. 45. 2. 0. 2. 88. 40. 35. 2. x. 0. 67. 40. 21. 2. 1. 0. ܸ ൌ ሼͶͲǡ͸͵ǡʹͺǡͶͷǡ͵ͷǡʹͳǡͶͲǡ͸͹ǡͺͺሽ ܷܶ ൌ ሼʹǡͲǡʹǡͲǡͲǡͳǡʹǡʹሽ ܰ ൌ ͸Ͳͻͷ (b) 實際編碼範例. (a) 紋理單元的組. 成. 圖 2.3: 紋理單元及其編碼範例. 參照上述研究的三元編碼方式 , Ojala 等學者在 1996 年則提出二元編碼的版本 [19] , 也就是現今被廣為熟悉的 LBP 。 LBP 紋理特徵是一種運算簡單又頗有效果的紋理表示方式 , 它的原理相當簡單 , 同樣以3 × 3區域為基礎 , 中心點像素的灰階值強度將作為一個依據或門檻值。針對這個依據 , 周遭鄰近點像素得以進行比較 , 並分析出二元的明暗結果 , 如下所示。. s(gp − gc ) =.     0, if gp − gc < 0. (2.7).    1, if gp − gc ≥ 0. gc 是中間像素的灰階強度 , gp = {p = 1, 2, · · · , 8}則代表周圍8 個鄰近像素的灰階強度。. 依照此二元關係的編碼規則以公式 (2.8) 表示 , 不同位置的鄰近像素 , 將對應至各自編碼權重以完成編碼 , 範例示於圖 2.4 。 LBP =. 8 X. s(gp − gc ) · 2p−1. p=1. 12. (2.8).

(22) ૜ ൈ ૜୔ ୔ୱ. ࢙ሺࢍ െ ࢍ ሻ. 6. 5. 2. 1. 0. 0. 7. 6. 1. 1. x. 0. 9. 3. 7. 1. 0. 1. ૛. ൈ. ࡸ࡮ࡼ ൌ ૚૟ૢ. 1. 2. 4. 1. 0. 0. 8. x. 16. 8. x. 0. 32. 64 128. 32. 0. 128. 圖 2.4: LBP 編碼範例. edge. corner. 圖 2.5: LBP 特徵對應之意義另外 , LBP 編碼所表達的具體意義如下 : 在比較的過程中 , 當周遭鄰近點強度較強 , 便表示為一個亮點 ; 當強度較弱 , 則表示成一個暗點。由亮案的差異便能組合出多種不同的圖樣。如圖所示 2.5 , 若亮點集中在同一側 , 則可視為一個邊界 ; 若亮點集中於區域的某一角 , 則可視為一個角落。 2002 年 , 同樣是由 Ojala 等學者所發表的 [20]一文中 , 除了對於 LBP 給予更廣泛. 的定義 , 亦提出一種具旋轉不變性的 LBP 衍生版本。該研究中 , 對紋理的描述不再侷限於3 × 3的區域 , 新定義的區域將拓展成一個圓形範圍 , 以中心像素為圓心 , 並搭配可調的半徑R ; 而用以比較的鄰近像素 , 數量P 也不再因區域的限制 , 固定存在8 個 , 是可自由調整的一個參數。因此若假設中心點像素的座標為(0, 0) , 鄰近像素的座標描述便為 (−Rdin(2πp/P ), Rcos(2πp/P )) , 概念呈現於圖 2.6 。新定義的 LBP , 中心像素的灰階. 強度表示為gc , 而鄰近像素則因為數量可更動 , 其定義拓展為gp (p = 0, 1, · · · , P − 1) 。. 13.

(23) ܲ ൌ Ͷǡ ܴ ൌ ͳǤͲ. ܲ ൌ ͺǡ ܴ ൌ ͳǤͲ. ܲ ൌ ͳʹǡ ܴ ൌ ͳǤͷ. 圖 2.6: 不同(P, R)所定義的圓形 LBP 區域藉由同樣的公式 (2.7) 衡量二元關係之後 , 廣義的 LBP 則定義為公式 (2.9) 。 LBPP,R =. P −1 X. s(gp − gc ) · 2p. (2.9). p=0. 而新版本的 LBP 將繼續由廣義 LBP 繼續延伸 , 稱之為灰階旋轉不變 LBP 。其概念是利用鄰近像素之間的明暗關係 , 區分出明暗程度較為一致的圖樣 , 衡量方式由下所示。 U(LBPP,R ) = |s(gp−1 − gc ) − s(g0 − gc )| +. P −1 X. (2.10) |s(gp − gc ) − s(gp−1 − gc )|. p=1. 假若鄰近的圖樣明暗變化次數不多 , 則用以衡量的U(LBPP,R )呈現一較小的值 , 以表示較為均勻的明暗變化 , 並將此種圖樣稱為均勻圖樣 , 示於圖 2.7(a) , 圖中圓周上的數字 0,1 表示s(gp − gc )的結果 ; 當明暗變化較多、較為劇烈 , 衡量的指標將顯示一較大的值 ,. 稱為非均勻圖樣 , 如圖 2.7(b) 。接著 , 將對於圖樣均勻程度的判斷 , 帶入編碼的描述之中 , 如公式 (2.11) 。被歸類為均勻的圖樣 , 方能被分派特定的編號 ; 非均勻圖樣只能共用同一種編號。. riu2 LBPP,R =.   P −1    Pp=0 s(gp − gc ), if U(LBPP,R ≤ 2)    . P + 1,. 14. otherwise. (2.11).

(24) 1 0. 1 1. 1. 1 0. 0. 0. 1 1. 0. 0. 0. (a) 均勻圖樣U (LBPP,R ) = 2. 0. 1. (b) 非均勻圖樣U (LBPP,R ) = 5. 圖 2.7: 由U(LBPP,R )定義的明暗均勻程度 2.2.2 其他區域描述的紋理編碼. 除了 LBP , 以區域描述的方式為紋理進行編碼的作法亦不少 , 甚至很多參考自部分 LBP 的概念 , 並融入其他見解 , 形成一種全新的紋理編碼。如 Zhou 和 Wang 提出的區. 域二元強度增加圖樣 (local binary increasing intensity patterns) [22] , 是一種以圖樣的方向向量對應查表的編碼方式。此方式以強度增強向量為基礎(公式 (2.12)) , 配合與 LBP 相似的二元比較結果 (公式 (2.13)) , 將計算量較大的強度差給予取代 , 得到一個透. 過二元方式簡化的強度增強向量 (公式 (2.14)) 。 IIV (Ic ) =. X. [(Ip − Ic ) · DV (Ip )]. (2.12). Ip ∈S. bi(Ip ) =. IIV (Ic ) =.      1,. if Ip > Ic. X. bi(Ip ) · DV (Ip ). X. DV (Ip ). Ip ∈S,Ip >Ic. =. (2.13).    −1, otherwise. Ip ∈S,Ip >Ic. 15. (2.14).

(25) 3 2. (-1, 1). (-1, 0). (0, 1). x (0, -1). 29. 28. 16. 15. 14. 13. 12. 1. 31. 17. 4. 3. 2. 11. 27. 0. 32. 18. 5. 0. 1. 10. 26. -1. 33. 19. 6. 7. 8. 9. 25. 20. 21. 22. 23. 24. 34. 35. 36. -1. 0. 1. (1, 1). (1, 0). -2. (-1, -1). 30. -3. (1, -1). -3. -2. 2. 3. . (b) LBIIP 編碼對照圖. (a) 方向向量對照圖. 圖 2.8: LBIIP 之相關對照圖其中Ip 為3 × 3範圍內 , 周圍像素的灰階強度 , Ic 則是中心像素的灰階強度 , DV (Ip )是周圍像素至中心像素的方向向量 , 可藉由圖 2.8(a) 得知。而經由上述步驟 , 能獲得一個合併後的方向向量 , 指向強度高於中心像素的區域 , 最後再對照圖 2.8(b) , 得出該向量對應的編碼。區域紋理圖樣 (local texture patterns) [24]則是由 Suruliandi 以及 Ramar 提出的方法 , 相對於 LBP 的二元判別 , 此編碼方式選用 LBP 前身的三元方式 , 並利用灰階旋轉不變的特性刪減減代表性較差的圖樣 , 最後留存的圖樣再以查表方式重新分配編碼。     0, if gi < (gc − ∆g)      (2.15) P (gi , gc ) = 1, if (gc − ∆g) ≤ gi ≤ (gc + ∆g) , i = 1, 2, · · · , 8        9, if gi > (gc + ∆g) LT P =.   P    8. i=1.    . P (gi − gc ), if U ≤ 3) (2.16) 73,. 16. otherwise.

(26) ૜ ൈ ૜୔ ୔ୱ. ࡼ ࢍ ǡ ࢍ ǡ οࢍ ൌ ૝. 123. 110. 113. 1. 0. 0. 117. x. 135. 1. x. 9. 130. 125. 128. 9. 9. 9. 圖 2.9: 三元判別範例 െ͵ െ͵ െ͵. ͷ ͷ ͷ. െ͵ ͷ Ͳ ͷ െ͵ ͷ ‫ܯ‬଴. െ͵ െ͵ െ͵. ͷ Ͳ െ͵ ‫ܯ‬ଵ. ͷ ͷ െ͵. ͷ െ͵ െ͵. ͷ ͷ Ͳ െ͵ െ͵ െ͵ ‫ܯ‬ଶ. ͷ ͷ െ͵. ͷ െ͵ Ͳ െ͵ െ͵ െ͵ ‫ܯ‬ଷ. െ͵ െ͵ Ͳ െ͵ െ͵ െ͵ ‫ܯ‬ସ. െ͵ ͷ ͷ. െ͵ െ͵ Ͳ െ͵ ͷ െ͵ ‫ܯ‬ହ. െ͵ െ͵ ͷ. െ͵ െ͵ Ͳ െ͵ ͷ ͷ ‫଺ܯ‬. െ͵ െ͵ െ͵. െ͵ Ͳ ͷ ‫଻ܯ‬. െ͵ ͷ ͷ. 圖 2.10: 8 種方向遮罩公式( 2.15) 即為三元的判別方式 , gi 及gc 分別是周圍與中心像素的灰階強度值 , ∆g 為一個小的正整數 , 其範例呈現於圖 2.9 。而灰階旋轉不變的特性 , 則是利用同於公式 ( 2.10) 的均勻性衡量來輔助判別。初步的編碼方式為公式 ( 2.16) , 編碼區間落在 0 到 73 之間 , 當中有許多未使用的編碼區段。故再進一步地整理 , 將 46 種圖樣重新分配編碼 , 以查表的方式完成編碼對照 , 編碼分布範圍為於 1 至 46 。區域方向數字紋理 (local directional number pattern) [23]是一種與 LBP 差異較大的編碼方式 , 3 × 3區域與8 種方向遮罩 (圖 2.10) 進行摺積 , 產生 8 個方向數字。數字中最大的正數與負數被挑選出來作為編碼的代表 , 以 6bit 完成編碼 , 前面 3bit 代表正數的方位 , 後面 3bit 則為負數的方位。整個編碼範例表示於圖 2.11 。. 17.

(27) ൈ ୔ ୔ୱ. Бӛኧӷ. ፿࿽. 162. 180. 175. 193. 20. 27. 190. 20. 25. ᄙᑈ. M3. M2. M1. 1364 1220. M4. x. M0. 1444. M5. M6. M7. 20. 140 -1100. 308 -1036 -2340 ൌ ͳͲͲ ͳͳͳ

(28). 圖 2.11: 區域方向數字紋理編碼實例. 2.3 基因演算法基因演算法這套理論是於 1975 年由 John Holland 所提出 [33] , 以生物物競天擇的概念作為基礎 , 在自然界中 , 族群內的個體會交配繁衍下一代 , 且有發生突變可能 , 但無論過程為何 , 最終都會在環境的選擇下 , 留下適應性較高的個體。基因演算法就如同生物演化一般 , 將問題的解答編碼制定出個體的染色體排列形式 , 初始化產生族群之後 , 便任由這些個體進行交配、突變產生子代 , 最後再由目標函數 , 如同生物所需適應的環境一般 , 挑選出適應性高的個體。經過多個世代的繁殖演化 , 可獲得對問題具較高適應性的近似最佳解。現今運用基因演算法的領域相當廣泛 , 無論在計算科學、工程學 , 或者在化學、製造、物理等方面都能見到它的身影。面對問題解的廣大搜尋空間 , 藉由交配 , 能維持搜尋的廣度 , 而突變更能幫助其跳脫區域最佳解 , 保有搜尋深度 , 因此常被用以解決全局最佳化的問題 , 尤其在遭遇搜尋空間極為廣泛時 , 更能顯示其優點。染色體編碼、初始化、適應性評估、選擇、交配、突變等階段 , 是執行基因演算法的幾個重要步驟 , 下方將此條列並予以介紹 , 而整體流程則由圖2.12詮釋 :. 18.

(29) • 染色體(chromosome) 編碼 : 問題的解答將會被編碼成一串數字或字元 , 每個數字. 或字元則稱為一個基因。 • 初始化 (initialize) : 依照染色體形式 , 隨機產生一定數量的個體組成一個族群 , 必. 要時也能控制初始化過程 , 使族群中存在一定數量較優秀的個體。 • 適應性 (fitness) : 個體的優越程度 , 以目標函數 (objective function) 進行判斷 ,. 也稱作適應性函數 (fitness function) 。 • 選擇 (selection) : 適應性高的個體 , 會有較高的機率被選擇放入交配池 (mating pool) , 進行後續的繁殖動作 , 常見的選擇方式有輪盤法 (roulette wheel selection) 、. 競爭法 (tournament selection) 等。 • 交配 (crossover) : 由交配池中選出兩者作為父代 , 交換部分染色體以生成新的子. 代 , 交配方式可以是單點、兩點、遮罩、或其他因應特殊狀況設計出來的交配方式。 • 突變 (mutation) : 在染色體中隨機選出一個至多個基因進行突變 , 其突變的數值. 可以是隨機產生 , 或在特殊情況下設計的突變方式。 • 取代 (replacement) : 新的子代產生後 , 會以適應性函數重新評估每個個體 , 適應. 性較佳的個體會保存於族群之中 , 反之則遭到淘汰。 • 重啟 (testart) : 當族群中染色體相似度極高的時候 , 可保留數個較優的個體 , 其餘. 進行初始化 , 藉以擾動當前穩定的狀態 , 有助於跳脫區域最佳的狀況。 • 終止條件 (terminal condition) : 終止條件用以判斷整個基因演算法於何時結束 ,. 可以為 (1) 達到設定代數、 (2) 演化收斂至某個穩定程度、 (3) 適性值達到設定的 19.

(30) GA໒‫ۈ‬ ߃‫ۈ‬ϯ ፾‫ॶ܄‬ຑ՗. ᒧ᏷ Ҭଛ ँᡂ. ख़௴. ‫ڗ‬ж ց. ᅈ‫ى‬ ಖЗచҹ ࢂ ᒡр่݀. ᄽϯ่‫״‬. 圖 2.12: 基因演算法流程標準。. 20.

(31) 第3章影像特徵差異與編碼距離普遍所見的影像特徵不外乎以顏色或紋理的型態呈現 , 其中 , 在使用上顏色描述又以 RGB 最為廣泛 ; 而紋理之中 , LBP 也是近年來經常被用於影像處理的特徵表示方式。下方將針對此兩種特徵進行分析 , 說明特徵差異與編碼距離的關係。. 3.1 RGB特徵距離特徵的編碼距離計算 , 是可以用來分別特徵差異性的一種手段。一般而言 , 較大的距離 , 用以表示較大的特徵差異 , 反之則否。基本的灰階色彩便擁有這樣的特色 , 圖 3.1 呈現一個 8 bit 灰階色彩的實例 , 以做初步的說明。圖例中呈現數個灰階色彩 , 顏色下方的數字代表各個顏色的灰階值。其中 , 灰階的黑色 (0) 與白色 (255) 為差異最極端的兩種顏色 , 兩者距離為 255 , 確實能對應劇烈差異的顏色表現 ; 而深灰色 (30) 之於黑色 (0) , 如同淺灰色 (230) 之於白色 (255) , 此為顏色相近的兩組顏色 , 也呈現較接近的編碼距離。 RGB 色彩作為特徵便如同灰階一般 , 特徵差異能對應至編碼距離。對 RGB 特徵而言 , 距離的計算便是把此三維的特徵想像成位於三軸上的一點 , 透過歐幾里德距離的方式 , 進行特徵距離計算。 DisRGB =. q. (Ri − Rj )2 + (Gi − Gj )2 + (Bi − Bj )2. (3.1). 圖 3.2所示 , 便是一個由 24 bit 的 RGB 色彩 , 所構成的範例。圖中呈現紅、橘、綠三色 , 並於顏色下方列出其所屬的 RGB 特徵。紅色與橘色人類對視覺感官而言是較為相近的顏色 ; 相對的綠色與前兩者的差異性就較為明顯。再從 RGB 的顏色特徵的編碼觀 21.

(32) dissimilar far 0. 30. 230. 255. 圖 3.1: 灰階特徵的距離與顏色差異關係. ࢊ࢏࢙ࡻࡳ ൎ ૛૜૝Ǥ ૠૢ. ࡵ࢓ࢇࢍࢋࡻ ࢊ࢏࢙ࡾࡻ ൎ ૚૛૙Ǥ ૛૚ similar. dissimilar ሺ૛૝૟ǡ ૚૛૝ǡ ૞ሻ. ࡵ࢓ࢇࢍࢋࡳ ࡵ࢓ࢇࢍࢋࡾ dissimilar. ሺ૛૚ǡ ૚ૢ૙ǡ ૚ૠሻ. ࢊ࢏࢙ࡾࡳ ൎ ૛ૢ૚Ǥ ૜૜. ૛૝૟ǡ ૞ǡ ૛૛. 圖 3.2: RGB 特徵的距離與顏色差異關係之 , 範例中紅色的 RGB 特徵為(246, 5, 22) 、橘色為(246, 124, 5) 、綠色為(21, 190, 17) , 經由計算過後 , 紅色與橘色的距離為 120.21 , 綠色與紅色、橘色的距離則各自為 291.33 、 234.79 。結果顯示紅色與橘色的距離是接近的 ; 而綠色是遠離這兩種顏色。相似的顏色. 將具有相近的 RGB 編碼距離 , 兩者之間存在正相關的對應。. 22.

(33) 3.2 LBP特徵距離由章節 2.2 可知 , LBP 編碼倚賴事先制定好的權重配置 , 不同的權重將決定截然不同的編碼結果。下方圖 3.3的範例將針對 LBP 此編碼特性 , 顯示不同權重的編碼方式 , 對於編碼距離的影響。而 LBP 的編碼距離計算概念同於 RGB , 是以代表紋理的圖樣編碼 , 計算歐幾里德距離。. DisLBP. q = (LBPi − LBPj ). (3.2). 圖例之中 , 圖樣周遭全為暗點 (LBP=0) 與全為亮點 (LBP=255) 的差異極高 , 編碼距離表現出最大值 255 , 是相當合理的結果。而下方三個存在 7 個亮點的圖樣 , 因為編碼權重的不同而有不一樣的編碼 , 編碼距離的合理性也有所不同。若在暗點對應到權重為 1 的情形下 , LBP 編碼為 254 , 距離計算的結果甚為適當 ; 但是當暗點對應到的權重為 64 甚至 128 , LBP 的編碼將變為 191 與 127 , 顯然地失去以距離表現圖樣差異的特性。圖 3.4則. 呈現在一個選定的權重配置下 , 三種 LBP 圖樣與編碼距離的對應關係的例子。當中 LBP 編碼 130 、 129 、以及 3 這三種圖樣 , 在視覺上彼此間是相當的類似 , 可是三者之間的特徵距離卻並非如此 , LBP 編碼 3 與 130 距離為 127 , 與 129 的距離為 126 , 此兩個距離是相近的 ; 但 LBP 編碼 130 與 129 距離卻僅有 1 , 與前兩個距離落差很大, 並沒有三者呈現一致的相似程度。可見傳統 LBP 編碼在某些情況下 , 編碼距離是不能正確表達圖樣的差異。由先前兩小節的範例可知 , 與顏色相關的特徵如 : 灰階、 RGB , 擁有特徵差異與編碼距離呈現連續性及一致性的特質。這樣的特質可以很有效地讓特徵被分群演算法以距離為依據適當分群 , 後續的應用如影像分群等 , 也才能正確地達成目標。而 LBP 紋理 23.

(34) ࢊ࢏࢙ ൌ ૛૞૞. ‫ۺ‬۰‫ ۾‬ൌ ૛૞૞. ‫ۺ‬۰‫ ۾‬ൌ ૙. 64. 1. ‫ۺ‬۰‫ ۾‬ൌ ૚૛ૠ. ‫ۺ‬۰‫ ۾‬ൌ ૚ૢ૚. ‫ۺ‬۰‫ ۾‬ൌ ૛૞૝. ࢊ࢏࢙ ൌ ૚૛ૠ. ࢊ࢏࢙ ൌ ૟૝. ࢊ࢏࢙ ൌ ૚. 128. 圖 3.3: 同權重對於 LBP 編碼距離之影響紋理特徵則缺乏此種特質 , 原因在於 LBP 的編碼方式受限於權重的影響頗高 , 尤其是權重愈高的點愈容易對編碼產生劇烈的變化 , 也間接地影響了編碼距離的計算結果。使得在某些情況下 , LBP 的編碼距離與圖樣差異的對應是有所落差 , 無法同 RGB 一般相當完善。這是 LBP 編碼的一個缺陷 , 同時也顯示出編碼的方式稍有不同 , 便能夠深深地影響距離的表現。顯然地若要滿足距離計算的合理性 , 對 LBP 以其他方式重新給予適當的編碼是必要的。. 24.

(35) 0. 1. 0. 1. x. 0. 0. 0. 0. ࢊ࢏࢙ ൌ ૚. 1. 0. 0. similar. 1. x. 0. 0. 0. 0. ‫ۺ‬۰‫ ۾‬ൌ ૚૛ૢ. ‫ۺ‬۰‫ ۾‬ൌ ૚૜૙ similar similar ࢊ࢏࢙ ൌ ૚૛ૠ. 1. 1. 0. 0. x. 0. ࢊ࢏࢙ ൌ ૚૛૟ 2. 4. 128 X. 8. 1. 0. 0 ‫ۺ‬۰‫ ۾‬ൌ ૜. 0. 64 32 16. weight. 圖 3.4: 特徵距離與 LBP 紋理圖樣的對應關係. 25.

(36) 第4章紋理特徵編碼策略 4.1 圖樣連續排列的可行性由上一章對 LBP 特徵距離分析的結果可知 , LBP 紋理在編排上並沒有考慮圖樣差異與距離的連續的變化關係 , 這意味著編碼相近的紋理圖樣 , 可能不是十分相似。對於重視資料的距離與相似度之間關係的分群演算法 , 無疑地將嚴重降低判斷上的精準度。因應這類型的問題所在 , 為 LBP 紋理特徵設計一套考量圖樣變化與距離連續性的編碼方式 , 是一個解決問題的方向。傳統的 LBP 圖樣 , 可以看成一組 8 bit 的二進制編碼 , 如圖 4.1 , 欲完成圖樣的連續性差異排列 , 可藉由排列 8 bit 編碼表示的 LBP 方式進行。下方呈現的是兩種編碼的排列情形 , 已說明此圖樣排列做法的可行性。圖 4.2 (a) 為 2 bit 編碼進行連續變化的編排結果 , 從中不難看出 , 每個編碼與相鄰者的差異皆只有 1 bit , 即是編碼漢明距離 (Hamming distance) 僅為 1 , 是相當理想的結果。而圖 4.2 (b) 呈現的則為 3 bit 的編排情形 , 與 2 bit 的編排結果相同 , 3 bit 的編碼也能夠達成連續變化的排列 , 使漢明距離的差異一致。除了從編碼的漢明距離的一致性能看出排列的效果 , 圖例中的呈現的長條狀圖樣 , 視覺上的變化亦相當連續 , 這顯示圖樣以編碼型態進行連續性編排具有一定效果 , 故將 8 bit 表示的 LBP 圖樣 , 排列連續性變化的可行性是存在的。本章節後續也將以此圖樣排列的概念 , 設計 LBP 重新編碼的一連串策略 , 使經由連續性變化排列的圖樣 , 能對應至新的整數編碼 , 存在合理的編碼距離。. 26.

(37) 1. 2. 1. 0. 0. 3. 8. 0. x. 1. 4. 7. 1. 0. 1. 1. 2. 4. 128. X. 8. 64. 32. 16. weight 6. 5. ጓዸǺ01011001. 圖 4.1: LBP 圖樣以 8 bit 編碼呈現 0 0 0 1 0 0 0. 0 0 1. 0. 0 1 1. 1 0 1 1. 0. 0. 1. 1 1 1 1. 1. 0 1 0 1 1 0. (a) 2 bit 編碼. (b) 3 bit 編碼. 圖 4.2: 圖樣連續性變化編排示意. 4.2 因應的編碼策略上一章節已說明了圖樣依照連續性變化排列的可行性 , 因此編碼的方向將以此為基礎 , 使相對應的編碼距離亦呈現連續性關係。但同時考量紋理差異程度以及特徵編碼距離的問題複雜性頗高 , 因而本論文採以兩階段方式處理 , 對此兩項需求先後做出適當的安排。. 27.

(38) 4.2.1 紋理的連續性考量. 傳統 LBP 的編制是考量一個3 × 3的區塊 , 其中 8 個相鄰像素與中間像素比較的二元關係 , 因此有28 = 256種紋理圖樣。這 256 種紋理圖樣的連續編排關係 , 是優先考慮的目標。率先將紋理的相似程度確立 , 方能給予後續的對應號碼編制一個明確的方向。為此首先考慮一具備 256 個位置環狀的空間 , 並將各式各樣的圖樣依照相似的程度安排至適當的位置。其意涵是相近的圖樣都能伴隨在附近區域 , 且整體排列不同於長條線狀 , 無首尾區分及大規模的落差存在 , 連續變化能不斷循環。要完成這樣的一套連續變化的規律 , 位在環狀空間上每一個位置的圖樣需要滿足以下這些考量。最基本的不外乎優先考慮左右相鄰者 , 如圖 4.3中最接近中央黑色圓的的兩個白色圓即是。假設作為基準的中央圖樣與左右相鄰位置上圖樣排列間距稱為 1 , 第一層考量便為 : 環狀空間上所有排列間距為 1 者 (見於圖 4.4左) , 其相似程度應當接近一致。但單純考量左右相鄰者 , 仍不足使附近區域都呈現一致的相似性及變化性 , 因此向外延伸是必須的。如圖 4.3中位於黑圓較外圍的兩個虛線圓 , 即兩側僅次於相鄰的第二接近位置。若中央圖樣與較外層位置上的圖樣排列間距設定為 2 , 則環狀空間上所有排列間距為 2 者 (見於圖 4.4右) 的相似程度 , 便是第二層的考量。比照這樣的概念 , 便可對更外層位. 置的圖樣 , 像是圖 4.3中的兩種同心圓所在的位置 , 做第三、第四層以上的延伸。即是環狀空間上排列間距為 3 者 , 具有一定相似度 ; 排列間距為 4 者亦同。藉由控制不同排列間距的鄰近圖樣與中央圖樣的差異關係 , 鄰近區域內的變化程度便能獲得控制。這樣的影響擴展至整個環狀空間 , 便產生一定的規律 , 而非是雜亂無章的排列。這是一個針對多個鄰近位置上的圖樣做考量的策略 , 也是一個可利用的基本雛. 28.

(39) 圖 4.3: 環狀空間中央位置與鄰近位置示意. 圖 4.4: 環狀空間上所有排列間距 1、2 的考量. 圖 4.5: 不考慮排列間距為 2 的鄰近位置形。因此在使用上是可以依不同的需求與考量 , 對每一層所採用的排列間距做出調整 , 衍生出其他類似的版本。如圖 4.5所示的排列間距便與基本雛形的1, 2, 3, 4, · · · 遞增不同 , 是不考慮間距 2 考量的版本。. 29.

(40) 4.2.2 對應的紋理編碼. 第一階段完成紋理相似程度的規劃 , 使紋理具備連續變化的環狀規律 , 是第二階段編排的一個重要參考的依據。因此第二階段編碼的第一個考量 , 便是要讓對應圖樣的編號 , 盡可能符合前階段排列的變化規律。最簡單的作法即是採用與前階段相同的規劃方式 , 對多個不同間距的鄰近位置做變化程度的考量 , 差別不同的僅在於前一階段是針對紋理圖樣的相似程度 , 而此階段針對的是編號經計算後的遠近程度。可運用的編碼範圍是第二個需要被考量的重點。回顧傳統的 LBP 編碼 , 其採用一組對應權重的累加 , 最後圖樣編號將落在 0 到 255 之間的整數上。但傳統的 LBP 在這個區間的編號無法表達紋理圖樣的連續變化 , 一部份的原因乃在於 0 到 255 的整數區間過於狹小與擁擠。為了給予充足的距離空間以對應紋理圖樣 , 將編號可使用的範圍合理地擴張是必須的。例如可以將原始範圍乘上一個倍數 , 放大調整至 0 到 1023 , 如此 256 種紋理圖樣在對應編號將有更大的選擇性。當然關於編碼範圍在運用上還是有其他的變化空間 , 例如當有尺度上的考量 , 可以在編碼後以正規化為尺度調整。這即便表示調整後的編號呈現可以不必拘束在整數上 , 帶有小數的編號是被允許的。一來編號只是用來表示一種紋理圖樣的身分 ; 二來小數的運用可以使對應的距離描述更細膩且具有彈性。第二個運用上變化 , 是可以強制指定兩種特定的圖樣擔任編號的最大與最小值 , 以圖 4.6為例便是合理地選擇兩個極端的圖樣來配置。需要這樣額外的變化 , 乃是因為編碼範圍雖然擴大 , 但最大最小的編號不見得會採用最為邊界的兩個值 , 如此起初設定的距離空間當受到壓縮 , 略為失去給予廣大編碼範圍的美意。. 30.

(41) 0. 0. 0. 1. 1. 1. 0. x. 0. 1. x. 1. 0. 0. 0. 1. 1. 1. 圖 4.6: 套用最大及最小編號的兩種圖樣. 4.3 編碼複雜度處理編碼本身複雜程度便不在話下 , 兩階段的作業也是基於簡化單一步驟工作量的考量。工作內容被分為在第一階段對於多個鄰近位置的圖樣進行衡量 , 確立紋理圖樣排列的變化連續性 ; 第二階段承襲上一階段的規律 , 並調整編碼範圍。但拆分開來的任務 , 實際上複雜度還是相當可觀。以第一階段的任務而言 , 目的將 256 種圖樣進行編排 , 當中要注意的是 , 這 256 種圖樣都是獨立不可重複的。因此可推知 , 在 256 個位置當中 , 第一個排入圖樣的位置能考慮的圖樣種類有 256 種選擇 ; 第二個位置因不能重複 , 故剩下 255 種選 Q , 擇 , 依次往下遞減。最後完成的整個環狀排列 , 排列組合將有 256 k=1 k = 256!種組合大. 約是8.5782 × 10506 種。. 接續分析的第二階段任務 , 雖然參考上一階段排列的變化規律 , 但實際上僅是作為第二階段的編碼目標 , 因此此階段的複雜度並不會低於前一階段。這一階段的目標在於 256 種圖樣需要對應不能重複的編號 , 假設編碼範圍為 0 到 1023 的區間的整數。依上述條. 件 , 第一個圖樣能選用的編號有 1024 種 , 第二個圖樣為 1023 種 , 依次遞減。整個組合的 Q768 Q 755 , 種。將有 1024 j=1 j = 1024!/768!種大約是2.9703 × 10 k=1 k/. 兩階段的編碼分工 , 當中任一階段都存在複雜與龐大的組合 , 無疑地編碼工作的困. 難度是相當的高 , 儘管在眾多的排列組合當中 , 存在著多為毫無規律的排列方式。再加. 31.

(42) 上排列是在一環狀空間上進行 , 會有旋轉不變的特質存在。也就是說 , 對於 256 個位置的環狀空間 , 每 1 種排列都將伴隨 255 種旋轉後會完全相同的排列方式 , 這些都是可以不用被考慮的對象。但剩餘的組合依舊繁多, 這也是本論文之所以選擇以基因演算法完成編碼的主要原因。. 32.

(43) 第5章演化式編碼最佳化設計 5.1 二階段之基因演算法基因演算法被帶入兩階段的編碼策略 , 以處理龐大的排列與計算問題。依據每一個階段的目標設定 , 各自使用一套獨立的基因演算法完成目標。第一套演化完成紋理圖樣的排列 , 再交由第二套演化出對應的編號。以下為此兩套演算法的詳細規劃與設定 : 5.1.1 染色體編碼. 第一階段的基因演算法 , 目的在於排列環狀空間上的 256 個 LBP 紋理圖樣。故染色體以表達環狀排列作為設計 , 長度設置由 256 個基因組成 , 基因分別代表不同的 LBP 紋理圖樣 , 種類不能重複。基因編號以 0 到 255 表示 256 種 LBP 圖樣 , 編號方式與 LBP 相同 , 由權重累加所得 , 見於圖 5.1 。完整的第一階段的染色體描述如下 : Chros1 = {G1,s1 , G2,s1 , · · · , GB,s1 } , 其中Gi,s1 = [0, B − 1] ∈ N, i = 1, 2, · · · , B , 代表染色體內. 的基因 ; B = 2P = 256 , 是針對P = 8個鄰近像素所能組成的圖樣種類。 256ঁ ঁ୷Ӣ 228. 235. 130. 0. 0. 1. 1. 1. 0. 0. x. 0. 1. x. 0. 1. 1. 1. 1. 1. 1. 198. 圖 5.1: 第一階段染色體編碼方式. 33.

(44) 256ঁ ঁ୷Ӣ 325. 975. 522. 101. 圖 5.2: 第二階段染色體編碼方式第二階段的染色體編碼方式與第一階段有部分相似之處 , 由於目的是將上一階段排列完成的 256 個圖樣進行編號對應 , 因此染色體設計由 256 個代表圖樣編號的基因所組成 , 並且有基因不得重複的限制。圖樣編號的範圍被允許做倍數放大 , 範圍內的整數可隨意挑選使用 , 示意於圖 5.2 。而第二階段染色體描述為 : Chros2 = {G1,s2 , G2,s2 , · · · , GB,s2 } , 當中的Gi,s2 = [0, α · (B − 1)] ∈ N, i = 1, 2, · · · , B 為染色體基因 ; α表示編碼範圍地放大倍數 , 為一正整數 ; B = 2P = 256 , 同前一階段是P = 8個鄰近像素能構成的圖樣種類。 5.1.2 適應性函數設計. 在事先擬定的策略中 , 第一階段要求圖樣依連續性的變化排列 ; 第二階段要求圖樣編碼對應排列的連續性 , 是各階段適應性函數要導向的目標。因此第一階段適應性函數在設計上 , 圖樣將由整數的基因編號 , 解碼成二進制 8 位元型態 , 以利於相似性的估算。圖樣之間 8 個位元的變化次數 (即漢明距離) 將被計算 , 並考量其變異數的最小化。而圖樣間不同間距的影響也是設計的重點 , 並搭配不同的權重加以控制。第一階段是適應性函數呈現如下 :. f itnesss1 =. I X. wj,s1 · Intj,s1 + ws · S. j=1. 34. (5.1).

(45) 其中wj,s1 為控制第j 種排列間距所屬的權重 ; I 為所有排列間距的種類數量 ; Intj,s1 的描述則為 :. Intj,s1 = bounds1 − varj,s1. (5.2). bounds1 為第一階段的最大距離上界 , 其代表第j 種排列間距的影響 , 以最大值 1 對變異程. 度相減 , 讓適應性函數呈現正相關的曲線變化。存在於Intj,s1 當中的varj,s1 所描述的是針對第i種排列間距 , 圖樣之間位元變化次數的變異數 , 詳細如下所示 : varj,s1.

(46) PB

(47) ¯

(48)

(49) k=1 hjk − hj = B. (5.3). 而hjk 是屬於第j 種排列間距當中 , 第k 個圖樣與鄰近圖樣的漢明距離。 h¯j 是關於第j 種間距的平均位漢明距離。 B 為 LBP 圖樣總數。至於S 是區域相似程度的衡量因子 , ws 為該項目之權重。當圖樣與鄰近區域內的圖樣相似度愈高 , S 則具有較高的衡量值。下方為S 因子之描述 , 其中n為一可變動參數 , 控制衡量的區域大小 ; h(k, k + i)代表第k 個圖樣與第k + i個圖樣的漢明距離。 S=. B X n X. s(k, k + i), n > 0. (5.4). k=1 i=−n. s(k, k + i) =.      2,. if h(k, k + i) < 3) (5.5).    −1,. otherwise. 第二階段適應性函數 , 是假設前一階段能獲得不錯的效果情況下設計 , 因此考量的重心與第一階段相似 , 當中包含對不同間距的考量以及其對應權重。內部針對不同性質的距離進行計算 , 是前後兩適應性函數的差異 , 而本階段是針對編碼距離的變異數最小. 35.

(50) 化來處理 , 以下為第二階段的適應性函數表示 : f itnesss2 =. I X. wj,s2 · Intj,s2 + wv · V. (5.6). j=1. 而針對不同排列間距 , 關於編碼距離的變異數表示如下 : Intj,s2 = bounds2 − varj,s2

(51) PB

(52)

(53) djk − d¯j

(54) varj,s2 = k=1 B. (5.7) (5.8). boundS,2為第二階段的最大距離上界 , djk 是在第二階段中 , 表示第j 種排列間距當中 , 第k. 個圖樣與鄰近圖樣的編碼距離。 d¯j 是關於第j 種排列間距的平均編碼距離。接著 , V 是針對排列階段與編碼階段之間 , 變異相似程度的度量 , wv 為其權重 , 表示於下方。 V =. B X. sv(varj,L , varj,S1 ). (5.9). k=1. sv(x, y) =.     2, if |x − y| < α    0,. (5.10). otherwise. 內部敘述的varj,L是代表區域的變異數 , α為一可容許的門檻值 , 調整相似層度。 5.1.3 交配. 在設計上前後兩階段採用相去不遠的交配策略 , 目的使此兩個階會有相類似的演化趨勢 , 呈現一致的連續變化。兩種階段的染色體設計都有一個很重要特性 : 染色體基因不得重複 , 因此交配方式須有所因應 , 無法使用一般常見的作法 , 如對交配而言 , 單點交配、雙點交配、字罩交配等皆不適用。下方詳述的特定交配方式 , 便是參考 TSP 問題 [34] 所設計的特殊作法 , 以因應此染色體的設定 : step 1: 隨機產生一個基因作為子代染色體的第一個基因 , 並設定為「主要基因」 36.

(55) ηж. 228. Рж. 143. 235. Ьा୷Ӣ 130. 130. 67. 198. 圖 5.3: 記錄主要基因在父代之中的染色體位置. ηж. 228. Рж. 143. 235. Ьा୷Ӣ 130. 130. 228. 67 ংᒧ୷Ӣ. 圖 5.4: 銜接於主要基因後方的候選基因. ηж. Рж. 0. 143. 235. Ьा୷Ӣ 130. ‫ܩ‬௝ ൌ Ͳǡ ૚ǡ ʹǡ ‫ ڮ‬ǡ ʹͷͷ ংᒧ୷Ӣ 130. 235. 0. 圖 5.5: 自基因集合中挑選的候選基因 step 2: 在兩條父代的染色體中 , 找出與主要基因相同或最為相似的基因(第二階段的交. 配 , 完全相同的基因可能不存在) , 並記錄其出現在染色體中的位置 , 如圖 5.3 。 step 3: 父代染色體各自從 step 2 紀錄的位置 , 對後方銜接的基因做探測 , 所探測到的第. 一個不曾出現在未完成的子代染色體上之基因 , 便是候選基因 , 概念呈現於圖 5.4 ; 假若後方銜接的基因都已經使用在子代染色體上 , 則從所有可用的基因中由小而大檢視 , 第一階段所有可用的基因為Gi = [0, B − 1] ∈ N , 而第二階段為Gj = [0, α·(B−1)] ∈ N 。同樣地找出第一個未被子代染色體使用的基因 , 示於圖 5.5 。. 37.

(56) ংᒧ୷Ӣ 2 Ьा୷Ӣ. ংᒧ୷Ӣ 3. 圖 5.6: 候選基因銜接示意 step 4: 屬於第一階段交配以下執行 a 部分 ; 第二階段則為 b 部分 a. 將兩條父代染色體中的基因 , 依各自編號轉換回二進制八位元表示。計算將. 兩條父代染色體中 , 相鄰基因的平均位元變化次數 (即平均漢明距離HDisave ) , 作為一比較基準。另一方面 , 各自的候選基因也須計算與主要基因的漢明距離HDisjcand1 、 HDiscand2 , 並與HDisave 比較。相差存在最小值者 , 其所代表的候選基因 , 便是銜接於子代染色體的下一個基因。 b. 計算將兩條父代染色體中相鄰基因的平均距離 , 當作比較基準Disave 。而後計. 算各自候選基因與主要基因的距離Discand1 、 Discand2 , 並與Disave 進行相差。相差後存在最小值者 , 其候選基因便是銜接於子代染色體的下一個基因。 step 5: 檢驗子代染色體的基因數 , 若低於總數 256 便將 step 4 選出的銜接基因設為主要. 基因 , 並跳至 step 2 繼續執行。經由一次 step 1 至 step 5 , 能產生一條子代染色體 , 若想讓同一組父代染色體產生更多子代 , 重複執行此五個步驟即可。本論文一組父代繁衍兩個子代 , 因此每一次交配重複執行上述流程兩次。. 38.

(57) 5.1.4 突變. 兩階段的突變採用相同的方式 , 而唯一需要注意的重點也與交配相同 , 染色體基因不得重複 , 相應的突變方式敘述如下 : step 1: 以隨機方式選出一條子代染色體 , 之後再從這一條染色體選出一個受突變的基因 ,. 以及一個搭配的基因 , 並將此兩基因組成一個突變的基因組。 step 2: 受突變的基因與搭配的基因進行基因互換 , 以完成一次突變。 5.1.5 重新啟動機制. 對於陷入區域最佳的演化 , 利用重新啟動給予適度的擾動是必須的。本論文使用兩種不同的觸發機制來啟用重新啟動功能 , 其一是對於定期檢查整個族群 , 觀察是否陷入區域最佳 , 以決定觸發與否 ; 其二為當演化每經歷一個代數周期 , 便強制觸發。第一種機制設定的檢查代數為 50 代 , 每經過 50 次演化便檢視族群中染色體的適性值。當適性值較高的前端染色體相似度極高 , 便隨機替換族群中80%的染色體 , 並保留前三個較為優越的個體。第二種機制設定 500 代為一個周期 , 當演化 500 次便強制重新啟動 , 將族群內適性值較差的 50% 條染色體進行汰換。. 5.2 特徵編碼概念整理與流程完整的編碼流程組合兩個階段的基因演算法 , 第一階段演化產生必須的圖樣排列 , 第二階段進行編碼作業。每個階段是獨立運作 , 因此不同的參數將生成多種結果。而這些結果在最後將進行對應比較 , 能妥善描述距離的 LBP 紋理編碼 , 將在多種組合中選出。下方圖 5.7表示一種合理的兩階段結果對應 , 圖樣之間的漢明距離落在 2 或 3 , 對應 39.

(58) ࡰ࢏࢙ ൌ ૛ૠ૙ ࡴࡰ࢏࢙ ൌ ૛. x. ࡰ࢏࢙ ൌ ૜૟૙ ࡴࡰ࢏࢙ ൌ ૜. x. ࡰ࢏࢙ ൌ ૛૞૙ ࡴࡰ࢏࢙ ൌ ૛. 50. x. 320. 300. x. x. 680. 670. x. ࡰ࢏࢙ ൌ ૜૝૙ ࡴࡰ࢏࢙ ൌ ૜. ࡰ࢏࢙ ൌ ૜ૠ૙ ࡴࡰ࢏࢙ ൌ ૜. ࡰ࢏࢙ ൌ ૜૞૙ ࡴࡰ࢏࢙ ൌ ૜. 1020 圖 5.7: 合理的基因編碼對應示意的編碼距離則分別約為 250 及 350 。除了顯示較短的漢明距離對應到較短的編碼距離 , 亦顯示在變異數的影響下 , 兩種類型的距離不會產生過大的變動。而圖 5.8呈現即是兩階段規劃的完整流程圖。. 40.

(59) ߃‫ۈ‬ϯ. ߃‫ۈ‬ϯ. ፾‫ॶ܄‬ຑ՗. ፾‫ॶ܄‬ຑ՗. ᒧ᏷. ᒧ᏷. Ҭଛ. Ҭଛ. ँᡂ. ख़௴. ँᡂ. ख़௴. ‫ڗ‬ж ց. ‫ڗ‬ж ց. ᅈ‫ى‬ ಖЗచҹ ࢂ. ᅈ‫ى‬ ಖЗచҹ ࢂ. ᒡр่݀. ᒡр่݀. ჹᔈ. 圖 5.8: 兩階段基因編碼流程. 41.

(60) 第6章實驗與結果分析本研究提出的 LBP 紋理編碼方式 , 實驗將分為三個部分來印證結果。首先針對基因編碼中 , 演算法的各種參數予以適當的調整 , 使編碼結果能呈現效果並達到最佳化 ; 接續將基因編碼的結果與其他編碼方式進行比較 , 以證明基因編碼結果在圖樣變化與編碼距離之間具有緊密的關係 ; 最後一階則對編碼成果執行測試 , 分別以不同影像、不同分群方式給予試驗 , 證實此編碼方式具有強韌的適應性。實驗流程將由下方圖 6.1表示。 ಃ΋೽ϩ ჴᡍୖኧፓ᏾. ಃΒ໘ࢤ ጓዸ่ᄬКၨ. ಃΟ໘ࢤ ϩဂਏ݀ᡍ᛾. ჴ ᡍ A. ჴ ᡍ B. ჴ ᡍ C. 圖 6.1: 三個階段的實驗流程. 6.1 實驗 A - 基因編碼之參數選擇對於本論文提出的 LBP 基因編碼方式 , 本小節將對演算法的參數予以調整及選用 , 使編碼結果能更加合適及完善。參數調整分為兩個類別進行 , 分別為 GA 參數 , 包含交配機率與突變機率 ; 以及適應性函數各個間距的權重 , 適應性函數公式可參考上一章節的公式 ( 5.3) 以及公式 ( 5.6) 。調整的策略如下 : 1. GA 參數 : 基於相同的權重下 , 大方向的調整每個階段所適合的 GA 參數。 2. 權重係數 : 確定合適的 GA 參數之後 , 對於各個間距的權重在進行微調。 42.

(61) GA 參數的調整 , 將在演算法第一階段的權重wj,S1 皆設定為 200 以及第二階段的權. 重wj,S2 皆為 0.5 的條件下進行。表 6.1顯示進行實驗的 GA 參數設定 , 其中演化的中止條件設為 25000 代 , 族群大小固定為 200 , 交配機率與突變機率設定具有 0% 、 20% 、 60% 三種 , 採取高低交錯的配置 , 一共有四種組合。而此四種組合將重複執行 5 次 , 再從中挑選出最佳的演化結果。兩個階段的結果各自呈現於表 6.2 (a)(b) 。表格中Std2 該項目為演化結果的衡量基準 , Std是差異變動程度的標準差 , 衡量結果愈小則表示演化出來的染色體 , 其圖樣差異 (演算法第一階段) 或編碼距離 (演算法第二階段) 愈為一致。間距 1 至間距 4 的Std2 總和呈現於加總欄位之中 , 具備最小值的該組參數設定 , 代表整體的一. 致性較佳 , 將被選入後續的權重調整。由表格中呈現的實驗結果 , 演算法第一階段以參數 C 擁有最小的Std2 加總 , 故選擇參數 C 為基礎 , 也就是以交配機率 60% 、突變機率 0% 的設定進行後續的權重調整實驗 ; 而第二階段則以參數 A 為最小 , 因此選用參數 A 即交配機率 0% 、突變機率 60% 的設定。 GA 參數的設定確立之後 (即演算法第一階段採用參數 C ; 第二階段採用參數 A) ,. 接著對 4 個間距的權重比例進行調整。調整的方式是依據先前演化參數調整的實驗結果 , 進行權重比例的變動。差異程度Std2 較大的該個間距 , 將配置較高的權重 , 以幫助演化出較小的差異變化 , 其實驗的權重設定如表 6.3 。實驗的每一組權重皆重複進行 5 次演化 , 然後再從之中挑選出最佳結果 , 實驗結果呈現於表 6.4 (a)(b) 。表格之中 , 用以衡量的基準與 GA 參數調整時相同 , 皆採用Std2 評估差異的變動程度 , 愈小的Std2 加總代表該組權重設定具有較佳的結果。由實驗結果可知 , 第一階段在權重 a 存在最小的Std2 加總 ; 而第二階段則以權重 e 出現最小值的情形。因此最後選擇以權重 a 演化的第一階段圖樣編排 , 搭配權重 e 演化的第二階段編碼 , 作為兩階段編碼的結果 , 而此編碼結果也 43.

(62) 表 6.1: GA 參數設定參數設定. A. B. C. D. 終止條件 25000 代 25000 代 25000 代 25000 代族群大小. 200. 200. 200. 200. 交配機率. 0%. 20%. 60%. 60%. 突變機率. 60%. 60%. 0%. 20%. 表 6.2: 不同 GA 參數的演化結果 (a) Stage 1. 參數設定 Std2. A. C. D. 間距 1 0.2734 0.3086. 0.0539. 0.2850. 間距 2 0.2830 0.2792. 0.3552. 0.3006. 間距 3 0.2655 0.2447. 0.3216. 0.2885. 間距 4 0.2559 0.2983. 0.2227. 0.2539. 1.0779 1.1308 0.9534. 1.1279. 加總. B. (b) Stage 2. 參數設定 Std2. 加總. A. B. C. D. 間距 1. 0.6291. 0.6014 0.6103 0.6213. 間距 2. 0.5251. 0.5417 0.5578 0.5693. 間距 3. 0.5305. 0.6172 0.5837 0.5526. 間距 4. 0.5272. 0.5357 0.5477 0.5697. 2.2120. 2.2959 2.2996 2.3130. 將於後續實驗應證其效果。. 44.

(63) 表 6.3: 權重係數設定 Stage 1. 參數設定. a. b. Stage 2. c. d. e. f. 間距 1 200 200 200 200 0.8 0.8. 權重. g. h. 1. 1. 間距 2 250 250 280 280 0.5 0.5 0.5 0.5 間距 3 250 250 250 250 0.5 0.7 0.5 0.7 間距 4 200 220 200 220 0.5 0.5 0.5 0.5 表 6.4: 不同權重係數的演化結果 (a) Stage 1. 參數設定 Std2. a. b. c. d. 間距 1. 0.0260. 0.0234 0.0313 0.0490. 間距 2. 0.3633. 0.3671 0.3707 0.3556. 間距 3. 0.2675. 0.3367 0.2798 0.3218. 間距 4. 0.2598. 0.2233 0.3469 0.2285. 0.9166. 0.9506 1.0287 0.9550. 加總. (b) Stage 2. 參數設定 Std2. 加總. e. f. g. h. 間距 1. 0.6193. 0.6079 0.6016 0.6095. 間距 2. 0.5029. 0.5291 0.5079 0.5253. 間距 3. 0.5158. 0.5634 0.5500 0.5101. 間距 4. 0.5374. 0.5282 0.5391 0.5434. 2.1754. 2.2285 2.1986 2.1883. 6.2 實驗 B - 基因編碼與其他編碼之比較. 45.