結合免疫系統與影像描述子之整合式資訊檢索模型

全文

(1)結合免疫系統與影像描述子之整合式資訊檢索模型 Using Artificial Immune System and Image Descriptors to Design an Information Retrieval Model 黃有評, 張遵偉, 高立仁, 張瀹鐏大同大學資訊工程研究所 Email: yphuang@ttu.edu.tw. the similarity measurement, the images closer to the features are shown to the users and constitute the query results. The computational complexity is proportional to the dimensions of feature vectors. Such a retrieval method is prohibited in performance. Moreover, matching similar images from global similarity measurement fails to consider partially matched images. In this paper, a modified genetic algorithm with self-adapted parameters and a new mutation operation is proposed for the retrieval of images that may have been rotated and transposed. While employing the artificial immune system in comparing the difference of better and worse populations, we can reduce the searching space. Therefore, the performance and accuracy can be achieved. The design methodology will be illustrated and thorough experimental results demonstrate the robustness of the proposed system. Keywords: Artificial immune system, genetic algorithm, elite competition, image information retrieval.. 摘要傳統的影像檢索方式，自影像中擷取特徵值，並將之對應到高維空間。再依據相似函數，計算影像的相似度，以進行影像檢索。然而運算的複雜度與特徵值的維度具高關聯性，使得運算速度受到嚴苛的挑戰。本論文之目的以減少檢索資料量為出發點，設計一套智慧型影像檢索系統。我們基於免疫系統的概念，透過比對優良群組與劣質群組的差異，以減少搜尋所需的資料量、增快檢索速度並增進搜尋的正確性，並在系統中利用基因演算法來做搜尋參數最佳化的運算，但由於傳統基因演算法的收斂速度過慢，因此我們對傳統的基因演算法進行改良後，提出動態調整的演化參數的方法及新的突變運算步驟。研究結果顯示我們提出的演算法的收斂速度與精確度，皆比傳統基因演算法快且精確。我們將此改進之基因演算法做為影像檢索的搜尋核心，以增進影像檢索的精準度與效率。本文將說明本演算法與實驗結果。. 一、簡介. 關鍵詞：人工免疫系統、基因演算法、菁. 1.1 前言蓬勃多元化的網際網路，不斷創新的資訊技術，個人電腦的主要功能由傳統運算轉變為提供流通資訊服務為主。而網路所提供的服務範圍，亦由辦公室延伸至家庭，進而擴展到為行動中的個人提供個人化的服務。所有個人化的裝置都可與網路連結，以共享網路資源，並朝以服務為導. 英競爭、影像資訊檢索。 Abstract The typical approaches for content-based image retrieval extract features such as color, shape, and texture from each image and map the features into a high dimensional metric space. According to 1.

(2) 向的方向發展，進而加速多媒體的發展。如何提供一套能快速搜尋個人喜愛或需求的多媒體資料搜尋系統，並讓電腦具有某種程度的人類視覺認知能力，在查詢過程，與使用者互動，不但可協助使用者快速搜尋多媒體資料，更能提供管理者多面相的管理機制，進而滿足使用者進階的服務。在面臨資料量龐大的情況下，要搜尋出使用者感興趣的資料往往需要強大的計算能力。提高運算效能雖能直接改善，但是資料量增長的速度遠超過運算效能可提升的幅度，因此，有效降低搜尋資料量才能直接改進搜尋效率。本論文的目的是以免疫系統分析為基礎理論，發展一套可以有效降低檢索資料量的演算法，並將其移植到直覺式的影像資訊搜尋系統，以提供使用者更快速、更方便的檢索方式。. 索，是以關鍵詞做為搜尋的依據，若要以此方式搜詢影像資料，則勢必要為成千上萬的影像資料加上註解。這種方式顯得效果甚差。因為不僅加上註解這件工作耗時費事，系統要猜測使用者所欲表達的語意更是困難。加以使用者往往無法清楚表達本身語意，不同使用者對相同觀念有不同表達方式，使得檢索工作非常不易。近年來，隨電腦科技的提昇，資訊檢索的技術，已由傳統的字串比對，進展到以自然語言、多媒體資訊為檢索依據。因此便有研究者開始研究，如何不需使用者輸入關鍵字詞，卻仍能將使用者之感覺抓出，或能猜測使用者主觀意圖，以找尋影像圖案。早期的影像檢索的方式多半使用關鍵字查詢，鑑於使用文字敘述作為索引影像的不適當，其後便以小圖示群方式提供一種瀏覽機制，或以查詢用語及影像瀏覽混合的方式進行。Layne[6]認為與其將時間與精力花費在過度繁瑣複雜的索引製作工程，不如針對影像基本特徵作簡要索引即可，他建議直接提供影像瀏覽機制，讓使用者自行過濾與擇選。 ” 植基於內容之影像搜尋 ” （content-based image retrieval, CBIR）是以影像內涵資訊或利用介面輔助工具，描繪一張影像做為輸入，以進行影像檢索。此種系統藉由擷取自影像內的特徵，與儲存於資料庫內事先計算好的特徵值做相似度計算，將最相近的一些影像資料回傳給使用者。它利用圖檔來找尋其他相關圖檔影像。 CBIR 利用的影像資訊包含紋理（texture）、顏色（color）、形狀（shape）及位置(position)。透過這些圖檔影像資訊或特徵（features），我們能將使用者感興趣的圖檔找出，而不需使用者鍵入關鍵字來表達其主觀意圖。CBIR 引起許多研究人員注意，許多早期商業或學術上的系統，便以此為基礎而被發展出來。但 CBIR 仍無法克服影像資訊中語意問題。前述影像圖檔資訊可以看成低階資訊，而此影像所欲表達的語意，譬如說一輛汽車，則屬於高階語意資訊。CBIR 僅以低階資訊為搜尋基. 1.2 相關研究資訊檢索系統之目的，在幫助使用者搜尋需求的資訊，並能過慮不必要的資訊，同時能瞭解使用者真正之意圖。資訊檢索之研究起源於 1950 末、1960 年初。最初，資訊檢索系統多以靜態資料、批次處理方式，以提供使用者資訊。其後，資訊檢索技術，由傳統文字比對，進展到智慧型資訊檢索，並逐漸朝向以自然語言為輸入查詢介面，檢索對象為多媒體資訊。在 1970 年之後，資訊檢索系統隨著電腦科技快速發展，由靜態資料提供者，轉為主動資訊提供者，並強調與使用者之間互動關係。此時期所發展的系統，主要以使用者需求為導向，研究者亦以系統與使用者之間互動為解決問題之思考方向。1980 年代後，資訊檢索便轉為以認知為導向，此時期所開發之系統，除滿足使用者的習慣與需求外，更希望能進一步瞭解使用者的認知過程，讓檢索系統能更符合人類認知的模式。電腦具備快速的計算能力，並能儲存大量的資料。可協助使用者在雜亂無結構的資料內，尋找感興趣的資料內容。傳統資訊檢索技術所討論的資料型態，多以非結構性文字形式為主。而傳統文字資訊檢 2.

(3) 礎，往往會找到一些不相關的圖，因為許多影像圖檔，其低階資訊相近似，但卻擁有完全不同之高階語意概念。為了要解決這二階層資訊上差異，相關研究人員提出相關性回饋（ relevance feedback）觀念。相關性回饋是允許使用者對其所選取的低階資訊特徵給予不同權重，如此當低階資訊回饋給系統後，系統便了解使用者感興趣的部份，此時系統能搜尋的範圍就會比較貼近使用者想要找的圖檔。 VisualSeek [8]是由哥倫比亞大學新媒體技術中心 (Image and ATV Lab of Columbia University)所開發的影像與視訊資料搜尋工具。使用者能藉由網路對全球資訊網中的影像與視訊進行搜尋。在 VisualSeek 系統中，使用顏色、形狀、紋理、及空間關係等特徵資訊，進行影像資訊搜尋。此系統主要特色為進行影像搜尋時，同時考量各物件的空間關係，以提高搜尋的精準度，系統收集了約 12,000 張彩色影像檔，供使用者透過網址，進行影像檢索。由麻省理工學院所開發的影像檢索系統 Photobook[7]，該系統提供使用者以顏色、形狀、紋理等影像特徵進行檢索依據。使用者可依不同的特徵、不同的演算法進行影像相似比對，同時利用 FourEyes 互動式學習代理引擎(Interactive Learning Agent) 為使用者介面，該系統讓使用者自 Texture Modeling 、 Face Recognition 、 Shape Matching、Brain Matching 四個範例資料庫中，選擇查詢依據的範例影像，自動建立並選擇最適合該使用者的使用模式。 Blobworld[4]是由加州大學柏克萊分校所開發的影像資料庫，該系統提供了四種影像檢索方式，包含顏色、外形、紋理、及範例圖片檢索。該系統先讓使用者依影像圖檔的主題選擇範例圖片，系統會顯示出代表該影像的氣泡圖，使用者自其中選擇心中認為最接近查詢的目標外形，並指定該氣泡的權值，其中包含：色彩、紋理、位置、外形、及大小的權值。系統會依據使用者所設定的權值，在計算相似度後，. 自資料庫內篩選出最接近的影像。視覺影像檢索引擎(Visual Information Retrieval Image Engine, VIRAGE) [9]是由密西根大學、加州大學聖地牙哥分校、及麻省理工學院媒體實驗室共同研究發展之視覺資訊影像檢索引擎，並由 Virage 公司將其產品化，包含三個主要功能：1)影像分析，2)查詢比對，3)系統管理。此系統的特色在於提供使用者靜態影像查詢(Still image query)、動態視訊資料查詢(Video query)，其查詢之介面提供四種特徵查詢，涵蓋顏色直方圖(Color histogram)、紋理 (Texture)、顏色分佈(Color layout)、圖片結構(Structure)。在檢索過程中，使用者更可針對不同的特徵，給予不同的權重值，系統會利用此四種特徵進行綜合比對，以找出相似度最為接近之圖檔。 S. Forrest 與其研究團隊[5]，嘗試將免疫系統應用於電腦安全防禦，以建立一套電腦智慧型免疫系統。他們以 Negative Selection 演算法為基礎，研發出的電腦防禦系統，可分辨自我細胞(合法使用者、未被破壞的資料檔案等)與危害細胞(未經受權的使用者、病毒等)。Negative Selection 演算法可偵測出被異動的檔案與程式。此種植基於免疫系統的電腦偵測與防禦系統，可與現有的安全系統相結合，運作於目前的作業系統上，可自動偵測未經授權的使用者非法使用的過程，同時能維護電腦中資料檔案的整體安全性，並預防電腦病毒的擴散。本論文擬將免疫系統之概念用於設計更有效率之資訊檢索系統。. 二、系統設計 2.1 區域為主之影像檢索系統為了克服一般系統與使用者冗長的詢問互答的過程，並提供讓使用者滿意的搜尋結果，我們提出一個以區域為主 (Region-based)的影像檢索系統雛形；同時，我們採用相關性回饋 (Relevance feedback)的觀念來加速搜尋的過程，此外，我們以 fuzzy c-means 相似度測量來分割影像的區域，在此模型中，我們將系統 3.

(4) 的處理過程分成三個階段，如圖 1 所示。. 系統會將資料庫內的影像圖檔，依其整體的相似度值排序，最終的實驗呈現了令人滿意的搜尋結果。在檢索圖形時，我們特別注重使用者在檢索影像時的直覺，我們所提出的系統強調下列部份，分述如下： l 特徵擷取 (Feature extraction)； l 影像分割 (Image segmentation)； l 區域分類和標號 (Regions clustering and labeling)； l 使用者選擇和回饋 (User selection and feedback)； l 檢索微調 (Retrieval refinement)。系統以 Visual C++ 6.0 和 Borland C++ Builder 6.0 來開發，資料庫內含約 1000 張彩色圖檔，從實驗結果顯示，我們的系統確實可以成功且有效率地處理影像的檢索。. 圖 1、系統架構。在前置處理的階段中，我們先將 RGB 色彩座標系統轉換成 HLS 色彩座標系統，在 HLS 座標系統中的光度 (luminance) 和色彩分量將形成一特徵向量，以代表每個像素點，這些特徵可用來表示各種常見的色彩間的關係，因此，影像可藉由這些特徵向量表示，然後利用 fuzzy c-means 方法將相似的特徵向量分類到不同的區域。資料庫則是以離線 (offline) 的方式來建立和更新，我們先將每張影像圖檔，利用這種合理的分割方式處理，所有像素點均被分到不同的區域，而其色彩特徵向量亦將隨著圖檔影像一併儲存至資料庫中。在第二階段中，我們將提供一些查詢範例影像，並顯示出分割後的區域，以供使用者選擇。當使用者從影像中選取了查詢區域後，系統將執行相似度的計算，並呈現前六個最相似的影像圖檔。此時，若使用者不滿意此結果，則可進入第三階段的查詢。在第三階段中，每張範例影像的區域將以不同的顏色呈現，以輔助使用者進行選擇。使用者可以選擇其感興趣的區域，然後將其回饋至系統中；同時，他們也可以設定所選區域的權重值，來代表不同的重要性。在經過選擇和回饋的過程之後，. 2.2 顏色特徵空間之分析在一張影像中，顏色可成為主要的表示關鍵子。而大多數的影像處理中，HLS (hue, luminance/intensity, saturation)是最常使用的色彩座標空間。其中，hue 屬性為三者中主要的部份，其內含不同光的顏色，如紅光、黃光、橘光、綠光等，對使用者而言，此部份為主控元素。Saturation 屬性可表達出某一種光的相對純度。當某一種光內混入不同比例的白光，會形成不同顏色的亮光。一般高飽和度的亮光，混入的白光成份較少。例如：粉紅色光內含的白光比例會小於紅光內含白光的比例。 Luminance (brightness/intensity) 屬性主要控制光的強度。因此，HLS 顏色座標系統相當適合於影像壓縮與影像處理。在此三種屬性內，人眼視覺對 hue 屬性最為敏感。在原始影像中，包含不同比例的紅光、綠光、及藍光。而人眼視覺對亮度較為敏感。以此種色彩三屬性（即 Hue, Saturation, Luminance）來定義色彩，在匹配色彩的過程中，HLS 色彩系統藉由定義可以在螢幕上呈現大量的色彩。我們先將 RGB 座標平面顏色要素，轉換為 HLS 顏色平面。在 HLS 座標平面裏，L 分量用以 4.

(5) 在進行影像分割時，我們處理每一個像素點，並自特徵向量中擷取出特徵值 xi ,. 代表每一個像素點的亮度。其餘兩個分量 H 與 S，用以表示該像素點的厭色與飽和度。RGB 座標系統與 HLS 座標系統間具有線性轉換關係，因此，在 RGB 座標系統內的每一個像素點均能經由線性轉換，對應到 HLS 座標空間的另一點。其間的轉換方式如 Eq.(1), Eq.(2), Eq.(3)所示。. 1 L = (R + G + B). 3. (1). 3 × min(R, G, B), R +G+B where R + G + B ≠ 0 .. (2). S = 1−. 表示為 xi = { f1, f 2 , f 3} ，其中 fi 是像素中. 的第 i 個特徵值。此步驟會檢查特徵向量中的特徵值是否符合門檻值。若符合門檻值，則將此點納入此區域中。此分類步驟不斷重複進行，直到每一個像素點被分到各區域內。我們使用 fuzzy c-means 以進行分類，並計算每一個類別的重心。每一個類別的重心代表一個特徵向量與重心的距離，此距離用以決定該像素點應屬那一個類別。以 X = {x1, x2 ,..., xn } 代表一張影像中所擷. G ≥ B, G ≤ B,.  θ, H= 2Π − θ,. 取出的特徵向量，其中 n 為總像素點數。我們的系統可允許由使用者自行訂定分類數量，當完成區域分類後，一張影像可以 P = { A1, A2 ,..., Ac } 表示，模糊分類需滿足. 1  [(R − G)+ (R − B)]  2 . (3)  (R−G)2 + (R − B)(G− B)  .  where θ = COS−1. Eq.(5)與 Eq.(6)兩式。. . . c. ∑ A j ( x i ) = 1 , for all i ∈ N n. j =1. 每一個像素點便可使用一個 3-D 特徵向量表示。各特徵向量在視覺上的距離便可用以作為影像切割的依據。. c. 0 < ∑ A j ( xi ) < n for all i ∈ N c j =1. 2.3 影像分割影像分割是電腦影像處理的基礎。其目的為在一張影像中分離出有意義的物件。此前置步驟可將影像中不連續的物件組成異質區域。以區域為主的影像切割是相當困難的一種方式，但許多研究者仍不斷的加以研究。在系統中，我們依據每一個像素點的特徵值，來決定其應分到那一個類別中。而在分類的過程包含：影像分割、區域擴張、區域合併、及區域標記等處理步驟。任一張影像均可用一些特徵表示，如：顏色、大小、形狀、及花紋。影像分割可將一張影像分成數個區域， Ri : i = 1,2,..., m , 其中，m 為區域總數，如. Ri  R j = Φ. (5). .. (6). 以糢糊分類可將一張影像依其資料的特性進行最佳化分類；在完成像素分類後，同類的像素將具有最強的內聚力，而類別與類別之間的相似度將降低。每一個分類可用 V = {v1, v2 ,..., vc } 表示，而影像像素的分類可經由 Eq.(7)計算而得。 n m ∑ [ A j ( x k )] x k k = 1 vi = , n m ∑ [ A j ( x k )] k =1. (7). 其中 m 為實數且滿足 m>1。我們的系統使用 fuzzy c-means，針對輸入的像素資料，依照像素特徵，計算其與各類別的相似程度，以決定該像素所屬的類別。如此，在 fuzzy c-means 方法下，影像原始結構將被保留。當一張影像被分割為幾個區域後，每個區域都會被標記為一個代號，以反應出影像內的區域資料結構。以此所產生出的各區域內具有最強內. Eq.(4)所示。 m Image I =  Ri , i=1. ,. for i ≠ j. (4). 5.

(6) 聚力，區域之間具有最弱的關聯性，如圖 2 所示。. 資料庫內的圖檔的相似程度，並以 Score ( I j ) 表示，在計算 Score ( I j ) 必須將使用者所設定的權重值一併考慮，如 Eq.(9) 所示，其中 wi 為使用者為該區域所設定的. 2.4 使用者介面系統初始化時，會先自動由影像資料庫內任選 5 張影像圖檔做為第一次查詢的依據，如圖 3 所示。在此初始畫面中，若使用者認為其中任一張圖檔與其欲搜尋的圖檔近似，則可用滑鼠點選該圖檔加入選擇欄位；否則使用者可點選“generate other images”按鈕以產生下一組影像圖檔，但已被點選的圖檔並不會被取代。同時，若使用欲更換已點選過的圖檔，可自選擇欄中點選欲刪除的圖檔，以撤回該圖檔。當使用者結束圖檔點選的步驟，他可自選擇欄位中，選取感興趣的區域，並為不同的區域設定不同的權重值。此步驟可不斷進行，直到使用者找到其感興趣的檔案。一旦使用者完成區域的選擇，他可以點選”search”按鈕以進行資料庫搜尋。在經過相似度的計算，系統會依照相似的程度產生一個排序，接著系統會自此排序內挑選前六張最相似影像圖檔，並顯示在結果區。若使用者對產生的結果不滿意，則可繼續進行下一回合的查詢。如圖 4 所示。. 權重值。 5 Score( I j ) = ∑ wi dist( I i , I j ). i =1. (9). 在經過此相似程度計算後，系統會產生一個候選影像排序，如 Eq.(10)。越接近使用者意圖影像檔案，會被放置在序列的前方，系統會自動由此序列中篩選出前 5 張影像，並呈現到使用者介面中。如圖 5 所示。 Rank = min{Score ( I1 ), Score ( I 2 ),..., Score ( I m ) }. (10). 當每一位使用者進行影像檢索時，系統會自動記錄其檢索過程，在該位使用者完成影像檢索後，系統將進行資料探勘，我們視使用者所點選的每一單獨區塊為一個產品項目，使用者所點選的所有區塊，為該名使用者該次所購買的所有產品。系統判斷該使用者所點選的區域是否與資料庫內一些已存在的點選序列相似，藉以進行資料探勘，由此分析使用者感興趣的影像資料與其點選區塊之間的關係。. 2.5. 相似度排行我們的目標為自資料庫內擷取最相近的圖檔，在查詢過程中，所選取的區域與資料庫中的區域，其整體相似度為各區域相似度的總和。在考慮計算量，我們會限定使用者只能自 5 張結果中選取 5 個區域，以進行查詢。使用者所選取的區域以 QRi = {v1, v2 ,..., vl } 表示，其中 vl 為自第 i. 2.6 影像區域編碼圖庫中的影像已事先分割為數個區域，我們將每一個區域內的特徵值視為一項基因，一張查詢影像檔案每一個區域由數項基因組成，而這些基因組成一條染色體，如圖 6 所示。在使用者完成區域點選後，基因編碼亦隨之完成，如圖 7。若使用者點選了 5 個區域，5 個區域共有 5! 種排列組合，若將每一種都納入計算，則計算量過於龐大。我們導入基因演算法，在使用者點選區域後，系統隨機選取 50 種排列組合，做為起始搜尋的基因族群。接著利用我們提出的改良式基因演算法，進行演化，以加速影像搜尋。. 張查詢圖中所挑選的第 l 個特徵向量中心。其距離 dist ( I i , I j ) ，如 Eq.(8)所示。此函式用以表示第 i 張查詢圖與資料庫內第 j 張圖檔的距離。 vh 為第 i 張圖內第 h 個區域的特徵向量重心；而 vk 為資料庫內第 j 張圖內第 k 個區域的特徵向量重心。 l c (8) dist ( I i , I j ) = ∑ ∑ || vh − vk || . h=1 k =1 我們使用歐氏距離以計算查詢範例與 6.

(7) 2.7 改良式基因演算法影像檢索運算時，需要大量的運算資源，因此我們利用免疫系統中的反向選擇（Negative Selection）機制與正向選擇，對資料進行交互刪減與比對。透過此方式，可以逐步減少額外的資訊（雜訊），因此可以加速資訊搜尋速度。. for ( A = PGS; A < N; A++ ) { If (A1 > A2 ) A1 add to “PGS+”； A2 add to “PGS－”； Else A1 add to “PGS－”； A2 add to “PGS+”； } if (number of PGS == 1) Output the result; for( C=PGS-; C < number of PGS-; C++) C2 = C1 OR C2; NG = C2; goto LOOP 其整體運作流程如圖 9 所示：. 基本運作方式 (1). 將欲處理之領域轉化成適當的函數。 (2). 由函數中產生最佳解基因（正基因）與最差解基因（反基因）。 (3). 利用正基因產生出正基因集合（稱為 ”Positive Gene Set +”）。 (4). 使用反基因去除 ”PGS+” 中含有反基因染色體的基因（稱為“PGS－”）。 (5). 於”PGS－”中進行選擇、突變、交配動作，產生出 Matching Set （稱為”PGS”）。 (6). 將此“PGS”與 Matching Function 進行運算，並以下列方式分為兩集合：假設 A 為 PGS 集合中的基因，A =1~N。若 A1 優於 A2，則 A1 到“PGS＋”，A2 到”PGS－”。 (7). 檢查“PGS+”是否只剩下唯一解。若是，則結束。否則，繼續下一步驟。 (8). 將 “PGS－” 中的基因產生出反基因。 (9). 回到第(4)步驟迭代進行篩選。. 基因交配在第二部份中，我們採用免疫系統的理論來建構資料篩選的步驟。在其中的基因交配部份，我們發現若採用傳統的遺傳演算法，反而會增加檢索系統篩選資料的負擔與運算時間，因此我們以加快收斂速度與運算效能為依歸，針對傳統遺傳演算法進行下列改良。在本研究中所改良的遺傳演算法分為三大部分描述如下： (1) 選擇運算為了避免染色體經過交配與突變運算之後退化，因此我們採用菁英保留策略取代傳統的選擇運算，此策略能夠保證每個子世代至少會和親代一樣好。第一步，我們將群組的第一條染色體視為菁英 (Elitist)，第二步則將菁英與群組中下一條染色體互相比對，將表現較差的染色體(稱為 Sb)進行突變運算，而較好的染色體(稱為 Sg)則設為新的菁英。重覆此步驟直到群組池中所有的染色體皆運算過一次。 (2) 突變運算突變運算包含三個步驟，第一個步驟是減少 Sg 與 Sb 之間的差異性；為了達成此目的，我們需將 Sg 與 Sb 間相異的個數(n) 與位置 P = [ P1 , P 2 ,..., P n ] 記錄下來，但. 演算法 F(X) = Matching Function。 PG = F ( X ), NG = F ( X ) 。 for (I = 1; I < Set number; I++) { “PGS+” += Random Gene + PG; } LOOP： for (I = 1; I < Number of PGS+; I++){ “PGS－” += PPGS - NG; } for (I=1; I < T; I++ ) { Select “PGS－”; “PGS－” Multiply; “PGS－” Crossover; } PGS = “PGS－”. 染色體上第一個 bit 為正負符號位元，且不列入相異個數的計算。接下來，我們使用 Eq.(11)來決定 Sb 的突變位元數(M)，其中 7.

(8) 的 Vg 和 Vb 分別為 Sg 與 Sb 的適應值。. M. = n *.  V g − Vb   Vg + 1 .  .  . 值落入區域最佳解，因此在第三個步驟中以 Eq.(14)來決定是否要對 Sb 進行退火運算。. (11). if random% M == 0,. 當得出突變個數之後，我們在 P 中隨機選出 M 個位置，並根據 Eq.(12)對 Sb 進行突變運算：  1 , if P i = 0 i ∈ [1 , n ].  0 , if P i = 1 ,. Pi ' = . then. (14). 在上式中的退火運算是將 Sb 上所有的基因由 1 變 0、0 變 1，如此一來可產生出與原來的 Sb 完全相反的染色體，進而達到擴展解域的效果。而 Eq.(14)中的 M 值越大時，代表 Sb 可以改良的空間越大，也隱含著 Sb 仍未接近最佳解，因此需要進行退火運算的機會也相對地減少，我們可經由此步驟減低由於演化過程過於平滑，而落入區域最佳解的機會。經上述三個步驟後，再將突變過的 Sb 放入交配池中等待交配。. (12). 此處需注意的一點是，在相同的突變運算中，已突變過的位置不再進行突變，因此若所選擇的位置在本次突變運算中曾經突變過，則需再次重新選擇另一個未突變過的位置。完成第一步驟後，我們在第二個步驟中利用 Vg 和 Vb 所處的象限來改良表現較差的染色體。舉例來說，以二進位為建構元的染色體在求解極大值時，我們通常將整個字串以二進位制數值的方式計算極大值，則此時包含位元 1 越多的染色體為被視為越好的解。因此，若 Vg 和 Vb 位於同一數值象限時(例如：同為正數)，則 Sb 上位元 1 的數量會比 Sg 少；因此若要將 Sb 的表現值往 Sg 逼近，可將 Sg 上為 1 的基因複製到 Sb 的相同位置上，如此不僅可保留 Sb 上位元為 1 的基因，且可得到 Sb 上更多位元為 1 的基因。設在 Sg 和 Sb 上第 i 個基因分別稱為 Sgi 和 Sbi，Sbi 可根據 Eq.(13) 進行第二步驟的突變。 1, if S gi = 1 and S g and Sb have the same sign. Sbi =  0, if S gi = 0 and S g and Sb have the different sign..  1, if S bi = 0 , S bi =   0 , if S bi = 1 .. (3) 交配運算在群組池中所有染色體全都經過突變運算後，除了最後一條菁英染色體以外，其餘的染色體皆存入交配池。我們透過 Eq.(15)統計出目前的群組裡，於選擇運算中找出的所有菁英的適應值總和，此總和則為該世代的總適應值(Tj)，此值可視為目前本世代的總體表現優劣程度。 N T j = ∑ (V gi ) j . i =1. (15). 得出總適應值之後，可經由比較親子兩代的總適應值，計算出子代與親代的差異程度；當親子兩代的差異逐漸減低時，也代表整體群組的解值逐漸逼近最佳解，因此需要改善的空間也越小，為了減少解值發生劇烈震盪的機會，因此交配率應隨著親子世代間的差異量而改變；與親代差異越多的子代，所需交配的染色體數越多，反之則越少。因此，我們可由 Eq.(16) 來計算有幾對染色體需進行交配運算。. (13). 經過 Eq.(13)的運算之後，再將 Sb 的象限改變為 Sg 所處的象限，到此為止即完成第二步驟的運算，此步驟可以將 Sg 中表現優良的基因複製到 Sb 中，但由於初始群組是以隨機排列的方式產生，因而無法保證目前的群組是否已包含可得出全域最佳解的基因。由於以上的原因，我們為了擴展目前的染色體群組所包含的值域，並且避免解. C=. 8. P 2. *. T j − T j −1 Tj +1. ,. (16).

(9) 程式如 Eq.(17)所示：上式中的 C 為進行交配的染色體對數，P 為交配池中的染色體數量。交配運算的方式是從交配池中隨機選擇一對染色體，以單點交配的方式找出兩條染色體上最佳的交配點。為了避免交配池中的染色體群組過於相似，因此若交配後的染色體完全相同時，我們僅保留其中一條，保留下來的染色體則存入群組池中進行下一世代的運算。此作法的目的在於避免群組太過相似，多樣性不足的群組會降低可找出全域最佳解的機率。完成交配運算後，再將其他未交配的染色體與最後的菁英存入群組池中，此時群組池中的染色體群即為子代群組。經過以上的選擇、突變與交配運算後，每個子代的表現可被保證至少與親代一樣好，甚至比親代優良。總結我們所提出的演化計算，可得出以下三個結論： 1) 由於每個菁英的產生都是經由互相競爭而來，因此最後一個菁英將會是此世代中最佳的染色體。而此菁英將不會受到破壞，而完整地保留到子代群組中，此做法即可保證子代群組的表現至少比不會比親代差。 2) Sb 可經由複製而得到 Sg 上較佳的基因。 3) 突變率與交配率都是根據該群組的適應值動態地決定的，因此可根據現狀的改變而得出最好的突變率與交配率，因此得以促進整個演化運算的效能。圖 10 為整個演算法的流程圖。. f (t ) = 5t + 3t 2 ,. (17) 將上述四個座標點代入 Eq.(17)後，可得出最小均方值差為 20。由圖 11 可看出，採用菁英策略的遺傳演算法雖然沒有一般的遺傳演算法的劇烈震盪，但在精確度上卻無法達到我們的需求；但使用我們改良後的遺傳演算法後，可從圖 12 看出不僅沒有劇烈震盪，並且在少量的遞迴次數中就可收斂接近最小均方值。因此在比較兩圖後，可清楚看出本模型的演算法不僅在收斂速度上比傳統的演算法來得快，且在精確度上也比較好。接著我們將此演算法做為提出的影像資訊檢索的核心演算法，搜尋結果如圖 5 所示。使用者介面以 C++ Builder 6.0 實作，背景處理程式則使用 Visual C++ 6.0 發展。系統中約收集 1,000 bmp 格式影像圖檔，每張解析度為 200 × 200 ，包含許多不同的類別，其中有交通工具、人物、動物和建築物。系統起始時，交配率(crossover rate) 與突變率(mutation rate)分別設為 0.6 及 0.1。族群數量(population size)設為 50，演算法迭代 100 代。查詢結果如圖 5 所示。我們所提出的系統受到下列條件限制： (1) 某些使用者可能會慣用自然語言做為輸入查詢方式，以代替點選方式，但本系統並未提供高階語意查詢方式。 (2) 如同大多數的 CBIR 系統，我們假設具有相近似的特徵值影像，會對應到使用者欲搜尋的範例影像。 (3) 應使用更多的特徵值以達較好的搜尋結果。. 三、實驗結果與討論在本論文中，我們提出一個植基於基因演算法的影像搜尋系統。我們改良傳統式的基因演算法，並在演化過程，採用菁英策略，以加速影像搜尋的速度。首先，針對多項式參數最佳化問題進行實驗，以驗證我們所提出的演算法之可行性。本實驗將在一個 2 維平面上尋找一條與(-1,8)、(0,8)、(1,4) 與 (2,16)等四點最接近的二次曲線方程式。我們首先經由線性代數方法找出最佳的參數，所得到的方. 四、總結與未來發展方向本篇論文提出一個以使用者導向的 CBIR 影像檢索系統。我們導入模糊推論以切割一張影像為數個區域，利用顏色直方圖，統計每一個區塊的顏色分佈，並導入免疫系統作為檢索之核心。在使用者提供 9.

(10) 查詢的範例影像後，系統自動產生染色體族群，在演化的過程中，系統能猜測使用者欲搜尋的影像。我們在前置處理階段以像素之特徵向量來分割所有的影像，而其他的視覺特徵可以很容易地在任何時候加入到系統內。我們將影像特徵向量分類成 2 到 5 個區域。使用者可以調整其類別數目，這種以使用者為導向的區域選擇方式，可以讓使用者以其本身的感知來調整不同視覺效果的重要性，且這種關聯性回饋機制有幾個重要特色，茲分別說明如下： (1) 可擴充性。任何種類的視覺特徵均可嵌入為系統之特徵向量，而不需要更改系統架構及其演算法。因此，在檢索影像時將不再需要引用使用者高階的概念，藉由相關性回饋，使用者的意圖便可嵌入回饋，系統可以學習有用的資訊，並在下次搜尋時進行改善。 (2) 動態調整性。相較於以電腦為主 (computer-based) 的搜尋方法，我們強調與使用者之間的互動，善用使用者與機器的合作，使用者可以任意調整查詢的權重來改變其影響因子，經由與使用者之間的互動，我們打破了使用者和機器間的界限，並獲得一個不錯的查詢結果。我們的系統可以進一步搜尋，以便越來越接近使用者真正的意圖。在未來的研究中，我們將會延續本系統的開發經驗，進一步地應用在資料探勘與樣式比對的領域進行上，並對使用者的側寫資料進行更深入的研究。. 五、參考文獻 [1] D. Dasgupta, N. Attoh-Okine, "Immunity-based systems: a survey," IEEE Int. Conf. on Systems, Man, and Cybernetics, vol. 1, pp.369-374, Oct. 1997. [2] M. Bessaou and P. Siarry, "A genetic algorithm with real-value coding to optimize multimodal continuous functions," Structural and Multidisciplinary Optimization, vol. 23, pp.63-74, 2002. [3] M. Meier-Schellersheim, "Understanding information processing in the immune system: computer modeling and simulations," IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 4, pp.IV-4036-IV-4039, May 2002. [4] C. Carson, S. Belongie, H. Greenspan, and J. Malik, “Region-based image querying,” Proc. of IEEE Workshop on Content-Based Access of Image and Video Libraries, pp.42-49, 1997. [5] S. Forrest, S. A. Hofmeyer, and A. Somayaji, “Computer immunology,” Communications of ACM, vol. 40, no. 10, pp.88-96, October 1997. [6] S.S. Layne, "Some issues in the indexing of images," Journal of the American Society for Information Science, vol. 45, no. 8, pp.583-588, 1994. [7] R.W. Picard and T. Kabir, “Finding similar patterns in large image databases,” IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 5, pp.161-164, April 1993. [8]J.R. Smith and S.F. Chang, “VisualSEEK: a fully automated content-based image query system,” Proc. of the 4th Int. Conf. on Multimedia, pp.87-98, 1996. [9] http://www.virage.com/. 致謝本研究獲國科會研究計畫 NSC93-2213-E-036-024 暨大同大學基礎研究案 B93-I01-032 之經費補助，謹此致謝。. 10.

(11) Source Image. Source Image. Source Image. Segmented Segmented Segmented Image Image Image 圖 2、原始影像與分割後之影像。圖 5、查詢結果。. 圖 3、系統啟始畫面。圖 6、自各區域統計顏色直方圖。. 圖 7、由直方圖進行基因編碼。. 圖 4、使用者回饋。. 圖 8、由基因產生基因群組。. 11.

(12) 圖 11、採用菁英策略的遺傳演算法。. 圖 9、免疫系統理論用於資料篩選之步驟。. 圖 12、本研究改良後的遺傳演算法。. 圖 10、改良後的遺傳演算法流程圖。. 12.

(13)