• 沒有找到結果。

結合免疫系統與影像描述子之整合式資訊檢索模型

N/A
N/A
Protected

Academic year: 2021

Share "結合免疫系統與影像描述子之整合式資訊檢索模型"

Copied!
12
0
0

加載中.... (立即查看全文)

全文

(1)結合免疫系統與影像描述子之整合式資訊檢索模型 Using Artificial Immune System and Image Descriptors to Design an Information Retrieval Model 黃有評, 張遵偉, 高立仁, 張瀹鐏 大同大學 資訊工程研究所 Email: yphuang@ttu.edu.tw. the similarity measurement, the images closer to the features are shown to the users and constitute the query results. The computational complexity is proportional to the dimensions of feature vectors. Such a retrieval method is prohibited in performance. Moreover, matching similar images from global similarity measurement fails to consider partially matched images. In this paper, a modified genetic algorithm with self-adapted parameters and a new mutation operation is proposed for the retrieval of images that may have been rotated and transposed. While employing the artificial immune system in comparing the difference of better and worse populations, we can reduce the searching space. Therefore, the performance and accuracy can be achieved. The design methodology will be illustrated and thorough experimental results demonstrate the robustness of the proposed system. Keywords: Artificial immune system, genetic algorithm, elite competition, image information retrieval.. 摘要 傳統的影像檢索方式,自影像中擷取 特徵值,並將之對應到高維空間。再依據 相似函數,計算影像的相似度,以進行影 像檢索。然而運算的複雜度與特徵值的維 度具高關聯性,使得運算速度受到嚴苛的 挑戰。本論文之目的以減少檢索資料量為 出發點,設計一套智慧型影像檢索系統。 我們基於免疫系統的概念,透過比對優良 群組與劣質群組的差異,以減少搜尋所需 的資料量、增快檢索速度並增進搜尋的正 確性,並在系統中利用基因演算法來做搜 尋參數最佳化的運算,但由於傳統基因演 算法的收斂速度過慢,因此我們對傳統的 基因演算法進行改良後,提出動態調整的 演化參數的方法及新的突變運算步驟。研 究結果顯示我們提出的演算法的收斂速度 與精確度,皆比傳統基因演算法快且精 確。我們將此改進之基因演算法做為影像 檢索的搜尋核心,以增進影像檢索的精準 度與效率。本文將說明本演算法與實驗結 果。. 一、簡介. 關鍵詞:人工免疫系統、基因演算法、菁. 1.1 前言 蓬勃多元化的網際網路,不斷創新的 資訊技術,個人電腦的主要功能由傳統運 算轉變為提供流通資訊服務為主。而網路 所提供的服務範圍,亦由辦公室延伸至家 庭,進而擴展到為行動中的個人提供個人 化的服務。所有個人化的裝置都可與網路 連結,以共享網路資源,並朝以服務為導. 英競爭、影像資訊檢索。 Abstract The typical approaches for content-based image retrieval extract features such as color, shape, and texture from each image and map the features into a high dimensional metric space. According to 1.

(2) 向的方向發展,進而加速多媒體的發展。 如何提供一套能快速搜尋個人喜愛或需求 的多媒體資料搜尋系統,並讓電腦具有某 種程度的人類視覺認知能力,在查詢過 程,與使用者互動,不但可協助使用者快 速搜尋多媒體資料,更能提供管理者多面 相的管理機制,進而滿足使用者進階的服 務。在面臨資料量龐大的情況下,要搜尋 出使用者感興趣的資料往往需要強大的計 算能力。提高運算效能雖能直接改善,但 是資料量增長的速度遠超過運算效能可提 升的幅度,因此,有效降低搜尋資料量才 能直接改進搜尋效率。本論文的目的是以 免疫系統分析為基礎理論,發展一套可以 有效降低檢索資料量的演算法,並將其移 植到直覺式的影像資訊搜尋系統,以提供 使用者更快速、更方便的檢索方式。. 索,是以關鍵詞做為搜尋的依據,若要以 此方式搜詢影像資料,則勢必要為成千上 萬的影像資料加上註解。這種方式顯得效 果甚差。因為不僅加上註解這件工作耗時 費事,系統要猜測使用者所欲表達的語意 更是困難。加以使用者往往無法清楚表達 本身語意,不同使用者對相同觀念有不同 表達方式,使得檢索工作非常不易。 近年來,隨電腦科技的提昇,資訊檢 索的技術,已由傳統的字串比對,進展到 以自然語言、多媒體資訊為檢索依據。因 此便有研究者開始研究,如何不需使用者 輸入關鍵字詞,卻仍能將使用者之感覺抓 出,或能猜測使用者主觀意圖,以找尋影 像圖案。 早期的影像檢索的方式多半使用關鍵 字查詢,鑑於使用文字敘述作為索引影像 的不適當,其後便以小圖示群方式提供一 種瀏覽機制,或以查詢用語及影像瀏覽混 合的方式進行。Layne[6]認為與其將時間與 精力花費在過度繁瑣複雜的索引製作工 程,不如針對影像基本特徵作簡要索引即 可,他建議直接提供影像瀏覽機制,讓使 用者自行過濾與擇選。 ” 植 基 於 內 容 之 影 像 搜 尋 ” (content-based image retrieval, CBIR)是以 影像內涵資訊或利用介面輔助工具,描繪 一張影像做為輸入,以進行影像檢索。此 種系統藉由擷取自影像內的特徵,與儲存 於資料庫內事先計算好的特徵值做相似度 計算,將最相近的一些影像資料回傳給使 用者。它利用圖檔來找尋其他相關圖檔影 像 。 CBIR 利 用 的 影 像 資 訊 包 含 紋 理 (texture)、顏色(color)、形狀(shape) 及位置(position)。透過這些圖檔影像資訊 或特徵(features) ,我們能將使用者感興趣 的圖檔找出,而不需使用者鍵入關鍵字來 表達其主觀意圖。CBIR 引起許多研究人員 注意,許多早期商業或學術上的系統,便 以此為基礎而被發展出來。但 CBIR 仍無 法克服影像資訊中語意問題。前述影像圖 檔資訊可以看成低階資訊,而此影像所欲 表達的語意,譬如說一輛汽車,則屬於高 階語意資訊。CBIR 僅以低階資訊為搜尋基. 1.2 相關研究 資訊檢索系統之目的,在幫助使用者 搜尋需求的資訊,並能過慮不必要的資 訊,同時能瞭解使用者真正之意圖。資訊 檢索之研究起源於 1950 末、1960 年初。 最初,資訊檢索系統多以靜態資料、批次 處理方式,以提供使用者資訊。其後,資 訊檢索技術,由傳統文字比對,進展到智 慧型資訊檢索,並逐漸朝向以自然語言為 輸入查詢介面,檢索對象為多媒體資訊。 在 1970 年之後,資訊檢索系統隨著電腦科 技快速發展,由靜態資料提供者,轉為主 動資訊提供者,並強調與使用者之間互動 關係。此時期所發展的系統,主要以使用 者需求為導向,研究者亦以系統與使用者 之間互動為解決問題之思考方向。1980 年 代後,資訊檢索便轉為以認知為導向,此 時期所開發之系統,除滿足使用者的習慣 與需求外,更希望能進一步瞭解使用者的 認知過程,讓檢索系統能更符合人類認知 的模式。 電腦具備快速的計算能力,並能儲存 大量的資料。可協助使用者在雜亂無結構 的資料內,尋找感興趣的資料內容。傳統 資訊檢索技術所討論的資料型態,多以非 結構性文字形式為主。而傳統文字資訊檢 2.

(3) 礎,往往會找到一些不相關的圖,因為許 多影像圖檔,其低階資訊相近似,但卻擁 有完全不同之高階語意概念。 為了要解決這二階層資訊上差異,相 關 研 究 人 員 提出 相關 性 回饋 ( relevance feedback)觀念。相關性回饋是允許使用者 對其所選取的低階資訊特徵給予不同權 重,如此當低階資訊回饋給系統後,系統 便了解使用者感興趣的部份,此時系統能 搜尋的範圍就會比較貼近使用者想要找的 圖檔。 VisualSeek [8]是由哥倫比亞大學新媒 體 技 術 中 心 (Image and ATV Lab of Columbia University)所開發的影像與視訊 資料搜尋工具。使用者能藉由網路對全球 資訊網中的影像與視訊進行搜尋。在 VisualSeek 系統中,使用顏色、形狀、紋 理、及空間關係等特徵資訊,進行影像資 訊搜尋。此系統主要特色為進行影像搜尋 時,同時考量各物件的空間關係,以提高 搜尋的精準度,系統收集了約 12,000 張彩 色影像檔,供使用者透過網址,進行影像 檢索。 由麻省理工學院所開發的影像檢索系 統 Photobook[7],該系統提供使用者以顏 色、形狀、紋理等影像特徵進行檢索依據。 使用者可依不同的特徵、不同的演算法進 行影像相似比對,同時利用 FourEyes 互動 式學習代理引擎(Interactive Learning Agent) 為使用者介面,該系統讓使用者自 Texture Modeling 、 Face Recognition 、 Shape Matching、Brain Matching 四個範例資料庫 中,選擇查詢依據的範例影像,自動建立 並選擇最適合該使用者的使用模式。 Blobworld[4]是由加州大學柏克萊分 校所開發的影像資料庫,該系統提供了四 種影像檢索方式,包含顏色、外形、紋理、 及範例圖片檢索。該系統先讓使用者依影 像圖檔的主題選擇範例圖片,系統會顯示 出代表該影像的氣泡圖,使用者自其中選 擇心中認為最接近查詢的目標外形,並指 定該氣泡的權值,其中包含:色彩、紋理、 位置、外形、及大小的權值。系統會依據 使用者所設定的權值,在計算相似度後,. 自資料庫內篩選出最接近的影像。 視覺影像檢索引擎(Visual Information Retrieval Image Engine, VIRAGE) [9]是由 密西根大學、加州大學聖地牙哥分校、及 麻省理工學院媒體實驗室共同研究發展之 視覺資訊影像檢索引擎,並由 Virage 公司 將其產品化,包含三個主要功能:1)影像 分析,2)查詢比對,3)系統管理。此系統的 特色在於提供使用者靜態影像查詢(Still image query)、動態視訊資料查詢(Video query),其查詢之介面提供四種特徵查詢, 涵蓋顏色直方圖(Color histogram)、紋理 (Texture)、顏色分佈(Color layout)、圖片結 構(Structure)。在檢索過程中,使用者更可 針對不同的特徵,給予不同的權重值,系 統會利用此四種特徵進行綜合比對,以找 出相似度最為接近之圖檔。 S. Forrest 與其研究團隊[5],嘗試將免 疫系統應用於電腦安全防禦,以建立一套 電腦智慧型免疫系統。他們以 Negative Selection 演算法為基礎,研發出的電腦防 禦系統,可分辨自我細胞(合法使用者、未 被破壞的資料檔案等)與危害細胞(未經受 權的使用者、病毒等)。Negative Selection 演算法可偵測出被異動的檔案與程式。此 種植基於免疫系統的電腦偵測與防禦系 統,可與現有的安全系統相結合,運作於 目前的作業系統上,可自動偵測未經授權 的使用者非法使用的過程,同時能維護電 腦中資料檔案的整體安全性,並預防電腦 病毒的擴散。本論文擬將免疫系統之概念 用於設計更有效率之資訊檢索系統。. 二、系統設計 2.1 區域為主之影像檢索系統 為了克服一般系統與使用者冗長的詢 問互答的過程,並提供讓使用者滿意的搜 尋結果,我們提出一個以區域為主 (Region-based)的影像檢索系統 雛形;同 時 , 我 們 採 用 相 關 性 回 饋 (Relevance feedback)的觀念來加速搜尋的過程,此 外,我們以 fuzzy c-means 相似度測量來分 割影像的區域,在此模型中,我們將系統 3.

(4) 的處理過程分成三個階段,如圖 1 所示。. 系統會將資料庫內的影像圖檔,依其整體 的相似度值排序,最終的實驗呈現了令人 滿意的搜尋結果。 在檢索圖形時,我們特別注重使用者 在檢索影像時的直覺,我們所提出的系統 強調下列部份,分述如下: l 特徵擷取 (Feature extraction); l 影像分割 (Image segmentation); l 區域分類和標號 (Regions clustering and labeling); l 使用者選擇和回饋 (User selection and feedback); l 檢索微調 (Retrieval refinement)。 系統以 Visual C++ 6.0 和 Borland C++ Builder 6.0 來開發,資料庫內含約 1000 張 彩色圖檔,從實驗結果顯示,我們的系統 確實可以成功且有效率地處理影像的檢 索。. 圖 1、系統架構。 在前置處理的階段中,我們先將 RGB 色彩座標系統轉換成 HLS 色彩座標系統, 在 HLS 座標系統中的光度 (luminance) 和 色彩分量將形成一特徵向量,以代表每個 像素點,這些特徵可用來表示各種常見的 色彩間的關係,因此,影像可藉由這些特 徵向量表示,然後利用 fuzzy c-means 方法 將相似的特徵向量分類到不同的區域。資 料庫則是以離線 (offline) 的方式來建立 和更新,我們先將每張影像圖檔,利用這 種合理的分割方式處理,所有像素點均被 分到不同的區域,而其色彩特徵向量亦將 隨著圖檔影像一併儲存至資料庫中。 在第二階段中,我們將提供一些查詢 範例影像,並顯示出分割後的區域,以供 使用者選擇。當使用者從影像中選取了查 詢區域後,系統將執行相似度的計算,並 呈現前六個最相似的影像圖檔。此時,若 使用者不滿意此結果,則可進入第三階段 的查詢。 在第三階段中,每張範例影像的區域 將以不同的顏色呈現,以輔助使用者進行 選擇。使用者可以選擇其感興趣的區域, 然後將其回饋至系統中;同時,他們也可 以設定所選區域的權重值,來代表不同的 重要性。在經過選擇和回饋的過程之後,. 2.2 顏色特徵空間之分析 在一張影像中,顏色可成為主要的表 示關鍵子。而大多數的影像處理中,HLS (hue, luminance/intensity, saturation)是最常 使用的色彩座標空間。其中,hue 屬性為 三者中主要的部份,其內含不同光的顏 色,如紅光、黃光、橘光、綠光等,對使 用者而言,此部份為主控元素。Saturation 屬性可表達出某一種光的相對純度。當某 一種光內混入不同比例的白光,會形成不 同顏色的亮光。一般高飽和度的亮光,混 入的白光成份較少。例如:粉紅色光內含 的白光比例會小於紅光內含白光的比例。 Luminance (brightness/intensity) 屬 性 主 要 控制光的強度。因此,HLS 顏色座標系統 相當適合於影像壓縮與影像處理。在此三 種屬性內,人眼視覺對 hue 屬性最為敏感。 在原始影像中,包含不同比例的紅 光、綠光、及藍光。而人眼視覺對亮度較 為 敏 感 。 以 此 種 色 彩 三 屬 性 ( 即 Hue, Saturation, Luminance)來定義色彩,在匹 配色彩的過程中,HLS 色彩系統藉由定義 可以在螢幕上呈現大量的色彩。我們先將 RGB 座標平面顏色要素,轉換為 HLS 顏 色平面。在 HLS 座標平面裏,L 分量用以 4.

(5) 在進行影像分割時, 我們處理每一個 像素點,並自特徵向量中擷取出特徵值 xi ,. 代表每一個像素點的亮度。其餘兩個分量 H 與 S,用以表示該像素點的厭色與飽和 度。RGB 座標系統與 HLS 座標系統間具 有線性轉換關係,因此,在 RGB 座標系統 內的每一個像素點均能經由線性轉換,對 應到 HLS 座標空間的另一點。其間的轉換 方式如 Eq.(1), Eq.(2), Eq.(3)所示。. 1 L = (R + G + B). 3. (1). 3 × min(R, G, B), R +G+B where R + G + B ≠ 0 .. (2). S = 1−. 表示為 xi = { f1, f 2 , f 3} ,其中 fi 是像素中. 的第 i 個特徵值。此步驟會檢查特徵向量 中的特徵值是否符合門檻值。若符合門檻 值,則將此點納入此區域中。此分類步驟 不斷重複進行,直到每一個像素點被分到 各區域內。 我們使用 fuzzy c-means 以進行分類, 並計算每一個類別的重心。每一個類別的 重心代表一個特徵向量與重心的距離,此 距離用以決定該像素點應屬那一個類別。 以 X = {x1, x2 ,..., xn } 代表一張影像中所擷. G ≥ B, G ≤ B,.  θ, H= 2Π − θ,. 取出的特徵向量,其中 n 為總像素點數。 我們的系統可允許由使用者自行訂定分類 數量,當完成區域分類後,一張影像可以 P = { A1, A2 ,..., Ac } 表示,模糊分類需滿足. 1  [(R − G)+ (R − B)]  2 . (3)  (R−G)2 + (R − B)(G− B)  .  where θ = COS−1. Eq.(5)與 Eq.(6)兩式。. . . c. ∑ A j ( x i ) = 1 , for all i ∈ N n. j =1. 每一個像素點便可使用一個 3-D 特徵 向量表示。各特徵向量在視覺上的距離便 可用以作為影像切割的依據。. c. 0 < ∑ A j ( xi ) < n for all i ∈ N c j =1. 2.3 影像分割 影像分割是電腦影像處理的基礎。其 目的為在一張影像中分離出有意義的物 件。此前置步驟可將影像中不連續的物件 組成異質區域。以區域為主的影像切割是 相當困難的一種方式,但許多研究者仍不 斷的加以研究。 在系統中,我們依據每一個像素點的 特徵值,來決定其應分到那一個類別中。 而在分類的過程包含:影像分割、區域擴 張、區域合併、及區域標記等處理步驟。 任一張影像均可用一些特徵表示, 如:顏色、大小、形狀、及花紋。影像分 割可將一張影像分成數個區域, Ri : i = 1,2,..., m , 其中,m 為區域總數,如. Ri  R j = Φ. (5). .. (6). 以糢糊分類可將一張影像依其資料的 特性進行最佳化分類;在完成像素分類 後,同類的像素將具有最強的內聚力,而 類別與類別之間的相似度將降低。每一個 分類可用 V = {v1, v2 ,..., vc } 表示,而影像像 素的分類可經由 Eq.(7)計算而得。 n m ∑ [ A j ( x k )] x k k = 1 vi = , n m ∑ [ A j ( x k )] k =1. (7). 其中 m 為實數且滿足 m>1。 我們的系統使用 fuzzy c-means,針對 輸入的像素資料,依照像素特徵,計算其 與各類別的相似程度,以決定該像素所屬 的類別。如此,在 fuzzy c-means 方法下, 影像原始結構將被保留。當一張影像被分 割為幾個區域後,每個區域都會被標記為 一個代號,以反應出影像內的區域資料結 構。以此所產生出的各區域內具有最強內. Eq.(4)所示。 m Image I =  Ri , i=1. ,. for i ≠ j. (4). 5.

(6) 聚力,區域之間具有最弱的關聯性,如圖 2 所示。. 資料庫內的圖檔的相似程度,並以 Score ( I j ) 表示,在計算 Score ( I j ) 必須將 使用者所設定的權重值一併考慮,如 Eq.(9) 所示,其中 wi 為使用者為該區域所設定的. 2.4 使用者介面 系統初始化時,會先自動由影像資料 庫內任選 5 張影像圖檔做為第一次查詢的 依據,如圖 3 所示。在此初始畫面中,若 使用者認為其中任一張圖檔與其欲搜尋的 圖檔近似,則可用滑鼠點選該圖檔加入選 擇欄位;否則使用者可點選“generate other images”按鈕以產生下一組影像圖檔,但已 被點選的圖檔並不會被取代。同時,若使 用欲更換已點選過的圖檔,可自選擇欄中 點選欲刪除的圖檔,以撤回該圖檔。當使 用者結束圖檔點選的步驟,他可自選擇欄 位中,選取感興趣的區域,並為不同的區 域設定不同的權重值。此步驟可不斷進 行,直到使用者找到其感興趣的檔案。一 旦使用者完成區域的選擇,他可以點 選”search”按鈕以進行資料庫搜尋。在經過 相似度的計算,系統會依照相似的程度產 生一個排序,接著系統會自此排序內挑選 前六張最相似影像圖檔,並顯示在結果 區。若使用者對產生的結果不滿意,則可 繼續進行下一回合的查詢。如圖 4 所示。. 權重值。 5 Score( I j ) = ∑ wi dist( I i , I j ). i =1. (9). 在經過此相似程度計算後,系統會產 生一個候選影像排序,如 Eq.(10)。越接近 使用者意圖影像檔案,會被放置在序列的 前方,系統會自動由此序列中篩選出前 5 張影像,並呈現到使用者介面中。如圖 5 所示。 Rank = min{Score ( I1 ), Score ( I 2 ),..., Score ( I m ) }. (10). 當每一位使用者進行影像檢索時,系 統會自動記錄其檢索過程,在該位使用者 完成影像檢索後,系統將進行資料探勘, 我們視使用者所點選的每一單獨區塊為一 個產品項目,使用者所點選的所有區塊, 為該名使用者該次所購買的所有產品。系 統判斷該使用者所點選的區域是否與資料 庫內一些已存在的點選序列相似,藉以進 行資料探勘,由此分析使用者感興趣的影 像資料與其點選區塊之間的關係。. 2.5. 相似度排行 我們的目標為自資料庫內擷取最相近 的圖檔,在查詢過程中,所選取的區域與 資料庫中的區域,其整體相似度為各區域 相似度的總和。在考慮計算量,我們會限 定使用者只能自 5 張結果中選取 5 個區 域,以進行查詢。使用者所選取的區域以 QRi = {v1, v2 ,..., vl } 表示,其中 vl 為自第 i. 2.6 影像區域編碼 圖庫中的影像已事先分割為數個區 域,我們將每一個區域內的特徵值視為一 項基因,一張查詢影像檔案每一個區域由 數項基因組成,而這些基因組成一條染色 體,如圖 6 所示。在使用者完成區域點選 後,基因編碼亦隨之完成,如圖 7。若使 用者點選了 5 個區域,5 個區域共有 5! 種排 列組合,若將每一種都納入計算,則計算 量過於龐大。我們導入基因演算法,在使 用者點選區域後,系統隨機選取 50 種排列 組合,做為起始搜尋的基因族群。接著利 用我們提出的改良式基因演算法,進行演 化,以加速影像搜尋。. 張 查 詢圖 中所挑選的第 l 個特徵向量中 心。其距離 dist ( I i , I j ) ,如 Eq.(8)所示。此 函式用以表示第 i 張查詢圖與資料庫內第 j 張圖檔的距離。 vh 為第 i 張圖內第 h 個區 域的特徵向量重心;而 vk 為資料庫內第 j 張圖內第 k 個區域的特徵向量重心。 l c (8) dist ( I i , I j ) = ∑ ∑ || vh − vk || . h=1 k =1 我們使用歐氏距離以計算查詢範例與 6.

(7) 2.7 改良式基因演算法 影像檢索運算時,需要大量的運算資 源,因此我們利用免疫系統中的反向選擇 (Negative Selection)機制與正向選擇,對 資料進行交互刪減與比對。透過此方式, 可以逐步減少額外的資訊(雜訊) ,因此可 以加速資訊搜尋速度。. for ( A = PGS; A < N; A++ ) { If (A1 > A2 ) A1 add to “PGS+”; A2 add to “PGS-”; Else A1 add to “PGS-”; A2 add to “PGS+”; } if (number of PGS == 1) Output the result; for( C=PGS-; C < number of PGS-; C++) C2 = C1 OR C2; NG = C2; goto LOOP 其整體運作流程如圖 9 所示:. 基本運作方式 (1). 將欲處理之領域轉化成適當的函數。 (2). 由函數中產生最佳解基因(正基因) 與最差解基因(反基因)。 (3). 利 用 正基因產生出正 基因集合(稱 為 ”Positive Gene Set +”)。 (4). 使用反基因去除 ”PGS+” 中含有反基 因染色體的基因(稱為“PGS-”)。 (5). 於”PGS-”中進行選擇、突變、交配動 作 , 產 生 出 Matching Set ( 稱 為”PGS”)。 (6). 將此“PGS”與 Matching Function 進行 運算,並以下列方式分為兩集合: 假設 A 為 PGS 集合中的基因,A =1~N。 若 A1 優於 A2,則 A1 到“PGS+”,A2 到”PGS-”。 (7). 檢查“PGS+”是否只剩下唯一解。若 是,則結束。否則,繼續下一步驟。 (8). 將 “PGS-” 中的基因產生出反基因。 (9). 回到第(4)步驟迭代進行篩選。. 基因交配 在第二部份中,我們採用免疫系統的 理論來建構資料篩選的步驟。在其中的基 因交配部份,我們發現若採用傳統的遺傳 演算法,反而會增加檢索系統篩選資料的 負擔與運算時間,因此我們以加快收斂速 度與運算效能為依歸,針對傳統遺傳演算 法進行下列改良。 在本研究中所改良的遺傳演算法分 為三大部分描述如下: (1) 選擇運算 為了避免染色體經過交配與突變運 算之後退化,因此我們採用菁英保留策略 取代傳統的選擇運算,此策略能夠保證每 個子世代至少會和親代一樣好。第一步, 我們將群組的第一條染色體視為菁英 (Elitist),第二步則將菁英與群組中下一條 染色體互相比對,將表現較差的染色體(稱 為 Sb)進行突變運算,而較好的染色體(稱 為 Sg)則設為新的菁英。重覆此步驟直到群 組池中所有的染色體皆運算過一次。 (2) 突變運算 突變運算包含三個步驟,第一個步驟 是減少 Sg 與 Sb 之間的差異性;為了達成此 目的,我們需將 Sg 與 Sb 間相異的個數(n) 與位置 P = [ P1 , P 2 ,..., P n ] 記錄下來,但. 演算法 F(X) = Matching Function。 PG = F ( X ), NG = F ( X ) 。 for (I = 1; I < Set number; I++) { “PGS+” += Random Gene + PG; } LOOP: for (I = 1; I < Number of PGS+; I++){ “PGS-” += PPGS - NG; } for (I=1; I < T; I++ ) { Select “PGS-”; “PGS-” Multiply; “PGS-” Crossover; } PGS = “PGS-”. 染色體上第一個 bit 為正負符號位元,且不 列入相異個數的計算。接下來,我們使用 Eq.(11)來決定 Sb 的突變位元數(M),其中 7.

(8) 的 Vg 和 Vb 分別為 Sg 與 Sb 的適應值。. M. = n *.  V g − Vb   Vg + 1 .  .  . 值落入區域最佳解,因此在第三個步驟中 以 Eq.(14)來決定是否要對 Sb 進行退火運 算。. (11). if random% M == 0,. 當得出突變個數之後,我們在 P 中隨 機選出 M 個位置,並根據 Eq.(12)對 Sb 進 行突變運算:  1 , if P i = 0 i ∈ [1 , n ].  0 , if P i = 1 ,. Pi ' = . then. (14). 在上式中的退火運算是將 Sb 上所有 的基因由 1 變 0、0 變 1,如此一來可產生 出與原來的 Sb 完全相反的染色體,進而達 到擴展解域的效果。而 Eq.(14)中的 M 值越 大時,代表 Sb 可以改良的空間越大,也隱 含著 Sb 仍未接近最佳解,因此需要進行退 火運算的機會也相對地減少,我們可經由 此步驟減低由於演化過程過於平滑,而落 入區域最佳解的機會。經上述三個步驟 後,再將突變過的 Sb 放入交配池中等待交 配。. (12). 此處需注意的一點是,在相同的突變運算 中,已突變過的位置不再進行突變,因此 若所選擇的位置在本次突變運算中曾經突 變過,則需再次重新選擇另一個未突變過 的位置。 完成第一步驟後,我們在第二個步驟 中利用 Vg 和 Vb 所處的象限來改良表現較 差的染色體。舉例來說,以二進位為建構 元的染色體在求解極大值時,我們通常將 整個字串以二進位制數值的方式計算極大 值,則此時包含位元 1 越多的染色體為被 視為越好的解。因此,若 Vg 和 Vb 位於同 一數值象限時(例如:同為正數),則 Sb 上 位元 1 的數量會比 Sg 少;因此若要將 Sb 的表現值往 Sg 逼近,可將 Sg 上為 1 的基 因複製到 Sb 的相同位置上,如此不僅可保 留 Sb 上位元為 1 的基因,且可得到 Sb 上 更多位元為 1 的基因。設在 Sg 和 Sb 上第 i 個基因分別稱為 Sgi 和 Sbi,Sbi 可根據 Eq.(13) 進行第二步驟的突變。 1, if S gi = 1 and S g and Sb have the same sign. Sbi =  0, if S gi = 0 and S g and Sb have the different sign..  1, if S bi = 0 , S bi =   0 , if S bi = 1 .. (3) 交配運算 在群組池中所有染色體全都經過突 變運算後,除了最後一條菁英染色體以 外,其餘的染色體皆存入交配池。我們透 過 Eq.(15)統計出目前的群組裡,於選擇運 算中找出的所有菁英的適應值總和,此總 和則為該世代的總適應值(Tj),此值可視為 目前本世代的總體表現優劣程度。 N T j = ∑ (V gi ) j . i =1. (15). 得出總適應值之後,可經由比較親子 兩代的總適應值,計算出子代與親代的差 異程度;當親子兩代的差異逐漸減低時, 也代表整體群組的解值逐漸逼近最佳解, 因此需要改善的空間也越小,為了減少解 值發生劇烈震盪的機會,因此交配率應隨 著親子世代間的差異量而改變;與親代差 異越多的子代,所需交配的染色體數越 多,反之則越少。因此,我們可由 Eq.(16) 來計算有幾對染色體需進行交配運算。. (13). 經過 Eq.(13)的運算之後,再將 Sb 的 象限改變為 Sg 所處的象限,到此為止即完 成第二步驟的運算,此步驟可以將 Sg 中表 現優良的基因複製到 Sb 中,但由於初始群 組是以隨機排列的方式產生,因而無法保 證目前的群組是否已包含可得出全域最佳 解的基因。 由於以上的原因,我們為了擴展目前 的染色體群組所包含的值域,並且避免解. C=. 8. P 2. *. T j − T j −1 Tj +1. ,. (16).

(9) 程式如 Eq.(17)所示: 上式中的 C 為進行交配的染色體對數,P 為交配池中的染色體數量。交配運算的方 式是從交配池中隨機選擇一對染色體,以 單點交配的方式找出兩條染色體上最佳的 交配點。為了避免交配池中的染色體群組 過於相似,因此若交配後的染色體完全相 同時,我們僅保留其中一條,保留下來的 染色體則存入群組池中進行下一世代的運 算。此作法的目的在於避免群組太過相 似,多樣性不足的群組會降低可找出全域 最佳解的機率。 完成交配運算後,再將其他未交配的 染色體與最後的菁英存入群組池中,此時 群組池中的染色體群即為子代群組。 經過以上的選擇、突變與交配運算 後,每個子代的表現可被保證至少與親代 一樣好,甚至比親代優良。總結我們所提 出的演化計算,可得出以下三個結論: 1) 由於每個菁英的產生都是經由互相競 爭而來,因此最後一個菁英將會是此世 代中最佳的染色體。而此菁英將不會受 到破壞,而完整地保留到子代群組中, 此做法即可保證子代群組的表現至少 比不會比親代差。 2) Sb 可經由複製而得到 Sg 上較佳的基因。 3) 突變率與交配率都是根據該群組的適 應值動態地決定的,因此可根據現狀的 改變而得出最好的突變率與交配率,因 此得以促進整個演化運算的效能。 圖 10 為整個演算法的流程圖。. f (t ) = 5t + 3t 2 ,. (17) 將上述四個座標點代入 Eq.(17)後,可得出 最小均方值差為 20。由圖 11 可看出,採 用菁英策略的遺傳演算法雖然沒有一般的 遺傳演算法的劇烈震盪,但在精確度上卻 無法達到我們的需求;但使用我們改良後 的遺傳演算法後,可從圖 12 看出不僅沒有 劇烈震盪,並且在少量的遞迴次數中就可 收斂接近最小均方值。因此在比較兩圖 後,可清楚看出本模型的演算法不僅在收 斂速度上比傳統的演算法來得快,且在精 確度上也比較好。 接著我們將此演算法做為提出的影 像資訊檢索的核心演算法,搜尋結果如圖 5 所示。 使用者介面以 C++ Builder 6.0 實作, 背景處理程式則使用 Visual C++ 6.0 發 展。系統中約收集 1,000 bmp 格式影像圖 檔,每張解析度為 200 × 200 ,包含許多不 同的類別,其中有交通工具、人物、動物 和建築物。 系統起始時,交配率(crossover rate) 與突變率(mutation rate)分別設為 0.6 及 0.1。族群數量(population size)設為 50,演 算法迭代 100 代。查詢結果如圖 5 所示。 我們所提出的系統受到下列條件限 制: (1) 某些使用者可能會慣用自然語言做為 輸入查詢方式,以代替點選方式,但 本系統並未提供高階語意查詢方式。 (2) 如同大多數的 CBIR 系統,我們假設具 有相近似的特徵值影像,會對應到使 用者欲搜尋的範例影像。 (3) 應使用更多的特徵值以達較好的搜尋 結果。. 三、實驗結果與討論 在本論文中,我們提出一個植基於基 因演算法的影像搜尋系統。我們改良傳統 式的基因演算法,並在演化過程,採用菁 英策略,以加速影像搜尋的速度。 首先,針對多項式參數最佳化問題進 行實驗,以驗證我們所提出的演算法之可 行性。本實驗將在一個 2 維平面上尋找一 條與(-1,8)、(0,8)、(1,4) 與 (2,16)等四點最 接近的二次曲線方程式。我們首先經由線 性代數方法找出最佳的參數,所得到的方. 四、總結與未來發展方向 本篇論文提出一個以使用者導向的 CBIR 影像檢索系統。我們導入模糊推論以 切割一張影像為數個區域,利用顏色直方 圖,統計每一個區塊的顏色分佈,並導入 免疫系統作為檢索之核心。在使用者提供 9.

(10) 查詢的範例影像後,系統自動產生染色體 族群,在演化的過程中,系統能猜測使用 者欲搜尋的影像。 我們在前置處理階段以像素之特徵向 量來分割所有的影像,而其他的視覺特徵 可以很容易地在任何時候加入到系統內。 我們將影像特徵向量分類成 2 到 5 個區 域。使用者可以調整其類別數目,這種以 使用者為導向的區域選擇方式,可以讓使 用者以其本身的感知來調整不同視覺效果 的重要性,且這種關聯性回饋機制有幾個 重要特色,茲分別說明如下: (1) 可擴充性。任何種類的視覺特徵均可 嵌入為系統之特徵向量,而不需要更 改系統架構及其演算法。因此,在檢 索影像時將不再需要引用使用者高階 的概念,藉由相關性回饋,使用者的 意圖便可嵌入回饋,系統可以學習有 用的資訊,並在下次搜尋時進行改善。 (2) 動 態 調 整 性 。 相 較 於 以 電 腦 為 主 (computer-based) 的搜尋方法,我們強 調與使用者之間的互動,善用使用者 與機器的合作,使用者可以任意調整 查詢的權重來改變其影響因子,經由 與使用者之間的互動,我們打破了使 用者和機器間的界限,並獲得一個不 錯的查詢結果。我們的系統可以進一 步搜尋,以便越來越接近使用者真正 的意圖。 在未來的研究中,我們將會延續本系統 的開發經驗,進一步地應用在資料探勘與 樣式比對的領域進行上,並對使用者的側 寫資料進行更深入的研究。. 五、參考文獻 [1] D. Dasgupta, N. Attoh-Okine, "Immunity-based systems: a survey," IEEE Int. Conf. on Systems, Man, and Cybernetics, vol. 1, pp.369-374, Oct. 1997. [2] M. Bessaou and P. Siarry, "A genetic algorithm with real-value coding to optimize multimodal continuous functions," Structural and Multidisciplinary Optimization, vol. 23, pp.63-74, 2002. [3] M. Meier-Schellersheim, "Understanding information processing in the immune system: computer modeling and simulations," IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 4, pp.IV-4036-IV-4039, May 2002. [4] C. Carson, S. Belongie, H. Greenspan, and J. Malik, “Region-based image querying,” Proc. of IEEE Workshop on Content-Based Access of Image and Video Libraries, pp.42-49, 1997. [5] S. Forrest, S. A. Hofmeyer, and A. Somayaji, “Computer immunology,” Communications of ACM, vol. 40, no. 10, pp.88-96, October 1997. [6] S.S. Layne, "Some issues in the indexing of images," Journal of the American Society for Information Science, vol. 45, no. 8, pp.583-588, 1994. [7] R.W. Picard and T. Kabir, “Finding similar patterns in large image databases,” IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 5, pp.161-164, April 1993. [8]J.R. Smith and S.F. Chang, “VisualSEEK: a fully automated content-based image query system,” Proc. of the 4th Int. Conf. on Multimedia, pp.87-98, 1996. [9] http://www.virage.com/. 致謝 本 研 究 獲 國 科 會 研 究 計 畫 NSC93-2213-E-036-024 暨大同大學基礎研 究案 B93-I01-032 之經費補助,謹此致謝。. 10.

(11) Source Image. Source Image. Source Image. Segmented Segmented Segmented Image Image Image 圖 2、原始影像與分割後之影像。 圖 5、查詢結果。. 圖 3、系統啟始畫面。 圖 6、自各區域統計顏色直方圖。. 圖 7、由直方圖進行基因編碼。. 圖 4、使用者回饋。. 圖 8、由基因產生基因群組。. 11.

(12) 圖 11、採用菁英策略的遺傳演算法。. 圖 9、免疫系統理論用於資料篩選之步驟。. 圖 12、本研究改良後的遺傳演算法。. 圖 10、改良後的遺傳演算法流程圖。. 12.

(13)

參考文獻

相關文件

建置門診個人健康紀錄:整 合醫療科室、品管中心、醫 企部及資訊室,提供結合預 約掛號及就醫前病人個人病

如未確實遵循資通系統 設置或運作涉及之資通 安全相關法令,可能使 資通系統受影響而導致 資通安全事件,或影響 他人合法權益或機關執

(ii) Maximum power point tracking (MPPT) controller design of the PV module.. (iii) MPPT controller design of the WTG without sensing the

操作流程: 系統選單-&gt;財產管理系統-&gt;點選報廢申請單-&gt;填寫報廢申請單資料(主 單、明細)-&gt;點選確認

圖4 1 整合資訊系統風險 圖4.1 整合資訊系統風險..

 透過一系列 一系列 一系列 一系列的圖畫 圖畫 圖畫 圖畫與少許相關文字 相關文字 相關文字 相關文字或者完全沒有 文字的結合,來傳遞資訊 傳遞資訊 傳遞資訊或說故事 傳遞資訊

The Performance Evaluation for Horizontal, Vertical and Hybrid Schema in Database Systems.. -A Case Study of Wireless Broadband

Lin-ya Hong (2009), “Effects of Enterprise Resource Planning (ERP) Systems Adoption on Production Performance in Manufacturing Industry -- using A Multinational Plastic