• 沒有找到結果。

基於內容影像檢索(CBIR)簡介

第四章、 影像幾何相關理論

6.1 基於內容影像檢索(CBIR)簡介

隨著影像資料快速的成長,以對地觀測遙測影像而言可分為:1.不同載具所 拍攝之影像 2.不同解析度之影像 3.不同時期之影像等,資料已達到巨量之程 度。在眾多影像中要對這些影像進行管理,最基本的功能就是要對所有影像建立 檢索系統,該檢索系統最基本的功能要包含如何快速將我們需要的影像給檢索出 來。基於此需求下就有了基於內容的影像檢索技術出現,當然應用領域上面有所 不同,其中也包含了影像理解、影像辨識、電腦視覺、人工智慧等科學領域應用。

目前網路上面一些著名的圖片搜尋引擎如Google、Yahoo、AltaVista 等均採用文 字方式進行圖片搜尋,其利用網站上之關鍵字(Keyword)將使用者欲檢索之影像 予以列出,而以文字為索引的方式雖然已經可以應用於網路世界,但也存在一些 無法避免的問題。

1. 由人工所建立影像檢索內容描述,帶有強烈的主觀性,當影像資料庫龐大 時須耗時耗力。

2. 影像中可能存在許多需要給予描述之對象,僅以文字方式單純對影像進行 特徵描述並無法滿足其應用之需求。

3. 目前自然語言(Natural Language)理解技術的研究還不成熟,限制了基 於文本描述的檢索應用。

為克服上述問題,有必要考慮新的方法。1990 年初,建立在電腦視覺和圖 像理解理論基礎上,綜合了人工智慧(Artificial Intelligence, AI),物件導向 (Object-Oriented),資料庫(Database)等多科學知識,開始提出了基於內容的影像 檢索技術,影像的內容描述不再依賴人工建置與描述的方式。比較有代表性的作 品如QBIC 系統、Photobook 系統、Netra 系統、Chabot 系統、VISUALSEEK 系 統、MARS 系統和 Virage 影像搜尋系統等。而目前 Google 所提供的免費影像管

理軟體Picasa 也內建簡易色彩內容檢索功能,如圖 6.1 所示[31]。

圖6.1 Picasa 圖像管理軟體 色彩檢索圖示 基於內容的影像檢索技術最常遇到的兩個關鍵問題

1. 如何使用提取圖像的特徵。

2. 如何將提取的圖像的特徵進行匹配。

以圖像特徵之分類主要可分成1.底層視覺特徵 2.高層語意特徵,如圖 6.2 所 示。

圖6.2 圖像特徵分類 1. 底層視覺特徵

底層視覺特徵包括有顏色、紋理、形狀等方法如圖6.3 所示:

(1) 以顏色為基礎的影像檢索系統

選擇適當的顏色格式->減少色階(降低空間域)->計算顏色分布圖及 特徵顏色分布圖,再進行相似性比對

圖像特徵

1.底層視覺特徵

2.高層語意特徵

a.顏色 b.形狀 c.紋理

d.空間關特徵 a.文本描述

b.視覺特徵和文本描

圖6.3 底層視覺特徵分類 (2) 以紋理為基礎的影像檢索系統

紋理特徵包含:1. Tamura 紋理特徵 2.小波紋理特徵 3.傅立葉紋理特 徵4.其他紋理特徵,如圖 6.4 所示。

影像擷取轉換->擷取紋理特征->比對

圖 6.4 紋理特徵提取方法 (3) 以形狀為基礎的影像檢索系統

形狀為基礎影像檢索可分為 1.基於邊界輪廓 2.區域特徵如圖 6.5 所 示。

A. 形狀演算法邊緣增強->邊緣檢測->邊緣聯結

B. 使用上述方法描繪出粗略形狀,在與資料庫中的影像比對。

紋理特徵

Tamura 紋理特徵

小波紋理特徵 傅立葉紋理特徵

其他紋理特徵

粗糙度

方向性 對比度 顏色特徵提取

顏色矩 顏色集(Color Sets)

累加直方圖 顏色空間 顏色直方圖

多分辨率顏色索引

RGB HSI HSV

圖 6.5 形狀特徵提取

2. 高層語意特徵

影像的含意屬影像之高層語意(Semantic),包含人對影像內容的理解,

此種無法直接由影像視覺特徵及低層特徵獲得,而須根據人的知識來辨識,

人與計算機的本質不同就在於人類觀察圖像時,結合了日常生活中累積的大 量知識與經驗,觀察圖像的過程同時也是一個利用知識推理語意的過程,同 時人們判斷影像的相似性也並非僅建立在影像視覺特徵相似度基礎上面,目 前影像的低層特徵與影像的高層語意表達之間還存在著巨大的「語意鴻 溝」。高層語意特徵包含了一些生物特徵辨識,如指紋辨識、人臉辨識等人 工智慧與類神經網路學習系統[44]。