偵測醒目區域

第三章辨識方法分析

3.1 偵測醒目區域

為了測試偵測醒目區域演算法的效果，我們採用資料庫Caltech 256 來實驗是否此演算法能正確找出圖片的醒目物體，此資料庫的圖片共分成 256 類，每個種類的照片至少有82 張以上，每張圖片尺寸不固定且圖片皆為彩圖，由於每張圖片有著明顯類別，因此常被視為物件辨識資料庫。

此小節我們想藉由背景複雜度探討偵測醒目區域演算法的效果，因此我們從 256 類中隨意選出 10 類，每類選取 10 張，5 張為單調背景，5 張為複雜背景，觀察此演算法是否能正確偵測出醒目物體。

3.1.1 背景單調的物體

原圖包含 10 類物體，此 10 類為:輪胎、車子、卡特曼(卡通人物)、螃蟹、木槿花、袋鼠、椰子樹、向日葵、蝴蝶、番茄、斑馬，每類 5 張，每張圖片的背景

單調，見圖3.1。圖片中的每個像素在經過醒目性偵測後會得到一個醒目分數(salient score)，分數範圍為

[ ]

0,1 ，醒目分數越高表示此位置的像素在圖片中的醒目性越

大，我們將顯示醒目分數大於0.5 的像素，醒目分數小於 0.5 的像素則不被顯示，

圖3.2 則為 10 類圖片醒目性偵測結果。

由圖3.2 發現，在背景單調的情況下，醒目性的偵測結果相當正確，圖中物體皆被視為醒目區域，背景也幾乎都被去除，僅有少數幾張圖片的部分背景未被完全除去，我們推測當物體本身與相鄰背景顏色相似時，相鄰物體的背景容易被視為醒目的物體，如圖 3.3(a)顯示圖庫內第 21 張的袋鼠和背景顏色相似，造成背景的沙地也被視為顯著區域。形狀不規則的物體也會增加醒目性偵測的難度，使物體難以與背景完全切割，如圖3.3(b)顯示圖庫內第 26 張到第 30 張的椰子樹，由於葉子邊緣較不規則，無法和背景精確的分隔開來。

圖 3.1 背景單調的 10 類圖片

圖 3.2 背景單調的 10 類圖片醒目性偵測結果

(a) (b)

圖 3.3 偵測醒目性效果不佳的圖片，(a)第 21 張袋鼠，(b)26-30 張的椰子樹

3.1.2 複雜背景的物體

原圖同為 10 類，每類 5 張，每張圖片的背景複雜，見圖 3.4，同樣地，每個像素在經過醒目性偵測後會得到一個醒目分數(salient score)，分數範圍為

[ ]

^0,1^，我

們將顯示醒目分數大於 0.5 的像素，醒目分數小於 0.5 的像素則不被顯示，圖 3.5 則為10 類圖片醒目性偵測結果。

由圖3.5 發現，在背景複雜的狀態下，因為圖片背景的複雜度變大使得醒目性偵測的難度上升許多，以此10 類別而言，物體偵測的位置大致正確，但受背景混亂的影響，導致上圖許多物體邊界的細部較不完整，尤其是邊緣不規則的物體。

整體而言，醒目性偵測的正確率的確會受背景複雜度影響，複雜背景的圖片較背景簡單的圖片偵測到的物體正確度稍差，但大致能找出物體正確區域，因此本文認為加入醒目性偵測應能對物件辨識有所幫助，而在往後的實驗我們也會加以驗證此項假設。

圖 3.4 背景複雜的 10 類圖片

圖 3.5 背景複雜的 10 類圖片醒目性偵測結果

K-最鄰近分類法 (K-Nearest Neighbor Classification, 簡稱 KNN)在 1951 年被提出，是一種簡易的非參數化方法，常應用於物件辨識。假設訓練資料庫有N 筆資

在文檔中基於視覺注意與多重特徵的快速物件辨識 (頁 33-37)

第三章 辨識方法分析

3.1 偵測醒目區域

[ ]

[ ]

第三章辨識方法分析