第三章 辨識方法分析
3.1 偵測醒目區域
為了測試偵測醒目區域演算法的效果,我們採用資料庫Caltech 256 來實驗是 否此演算法能正確找出圖片的醒目物體,此資料庫的圖片共分成 256 類,每個種 類的照片至少有82 張以上,每張圖片尺寸不固定且圖片皆為彩圖,由於每張圖片 有著明顯類別,因此常被視為物件辨識資料庫。
此小節我們想藉由背景複雜度探討偵測醒目區域演算法的效果,因此我們從 256 類中隨意選出 10 類,每類選取 10 張,5 張為單調背景,5 張為複雜背景,觀 察此演算法是否能正確偵測出醒目物體。
3.1.1 背景單調的物體
原圖包含 10 類物體,此 10 類為:輪胎、車子、卡特曼(卡通人物)、螃蟹、木 槿花、袋鼠、椰子樹、向日葵、蝴蝶、番茄、斑馬,每類 5 張,每張圖片的背景
23
單調,見圖3.1。圖片中的每個像素在經過醒目性偵測後會得到一個醒目分數(salient score),分數範圍為
[ ]
0,1 ,醒目分數越高表示此位置的像素在圖片中的醒目性越大,我們將顯示醒目分數大於0.5 的像素,醒目分數小於 0.5 的像素則不被顯示,
圖3.2 則為 10 類圖片醒目性偵測結果。
由圖3.2 發現,在背景單調的情況下,醒目性的偵測結果相當正確,圖中物體 皆被視為醒目區域,背景也幾乎都被去除,僅有少數幾張圖片的部分背景未被完 全除去,我們推測當物體本身與相鄰背景顏色相似時,相鄰物體的背景容易被視 為醒目的物體,如圖 3.3(a)顯示圖庫內第 21 張的袋鼠和背景顏色相似,造成背景 的沙地也被視為顯著區域。形狀不規則的物體也會增加醒目性偵測的難度,使物 體難以與背景完全切割,如圖3.3(b)顯示圖庫內第 26 張到第 30 張的椰子樹,由於 葉子邊緣較不規則,無法和背景精確的分隔開來。
圖 3.1 背景單調的 10 類圖片
24
圖 3.2 背景單調的 10 類圖片醒目性偵測結果
(a) (b)
圖 3.3 偵測醒目性效果不佳的圖片,(a)第 21 張袋鼠,(b)26-30 張的椰子樹
3.1.2 複雜背景的物體
原圖同為 10 類,每類 5 張,每張圖片的背景複雜,見圖 3.4,同樣地,每個 像素在經過醒目性偵測後會得到一個醒目分數(salient score),分數範圍為
[ ]
0,1,我們將顯示醒目分數大於 0.5 的像素,醒目分數小於 0.5 的像素則不被顯示,圖 3.5 則為10 類圖片醒目性偵測結果。
由圖3.5 發現,在背景複雜的狀態下,因為圖片背景的複雜度變大使得醒目性 偵測的難度上升許多,以此10 類別而言,物體偵測的位置大致正確,但受背景混 亂的影響,導致上圖許多物體邊界的細部較不完整,尤其是邊緣不規則的物體。
25
整體而言,醒目性偵測的正確率的確會受背景複雜度影響,複雜背景的圖片較背 景簡單的圖片偵測到的物體正確度稍差,但大致能找出物體正確區域,因此本文 認為加入醒目性偵測應能對物件辨識有所幫助,而在往後的實驗我們也會加以驗 證此項假設。
圖 3.4 背景複雜的 10 類圖片
圖 3.5 背景複雜的 10 類圖片醒目性偵測結果
26
K-最鄰近分類法 (K-Nearest Neighbor Classification, 簡稱 KNN)在 1951 年被提 出,是一種簡易的非參數化方法,常應用於物件辨識。假設訓練資料庫有N 筆資