第四章 實驗結果
4.2 圖像自動註解實驗與分析
4.2.2 圖像區塊大小限制對自動圖像註解之效能影響
在4.2.1 節的實驗中,我們在綜合圖像區塊資訊產生圖像自動註解字詞時並 沒有對圖像區塊的大小做限制,然而在測試資料圖像 I 經過圖像分割後,有可能 因為圖像的複雜度因素導致產生許多零碎、較小且不具語意的圖像區塊,這對圖 像自動註解時有可能降低其效能,因此本小節將以實驗驗證圖像區塊大小限制對 圖像自動註解效能的影響,在本實驗中分別將圖像區塊大小門檻值設定在 0、
300、600、900、1200 與 1500 個像素點以上,即超過門檻值大小的圖像區塊才 用來計算產生註解字詞,並使用3.3.1 的方法產生自動註解字詞,資料庫中圖像 區塊經過標記字詞及權重建構,採用N=3,我們比較在不同的區塊大小限制條件 下讓系統自動給出1 至 5 個自動註解字詞時的正確率,結果如圖 4-8,橫軸為自 動註解字詞個數。
圖4-8:自動圖像註解正確率(限制圖像區塊大小)。
由圖4-8 可以發現當系統給的自動註解字詞個數為 1 個的時候,圖像區塊大 小限制300 個像素點以上與不限制圖像區塊大小自動註解正確率相差近 5 個百分 比,且在自動註解字詞個數較少時,將圖像區塊大小門檻值設定在300 個像素點 以上可得到較佳的正確率,其原因可歸咎於一些較零碎、較小的圖像區塊,在人 看起來覺得不具語意於其上,然而在計算時視覺相似度可能與某些圖像區塊非常 相似,導致錯誤的標記字詞被設定到這些較零碎的小圖像區塊且具有很大的權重 值,造成自動註解時這些錯誤的標記字詞擁有較高的優先權,降低自動圖像註解 的正確率,然而若將圖像區塊大小限制設定太大,也可能忽略掉一些較小但卻帶 有語意的圖像區塊資訊,像是一些圖像場景中距離較遠的的物件就有可能較小,
但可能帶有語意於其上,圖4-9 為圖像區塊大小限制在 300 像素點以上時,系統 給定1~15 個自動註解字詞的正確率與召回率。
圖4-9:圖像大小限制 300 像素點時自動註解正確率與召回率。
進行自動圖像註解時,限制所需考慮的圖像區塊大小除了可以增進自動圖像 註解的正確率外,對於計算的時間也有很大的幫助,表4-3 為在不同的圖像區塊 大小限制下單張圖像經過圖像區塊標記字詞及權重建構後產生自動圖像註解的 平均時間,當限制在大於 600 像素點時比起不限制圖像區塊大小可以節省近 7 倍的時間,因此,在進行自動圖像註解時對圖像區塊大小做適當的條件限制不但 可以增進自動圖像註解的正確率且有節省運算時間的優點,這對於本論文所建置 的web 2.0 圖像自動註解及檢索系統是很重要的。
表4-3:使用不同圖像區塊大小限制產生自動圖像註解所需平均時間。
圖像區塊大小限制(像素) 平均花費時間(秒)
> 0 7.1
> 300 1.5
> 600 1.0
> 900 0.85
> 1200 0.75
> 1500 0.64