第三章 建築物區域偵測與建築物影像分類
3.3 特定類型建築物偵測
本節我要針對特定類型的建築物來偵測,這個動作能更精準的取出影像中的 語意,讓影像有更明確的分類,我的作法仍是使用紋理這個特徵來分類,作法為 在訓練特定建築物模型時,支持向量機中的正面資料為特定建築物的區塊,而反 面資料為所有其他類型建築物的區塊,執行建築物區塊偵測時只會在之前所取出 的建築物區域中偵測,當執行區塊偵測完畢後,計算所偵測出來的區塊數佔所有 建築物區域中區塊數之比例,當大過一定比例就認定為此種類型建築物的影像,
: 都市方形小窗戶的建築物 我找了幾種類型建築物做測試,如下 1.
戶建築物(上)訓練資料(下)偵測結果
圖 3.16 都市方形小窗
2.古羅馬式建築物(柱子)
圖 3.17 古羅馬式建築物(柱子)(上)訓練資料(下)偵測結果
3. 哥德式建築物
圖 3.18 哥德式建築物(上)訓練資料(下)偵測結果
4. 都市建築物
圖 3.19 都市建築物(上)訓練資料(下)偵測結果
第四章
驗結果
在這章中我針對第三章所提的方法,設計實驗來評估此方法的在偵測建築物 區域與建築物分類的效能。對於實驗的平台,在硬體方面使用了 Intel Pentium-4 1.8Ghz core dual 中央處理器的個人電腦,搭配 1 Gigabytes 主記憶體,作業 系統為 Microsoft Windows XP 專業版,程式的執行使用 MATLAB 7.1。
本節我將測試在不同大小的區塊以及區塊是否有重疊的情況下對偵測結果 的影響與本方法之偵測效能,我以偵測結果與正確結果(ground-truth)之間重疊 面積的多寡來做為偵測效能之依據,來估計召回率(recall rate)與正確率 (precision rate),召回率與正確率之算法如下:
首先以沒有重疊的區塊來測試,區塊大小由 8x8 到 32x32 共 6 種,
1 不重疊區塊 測召回率與
率 率 (秒/張)
表 4. 之區域偵 正確率
區塊大小 區域召回 區域正確 時間
8x8 67.90% 76.86% 62
12x12 70.73% 79.78% 35 16x16 73.99% 80.32% 24 20x20 68.32% 77.66% 18 24x24 64.82% 75.50% 15 32x32 61.68% 76.75% 12
圖 4.1 不重疊區塊之區域偵測召回率與正確率曲線圖
接下來使用重疊(50%)的區塊來測試,區塊大小由 8x8 到 64x64 共 10 種,
2 重疊區塊之 召回率與正
率 率 (秒/張)
表 4. 區域偵測 確率
區塊大小 區域召回 區域正確 時間
8x8 70.38% 79.04% 173
12x12 71.56% 79.43% 80 16x16 75.75% 78.88% 51 20x20 74.77% 77.72% 37 24x24 75.70% 77.24% 28 32x32 74.75% 77.60% 22 40x40 70.90% 74.19% 17 48x48 67.27% 72.48% 15 56x56 64.11% 73.37% 14 64x64 64.25% 74.21% 12
圖 4.2 重疊區塊之區域偵測召回率與正確率曲線圖
實驗結果比較與分析:
圖 4.3 區塊重疊與不重疊下召回率之比較曲線圖
圖 4.4 區塊重疊與不重疊下正確率之比較曲線圖
由上圖來看,召回率在區塊重疊下明顯比不重疊要好,且區塊大小 16x16 到 32x32 之間有較佳的結果,另外區塊較大其結果也明顯下降,而正確率方面區 塊重疊下最大值比起不重疊的最大值稍微的低,但曲線較穩定直到區塊大小超過 32x32 才有明顯的下降。原因在於區塊太小建築物的結構特徵較不明顯,而太大 則會抓到太多非建築的區域而使結果變差了。
4.2 建築物影像分類實驗結果與分析
本節我要來測試 3.2 節介紹的建築物影像分類方法,同樣還是測試在不同大 小的區塊以及區塊是否有重疊的情況下的分類結果之準確率(accuracy rate), 實驗使用 corel image 550 張建築物影像以及 1000 張非建築物影像來測試,結 果如下:
首先以沒有重疊的區塊來測試,區塊大小由 8x8 到 32x32 共 6 種,
表 4.3 不重疊區塊之建築物影像分類結果
區塊大小 分類(建築物影像) 分類(非建築物影像)
8x8 80.07% 96.60%
12x12 81.35% 96.20%
16x16 82.44% 96.60%
20x20 78.98% 95.70%
24x24 79.98% 96.30%
32x32 77.69% 96.10%
圖 4.5 不重疊區塊之建築物影像分類結果曲線圖
接下來使用重疊(50%)的區塊來測試,區塊大小由 8x8 到 64x64 共 10 種,
區塊之建築物影
小 築物影像) 建築物影像)
表 4.4 重疊 像分類結果
區塊大 分類(建 分類(非
8x8 82.99% 97.10%
12x12 82.26% 97.70%
16x16 82.63% 97.50%
20x20 83.54% 97.50%
24x24 83.54% 97.20%
32x32 83.54% 97.00%
40x40 81.90% 96.40%
48x48 79.89% 96.30%
56x56 81.53% 96.20%
64x64 80.99% 96.40%
塊之建築物影像分類結果曲線圖 圖 4-6 重疊區
實驗結果比較與分析:
圖 4.7 區塊重疊與不重疊下影像分類結果(建築物)之比較曲線圖
圖 4.8 區塊重疊與不重疊下影像分類結果(非建築物)之比較曲線圖
由上圖來看,區塊重疊確實在建築物影像分類上有較好的結果,原因在於影 像上相同位置會被偵測 2 次,因此建築物區塊被辨識出來的機會增高了,且偵測 出的區塊也更貼近建築物的輪廓,而在不同區塊大小偵測下非建築物影像的判斷 正確率差異不大且精確,而建築物影像則是在區塊大小 16x16~32x32 重疊與 16x16 不重疊下結果比較好,而為什麼非建築物影像的結果會比建築物影像的結
果要好,原因是區域的分類器在將非建築物區域判斷為非建築物區域下比將建築 區域判斷為建築物區域來的準確。
紹的特定建築物偵測方法,使用大小為 32x32 的重 區塊來測試,並記錄實驗結果的召回率與正確率,實驗使用 corel image 550
表 4.5 特定類型建築物偵測之召回率與正確率
建築物類型 召回率 正確率
物
4.3 特定類型建築物偵測實驗結果與分析
本節我要來測試 3.3 節介 疊
張建築物影像,結果如下:
都市方形小窗戶建築物 85.7% 60%
古羅馬式建築物(柱子) 60% 54%
哥德式建築物 50% 46.2%
都市建築物 52.8% 48.6%
都市方形小窗戶建築物有較明顯與規律的紋理特徵,因此有較好的實驗結果,而 羅馬式建築物與哥德式建築物的紋理特徵較不規律,因此結果大概只在五成左 右。
古
第五章
結論與未來展望
5.1 結論
本文提出了以紋理特徵為基礎的建築物偵測方法來進行不同類型建築物的 偵測,方法會先使用較小區塊中的紋理特徵找出影像中有可能為建築物的區域,
再利用較大範圍區域中之紋理特徵來判斷是否為建築物,來找出建築物的區域,
因此偵測結果較不容易受到建築物區域大小影響,在判斷影像是否為建築物影像 時,則是會受到建築物區域偵的結果所影響。
我們利用本方法來實作建築物的偵測,實驗證明了本方法在建築物區域偵測 與建築物影像分類有不錯的結果。
5.2 未來展望
在本論文的研究與實驗中,發現有幾個細節是我們可以繼續改進的重點,在 此說明如下:
1. 本研究中建築物區塊與建築物區域的判斷已有不錯的結果,但可以再找出其 它有效的特徵合併使用,來增加正確率。
2. 特定類型建築物偵測目前是使用紋理的特徵,但有些類型偵測的結果較好有 些較差,所以希望未來能找到其他更有效的特徵,且不同建築物類型使用不 同的特徵。
參考文獻
[1] A. lqbal and J.K.Aggarwal, "Applying perceptual grouping to
content-based image retrieval: Builing images", In Proc. IEEE Int. Conf.
CVPR, 1:42-48,1999.
[2] S. Kumar and M. Hebert, "Man-made Structure Detection in Natural Images using a Causal Multiscale Random Field", In Proc. IEEE Int. Conf.
on CVPR ,2003
[3] Hoang-Hon Trinh Dae-Nyeon Kim and Kang-Huyn Jo“Urban building detection by visual and geometrical features,2004
[4] Q. Yanyun, Z. nanning, salient building detection in natural image using SVM IEEE Intl Conf,2005
[5] Yqing Song and Aidong Zhang, analyzing scenery images by monotonic tree,ACM Multimedia System Journal,2002
[6] D.M. McKeown, "Toward Automatic Cartographic Feature Extraction, Mapping and Spatial Modelling for Navigation, L.F. Pau, ed., NATO ASI series, vol. F65, pp. 149-180,1990.
[7] R.B. Irvin and D.M. McKeown, "Methods for Exploiting the Relationship Between Buildings and Their Shadows in Aerial Imagery,"IEEE Trans.
Systems, Man, and Cybernetics, vol. 19, no. 6,pp. 1,564-1,575, Nov.1989.
[8] J.C. McGlone and J.A. Shufelt, "Projective and Object Space Geometry for Monocular Building Extraction," Proc. IEEE Conf. Computer Vision and Pattern Recognition, pp. 54-61, June 1994.
[9] C. Lin, R. Nevatia, "Building Detection and Description from a Single
ry 2:121 - 167,
, vol. 8, pp. 888-905,2000.
oach toward feature
out 1999
sed
1 1999
8] YAN-NI WANG,LONG-BIN CHEN,BAO-G HU," I semantic extraction of the building images using support vector machines " Machine Learning and Cybernetics, 2002. Proceedings. 2002 International Conference
[10] Christopher J. C. Burges. "A Tutorial on Support Vector Machines for Pattern Recognition". Data Mining and Knowledge Discove
1998
[11] Jianbo Shi, J. Malik, “Normalized cuts and image segmentation,
"IEEE Trans. PAMI, no. 22
[12] Y. Deng, B. S. Manjunath, “Unsupervised segmentation of
color-texture regions in images and video," IEEE Trans. PAMI, vol. 23, no. 8, pp. 800-810, 2001
[13] D. Comaniciu, P. Meer, “Mean shift: a robust appr
space analysis, " IEEE Trans. PAMI, vol. 24, no. 5, pp. 603-619, 2002.
[14] Y. Rubner and C. Tomasi. “Texture-based image retrieval with segmentation. In ICCV'99, Corfu,Greece,Sep.
[15] A.Vailaya, M. Figueiredo, A. K. Jain, and H.J.Zhang. content-ba hierarchical classification of vacation images. In IEEE conf. on Multimedia Computing and System, vol.
[16] B.S.Manjunath and W.Y.Ma, Texture features for browsing and retrieval of image data, IEEE Trans. On Pattern Analysis and Machine Intelligence, vol.18 no.8, Aug.1996
[17] Y.Deng,C.Kenney,M.S. Moore, and B.S. Manjunath," Peer Group Filtering and Perceptual Color Image Quantization" IEEE Proc.
International Symposium on Circuits and Systems, vol. 4,1999 [1