• 沒有找到結果。

ZuBud 建築資料庫的辨識結果

第五章 辨識實驗結果與評估

5.2 ZuBud 建築資料庫的辨識結果

5.2.1 ZuBud 建築資料庫介紹

ZuBud(Zurich Buildings Database)是由 Swiss Federal Institute of Technology 所建立的 建築物影像資料庫,以Zurich 街上建築物的為對象,分成兩個部分,資料庫部分包含了 201 棟建築物,每棟建築物各五張任意視角的影像,共有 1005 張;查詢影像部分包含了 115 張建築物的影像。為了包含更多不同照明度的影像,所有影像皆在不同季節與天氣 狀態之下由兩台不同相機所拍攝,如表14。

表14、ZuBud 建築物影像範例

查詢影像 資料庫影像

   

5.2.2 ZuBud 建築資料庫的辨識結果

本研究測試ZuBud 資料庫的辨識率時,發現測試兩區域相似性時,必須同時考慮 Zernike Moment 的強度與相位資訊才能獲得更好的辨識率,而使用 kd-tree 搜尋的時候 找最近一點的辨識率略高於找一個範圍的辨識率,辨識結果如表15。

表15、 ZuBud 辨識結果

實驗編號 實驗 5 實驗 6 實驗 7

狀況 判斷找到的

bounding box 包含 區域與查詢影像 上區域相似性只 看ZM 強度

判斷找到的 bounding box 包含 區域與查詢影像

bounding box 大小 參數s

0.5 0.5 無 feature vector 數

量 能存在如鏡射、反白等等不相似的情況,因此需要讓Zernike Moment 發揮它更強大的辨 識力,也就是:當ZM 的強度與「相位」皆相近才能確定此兩區域夠相似,才能夠投票。

第六章 結論與未來發展

本研究結合MSER 特徵區域與 Zernike Moment 描述子,並使用 kd-tree 的多維空間 索引結構來做建築物的影像辨識。在交通大學建築資料庫可獲得95%左右的辨識率,在 ZuBud 資料庫最佳也可獲得 94.8%的辨識率,辨識率皆相當不錯。

針對MSER 的偵測在不同的光線條件下,會偵測到的不穩定區域,本研究利用其他 張相同的建築影像偵測之區域,做互相消除的動作,有效增加的空間與時間的效率。本 研究並利用DBSCAN 分群法減少資料庫中的重覆區域,而為了保有特徵之間的區辨力,

只將非常相似的區域分成同群,因此分群產生的效益並未非常巨大,未來若能找到能夠 兼顧區辨力與有效減少資料庫中儲存的特徵向量的數量之分群法,在空間與時間上,一 定會有更大的改進。

本研究發現面對較大的資料庫,如ZuBud,需同時考慮強度與相位的相似性,確認 查詢影像上的區域與資料庫的區域極相似,才能充分發揮Zernike Moment 的區域辨識能 力,獲得更好的辨識率。

本研究使用的程式語言為Matlab,並且尚未對程式碼做最佳化的動作,因此主要著 重在準確度上,而非辨識的速度,未來如果對程式碼做最佳化,並且使用編譯式的程式 語言,或是將重覆的動作平行化,將可以獲得更佳的效率。

然而,本研究所用辨識的方法,並未結合各個區域間的空間關係,為了獲得更高的 區辨力,可再結合各區域間的空間資訊來做強化,如以資料庫影像與查詢影像的特徵區 域點對應估計出3D 的關係,來做更精確的比對。在建築物的 3D 的比對方面將會面臨 到問題是特徵區域的重覆性,如何克服特徵點的重覆性做到有效的點對應,是建築物3D 比對將面臨到的重要課題。

參考文獻

[1] Wang J., G. Wiederhold, O. Firschein, and S. Wei, “Content-Based Image Indexing and Searching Using Daubechies’ Wavelets”, Int’l J. Digital Libraries, vol. 1, pp. 311-328, 1998.

[2] Chen Z. Sun SK, “A Zernike Moment Phase-Based Descriptor for Local Image Representation and Matching”, IEEE Transactions on Image Processing, vol. 19, No. 1, pp. 205-219, 22 September 2009.

[3] Mikolajczyk, K., Tuytelaars, T., Schmid, C., Zisserman, A., Matas, J., Schaffalitzky F., Kadir, T., and Van Gool, L, “A Comparison of Affine Region Detectors”, International Journal of Computer Vision,vol. 65, pp. 43-72, 2005.

[4] D. G. Lowe, “Distinctive Image Features from Scale-invariant Keypoints”, International Journal of Computer Vision, vol. 60, no.2, pp. 91-110, 2004.

[5] Mikolajczyk K., Schmid, C., “A Performance Evaluation of Local Descriptors”, IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 27, no. 10, pp. 1615-1630, 2005.

[6] Feng Jing, Mingjing Li, “An Efficient and Effective Region-Based Image Retrieval Framework”, IEEE Transactions on Image Processing, vol. 13, no. 5, pp. 699-709, 2004.

[7] J. Willamowski, D. Arregui, G. Csurka, C.R. Dance, and L. Fan., “Categorizing Nine Visual Classes Using Local Appearance Descriptors”, ICPR Workshop on Learning for Adaptable Visual Systems, Cambridge, August 2004

[8] W. Wen, J. Yang, “Object Fingerprints for Content Analysis with Applications to Street Landmark Localization”, Proceedings of ACM International Conference on Multimedia, pp.169-178, 2008.

[9] Obdrzalek S, Matas J., “Image Retrieval Using Local Compact DCT-Based Representation”, Pattern Recognition, 25th DAGM Symposium, vol. 2781 of Lecture Notes in Computer Science. Magdeburg, Germany: Springer Verlag, pp.490–497, 2003 [10] Wei Zhang, Jana Kosecka, “Hierarchical Building Recognition”, Image and Vision

Computing, vol. 25, pp.704-716, 2007.

[11] Shao, H., Svoboda, T., Van Gool, L., “ZuBuD—Zurich Buildings Database for Image Based Recognition”, Technical Report 260, Computer Vision Laboratory, Swiss Federal Institute of Technology, 2003

[12] Jerome H. Friedman, Jon Louis Bentley, and Raphael Ari Finkel, “An Algorithm for Finding Best Matches in Logarithmic Expected Time”, ACM Transactions on Mathematical Software, vol. 3, no 3, pp. 209-266, 1977

[13] N.J.C. Groeneweg, B. de Groot, A.H.R. Halma, B.R. Quiroga, M. Tromp, and F.C.A.

Groen, “A Fast Offline Building Recognition Application on a Mobile Telephone”, Advanced Concepts for Intelligent Vision Systems, vol. 4179, pp. 1122-1132, 2006

[14] Gerald Fritz, Christin Seifert, and Lucas Paletta, “A Mobile Vision System for Urban

Detection with Informative Local Descriptors”, In Proc. International Conference on Computer Vision Systems, pp. 30-30, 2006.

[15] M. Ester, H.-P. Kriegel, J. Sander, and X. Xu., “A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise”, In Proc. 2nd Int. Conf. on Knowledge Discovery and Data Mining (KDD'96 ). AAAI Press, Menlo Park, CA, pp.

226-231, August 1996

[16] Jerome H. Friedman, Jon Louis Bentley, Raphael Ari Finkel, “An Algorithm for Finding Best Matches in Logarithmic Expected Time”, ACM Transactions on Mathematical Software, vol. 3, no. 3, pp.209-226, September 1977

[17] Andrea Vedaldi, “An Implementation of Multi-Dimensional Maximally Stable Extremal Regions”, February 7, 2007

 

相關文件