第四章 實驗
4.4 實驗總結
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
4.4 實驗總結
由上述所有實驗中,我們可以歸納一些特性
1. 在k-Nearest Neighbor方法中找出最接近k個相似度建立關係的值實驗中,我們可以發 現,k 值的設定會深深地影響到圖片的準確率變化,因此若能在建立圖片關係時,
找到越相似的圖片進行關係建立,將對準確率的改進有很大的幫助。
2. 在實驗中證實了,我們提出將CBIB融入Community-Search Algorithm應用於多張影像 搜尋的概念的確是有效能的,也證明這樣子的概念也較適合做多張圖片的搜尋,而 實驗中也發現,在特徵擷取時,除了使用MPEG-7做特徵擷取之外,如果再加上SIFT 的特徵,則對準確率有不錯的提升。
將社群的概念融入建立影像關係,從實驗中可以看出效果還不錯,主觀視覺觀察搜 尋影像得到的結果,發現我們的方法在找出相關聯影像的能力是很好的,在客觀準確率 圖表觀察,發現在多張影像搜尋上準確率有維持7~8成以上,穩定的準確率表現也是影 像搜尋系統所須具備的特色。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第五章
結論與未來研究方向
5.1 結論
在本論文中,我們所提出的多張影像內容檢索影像內容搜尋擷取技術有不錯的成果,
藉由將人際關係所產生之網路圖的概念,以此想法建立影像關係網路,距離近的影像表 示其相似性越高,反之距離遠的影像表示其相似性較低,將 Community-Search Algorithm 應用於多張影像搜尋,找出相似影像出來。
我們的影像搜尋方法與一般影像搜尋不同的特色如下:
(1) 建立影像關係網路。
(2) 利用 Community-Search Algorithm 的技術融合社群的概念應用在圖片搜尋。
(3) 多張影像查詢。
在多張影像搜尋上,回傳影像以人類視覺主觀觀察,發現回傳影像和查詢影像有不 錯的相似度及關聯性,而以客觀數據測試結果準確度也不錯,顯示在多張影像搜尋結果 效果頗佳。
5.2 未來研究方向
在本論文中所提出一個有效的多張影像內容檢索和搜尋方法,由於傳統影像搜尋都 著重於影像特徵的抽取和比對,我們將影像特徵和影像關係整合為一個影像關係網路,
藉由演算法將影像與影像之間相關聯的影像抓取出來且有不錯的效果。
現在是網路與數位科技蓬勃發展的世代,資料以極快的速度在成長,尤以多媒體資
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
訊為大宗,如何有效率且精確的搜尋出使用者所需要的影像是一個很重要的課題,傳統 影像搜尋皆著重在影像關鍵字的搜尋,進階則是以影像相關特徵值找出相似的影像,不 管傳統或進階影像搜尋皆是以單張圖片為搜尋來源,很少人提出多張影像搜尋的方法,
本文提出一個應用在多張影像搜尋的方法,結合影像特徵值搜尋已有不錯的效果,顯示 藉由影像特徵值相似度建立影像關係網路有不錯的成果,未來如果能提升影像特徵值擷 取及相似度計算的效率,則應用於影像線上搜尋會更加完美。
影像關係網路目前以影像特徵值為判斷影像彼此關係的依據,未來如果能加上語意 的關係,並讓使用者針對回傳的圖片勾選概念相符合的相關圖片後,回饋給系統,系統 再藉由回饋資訊做配對調整,對於影像搜尋結果會更加準確且符合人類對於影像的想法 及描述,使影像搜尋的使用能越來越貼近人的口語形容和人性化,長程目標未來可以進 階為延伸至音樂、視訊影像搜尋。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
參考文獻
[1] M. Bober, “MPEG-7 Visual Shape Descriptors,” IEEE Transactions on Circuits and
System for Video Technology, Vol. 11, No. 6, pp. 716-719, 2001.
[2] C. Carson, S. Belongie, H. Greenspan, and J. Malik, “Blobworld: Image Segmentation using Expectation-Maximization and Its Application to Image Querying,” IEEE
Transactions on Pattern Analysis and Machine Intelligence, Vol. 24, No. 8, pp.
1026–1038, 2002.
[3] S. F. Chang, T. Sikora, and A. Puri, “Overview of MPEG-7 Standard,” IEEE
Transactions on Circuits Systems for Video Technology, Vol. 11, No. 6, 2001.
[4] M. Flickner, H. Sawhney, J. Ashley, Q. Huang, B. Dom, M. Gorkani, J. Hafner, D.Lee, D.
Petkovic, D. Steele, and P. Yanker, “Query By Image and Video Content : The QBIC System,” IEEE Computer Magazine, Vol. 28, No. 9, pp. 23–32, 1995.
[5] A. Gupta, “Visual Information Retrieval: A Virage Perspective,” Virage, Inc. , San Mateo, Calif., 1995.
[6] J. Han, and K. K. Ma, “Fuzzy Color Histogram and Its Use in Color Image Retrieval,”
IEEE Transactions on Image Processing, Vol. 11, No. 8, pp. 944-952, 2002.
[7] R. Hess, “An Open-Source SIFT Library,” In Proc. of the ACM International Conference
on Multimedia, pp.25–29, 2010.
[8] T. S. Huang, S. Mehrotra, and K. Ramachandran, “Multimedia Analysis and Retrieval System (MARS) Project,” In Proc. of 33rd Annual Clinic on Library Application of Data
Processing-Digital Image Access and Retrieval, 1996.
[9] E. Kasutani, A. Yamada, “The MPEG-7 Color Layout Descriptor: a Compact Image Feature Description for High-speed Image/Video Segment Retrieval,” In Proc. of
International Conference on Image Processing, pp. 674-677, 2001.
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
[10] H. K. Kim, J. D. Kim, D. G. Sim, and D. I. Oh, “A Modified Zernike Moment Shape Descriptor Invariant to Translation, Rotation and Scale for Similarity-Based Image Retrieval,” In Proc. of the IEEE International Conference on Multimedia and Expo, pp.
307-310, 2000.
[11] J. J. Koenderink, “The Structure of Images,” Biological Cybernetics, Vol. 50, No.
5, pp. 363-396, 1984.
[12] H. J. Lin, Y. T. Kao, S. H. Yen, and C. J. Wang, “A Study of Shape-Based Image Retrieval,” In Proc. of 24th International Conference on Distributed Computing Systems
Workshops, pp. 118-123, 2004.
[13] T. Lindeberg, “Scale-space Theory: A Basic Tool for Analyzing Structures at Different Scales,” Journal of Applied Statistics, Vol. 21, No. 2, pp. 224-270, 1994.
[14] D. Lowe, “Distinctive Image Features from Scale-invariant Keypoints,” International
Journal of Computer Vision, Vol. 60, No. 2, pp. 91-110, 2004.
[15] B. S Manjunath, G. M. Haley, and D. F. Dunn, “Efficient Gabor Filter Design for Texture Segmentation,” Pattern Recognition, Vol. 29, No. 12, pp. 2005-2016, 1996.
[16] B. S. Manjunath, J.-R. Ohm, V. V. Vasudevan, and A. Yamada, “MPEG-7 Color and Texture Descriptors,” IEEE Transactions on Circuit and System for Video Technoloy, Vol.
11, No. 6, pp. 703-715, 2001.
[17] B. S. Manjunath, P. Salembier, and T. Sikora,” Introduction to MPEG-7: Multimedia Content Description Standard,” New York: Wiley, 2001.
[18] J. M. Martinez, “Standards-MPEG-7 Overview of MPEG-7 Description tools, Part 2,”
IEEE Multimedia, Vol. 9, No. 3, pp. 83-93, 2002.
[19] W. Niblack, R. Barber, W. Equitz, et al , “The QBIC Project: Querying Images by Content using Color, Texture, and Shape,” In Proc. of SPIE Electronic Imaging: Science
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
and Technology, 1993.
[20] J. S Payne, T. J. Stonbam, “Can Texture and Image Content Retrieval Methods Match Human Perception,” In Proc. of Intelligent Multimedia, Video and Speech Processing, pp.154-157, 2001.
[21] A. Pentland, R.W. Picard, and S. Sclaroff, “Photobook : Tools for Content-Based Manipulation of image databases, ” International Journal of Computer Vision , Vol.18, pp. 233-254, 1996.
[22] K. Porkaew , S. Mehrotra, and M. Ortega, “Query Reformulation for Content Based Multimedia Similarity Retrieval in Mars,” In Proc. of IEEE Conference on Multimedia
Computing and Systems,pp.747-751, 1999.
[23] Y. Rui, T. Huang, and S. Mehrotra, “Content-Based Image Retrieval with Relevance Feedback in MARS,” In Proc. of IEEE International Conference on Image Processing , pp. 815-818, 1997.
[24] T. Sikora, “The MPEG-7 Visual Standard for Content Description-An Overview, “ IEEE
Transactions on Circuits Systems for Video Technology, Vol. 11, No. 6, 2001.
[25] J. R. Smith and S. F. Chang, “Visualseek: A Fully Automated Content-Based Image Query System,” In Proc. of the ACM International Multimedia Conference, pp.87-98, 1996.
[26] J. R. Smith, Integrated Spatial and Feature Image Systems: Retrieval, Compression and Analysis, PhD Thesis, Graduate School of Arts and Sciences, Columbia University, 1997.
[27] M. Sozio and A. Gionis, “The Community-Search Problem and How To Plan A Successful Cocktail Party,” In Proc. of 16th ACM SIGKDD International Conference on
Knowledge Discovery and Data Mining, KDD ’10, pp.939-948, 2010.
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
[28] P. Y. Yin , S. H. Li, “Content-Based Image Retrieval Using Association rule Mining with Soft Relevance Feedback” Journal of Visual Communication and Image
Representation, Vol.17, No. 5, pp.1108-1125, 2006.
[29] Y. Zhang, M.A. Nascimento, and O.R. Zaiane, “Building Image Mosaics: An Application of Content-Based Image Retrieval,” In Proc. of IEEE International
Conference on Multimedia and Exposition, 2003.
[30] “MPEG-7 Visual Experimentation Model (XM) Version 10,”
ISO/IEC/JTC1/SC29/WG11, Doc. N4063, 2001.
[31] “Overview of the MPEG-7 Standard Version 5.0,” Final Committee Draft, ISO/IECJTC1/SC29/WG11, Doc. N4031, 2001.