第三章 建築物影像與特徵資料庫建立
3.2 建築物資料庫影像特徵偵測與描述
對於資料庫中拍攝的每一張影像,利用MSER 特徵區域偵測與 Zernike Moment 特 徵區域描述,可以求得每一張影像的MSER 特徵區域與其對應的特徵向量集合,如圖 18、圖 19 所示,以紅色橢圓標出特徵區域。一個橢圓特徵區域,可計算出一個 Zernike Moment 的特徵,包含了 magnitude 向量與 phase 向量兩部份。
圖18、MSER 特徵區域示意圖,交通大學竹軒。
圖19、MSER 特徵區域示意圖,交通大學工程三館。
3.2.1 使用相鄰影像去除不穩定的建築物影像特徵區域
觀察特徵區域偵測結果,可以發現直接由MSER 特徵區域偵測方法偵測出來的特徵 區域,包含了很多非建築物上的區域,如圖18 的樹葉、腳踏車、汽車與圖 19 的樹葉與 地板上的區域,這些多餘的區域不屬於建築物上,而且如樹為非剛體,會隨風搖晃,每 次拍攝都不太相同,因此,需要將這些特徵區域排除在資料庫之外。
建築物遠看時,由於表面的窗戶、外牆等等區域接近平面,較不容易隨著較小的視 角變化而有太大的光影改變,因此,在較小視角變化下,建築物本身的橢圓特徵區域偵 測出來穩定性較高;相對而言,樹木、腳踏車、汽車等等,形狀較凹凸有致、錯綜複雜,
容易隨著小視角的改變,有較大的光影變化,因此,當有視角變化時,在樹木、腳踏車、
汽車等等較無法偵測出相同的橢圓特徵區域,如圖20。
圖20、有較小視角變化時的 MSER 特徵區域萃取結果,交通大學工程三館。
利用上述特性,配合Zernike Moment 的區辨力,可以發展出一個全自動去除不穩定 特徵區域的簡單方法。本研究對於建築物的一個面拍攝五張照片,以圖20 為例,五張 照片鄰近之兩張間角度變化較小,如果一個特徵區域夠穩定出現,也會同時出現在角度 變化較小的兩張鄰近影像。此演算法以建築物同一面的五張照片為一個處理單位。
表1、使用相鄰影像去除不穩定的建築物影像特徵區域演算法 Algorithm 3.1:使用相鄰影像去除不穩定的建築物影像特徵區域演算法 Input:
簡單來說,決定一個特徵區域是否保留的條件,就是檢查它的鄰近影像有無長相接 近的Zernike Moment 特徵向量,此演算法就是查詢鄰近的影像特徵相似度的過程,因為 Zernike Moment 的區辨力夠強,樹葉等等不穩定的區域並不容易在鄰近角度的影像中同 時出現,此演算法的結果範例如圖21。
圖21、使用相鄰影像去除不穩定的建築物影像特徵區域結果,交通大學工程三 館。
3.2.2 建築物多面貌的表示法
一棟建築存在多個適合拍攝的面,由於每一個面的長相都不相同,因此資料庫中必 須儲存各個不同面之影像,而每面因為建築物本身構造為非平面,會造成遮擋現象,需 要拍攝五個不同角度的影像,例如:圖22 顯示的是交通大學工程五館適合拍攝的三個 面,本研究就以十五張影像來表示工程五館這棟建築物。
這麼一來,資料庫中已經概略儲存了使用者可能拍攝的各種角度,但使用者實際拍 攝查詢影像時,並不會與資料庫中的其中一張影像一模一樣,即使是資料庫中拍攝角度 與查詢影像最接近的一張,仍存在旋轉、位移、光線等等的不同。本研究利用MSER 與 Zernike Moment 的視角不變特性,找出資料庫中內容與查詢影像最相似的影像,其所代 表的建築物,即是建築物辨識的結果。
圖22、交通大學工程五館適合使用者拍攝的三個面。