第四章 資料庫集合與結合演算法
4.1 資料庫的建立
4.1.2 修改過後的結合演算法
一個畫面,即是一個物體,那再這個畫面附近變動的時後,勢必和繞著一 個物體選轉拍攝,有異曲同工的效果,如圖 20 所示:
camera View angle
圖 20 利用攝影機選轉模仿多角度觀察物體
所以將上述演算法稍做改良,勢必對我們縮減資料量,有很大的助益。上 述的概念是將一連串序列的影像,透過尋求最佳的特徵面,來描述該物體 的外觀,然而仍存在幾個缺點
1. 每個物體在建立資料庫時,都必須使用 M 張照取樣順序排列的面,
即照拍攝角度由小到大排列的視角順序的面,才能代入演算法去建 資料庫。
2. 由於此法假設取樣的物體的面是足夠多去表示此物體的,但實際上 我們知道一個物體可能投影出的面是無限多的,所以,此假設是會 有問題的,因此必須有一個可以更新資料庫的機制,使的資料庫變 的更完善。不幸的是,此法若要更新資料庫,則必須把物體全部M 張面加上新進用來更新資料庫的面,重新按照拍攝角度由小到大排 列的視角順序排好,全部再重新代入演算法去建資料庫,即無法簡 單地一張一張的更新,而是不管有幾張要更新,都要加上之前的全 部重算。
此法不致因物體的對稱性的關係而多出一些不必要的外觀,但這樣 做還是不能完全避免不必要的外觀,例如像完全對稱的物體就還是 會產生不必要的外觀。
因此有[27]提出的改善機制,他保留了 Cyr and Kimia 提出的外觀結合演算 法分開建立資料庫的好處。然而,新的外觀結合演算法也是一種基於相似 度的方法,所以利用其相似度相近者合併的原理,來輔助我們減低資料 量,而且不用考慮到影像資訊所獲得的順序,對於將來資料庫升級(update) 來說,有很大的助益,以下,就將其減低物體特徵面描述的機制,改成我 們減低場景影像資料的機制:
首先,先定義一些用於下列說明的符號,
V
new指的是新進來要建立資 料庫的某場景的某個影像,C
m是此物體資料庫中某場景的第m個角度之特 徵影像,C
mmin±1則是此新進來的影像與所有此場景資料庫中距離最近的那 個特徵影像的相鄰左右兩個特徵影像的角度,m
min代表此新進來的影像與 所有此場景的特徵影像中距離最近的那個特徵影像。接著列出此新的外觀結合演算法(用於場景資料庫建立)運作的步驟如 下:
1. 當有一個新進影像要建立某場景資料庫時,先判斷此時此場景中的 資料庫裡已存在多少個特徵影像。
2. 依據外觀的數目,來做其建立此場景的資料庫的動作。
(a)特徵影像的數目=0:
此新進來的影像直接形成一個外觀,且此特徵影像就是此新進來 的影像。
(b)特徵影像的數目=1 或 2:
若下式成立,則不增加新的特徵影像,且將此新進來的面直接併
min
(
,)
_1Cmd Vnew Cm threshold
all < (4-4)
若不符合上式,即此新進來的影像與所有此場景中的特徵面距離 最近的那一個距離比門檻值
threshold
_1大,而此時,此新進來的 影像就會形成一個新的特徵影像,且此新特徵影像的就是此新進 來的影像。(c)特徵影像的數目≧3:
設定兩個門檻值,來縮減資料量:
(
,)
_2 , _2 _1min
Cmd Vnew Cm threshold threshold threshold
all > > (4-5)
(
,)
_2(
,)
_2min 1
Cmd Vnew Cm threshold and dVnew Cmmin threshold
all < ± > (4-6)
若(4-5)或(4-6)其中一式成立且(4-4)式不成立,則此新進 來的影像就會形成一個新的特徵影像,且此新特徵影像就是此新 進來的影像。至於此新特徵影像的位置,則依據(4-7)式來判定,
若成立,則此新外觀加在
m
min和m
min−1兩個影像之間,反之,加在m
min和m
min+1兩個影像之間。
d ( V
new,C
mmin+1) (
>d V
new,C
mmin−1)
(4-7)若此時(4-5)或(4-6)兩式皆不成立或是(4-4)成立,則不增 加新的特徵影像,且將此新進來的影像直接併入此擁有最小距離 的特徵影像,且此特徵影像還是保持不變。
步驟2 的(c)的含義就是說,此新進來的影像與所有此場景的特徵影 像中距離最近的那一個距離,
1. 若比
threshold
_1小,則合併此新進來的影像。2. 若比
threshold
_1大、比threshold
_2小,則依據跟m
min左右兩個特徵 影像的關係來決定,也就是說跟m
min左右兩個特徵影像的距離都大則合併此新進來的影像。
3. 若比
threshold
_2大,則要用此新進來的影像新增一個特徵影像。所以,由上述步驟2 的(c)的說明可知,這兩個門檻值會影響整個新 的外觀結合演算法最後得到的結果,因此若希望適當的資料庫,則此處兩 個門檻值的設定就變的很重要。值得注意的是,
threshold
_1的值不能設定 的與threshold
_2的值比例差太大,否則會導致此場景的資料庫裡的特徵影 像的數目不斷的增加,而使得用來表達場景的特徵影像過度表達。而若2 _
threshold
設定的值越小,場景就會被表達的越細微,即特徵影像的數目會越多,當然此時用來表達場景也可能會過度表達。
如此可以透過上述的方式,將同一場景內不同角度所攝影到的點,透 過相似度的判定,而本論文採用的相似度是透過Kullback-Leibler 距離來量 測,利用KL 距離來跟兩個門檻值做比較;當兩個模型透過 EM 演算法建 立出來之後,要判別兩個模型是否都留下來,就再利用此機制,可以輕鬆 的幫助我們選擇適當的保留特徵影像來描述該場景的位置,而不必人工去 挑選資料庫,可以提升後段的辨識率,減低運算時間,更減少資料量,一 石三鳥,而唯一稍微需要嘗試的則是兩個門檻值的調變,將會影像資料庫 的大小與辨識的結果。而修改過後的結合演算法,其流程圖如下圖 21 所 示:
獲得新角度的影像
d V C threshold d V C ± threshold