• 沒有找到結果。

第四章 資料庫集合與結合演算法

4.1 資料庫的建立

4.1.2 修改過後的結合演算法

一個畫面,即是一個物體,那再這個畫面附近變動的時後,勢必和繞著一 個物體選轉拍攝,有異曲同工的效果,如圖 20 所示:

camera View angle

圖 20 利用攝影機選轉模仿多角度觀察物體

所以將上述演算法稍做改良,勢必對我們縮減資料量,有很大的助益。上 述的概念是將一連串序列的影像,透過尋求最佳的特徵面,來描述該物體 的外觀,然而仍存在幾個缺點

1. 每個物體在建立資料庫時,都必須使用 M 張照取樣順序排列的面,

即照拍攝角度由小到大排列的視角順序的面,才能代入演算法去建 資料庫。

2. 由於此法假設取樣的物體的面是足夠多去表示此物體的,但實際上 我們知道一個物體可能投影出的面是無限多的,所以,此假設是會 有問題的,因此必須有一個可以更新資料庫的機制,使的資料庫變 的更完善。不幸的是,此法若要更新資料庫,則必須把物體全部M 張面加上新進用來更新資料庫的面,重新按照拍攝角度由小到大排 列的視角順序排好,全部再重新代入演算法去建資料庫,即無法簡 單地一張一張的更新,而是不管有幾張要更新,都要加上之前的全 部重算。

此法不致因物體的對稱性的關係而多出一些不必要的外觀,但這樣 做還是不能完全避免不必要的外觀,例如像完全對稱的物體就還是 會產生不必要的外觀。

因此有[27]提出的改善機制,他保留了 Cyr and Kimia 提出的外觀結合演算 法分開建立資料庫的好處。然而,新的外觀結合演算法也是一種基於相似 度的方法,所以利用其相似度相近者合併的原理,來輔助我們減低資料 量,而且不用考慮到影像資訊所獲得的順序,對於將來資料庫升級(update) 來說,有很大的助益,以下,就將其減低物體特徵面描述的機制,改成我 們減低場景影像資料的機制:

首先,先定義一些用於下列說明的符號,

V

new指的是新進來要建立資 料庫的某場景的某個影像,

C

m是此物體資料庫中某場景的第m個角度之特 徵影像,

C

mmin±1則是此新進來的影像與所有此場景資料庫中距離最近的那 個特徵影像的相鄰左右兩個特徵影像的角度,

m

min代表此新進來的影像與 所有此場景的特徵影像中距離最近的那個特徵影像。

接著列出此新的外觀結合演算法(用於場景資料庫建立)運作的步驟如 下:

1. 當有一個新進影像要建立某場景資料庫時,先判斷此時此場景中的 資料庫裡已存在多少個特徵影像。

2. 依據外觀的數目,來做其建立此場景的資料庫的動作。

(a)特徵影像的數目=0:

此新進來的影像直接形成一個外觀,且此特徵影像就是此新進來 的影像。

(b)特徵影像的數目=1 或 2:

若下式成立,則不增加新的特徵影像,且將此新進來的面直接併

min

(

,

)

_1

Cmd Vnew Cm threshold

all < (4-4)

若不符合上式,即此新進來的影像與所有此場景中的特徵面距離 最近的那一個距離比門檻值

threshold

_1大,而此時,此新進來的 影像就會形成一個新的特徵影像,且此新特徵影像的就是此新進 來的影像。

(c)特徵影像的數目≧3:

設定兩個門檻值,來縮減資料量:

(

,

)

_2 , _2 _1

min

Cmd Vnew Cm threshold threshold threshold

all > > (4-5)

(

,

)

_2

(

,

)

_2

min 1

Cmd Vnew Cm threshold and dVnew Cmmin threshold

all < ± > (4-6)

若(4-5)或(4-6)其中一式成立且(4-4)式不成立,則此新進 來的影像就會形成一個新的特徵影像,且此新特徵影像就是此新 進來的影像。至於此新特徵影像的位置,則依據(4-7)式來判定,

若成立,則此新外觀加在

m

min

m

min1兩個影像之間,反之,加在

m

min

m

min+1兩個影像之間。

d ( V

new,

C

mmin+1

) (

>

d V

new,

C

mmin1

)

(4-7)

若此時(4-5)或(4-6)兩式皆不成立或是(4-4)成立,則不增 加新的特徵影像,且將此新進來的影像直接併入此擁有最小距離 的特徵影像,且此特徵影像還是保持不變。

步驟2 的(c)的含義就是說,此新進來的影像與所有此場景的特徵影 像中距離最近的那一個距離,

1. 若比

threshold

_1小,則合併此新進來的影像。

2. 若比

threshold

_1大、比

threshold

_2小,則依據跟

m

min左右兩個特徵 影像的關係來決定,也就是說跟

m

min左右兩個特徵影像的距離都大

則合併此新進來的影像。

3. 若比

threshold

_2大,則要用此新進來的影像新增一個特徵影像。

所以,由上述步驟2 的(c)的說明可知,這兩個門檻值會影響整個新 的外觀結合演算法最後得到的結果,因此若希望適當的資料庫,則此處兩 個門檻值的設定就變的很重要。值得注意的是,

threshold

_1的值不能設定 的與

threshold

_2的值比例差太大,否則會導致此場景的資料庫裡的特徵影 像的數目不斷的增加,而使得用來表達場景的特徵影像過度表達。而若

2 _

threshold

設定的值越小,場景就會被表達的越細微,即特徵影像的數目

會越多,當然此時用來表達場景也可能會過度表達。

如此可以透過上述的方式,將同一場景內不同角度所攝影到的點,透 過相似度的判定,而本論文採用的相似度是透過Kullback-Leibler 距離來量 測,利用KL 距離來跟兩個門檻值做比較;當兩個模型透過 EM 演算法建 立出來之後,要判別兩個模型是否都留下來,就再利用此機制,可以輕鬆 的幫助我們選擇適當的保留特徵影像來描述該場景的位置,而不必人工去 挑選資料庫,可以提升後段的辨識率,減低運算時間,更減少資料量,一 石三鳥,而唯一稍微需要嘗試的則是兩個門檻值的調變,將會影像資料庫 的大小與辨識的結果。而修改過後的結合演算法,其流程圖如下圖 21 所 示:

獲得新角度的影像

d V C threshold d V C ± threshold