修改過後的結合演算法

第四章資料庫集合與結合演算法

4.1 資料庫的建立

4.1.2 修改過後的結合演算法

一個畫面，即是一個物體，那再這個畫面附近變動的時後，勢必和繞著一個物體選轉拍攝，有異曲同工的效果，如圖 20 所示：

camera View angle

圖 20 利用攝影機選轉模仿多角度觀察物體

所以將上述演算法稍做改良，勢必對我們縮減資料量，有很大的助益。上述的概念是將一連串序列的影像，透過尋求最佳的特徵面，來描述該物體的外觀，然而仍存在幾個缺點

1. 每個物體在建立資料庫時，都必須使用 M 張照取樣順序排列的面，

即照拍攝角度由小到大排列的視角順序的面，才能代入演算法去建資料庫。

2. 由於此法假設取樣的物體的面是足夠多去表示此物體的，但實際上我們知道一個物體可能投影出的面是無限多的，所以，此假設是會有問題的，因此必須有一個可以更新資料庫的機制，使的資料庫變的更完善。不幸的是，此法若要更新資料庫，則必須把物體全部M 張面加上新進用來更新資料庫的面，重新按照拍攝角度由小到大排列的視角順序排好，全部再重新代入演算法去建資料庫，即無法簡單地一張一張的更新，而是不管有幾張要更新，都要加上之前的全部重算。

此法不致因物體的對稱性的關係而多出一些不必要的外觀，但這樣做還是不能完全避免不必要的外觀，例如像完全對稱的物體就還是會產生不必要的外觀。

因此有[27]提出的改善機制，他保留了 Cyr and Kimia 提出的外觀結合演算法分開建立資料庫的好處。然而，新的外觀結合演算法也是一種基於相似度的方法，所以利用其相似度相近者合併的原理，來輔助我們減低資料量，而且不用考慮到影像資訊所獲得的順序，對於將來資料庫升級(update) 來說，有很大的助益，以下，就將其減低物體特徵面描述的機制，改成我們減低場景影像資料的機制：

首先，先定義一些用於下列說明的符號，

V

_new指的是新進來要建立資料庫的某場景的某個影像，

C

_m是此物體資料庫中某場景的第m個角度之特徵影像，

C

mmin±₁則是此新進來的影像與所有此場景資料庫中距離最近的那個特徵影像的相鄰左右兩個特徵影像的角度，

m

^min代表此新進來的影像與所有此場景的特徵影像中距離最近的那個特徵影像。

接著列出此新的外觀結合演算法(用於場景資料庫建立)運作的步驟如下：

1. 當有一個新進影像要建立某場景資料庫時，先判斷此時此場景中的資料庫裡已存在多少個特徵影像。

2. 依據外觀的數目，來做其建立此場景的資料庫的動作。

（a）特徵影像的數目=0：

此新進來的影像直接形成一個外觀，且此特徵影像就是此新進來的影像。

（b）特徵影像的數目=1 或 2：

若下式成立，則不增加新的特徵影像，且將此新進來的面直接併

min

(

)

Cmd V_new C_m threshold

all < （4-4）

若不符合上式，即此新進來的影像與所有此場景中的特徵面距離最近的那一個距離比門檻值

threshold

_1大，而此時，此新進來的影像就會形成一個新的特徵影像，且此新特徵影像的就是此新進來的影像。

（c）特徵影像的數目≧3：

設定兩個門檻值，來縮減資料量：

(

)

_2 , _2 _1

min

Cmd V_new C_m threshold threshold threshold

all > > （4-5）

(

)

^_²

(

)

^_²

min ₁

C_md V_new C_m threshold and dV_new C_m^min threshold

all < _± > （4-6）

若（4-5）或（4-6）其中一式成立且（4-4）式不成立，則此新進來的影像就會形成一個新的特徵影像，且此新特徵影像就是此新進來的影像。至於此新特徵影像的位置，則依據（4-7）式來判定，

若成立，則此新外觀加在

m

^min和

m

^min⁻¹兩個影像之間，反之，加在

m

min和

m

^min+¹兩個影像之間。

d ( V

new^,

C

m^min₊₁

) (

d V

new^,

C

_m^min₋₁

)

（4-7）

若此時（4-5）或（4-6）兩式皆不成立或是（4-4）成立，則不增加新的特徵影像，且將此新進來的影像直接併入此擁有最小距離的特徵影像，且此特徵影像還是保持不變。

步驟2 的（c）的含義就是說，此新進來的影像與所有此場景的特徵影像中距離最近的那一個距離，

1. 若比

threshold

_1小，則合併此新進來的影像。

2. 若比

threshold

_1大、比

threshold

_2小，則依據跟

m

^min左右兩個特徵影像的關係來決定，也就是說跟

m

^min左右兩個特徵影像的距離都大

則合併此新進來的影像。

3. 若比

threshold

_2大，則要用此新進來的影像新增一個特徵影像。

所以，由上述步驟2 的（c）的說明可知，這兩個門檻值會影響整個新的外觀結合演算法最後得到的結果，因此若希望適當的資料庫，則此處兩個門檻值的設定就變的很重要。值得注意的是，

threshold

_1的值不能設定的與

threshold

_2的值比例差太大，否則會導致此場景的資料庫裡的特徵影像的數目不斷的增加，而使得用來表達場景的特徵影像過度表達。而若

2 _

threshold

設定的值越小，場景就會被表達的越細微，即特徵影像的數目

會越多，當然此時用來表達場景也可能會過度表達。

如此可以透過上述的方式，將同一場景內不同角度所攝影到的點，透過相似度的判定，而本論文採用的相似度是透過Kullback-Leibler 距離來量測，利用KL 距離來跟兩個門檻值做比較；當兩個模型透過 EM 演算法建立出來之後，要判別兩個模型是否都留下來，就再利用此機制，可以輕鬆的幫助我們選擇適當的保留特徵影像來描述該場景的位置，而不必人工去挑選資料庫，可以提升後段的辨識率，減低運算時間，更減少資料量，一石三鳥，而唯一稍微需要嘗試的則是兩個門檻值的調變，將會影像資料庫的大小與辨識的結果。而修改過後的結合演算法，其流程圖如下圖 21 所示：

獲得新角度的影像

d V C threshold d V C _± threshold

在文檔中利用空間高斯混合模型進行影像地標判定及輔助定位 (頁 49-54)

第四章 資料庫集合與結合演算法

4.1 資料庫的建立

4.1.2 修改過後的結合演算法

V

C

C

m

(

)

threshold

(

)

(

)

(

)

m

m

m

m

d ( V

C

) (

d V

C

)

threshold

threshold

threshold

m

m

threshold

threshold

threshold

threshold

第四章資料庫集合與結合演算法