第三章 方法及步驟
3.3 加速搜索動態區域
法的 Efficient Subwindows Search(ESS)[12]不僅可對一個區域內任何大小的範圍 搜索,亦可達到加速搜索的目的。
如圖 3.3.1 所示,ESS 使用四個區間(T, B, L, R)來定義一組矩形,其中小矩 形(thi, blo, lhi, rlo)為最小可能區域,大矩形(tlo, bhi, llo, rhi)為最大可能區域,並 藉由大矩形與小矩形之間的四個區間來決定一組矩形的位置。每次分支均選擇區 間最大的一段來分割(Branch),分割完後,個別計算彼此的界限(Bound)放入優 先權佇列(Priority Queue),以界限為優先權來決定下次分支的順序。而當搜索的 矩形唯一,也就是當最大可能區域與最小可能區域之四個區間為零時,即完成搜 尋。
圖 3.3.1:2-D 高效子視窗搜尋示意圖
在本論文中,我們將 ESS 延伸至三維空間,圖 3.3.2 為一示意圖,我們將時 間的維度以兩段區間(S, E)取代兩個時間點,但若是直接將 ESS 延伸至三維則 ESS 的維度將變成六維,如此一來分支的複雜度變高,反而會降低搜索的效率。
因此,做法上會拆成兩個部分,(1)先以 ESS 對二維平面搜索,(2)再以 ESS 對一 維時間搜索,如圖 3.3.3 所示,每當在二維平面上搜索到一塊區域時則對其找一 維時間中最佳的區塊。接著計算每一個區域最佳的界限,同樣以此界限當作優先 權放入優先權佇列,每次皆選擇優先權最高的區域做下一次分支,直到找到最佳 區域為止。
圖 3.3.2:3-D 高效子視窗搜尋示意圖一
圖 3.3.3:3-D 高效子視窗搜尋示意圖二 3.3.2 界限函數
由於 ESS 基於分支界定演算法,每次分支需對分割後的區域計算界限值,而 本研究使用的方法皆需要計算上界,故本小節將會對我們提出的三個想法分別介 紹上界函數。首先,上界函數需滿足以下特性:
(1) ,
(2) .
其中, 為上界函數, 為目標函數。特性(1)表示, 為 的上界。特性(2)表
示,當最大可能區塊與最小可能區塊相等時, 為最佳解。
對於運動量最大區域,我們以運動量來描述一部影片,故影片中每張影像的 每一個點所代表的意義為,該點從時間 t 到時間 t+1 的運動量,而我們會將影片 中運動量太小或沒有運動量的點標記為負。其上界值的計算方法如圖 3.3.4 所示,
紅色框為最大可能矩形 ,黃色框為最小可能矩形 ,且
,則上界值的計算方式為,將最小可能矩形中的最佳區塊 (黃色區 塊)與不屬於最小可能矩形,但屬於最大可能矩形的位置中的最佳區塊 (綠 色區塊)相加。因此,上界函數的運算形式如下:
公式 3.7
圖 3.3.4:運動量最大區域之上界值計算示意圖
對於運動方向不同區域,我們使用八個方向來表示影像的運動方向,並利用 卡方距離計算兩個直方圖之間的差異性,來決定與整體運動方向相差最大的區域。
關於上界值的計算,首先用公式 3.8 及公式 3.9 對每一個 bin 做正規化,其目的在
於使 ,以計算每一個 bin 的上界,其中 屬於最小可能區塊, 屬
圖 3.3.5: 之曲線圖