快速區塊比對

第四章手部追蹤

4.3 快速區塊比對

在區塊比對法部分，本論文採用影像金字塔與快速區塊比對搭配的方式來達

到加速的目的。

4.3.1 影像金字塔

影像金字塔的觀念是由上而下，逐步逼近來找尋匹配的位移候選點位置的技巧，一來是因為縮小後的影像所建立的樣板區塊所包含的資訊較為豐富，二來是可達到使用較少的搜尋次數來獲得大範圍搜尋的目的。影像金字塔會將原始影像縮小倍率成較小的影像，根據本論文所設定的層數來依序產生縮小影像。將時間連續的前一張影像 A 與當前影像 B 做縮小處理後，計算原始影像 B 中特徵點投影在各個縮小影像中的位置，來當作該階層樣板區塊的中心位置，而每一層的樣板區塊面積大小皆相同。接著從目前縮小影像中最小張的影像開始﹝即為影像金字塔最頂層﹞，將投影到縮小影像 B 的特徵點位置對應在同一層的影像 A 上，

再以該對應點為搜尋中心，建立搜尋區域來作區塊比對，其結果為目前影像 B 之特徵點在縮小影像上，於前一張影像 A 縮小後的移動位置。

在影像金字塔頂層找到縮小影像 B 的投影特偵點對應在縮小影像 A 的位移點之後，本論文將該位移點向下投影在影像 A 下一層較大的影像上，來獲得新的搜尋區域中心，分別對同一層的影像 B 的每一個樣板區塊做區塊比對，來獲得更準確的位移量，而影像 A 所建立的搜尋區域在每一層都是相同的大小。根據新的位移量來更新位移點的位置，並重複向下投影，直到在原始影像 A 上做完區塊比對為止。執行的順序如下圖 20 所示：

右圖紅色方框表示樣板區塊，左圖黃色方塊表示搜尋區域綠色表示上一層對應的搜尋範圍。

圖20、影像金字塔的執行順序與區塊示意圖

本論文使用兩層的影像金字塔，倍率為 0.5，即表示縮小影像為原始影像的四分之一。由於本論文在每一層影像金字塔中使用固定大小的搜尋範圍，所以影像金字塔在影像縮小後，所搜尋的範圍是原始影像的四倍大小，因執行兩次同面積搜尋，相較傳統全域搜尋(Full Search)約能夠減少一半的搜尋時間。

4.3.2 區塊比對

本論文在快速區塊比對採用空間強度分佈法 [10](Spatial Intensity Distribution)來做為特徵比對的部分，它是利用樣板區塊(Template Block)的幾何分佈在搜尋區域內的強度來加速的方式，下面將介紹其設計原理。

比較下圖 21 中的 Block1 與 Block2，能找出共有 6 處不同和 10 處相同的位置，其不同的地方並不是透過複雜的計算而來，而是單純的比較數值是否相同。

圖21、 Block1(左) 與 Block2(右)

這種差異比較的方法類似 MPC(Matching Pel Count)的使用門檻值為 0 的情 況：

𝑀𝑃𝐶 𝑥, 𝑦, 𝑢, 𝑣 = 𝑇 𝑥, 𝑦, 𝑢, 𝑣, 𝑖, 𝑗

𝑁

𝑗 =1 𝑁

𝑖=1

𝑇 𝑥, 𝑦, 𝑢, 𝑣, 𝑖, 𝑗

= 1, if 𝐼_𝑡−1 𝑥 + 𝑖, 𝑦 + 𝑗 − 𝐼_𝑡 𝑥 + 𝑢 + 𝑖, 𝑦 + 𝑣 + 𝑗 < 𝑇𝑕

0, otherwise

式子中，(𝑥, 𝑦)為 t-1 時刻的影像上的座標，(𝑢, 𝑣)為位移向量，(𝑖, 𝑗)為樣板區塊 的掃描引索，其樣板區塊所使用的寬度與高度皆為 N。𝑇 𝑥, 𝑦, 𝑢, 𝑣, 𝑖, 𝑗 表示在 t-1 時刻的影像上，以(𝑥, 𝑦)作為樣板區塊的基準點，平移(𝑖, 𝑗)的像素點與在 t 時刻的影像位移(𝑢, 𝑣)後，於(𝑥 + 𝑢, 𝑦 + 𝑣)上作為基準點，平移(𝑖, 𝑗)的像素點是否有相同，當兩像素誤差低於誤差門檻值𝑇𝑕時，則判定(𝑢, 𝑣)相同，否則則認為其不相似。所以𝑀𝑃𝐶 𝑥, 𝑦, 𝑢, 𝑣 為 t-1 時刻的影像上(𝑥, 𝑦)位置在 t 時刻的影像上位移(𝑢, 𝑣) 的相似分數，越高則表示兩者越像。根據這一點，空間強度分佈以下式做為加速根據：

𝑀𝑃𝐶 𝑥, 𝑦, 𝑢, 𝑣 ≥ 𝑅 × 𝑁²

式子中 R 為匹配相似度，𝑁²為總分。調整參數 R 可以控制匹配程度的品質，用 來產生匹配分數底標，以做為所能接受的匹配程度門檻值，下面將講解其加速設

計。

首先將匹配計算中所有會使用到的像素灰度值，建立出一個直接定址表 (Direct-Address Table)，藉由這個定址表，將能夠直接的取得所有具有相同灰階值的像素座標，如下圖 22 所示。

圖22、 Direct-address table 範例

接著利用相對座標的計算來取得基準點的位置，以圖 23 為例子，樣板區塊中，

當(i, j) = (1,0)時，它的灰階值為 45，而搜尋區域 (u,v)=(3,1)的灰階值也是 45，若 這兩點是對應點時，則基準點位置 (U,V)的計算方法就成為 (u-i , v-j)，即 (3-1,1-0)=(2,1)。

圖23、樣板區塊與搜尋影像

在獲得基準點之後，需要一個投票暫存器，以儲存匹配的投票結果，對樣板區塊每個像素來做投票。首先從樣板區塊中(0, 0) 開始，取出其灰階值後，藉由查詢直接定址表來取得誤差在門檻值(初始為 0)內所有灰階值的位置座標，然後

根據前面計算基準點的方法得到個別對應的基準點(U, V)，並在投票暫存器中(U, V)的位置投票，如圖 24 所示。

圖24、投票暫存器投票過程

若投票分數有兩個以上的基準點超過底標分數，則對這些基準點做 SSD 或 SAD 來找出最小匹配誤差。演算法中誤差門檻值 Th 為 MPC 匹配的門檻值，會 隨著匹配過程發生找不到候選點時而遞增，直到找到等於或超過底標分數為止，

如圖 25 所示。

圖25、迴圈結構中誤差門檻值改變造成的投票結果

4.3.3 以 LBP 為特徵的空間強度分佈演算法

在原來的做法中，它是以灰度值影像來運算，而論文則是依據 LBP 影像，

來做為空間強度分佈的輸入影像，因此必頇將原來的加速方法做一些調整，才能有效的計算 LBP 影像間的距離。圖 26 為本論文所設計的空間強度分佈演算流程：

圖26、適用於 LBP 影像的空間強度分佈演算法

對於一個特徵點，調整後的空間強度分佈演算法所需的輸入包含(1)目前的 LBP 影像，(2)前一張的 LBP 影像，(3)特徵點的位置和(4)搜尋區域的中心位置。

在本論文中採用的樣板區塊大小為 11× 11，搜尋區域為 17× 17。

演算法開始前會以搜尋中心建立搜尋區域中 LBP 影像的直接定址表 (Direct-Address Table)以及 LBP 數值的 XOR 誤差表。直接定址表的功能在於紀錄前一張 LBP 影像中位於搜尋區域內，所包含的不同 LBP 數值的所有位置資訊；

而 LBP 數值 XOR 誤差表則是記錄在每一個漢明距離的誤差下所有可能的 LBP 數值。下面圖 27 為 LBP 數值 XOR 誤差表的示意圖。

圖27、 LBP 數值 XOR 誤差表範例

演算法會依序將目前 LBP 影像的特徵點為中心建立樣板區塊，並依序從樣板區塊中計算他們的 LBP 數值，透過查詢 XOR 誤差表中漢明距離為 0 的數值，

在搜尋區域內以直接定址表來取出與樣板區塊中所包含的每一個 LBP 數值的所有可能對應位置對應的 LBP 數值位置，並於計算基準點後，在投票暫存器內投票。

當樣板區塊內的數值皆完成投票動作後，檢查投票暫存器中，是否有基準點的得票量超過本論文所設定的門檻值。若暫存器內的得票量都沒有超過門檻值，

則將漢明距離放寬加 1，重新再做投票，並將新的得票量再加入投票暫存器；若暫存器內有一個點的數值超過門檻值，則將該點輸出做為匹配點；若暫存器內有多個點超過門檻值，則使用 SAD 來做篩選，將輸出最小誤差者做為匹配點。

假設(𝑥₁, 𝑦₁)為在當前畫面中的一個特徵點位置，而(𝑥₂, 𝑦₂)為此特徵點在上一畫面經上述區塊比對所得到的最佳對應點位置，則此特徵點的相對移動向量 (𝑢, 𝑣)即為𝑢 = 𝑥₁− 𝑥₂和𝑣 = 𝑦₁− 𝑦₂。

在文檔中中華大學 (頁 39-46)

第四章 手部追蹤

4.3 快速區塊比對

4.3.1 影像金字塔

4.3.2 區塊比對

4.3.3 以 LBP 為特徵的空間強度分佈演算法

第四章手部追蹤