自動區域運動估測與手動全域運動估測 - 視訊影片中運動物體之自動切割

第五章視訊影片中運動物體之自動切割

5.3 自動區域運動估測與手動全域運動估測

圖 29：全域運動估測流程圖

5.3 自動區域運動估測與手動全域運動估測

圖 30 為自動區域運動估測與手動全域運動估測之視訊切割架構圖，為了對圖 28（a）的Mobile 畫面做切割，首先使用 16×16 大小的區塊比對方法求得圖 28

（a）I_t與圖 28（b）I_t+1間的區域運動向量，因為Mobile 為 325×288 的影像，所以一張影像共可切割成 396 個 16×16 的區塊。對於影像中的每一個區塊都必須使用區塊比對求得一個區域運動向量，所以對於一張畫面共有 396 的區域運動向

量。區域運動向量的起點為 I_t畫面中現在處理區塊的左上角點座標，比對到 I_t+1 畫面中，區塊的左上角座標則為終點，以（

x′

,

y′_l ）表示。圖 31（a）即為圖 28

（a）參考圖 28（b），利用區塊比對後所找出的 396 個區域運動向量。

圖 30：自動區域運動估測與手動全域運動估測之視訊切割架構圖

PTZ 攝影機運動模型已經在 5.2 小節驗證過其準確性，為了攝影機參數之正確性，我們仍然使用手動標示的對應點所求出攝影機參數。此參數已經在 5.2 小節求出，列於表 12 中。由於區域參數之估測是以區塊大小為基礎，所以全域運動之估測亦以區塊大小為基礎，每一個區塊只需求得一個全域運動向量。在計 算全域運動向量時，起點同樣為 I_t畫面中現在處理區塊的左上角點座標，而全域 運動向量之終點求法即是將起點座標帶入（5.1）式求出，It+1畫面中上的全域運動終點座標以（

x′ ,

y′ ）表示，圖 31（b）即為圖 28（a）參考圖 28（b）

_g ，並經過全域運動向量估測所找出的 396 個區域運動向量。

(a) 區域運動向量 (b) 全域運動向量

圖 31：區域運動向量與全域運動向量

圖 32 為以區塊為基礎的區域運動向量與全域運動向量之示意圖，每一個區塊皆會有一個全域運動向量與區域運動向量，兩個向量的起點皆為同一個，而終點則會依照其差異程度而有遠近的關係，定義兩個向量的差異程度使用（5.3）

式估計:

d

_motion

= | x′ -

x′ | + |

y′ -

_g y′_l | （5.3）

其中（

x′ ,

y′ ）代表全域運動終點座標，

_g （

x′ ,

_l y′_l ）代表區域終點座標，d_motion表

示區域運動向量與全域向量的差異程度，單位為像素。當 d_motion越大時，物體不同於攝影機運動的機率越高，也就是說實際上物體本身是在運動的，此時就可被 劃分為前景；當 d_motion越小，物體相似攝影機運動的機率越高，此時真正的物體是靜止不動的，物體看起來會運動的原因是因為攝影機的運動。由於區域運動估計是以區塊為單位，所以後續的切割均是以區塊為單位。

圖 32：16×16 區塊之區域運動向量與全域運動向量

對於圖 28（a）所求出的 396 個 dmotion值如圖 33 所示，縱座標為區塊總個 數，每個橫軸 d_motion值所統計的是具有相同 d_motion值的區塊個數，從圖 33 可以 發現大多數的區塊集中在 dmotion為 1 與 dmotion為 5 附近，這表示畫面中有一群區塊的區域運動向量與全域運動向量差異很小，而另外一群則差異很大。在切割影 像時，只要訂定一個 dmotion的臨界值即可對影像作切割，當 dmotion小於臨界值即 判斷為背景，d_motion 大於臨界值則判斷為前景。圖 34 為使用自動區域運動估測

與手動全域運動估測之切割結果，圖 34（a）為取臨界值 1.4，圖 34（b）為取臨界值 3.4，圖中紅色方塊所遮罩的地方是被判斷為前景的區塊；在 Mobile 影片中會自行運動的物體即月曆、球與火車，從圖中的結果可以看到有相當不錯的初步切割，然而在前景和背景部分各有一些被誤判的地方，這是因為區域運動估計之偏差所造成，在後續的章節我們會將雜訊去除而使得切割更加完整。圖 34

（a）與圖 34（b）雖然只有顯示臨界值 1.4 與 3.4 的結果，但是其實介於 1.4 與 3.4 間的臨界值之切割結果亦相當不錯。

Motion Difference Distribution

0 5 10 15 20 25 30 35

0.1 0.8 1.5 2.2 2.9 3.6 4.3 5 5.7 6.4 7.1 7.8 8.5 9.2 9.9 10.6 11.3 12 dmotion ( pixel )

# of Block

圖 33：Mobile 畫面之自動區域運動估測與手動全域運動估測 dmotion值

(a) threshold 1.4 (b) threshold 3.4 圖 34：Mobile 畫面切割結果之一

在文檔中利用階層分解之視訊壓縮 (頁 52-57)

自動區域運動估測與手動全域運動估測

第五章 視訊影片中運動物體之自動切割

5.3 自動區域運動估測與手動全域運動估測

5.3 自動區域運動估測與手動全域運動估測

x′

,

x′ ,

y′ ）表示，圖 31（b）即為圖 28（a）參考圖 28（b）

d

= | x′ -

x′ | + |

y′ -

x′ ,

y′ ）代表全域運動終點座標，

x′ ,

Motion Difference Distribution

第五章視訊影片中運動物體之自動切割