第五章 視訊影片中運動物體之自動切割
5.3 自動區域運動估測與手動全域運動估測
圖 29:全域運動估測流程圖
5.3 自動區域運動估測與手動全域運動估測
圖 30 為自動區域運動估測與手動全域運動估測之視訊切割架構圖,為了對 圖 28(a)的Mobile 畫面做切割,首先使用 16×16 大小的區塊比對方法求得圖 28
(a)It與圖 28(b)It+1間的區域運動向量,因為Mobile 為 325×288 的影像,所 以一張影像共可切割成 396 個 16×16 的區塊。對於影像中的每一個區塊都必須使 用區塊比對求得一個區域運動向量,所以對於一張畫面共有 396 的區域運動向
量。區域運動向量的起點為 It畫面中現在處理區塊的左上角點座標,比對到 It+1 畫面中,區塊的左上角座標則為終點,以(
x′
l,
y′l )表示。圖 31(a)即為圖 28(a)參考圖 28(b),利用區塊比對後所找出的 396 個區域運動向量。
圖 30:自動區域運動估測與手動全域運動估測之視訊切割架構圖
PTZ 攝影機運動模型已經在 5.2 小節驗證過其準確性,為了攝影機參數之 正確性,我們仍然使用手動標示的對應點所求出攝影機參數。此參數已經在 5.2 小節求出,列於表 12 中。由於區域參數之估測是以區塊大小為基礎,所以全域 運動之估測亦以區塊大小為基礎,每一個區塊只需求得一個全域運動向量。在計 算全域運動向量時,起點同樣為 It畫面中現在處理區塊的左上角點座標,而全域 運動向量之終點求法即是將起點座標帶入(5.1)式求出,It+1畫面中上的全域運 動終點座標以(
x′ ,
gy′ )表示,圖 31(b)即為圖 28(a)參考圖 28(b)
g ,並 經過全域運動向量估測所找出的 396 個區域運動向量。(a) 區域運動向量 (b) 全域運動向量
圖 31:區域運動向量與全域運動向量
圖 32 為以區塊為基礎的區域運動向量與全域運動向量之示意圖,每一個區 塊皆會有一個全域運動向量與區域運動向量,兩個向量的起點皆為同一個,而終 點則會依照其差異程度而有遠近的關係,定義兩個向量的差異程度使用(5.3)
式估計:
d
motion= | x′ -
gx′ | + |
ly′ -
g y′l | (5.3)其中(
x′ ,
gy′ )代表全域運動終點座標,
g (x′ ,
l y′l )代表區域終點座標,dmotion表示區域運動向量與全域向量的差異程度,單位為像素。當 dmotion越大時,物體不 同於攝影機運動的機率越高,也就是說實際上物體本身是在運動的,此時就可被 劃分為前景;當 dmotion越小,物體相似攝影機運動的機率越高,此時真正的物體 是靜止不動的,物體看起來會運動的原因是因為攝影機的運動。由於區域運動估 計是以區塊為單位,所以後續的切割均是以區塊為單位。
圖 32:16×16 區塊之區域運動向量與全域運動向量
對於圖 28(a)所求出的 396 個 dmotion值如圖 33 所示,縱座標為區塊總個 數,每個橫軸 dmotion值所統計的是具有相同 dmotion值的區塊個數,從圖 33 可以 發現大多數的區塊集中在 dmotion為 1 與 dmotion為 5 附近,這表示畫面中有一群區 塊的區域運動向量與全域運動向量差異很小,而另外一群則差異很大。在切割影 像時,只要訂定一個 dmotion的臨界值即可對影像作切割,當 dmotion小於臨界值即 判斷為背景,dmotion 大於臨界值則判斷為前景。圖 34 為使用自動區域運動估測
與手動全域運動估測之切割結果,圖 34(a)為取臨界值 1.4,圖 34(b)為取 臨界值 3.4,圖中紅色方塊所遮罩的地方是被判斷為前景的區塊;在 Mobile 影 片中會自行運動的物體即月曆、球與火車,從圖中的結果可以看到有相當不錯的 初步切割,然而在前景和背景部分各有一些被誤判的地方,這是因為區域運動估 計之偏差所造成,在後續的章節我們會將雜訊去除而使得切割更加完整。圖 34
(a)與圖 34(b)雖然只有顯示臨界值 1.4 與 3.4 的結果,但是其實介於 1.4 與 3.4 間的臨界值之切割結果亦相當不錯。
Motion Difference Distribution
0 5 10 15 20 25 30 35
0.1 0.8 1.5 2.2 2.9 3.6 4.3 5 5.7 6.4 7.1 7.8 8.5 9.2 9.9 10.6 11.3 12 dmotion ( pixel )
# of Block
圖 33:Mobile 畫面之自動區域運動估測與手動全域運動估測 dmotion值
(a) threshold 1.4 (b) threshold 3.4 圖 34:Mobile 畫面切割結果之一