第五章 視訊影片中運動物體之自動切割
5.7 不同參數設定的影響與實驗結果
5.7.2 參考畫面 I t+1 的選取與切割結果之關係
在切割視訊影像時,dmotion之臨界值的選取會影響到切割的結果,為了達到 自動視訊切割之目的,必須要訂定一個合適的臨界值。另外,在想要切割的影像 中,雖然存在著不同運動的物體,但是物體的運動卻與攝影機運動非常相似,造 成求出的 dmotion差異不大,此時也會切割的不好,在本章節將對這些影響的因素 列入考慮,並分析實驗的結果。
5.7.1 運動向量差異 d
motion之臨界值選取
在切割的影像時
,
因為前景區域與背景區域在運動上有本質的差異,造成 前景部分的運動向量差異(dmotion)會較大,從前幾個小節的 dmotion 分佈圖可以 發現,前景區塊與背景區塊有各自的群聚效應,且兩個集團的 dmotion值有一定的 差異,造成在取臨界值時,有一段範圍的切割結果都相當不錯,所以很容易切割。另外在 5.2.2 小節中,我們用了三段不同的影片來評估 PTZ 模型之誤差,從實驗 結果也可以發現誤差多在 2 個像素以下,所以在自動切割時取臨界值為 2 是一個 可行的設定。
5.7.2 參考畫面 I
t+1的選取與切割結果之關係
每次進行切割時,共需要輸入兩個畫面,分別為“所要切割的畫面” It 與其“參 考畫面” It+1,圖 48 為 Mobile 影片中的六張影像,假設圖 48(a)為我們現在 所要切割的影像 It,而圖 48(b)至圖 48(f)可任選一張畫面做為我們參考的 影像 It+1。當然,亦可以選取其他的畫面當作參考影像,但是參考影像的選擇可 能影響到切割結果的好壞。
在前面的章節,為了簡化問題,我們不針對參考畫面的選擇做討論。從 5.2 至5.5 小節切割 Mobile 檔案時,均以圖 28(a)當作要切割的畫面 It,而圖 28
(b)則當成參考畫面 It+1。其實圖 28(a)即為圖 48(a),是 Mobile 檔案中的 第 0 張畫面,圖 28(b)則與圖 48(f)相同,為 Mobile 檔案中的第 6 張畫面。
為了瞭解不同參考畫面對切割結果的影響,圖 49 列出了利用不同參考畫面所產 生出來的區域運動向量與全域運動向量,其中圖 49 所顯示的全域運動向量是用 本論文在 5.5 小節所提出的方法,並取 loop10 的攝影機運動參數求得的結果,
由於所求得的全域運動向量並非整數,因此圖 49 的全域運動向量只顯示四捨五 入後的結果。從圖 49 可以發現參考畫面越靠近,各個物體的運動向量越小;另 外不管參考畫面的遠近,背景部分的區域向量與全域向量之差異 dmotion大多在兩 個像素以下(因為全域向量是利用背景部分的區域向量所求出,並且攝影機運動 模型的誤差在兩個像素以下);而前景的部分在參考畫面越遠離時,其區域向量 與全域向量的差異 dmotion較大,但是當參考畫面越近,由於某些物體的運動量會 變小,造成了這些物體的 dmotion也較小,若前景部分的 dmotion值小到兩個像素以 下,與背景部分混和在一起,此時就無法完整的從畫面中切割出前景。
如圖 50 所示,列出了使用不同參考畫面所求得的 dmotion分佈,在圖 50(a)
與圖 50(b)的 dmotion分佈,前景與背景並沒有分成兩個集團,其切割結果如圖 51(a)與圖 51(b)所顯示,並不是很理想。而圖 50(c)的 dmotion 分佈已逐 漸分成兩個集團,但是前景的集團並沒有完全大於 2 個像素,因此切割結果如圖 51(c)所示,仍有部分切割錯誤。最後,在圖 50(d)到圖 50(f)中的前景 集團開始逐漸遠離背景集團,因此可以很容易的切割出前景與背景,切割的結果 顯示在圖 51(d)到圖 51(f),由圖中可以看到切割的結果相當不錯。
(a) Frame 0 (b) Frame 1
(c) Frame 2 (d) Frame 3
(e) Frame 4 (f) Frame 6
圖 48:Mobile 影片中的六張影像
(a) 參考 Frame 1 所求得的區域運動向量 (b) 參考Frame 1 所求得的全域運動向量
(c) 參考 Frame 2 所求得的區域運動向量 (d) 參考Frame 2 所求得的全域運動向量
(e) 參考 Frame 3 所求得的區域運動向量 (f) 參考Frame 3 所求得的全域運動向量
(g) 參考 Frame 4 所求得的區域運動向量 (h) 參考Frame 4 所求得的全域運動向量
(i) 參考 Frame 6 所求得的區域運動向量 (j) 參考Frame 6 所求得的全域運動向量
(k) 參考 Frame 8 所求得的區域運動向量 (l) 參考Frame 8 所求得的全域運動向量 圖 49:使用不同參考畫面所求得的區域運動向量與全域運動向量
Motion Difference Distribution
dmotion ( pixel )# of Block
(a) 參考 Frame 1 所求得的
d
motionMotion Difference Distribution
0 dmotion ( pixel )
# of Block
(b) 參考 Frame 2 所求得的
d
motionMotion Difference Distribution
0 dmotion ( pixel )
# of Block
(c) 參考 Frame 3 所求得的
d
motionMotion Difference Distribution
dmotion ( pixel )# of Block
(d) 參考 Frame 4 所求得的
d
motionMotion Difference Distribution
0 dmotion ( pixel )
# of Block
(e) 參考 Frame 4 所求得的
d
motionMotion Difference Distribution
0 dmotion ( pixel )
# of Block
(f) 參考 Frame 8 所求得的
d
motion圖 50:使用不同參考畫面所求得的 dmotion分佈
(a) 參考 Frame 1 所得到的切割結果 (b) 參考Frame 2 所得到的切割結果
(c) 參考 Frame 3 所得到的切割結果 (d) 參考Frame 4 所得到的切割結果
(e) 參考 Frame 6 所得到的切割結果 (f) 參考Frame 8 所得到的切割結果 圖 51:使用不同參考畫面之自動切割結果
表 16:使用不同參考畫面時的切割正確率(共切割 50 張畫面)
多,精確度的影響就更為重要,因此,如果運動向量估計的不精確,就會造成較 差的切割結果。從表中可以看到當參考畫面由 2 改為 3 時,運動向量小於 1 的比 例大幅減少,而從參考畫面 3 改為參考畫面 4 時,運動向量小於 1 的比例減少了 約兩倍,而參考畫面為 4、6、8 時,隔了兩張畫面,減少的比例不到 2%,已經 有不錯的切割結果,因此當運動向量小於 1 的比例非常少,並且只有小幅度的減 少時,受到運動向量精確度不足的影響就會變小,也會有較好的切割結果,則此 時選擇的參考畫面是合適的。
表 17 中列出切割一張畫面所佔的時間為 3452 ms,其中區塊比對的時間佔 了大部分,共花了 2876 ms,而修正偏差的攝影機參數共花了 556 ms。由於視訊 壓縮時與切割時的區塊比對是相同的,因此若能整合在一起,也可以節省重複花 費的時間。
表 17:切割時間
切割時間 3452ms 區塊比對的時間 2876ms 更正攝影機運動參 數的時間(loop10)
556ms