研究目的 - 支援3-D立體視訊的數位電視多媒體平台設計(II)

深度圖(Depth map)經過現行視訊壓縮標準的編解碼後，將造成解碼重建後深度圖有不同程度的失真。這些失真可能會影響到最終虛擬影像的合成品質，例如在物體邊界的深度值發生錯誤時，可能明顯地造成主、客觀影像品質評量上的降低。因此，本子計畫針對重建後的深度圖對虛擬影像合成的影響，

提出一個單一像素之合成誤差的檢測模型。透過此模型之分析，可有效預測出每個像素可能造成的合成誤差。利用不同參照視角(Reference Views)畫面之間對應點關係，找出隱藏的深度資訊，並依此修正不可靠的深度像素 (Unreliable Depth Pixel)，使其在虛擬影像合成上可得到較好的品質。採用現行最新的視訊壓縮標準對原始深度圖(圖 27) 進行壓縮後，並再解碼重建深度圖 (圖 28)。主觀視覺比較上，可在圖 27 與圖 28 看見明顯的落差，例如圖 28 中，人背上的深度影像產生明顯的區塊效應(Block Effect)。

目前 MPEG 標準制定小組已出現兩篇於接收端修正深度圖的演算法：第一篇由 Tanimoto 提出，其利用合成相鄰參照視角時的合成誤差，以 Linear Prediction 的方式，推測出虛擬視角可能的合成誤差，最後將此預測出來的合成誤差補回虛擬視角之合成影像；第二篇由 Sung 提出，其利用合成虛擬視角時，來自不同參照畫面的亮度值與深度值的差值，若此差值越過某個門檻值，則判定此深度值需要被修正；其次，此方法為每個 Connected Component 找出一個最佳的深度值偏量，使得合成誤差可以降到最低。然而，上述方法未考慮深度值壓縮的情況，兩者皆無法根據不同的壓縮品質進行調整，造成修改的效能嚴重受到壓縮之品質所影響。

為解決上述問題，子計畫三設計一個單一像素之合成誤差的檢測模型，於理論上分析虛擬影像合成時，所有可能影像合成品質的因素。根據 Depth-Image-Based Rendering(DIBR)描述參照視角和虛擬視角的對應點關係，如公式(1)：

1 : 1 1 1 Z





     

      

   

p p p

A RA A T



(1)

其中

p

和

p 

分別為參照視角和虛擬視角的對應點座標，R 和 T 為虛擬相機的旋 轉矩陣與位移向量，

A

和

A 

分別為參照相機和虛擬相機的相機內部參數，本

文以

 p ( ; Z

)

簡化表示公式(1)之運算子。在深度圖沒有失真的情況下，可確保

p  ( ; p Z

)

，且亮度值相同

I

_T( )p

I

_R( )p ；若深度圖有失真(

Z

_p加上雜訊，



p p

Z   Z n

)，以

q  ( ; p Z ^

)

表示，則合成誤差

可由泰勒展開式逼近：

 

2 2

( ) ( ) ( ( ) ( )) ( ) ( ) ( ) ( )

( ) ( )

p R T R R

R R R

I I I I

I I I

I

     

    

   

p q p q

p p p q p

p q p

(2)

其中

^q ^

^¹

  ^q ^ ^; ^Z

^q ^，^{ p 為}

^I

^R^{( )}

^p

的 Gradient。利用

p

、

q

和

q 

三點的關係

   Z

  Z

 n





 q; p;

q'

，可將

( q p  )

可表示為公式(3)：

圖27. 原始深度圖. 圖28. 解碼後之深度圖.

 

( ) ^p

q p p

n Z Z n

  

q p  c (3)

其中



2 2 1





 

c I 0 AR T 。將

( q p  )

帶入公式(2)，並導出下式：

  ^

2 p

p R

q p p

n I

Z Z n

  ^ ^  ^ ^

  

 

p c 

(4)

在 MPEG FTV 的水平相機設置的限定下，位移矩陣只含水平方向之分量，因此可將公式(4)簡化為下式：

  ^

2 2

p x

q p p

n g c

Z Z n

  ^ ^ ^ ^  

  

 

p

(5)

其中

g

²x



p 為 p 的水平分量。因此，假設有真實(Ground-truth)深度資

I



訊的情況下，計算出合成影像誤差的條件期望值：

 

Depth Value、Virtual Camera Location。本文給定公式(6)各種不同的參數設定，並將結果描繪於圖 29 中，並提出四項詳細之觀察：

Expected Synthesis Distortion

圖29. Measuring the depth-error sensitivity under various settings of

Z

_q and

g

²_x

 p

圖30. A geometrical interpretation of the effect of

Z

_q on depth-error sensitivity. 差的檢測模型(Per-pixel Synthesis Distortion Model)。透過此模型之分析，可有效預測出每個像素可能造成的合成誤差，並在傳送端計算修改深度圖後可能的合成誤差，使其在接收端之虛擬影像合成上，可得到主客觀視覺品質的提升。

在文檔中支援3-D立體視訊的數位電視多媒體平台設計(II) (頁 23-26)

研究目的

1

: 1 1 1 Z



     

      

   

p p p

A RA A T



p

p 

A

A 

 p ( ; Z

)

p  ( ; p Z

)

I

I

Z



Z   Z n

q  ( ; p Z 

)

可由泰勒展開式逼近：

 

 

 

( ) ( ) ( ( ) ( )) ( ) ( ) ( ) ( )

( ) ( )

I I I I

I I I

I

     

    

   

p q p q

p p p q p

p q p

q 

  q  ; Z

I

p

p

q

q 

   Z

  Z

 n





 q; p;

q'

( q p  )

 

n Z Z n





( q p  )

  

n I

Z Z n

      

  

 

p c 

  

n g c

Z Z n

       

  

 

p

g



I



 

Z

q  ( ; p Z ^

^q ^

  ^q ^ ^; ^Z

^I

^p

  ^

  ^ ^  ^ ^

  ^

  ^ ^ ^ ^  