B ACKGROUND - 可調視訊編碼多層編碼控制的快速演算法理論的位元與失真關係函數初步分析

CHAPTER 1. INTRODUCTION

1.1. B ACKGROUND

考慮多變容量的不同設備，和各類型網路所傳遞的視訊內容，在許多應用中可調性已經是很重要的性質，基於這個理由，Joint Video Team (JVT)以 H.264/AVC 為基礎，標準化了 Scalable Video Coding (SVC)[1]，SVC 支援了在單一的 Bitstream 中擁有 spatial，

temporal，SNR 和它們組合起來的可調性，且此 Bitstream 可只具備其中幾樣特性，如只有解析度或畫質的差別。空間和畫質的不同可以在不同層間展現，而時間性是以一種有等級制的方法表現，這點和 H.264/AVC 幾乎是一樣的。因為一次編碼多層可以使 Rate 有適當的減少，且依然維持理想的畫質，SVC 提供了具適應性層與層間猜測的方法 (Inter-Layer Prediction Mechanism) ，此方法可以盡可能的重複使用較低層資訊。

Figure 1.1 The definition of MB Pair (from Lin’s thesis)

為了決定基層(Base Layer, BL)和增進層(Enhancement Layer, EL)的mode，Joint Scalable Video Model (JSVM)[2]採用一種由下到上編碼方法(Bottom-up Encoder Control, BUEC)。這方法是在決定BL的編碼方式時，只有考慮BL的內容而不考慮較高的EL，同理，較低的EL在決定編碼方式時，不會考慮到較高的EL。由於BUEC具有比單一層編碼 (Single-Layer Coding)較無法預期或不規則的Rate-Distortion (R-D)，通常較高的EL會比較低層有更多的編碼損失，像是Distortion，是由於BUEC以循序的方式進行Mode Decision 而導致這樣的結果。

想解決上一段所描述的問題，Schwarz et al. [3]提供了一種可以在BL和EL間給予適 當權重的方法，稱之多層編碼控制(Multi-loop Encoder Control, MLEC)，在做分割分式的決定時，BL使用權重式的Lagrangian成本決策方法。就如Figure 1.1顯示的，在MLEC做分割方式決策時的基本單位是一對Macroblock (MB)的組合，分別來自BL和EL相對位置的MB，對於每一對MB Pair，它們的分割方式有BL和EL分割方式的Cartesian Product組，

一共有56組Mode Pair，比起BUEC這明顯是很大的計算量，所以對MLEC來說，一個好的快速決策演算法就顯得必要。

為了減少編碼時間，在H.264/AVC和SVC中已經有為數不少的快速演算法被提出。

H.264中，Kannangara et al.[12]基於所提出的Lagrangian Cost函數判斷是否及早決定編碼 為Skip mode，Kim et al.[13]利用current MB的資訊計算出三種特性，用這些特性及早決 定編碼為Intra或Inter mode，Kim et al.[14]以reference frame中co-located mode決定current mode的candidate mode，Ri et al.[15]同時以spatial和temporal的mode決定current mode的 candidate mode。而SVC中,像是Yeh et al.[16]中利用BL co-located mode和EL周圍mode來 預測current mode，並提出一套及早決定mode的判斷方式，Kim et al.[17]用BL中co-located MB和其周圍MB，對不同的mode和所在位置給於適當的權重計算出一個值，並同時利用這值和BL mode一同決定candidate mode。

Figure 1.2 Schwarz’s 的快速演算法在選擇 Dominant Mode Pair 時的規則

目前根據 MLEC 所設計的快速演算法非常少，其中以 Schwarz et al.[3]所提出的快 速演算法為主。其做法是當 BL 的 MB 做 Mode Decision 時，每一個 mode 都會有一個 EL 的 mode 做為配對，此種配對稱為 Dominant Mode Pair (DMP)。配對方法是當 BL 選擇 Inter/Intra 的 mode 時，EL 選擇 BLskip/IntraBL 做為預測(如 Figure 1.2)，然後 BL 利用這組配對去計算 R-D cost，並選擇 R-D cost 最小的做為 BL 的 mode。最後在 EL 中對應的 MB，再根據 BL 選定好的 mode 去做徹底式搜尋，找出 R-D cost 最小的 mode 做壓縮。但此方法存在一些嚴重的問題：

I. 在[3]中所提的MLEC多目標最佳化問題中，其限制會因為權重的設定而改變。而這限制的改變將會在權重較高的情況下，造成不理想的R-D performance。詳細內容會在2.2.2(A)提及。

II. 在選擇BL中每一個MB的mode時，都是使用Figure 1.2中的7組配對組合去做計算，

並不會依照sequence的特性做調整。這種配對方式太過於單調，不具任何可調性。

III. 此7組配對只是所有配對模式中的一部分，所以此配對模式與實際的編碼模式可能並不相同。若我們利用此方法去預測EL的mode，可能與實際的mode差異太大，因此會導致BL在做Mode Decision時出現錯誤，若再用此錯誤的mode去找EL中的，將會造成不可預期的嚴重失真。

IV. 此演算法雖然是根據MLEC去設計，但卻沒有考慮權重(weighting)對Mode Decision 的影響。因為在不同權重時，並不會改變BL在選擇mode時所需計算的7組配對。

Figure 1.3 Lin 的快速演算法在選擇 Dominant Mode Pair 時的規則

為了解決Schwarz et al.[3]所提出快速演算法的問題，Lin et al.也提出了一套快速演 算法。然而在Lin的演算法中，針對上述的問題修正以下幾點：

I. 修正了[3]中所提出的MELC多目標最佳化問題，改善了權重因子對限制的影響，詳細內容將在2.2.2.的(A)提及。

II. 修正了[3]中BL在做Mode Decision時，不會隨權重改變而有不同配對計算的問題。

而且也增加DMP的配對組合，使演算法稍具可調性。此修正如Figure 1.3所示，BL 在權重小於0.5時，其在EL的配對都為skip；在權重大於等於0.5時，其配對有Inter 16x16和BLskip。而且配對的mode不僅只有BLskip和IntraBL兩種。

在文檔中可調視訊編碼多層編碼控制的快速演算法理論的位元與失真關係函數初步分析 (頁 10-14)