• 沒有找到結果。

CHAPTER 1. INTRODUCTION

1.1. B ACKGROUND

考慮多變容量的不同設備,和各類型網路所傳遞的視訊內容,在許多應用中可調性 已經是很重要的性質,基於這個理由,Joint Video Team (JVT)以 H.264/AVC 為基礎,標 準化了 Scalable Video Coding (SVC)[1],SVC 支援了在單一的 Bitstream 中擁有 spatial,

temporal,SNR 和它們組合起來的可調性,且此 Bitstream 可只具備其中幾樣特性,如只 有解析度或畫質的差別。空間和畫質的不同可以在不同層間展現,而時間性是以一種有 等級制的方法表現,這點和 H.264/AVC 幾乎是一樣的。因為一次編碼多層可以使 Rate 有適當的減少,且依然維持理想的畫質,SVC 提供了具適應性層與層間猜測的方法 (Inter-Layer Prediction Mechanism) , 此 方 法 可 以 盡 可 能 的 重 複 使 用 較 低 層 資 訊 。

Figure 1.1 The definition of MB Pair (from Lin’s thesis)

2

為了決定基層(Base Layer, BL)和增進層(Enhancement Layer, EL)的mode,Joint Scalable Video Model (JSVM)[2]採用一種由下到上編碼方法(Bottom-up Encoder Control, BUEC)。這方法是在決定BL的編碼方式時,只有考慮BL的內容而不考慮較高的EL,同 理,較低的EL在決定編碼方式時,不會考慮到較高的EL。由於BUEC具有比單一層編碼 (Single-Layer Coding)較無法預期或不規則的Rate-Distortion (R-D),通常較高的EL會比較 低層有更多的編碼損失,像是Distortion,是由於BUEC以循序的方式進行Mode Decision 而導致這樣的結果。

想解決上一段所描述的問題,Schwarz et al. [3]提供了一種可以在BL和EL間給予適 當權重的方法,稱之多層編碼控制(Multi-loop Encoder Control, MLEC),在做分割分式的 決定時,BL使用權重式的Lagrangian成本決策方法。就如Figure 1.1顯示的,在MLEC做 分割方式決策時的基本單位是一對Macroblock (MB)的組合,分別來自BL和EL相對位置 的MB,對於每一對MB Pair,它們的分割方式有BL和EL分割方式的Cartesian Product組,

一共有56組Mode Pair,比起BUEC這明顯是很大的計算量,所以對MLEC來說,一個好 的快速決策演算法就顯得必要。

為了減少編碼時間,在H.264/AVC和SVC中已經有為數不少的快速演算法被提出。

H.264中,Kannangara et al.[12]基於所提出的Lagrangian Cost函數判斷是否及早決定編碼 為Skip mode,Kim et al.[13]利用current MB的資訊計算出三種特性,用這些特性及早決 定編碼為Intra或Inter mode,Kim et al.[14]以reference frame中co-located mode決定current mode的candidate mode,Ri et al.[15]同時以spatial和temporal的mode決定current mode的 candidate mode。而SVC中,像是Yeh et al.[16]中利用BL co-located mode和EL周圍mode來 預測current mode,並提出一套及早決定mode的判斷方式,Kim et al.[17]用BL中co-located MB和其周圍MB,對不同的mode和所在位置給於適當的權重計算出一個值,並同時利 用這值和BL mode一同決定candidate mode。

Figure 1.2 Schwarz’s 的快速演算法在選擇 Dominant Mode Pair 時的規則

3

目前根據 MLEC 所設計的快速演算法非常少,其中以 Schwarz et al.[3]所提出的快 速演算法為主。其做法是當 BL 的 MB 做 Mode Decision 時,每一個 mode 都會有一個 EL 的 mode 做為配對,此種配對稱為 Dominant Mode Pair (DMP)。配對方法是當 BL 選 擇 Inter/Intra 的 mode 時,EL 選擇 BLskip/IntraBL 做為預測(如 Figure 1.2),然後 BL 利 用這組配對去計算 R-D cost,並選擇 R-D cost 最小的做為 BL 的 mode。最後在 EL 中對 應的 MB,再根據 BL 選定好的 mode 去做徹底式搜尋,找出 R-D cost 最小的 mode 做壓 縮。但此方法存在一些嚴重的問題:

I. 在[3]中所提的MLEC多目標最佳化問題中,其限制會因為權重的設定而改變。而這 限制的改變將會在權重較高的情況下,造成不理想的R-D performance。詳細內容會 在2.2.2(A)提及。

II. 在選擇BL中每一個MB的mode時,都是使用Figure 1.2中的7組配對組合去做計算,

並不會依照sequence的特性做調整。這種配對方式太過於單調,不具任何可調性。

III. 此7組配對只是所有配對模式中的一部分,所以此配對模式與實際的編碼模式可能 並不相同。若我們利用此方法去預測EL的mode,可能與實際的mode差異太大,因 此會導致BL在做Mode Decision時出現錯誤,若再用此錯誤的mode去找EL中的,將 會造成不可預期的嚴重失真。

IV. 此演算法雖然是根據MLEC去設計,但卻沒有考慮權重(weighting)對Mode Decision 的影響。因為在不同權重時,並不會改變BL在選擇mode時所需計算的7組配對。

Figure 1.3 Lin 的快速演算法在選擇 Dominant Mode Pair 時的規則

4

為了解決Schwarz et al.[3]所提出快速演算法的問題,Lin et al.也提出了一套快速演 算法。然而在Lin的演算法中,針對上述的問題修正以下幾點:

I. 修正了[3]中所提出的MELC多目標最佳化問題,改善了權重因子對限制的影響,詳 細內容將在2.2.2.的(A)提及。

II. 修正了[3]中BL在做Mode Decision時,不會隨權重改變而有不同配對計算的問題。

而且也增加DMP的配對組合,使演算法稍具可調性。此修正如Figure 1.3所示,BL 在權重小於0.5時,其在EL的配對都為skip;在權重大於等於0.5時,其配對有Inter 16x16和BLskip。而且配對的mode不僅只有BLskip和IntraBL兩種。

5

相關文件