第二章 SHVC 視訊編碼標準
2.2 SHVC 視訊標準與架構之簡介
HEVC 於 2013 年 4 月成為正式的標準,為了能夠使 HEVC 更廣泛的使用,
且更具備商業化價值,ITU-T 和 ISO/IEC 聯合組成的視訊編碼聯合團隊 JCT-VC 於 2012 年 7 月著手開始制定可調的 HEVC 視訊標準 SHVC,並於 2014 年的 7 月完成標準化和商品化,SHVC 最大特色在於只需提供單一位元流就能夠支援多 層的畫面品質、畫面率和畫面解析度,在不同的接收端只需依照符合本身的條件 及需求來截取適當的位元流即可,圖 2.7 為 SHVC 根據不同使用者及傳輸條件所 應用的示意圖,在網路環境及設備功能較佳時,透過提取器(extractor)對原本位原 流進行截取,取出最適合的位元流大小給接收端,當網路環境及設備功能較差時,
則截取較小的位元流給接收端,利用此方法可以依照使用者在不同的網路及裝置 環境下選擇適當的資料,達到最有效率的資料傳輸,現今無線網路的快速發展,
人們無時無刻都可以透過行動通訊上網瀏覽影音資訊,像 YouTube、Facebook 和 FaceTime 等,未來在利用 SHVC 系統可以更加提升傳輸效率,讓使用者能享受 到更優質的影音服務。
作為 HEVC 的延伸應用,SHVC 主要是以 HVC 為主要架構,並且將三種可 調技術,品質可調(SNR scalability)、時間可調(temporal scalability)、空間可調 (spatial scalability)做結合並成為完整的系統,SHVC 是由一個基礎層(base layer:
BL)和數個加強層(enhancement: EL)所組成的,圖 2.8 為 SHVC 系統的編碼架構 圖,在圖中只使用了一個 EL 做為舉例,在輸入影像進行各層編碼之前,將會先 經過取樣濾波器來進行下取樣(down sampler)的處理,達到各層的不同解析度,
為了能夠提高編碼效能,SHVC 更改了 H.264/SVC 所使用的單迴路設計,而是採 用多重迴路架構,EL 利用了層間預測(inter-layer prediction: ILP)的技術來使用較 低層的重建畫面當參考畫面來進行預測,在之後會進行詳細介紹,各層的重建畫 面將會存入各層當中的解碼圖像緩衝區中(decoded pictures buffer: DPB),在 3.4
11
節中會對此做介紹,最後在輸出 SHVC 的位元流。
在 SHVC 位元流中,BL 可向後相容(backward compatible)於 HEVC 並可以 單獨被解碼,若解碼時只有 EL 位元流而沒有 BL 位元流時,將無法解碼出視訊 4K2K & 60fps
1080P & 60fps
CIF & 30fps
QCIF & 15fps
12
POC)和時間可調階層(temporal layer: TL)的編號,箭頭代表編碼畫面所參考的畫 面,BL 中的畫面為重要畫面(key frames),必定為 I/P 畫面,EL 的畫面則是以雙
Inter-layer Reference Pictures (Upsampling)
Inter-layer Prediction (Upsampling)
Decoded pictures buffer
(DPB) sample adaptive offset
Deblocking filter sample adaptive offset
Entropy encoding
13
圖 2.9、階層式 B 畫面架構
2.2.2 品質可調
品質可調主要是在各個不同層之間設不同的量化參數,BL 的影像是使用較 大的量化參數去編碼,EL 則使用筆 BL 小的量化參數進行編碼,在品質可調主 要可以分為粗略品值可調(coarse grain scalability: CGS)、精細品質可調(fine grain scalability: FGS)和中度的品質可調(median grain scalability: MGS)這三種模式。
SHVC 所採取模式為 FGS 可調,此模式也在 H.264/SVC 使用,H.264 可調視訊 編碼中的 FGS 考慮到 DC 係數和 AC 係數重要性的差異,利用環形區塊編碼 (cyclical block coding)方式,使得編碼時能從較為重要的係數開始編碼,在相同的 位元率下能加收較多的重要的係數,提升畫面的品質,而 SHVC 品質可調目前也 使用此技術可調。
2.2.3 空間可調
空間可調主要是由不同解析度的影像分別作各層的編碼,當原始影像會先經 過下取樣濾波器(down sampling filter)的處理,達到各層的不同解析度,接著各層 各自做 HEVC 編碼過程,在相同畫面的不同層之間的有許多的相關性,EL 可以 使用較低層已經編碼完的資訊,進行層間預測過程將較低層的畫面資訊來進行預
POC 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 TL 0 3 2 3 1 3 2 3 0 3 2 3 1 3 2 3 0
14
測,有效地減少編碼的時間與複雜度,層間預測主要分為兩個模式,層間畫面內 模式(inter-layer intra modes)和層間畫面間模式(inter-layer inter modes),層間畫面 內模式是利用不同層的畫面來進行畫面內編碼,較低層的重建畫面依據不同層解 析度不同的比例,經過上取樣濾波器(upsampling filter)作取樣,而產生的層間參 考畫面(inter-layer reference: ILR)進行預測,層間畫面間模式是在 BL 做 ME 所得 到的運動像量(motion vector: MV) 給 EL 當進階移動向量預測(advance motion vector predictor: AMVP)做參考資訊使用,使編碼的速度加速,來減少在畫面間預 測時的運算複雜度,最後畫面間階層殘值預測為了減少 EL 的殘值資料,主要利 用 BL 所產生的殘值資訊經過上取樣後,給 EL 當參考資訊,來降低 EL 的殘值 資訊,提高編碼的效益。