1.1 研究背景
由於網路傳輸以及多變容量不同設備的蓬勃發展,視訊內容在各種應用上的 可調性已經是需要且非常重要的問題。基於這個理由,Joint Video Team(JVT)以 H.264/AVC 為基礎,制訂了可調視訊編碼(Scalable Video Coding, SVC)[1]。可調 視訊編碼在單一位元串流中提供了不同的調節性,其中包括 1)空間可調性(spatial scalable)、2)時間可調性(temporal scalable)、3)品質可調性(quality scalable)。可調 視訊編碼是由一個基礎層(base layer, BL)和多個增進層(enhancement layer, EL)所 組成,且相較於低層的增進層是相較於高層增進層的基礎層,然而增進層利用層 與層之間預測的方式(inter-layer prediction),盡可能的使用基礎層的資訊來達到 減少壓縮時所需要的位元率。
1.1.1 可調視訊編碼之 CGS 架構
粗略可調編碼是(Coarse-grain Quality Scalable Coding, CGS)可調視訊編碼的 品質可調性中的一種架構,此架構最基本的設計為基礎層和增進層擁有相同的畫 面解析度(resolution),兩層之間利用不同量化參數(QP)的設定來達到不同層之間 的調節作用,以圖 1 為例。圖 1 是可調視訊編碼中的 CGS 架構且畫面序列之間 是 IPPP 架構,從圖中可以看到此架構的上下兩層是由相同畫面解析度所形成,
圖 1 可調視訊編碼的 CGS 架構
且基礎層做為增進層的預測。圖中兩層同一張畫面之間相同位置的 MB 稱為一組 MB pair,例如(B1,E1)就是一組 MB pair。這組 MB pair 在可調視訊編碼中扮演非 常重要的腳色,MB pair 中的兩個 MB 之間的編碼資訊有某種程度的相關性,由
最佳停止理論(Optimal Stopping Theory, OST)[2]中存在一個最佳停止問題,
此問題主要是在說一位決策者如何逐一訪談一連串的物件中,每訪談完一個物件 型的問題稱為 Duration Problem [3]。在最佳停止理論中的 Duration Problem,其 計算分數的函式是用來計算序列中,下一個會遇到相對更好的物件需要花費多少 由 Zhao’s et al.所提出[4]。Zhao’s et al.[4]利用 Duration Problem 在可調視訊編碼
圖 2 編碼模式序列
的編碼模式決策上設計出一套編碼模式提前結束的快速演算法,此方法如圖 2 所示。Zhao’s et al. [4] 利用目前要編碼 MB 周圍的資訊產生一組編碼模式序列,
其排序方式是將目前要編碼的 MB 最有可能的編碼模式,依機率由大到小排序。
此排序的目的,是為了讓 reward function 擁有 unimodal function 的特性,也就是 要確保此 reward function 只擁有一個極大值。
1.2 問題闡述與提出解決辦法
1.3 研究貢獻
在這次的研究工作中,最主要的貢獻是提出一套新的快速編碼模式決策演算 法,其中包含以下幾點:
有效的利用周圍的資訊去產生編碼模式配對序列,以提供目前的 MB 所使 用。
有效的改善原先 Zhao’s et al.[4]所提出演算法中的問題,在此利用統計與分 析的方式成功建立不同位置的 RD 下降表,以及提供不同編碼模式配對的編 碼運算複雜度參考。
有效的提出一套精進編碼模式的機制,不但能在作者所提出的演算法上實施,
在其他的演算法中也能適用。
作者提出的快速演算法能有效的在編碼時間上加速,而且位元率與畫面品質 和完整搜尋法相比,並沒有太大的上升與失真。
實驗結果顯示,作者所提出的快速編碼模式決策演算法和完整搜尋法比較,能得 到 80% ~85%的編碼時間節省,並且擁有相似的位元率-失真效能。並且作者所 提出的精進編碼模式的方式,亦能有效改善 Zhao’s et al.[4]所提出演算法的位元 率-失真效能。
1.4 論文編排
本論文之後的組織架構為:第二章包含可調視訊編碼的基本架構與編碼控制 的介紹。第三章呈現作者所提出的快速編碼模式決策演算法。第四章為實驗結果 與討論。最後,第五章為本篇論文的結論以及未來展望。