緒論 - 基於最佳停止理論所設計之可調視訊多層編碼控制的快速編碼模式決策演算法

1.1 研究背景

由於網路傳輸以及多變容量不同設備的蓬勃發展，視訊內容在各種應用上的可調性已經是需要且非常重要的問題。基於這個理由，Joint Video Team(JVT)以 H.264/AVC 為基礎，制訂了可調視訊編碼(Scalable Video Coding, SVC)[1]。可調視訊編碼在單一位元串流中提供了不同的調節性，其中包括 1)空間可調性(spatial scalable)、2)時間可調性(temporal scalable)、3)品質可調性(quality scalable)。可調視訊編碼是由一個基礎層(base layer, BL)和多個增進層(enhancement layer, EL)所組成，且相較於低層的增進層是相較於高層增進層的基礎層，然而增進層利用層與層之間預測的方式(inter-layer prediction)，盡可能的使用基礎層的資訊來達到減少壓縮時所需要的位元率。

1.1.1 可調視訊編碼之 CGS 架構

粗略可調編碼是(Coarse-grain Quality Scalable Coding, CGS)可調視訊編碼的品質可調性中的一種架構，此架構最基本的設計為基礎層和增進層擁有相同的畫面解析度(resolution)，兩層之間利用不同量化參數(QP)的設定來達到不同層之間的調節作用，以圖 1 為例。圖 1 是可調視訊編碼中的 CGS 架構且畫面序列之間是 IPPP 架構，從圖中可以看到此架構的上下兩層是由相同畫面解析度所形成，

圖 1 可調視訊編碼的 CGS 架構

且基礎層做為增進層的預測。圖中兩層同一張畫面之間相同位置的 MB 稱為一組 MB pair，例如(B1,E1)就是一組 MB pair。這組 MB pair 在可調視訊編碼中扮演非常重要的腳色，MB pair 中的兩個 MB 之間的編碼資訊有某種程度的相關性，由

最佳停止理論(Optimal Stopping Theory, OST)[2]中存在一個最佳停止問題，

此問題主要是在說一位決策者如何逐一訪談一連串的物件中，每訪談完一個物件型的問題稱為 Duration Problem [3]。在最佳停止理論中的 Duration Problem，其計算分數的函式是用來計算序列中，下一個會遇到相對更好的物件需要花費多少 由 Zhao’s et al.所提出[4]。Zhao’s et al.[4]利用 Duration Problem 在可調視訊編碼

圖 2 編碼模式序列

的編碼模式決策上設計出一套編碼模式提前結束的快速演算法，此方法如圖 2 所示。Zhao’s et al. [4] 利用目前要編碼 MB 周圍的資訊產生一組編碼模式序列，

其排序方式是將目前要編碼的 MB 最有可能的編碼模式，依機率由大到小排序。

此排序的目的，是為了讓 reward function 擁有 unimodal function 的特性，也就是要確保此 reward function 只擁有一個極大值。

1.2 問題闡述與提出解決辦法

1.3 研究貢獻

在這次的研究工作中，最主要的貢獻是提出一套新的快速編碼模式決策演算法，其中包含以下幾點：

 有效的利用周圍的資訊去產生編碼模式配對序列，以提供目前的 MB 所使用。

 有效的改善原先 Zhao’s et al.[4]所提出演算法中的問題，在此利用統計與分 析的方式成功建立不同位置的 RD 下降表，以及提供不同編碼模式配對的編碼運算複雜度參考。

 有效的提出一套精進編碼模式的機制，不但能在作者所提出的演算法上實施，

在其他的演算法中也能適用。

 作者提出的快速演算法能有效的在編碼時間上加速，而且位元率與畫面品質和完整搜尋法相比，並沒有太大的上升與失真。

實驗結果顯示，作者所提出的快速編碼模式決策演算法和完整搜尋法比較，能得到 80% ~85%的編碼時間節省，並且擁有相似的位元率－失真效能。並且作者所 提出的精進編碼模式的方式，亦能有效改善 Zhao’s et al.[4]所提出演算法的位元 率－失真效能。

1.4 論文編排

本論文之後的組織架構為：第二章包含可調視訊編碼的基本架構與編碼控制的介紹。第三章呈現作者所提出的快速編碼模式決策演算法。第四章為實驗結果與討論。最後，第五章為本篇論文的結論以及未來展望。

在文檔中基於最佳停止理論所設計之可調視訊多層編碼控制的快速編碼模式決策演算法 (頁 9-14)