結果與討論

(a)原本, 訊號雜訊比 31.19dB, 位元流大小 4371 位元組

(b)權重, 訊號雜訊比 30.98dB, 位元流大小 4317 位元組圖 4：測試影像一在每秒 1000K 個位元的傳輸速率

(a)原本, 訊號雜訊比 26.85dB, 位元流大小 4687 位元組

(b)權重, 訊號雜訊比 26.67dB, 位元流大小 4272 位元組圖 5：測試影像二在每秒 1000K 個位元的傳輸速率

圖 4 和圖 5 的傳輸速率是假設解碼端每秒可以解碼 30 張的狀況下。從圖 4 和圖 5 可以看出，乘上權重後的影像在視覺效果比原本的好，尤其是在大面積的平坦的區域上可以另其看起來更為平滑；但有時候會另影像中的線條的部份更模糊，尤其是在較低的傳輸速率上，因為原本的權重就是把低頻的權重加大，把高頻的權重減輕，原因在於人眼對低頻的訊號比高頻的訊號敏感。

因為我們把每個截斷點的斜率轉換成視覺失真的斜率，換句話說，我們把“數學上的量化的錯誤”轉換成“視覺上的權重的失真”，因此最後解碼出來的影像雖然有較佳的視覺效果，但不並會有較高的訊號雜訊比，因為訊號雜訊比是不考慮人眼視覺的特性，只是考慮到量化的錯誤，也就是單純的數學上的差。

在把每個截斷點的斜率都乘上權重後，我們可以發現，越接近最小重要性位元 (least significant bit，LSB)的位元平面的截斷點的權重都很低，如此，視覺權重會把接近最大重要性位元(most significant bit，MSB)的位元平面的截斷點和越接近最小重要性位元的位元平面的截斷點之間的差距拉開，也就是說，如果我們要封裝乘上權重後的越接近最小重要性位元的位元平面的截斷點的資料，我們要更大的傳輸速率才行。因此，乘上權重後所封裝的資料就比較少。

在本計畫中，我們提出了一個算出視覺權重的方法，可以在同樣的傳輸速率下達成較佳的視覺品質，但並不會有較高的視覺雜訊比，這也表示說有較高的視覺雜訊比的影像並不表示說有較佳的視覺品質。

第二部份用於影像壓縮之方向性多重解析度轉換和區塊位元平面算數編碼

A. 前言

在圖片和影片壓縮的領域中，空間轉換扮演著重要的角色。藉著空間轉換，圖片就能夠被轉換到頻域。對於一般常看到的自然影像，能量多半會聚集在某些區域的頻段上，這些頻段一般是低頻頻段。由於這樣能量聚集的的特性，所以使的壓縮的效率能夠提升。在理論上 FFT、

KLT、DCT 和小波轉換是常見的空間轉換方法，然而實際的編碼器要考慮到效能和實現困難度的取捨，因此JPEG、MPEG-1、MPEG-2 和 H.264 是採用 2D-DCT。在JPEG2000 和畫面間小波轉換編碼則是使用小波轉換。經過空間轉換後之影像，必須搭配有效率的熵(Entropy) 編碼器，才可發揮壓縮效能，本計畫部份主要針對小波轉換編碼的空間轉換與熵編碼器進行研究。

B. 研究目的

小波轉換的優點在於能有效的表示點和點的變化，由於小波轉換在一維方向有不錯的趨近特性，所以在訊號處理的領域中常常被使用，然而在二維方向的表現卻不如一維方向，二維分別小波轉換雖然可以處理點的變化，但對於線和曲線的變化卻不能發揮，在幾年前Candes and Donoho[9]發表了新的空間分析方法，此方法叫做曲線轉換

（curvelet），藉著這個方法來趨近二維曲線的函數。藉著曲線轉換的激發，Minh N. Do [10] 提出了輪廓轉換(contourlet)建立新的圖片表示方法。

我們的研究會用Minh N. Do 的輪廓轉換放入 MPEG Wavelet Coding 參考軟體中，並且取代掉原本壓縮器常使用的小波轉換，來檢視輪廓轉換是否能夠彌補原本小波轉換不足之處。而在熵編碼方面，由於參考軟體所使用的三維嵌入式塊最佳截斷編碼沒有利用到能量聚集的現象，因此我們希望能藉著位元平面上能量聚集的現象讓編碼效率能夠提升。

C. 文獻探討

C.1 輪廓轉換

由於本研究的主要部分是使用Minh N. Do 提出的輪廓轉換，因此文獻討論會圍繞在輪廓轉換以及此轉換所會運用的相關知識。

輪廓轉換由Minh N. Do 提出的，此轉換綜合了曲線轉換和次頻域分解的優點的優點。他對圖片的分解方法可以粗略的分成兩個步驟：（1）大區域多重解析度轉換與（2）

局部區塊方向性轉換，第一個步驟的目的事為了邊界偵測並且同時把類似小波轉換的方法應用到影像分析，第二個步驟的目的是利用局部區塊方向性轉換來處理物件輪廓的區塊。

前述的兩個步驟在實作上分別使用Burt 和 Adelson [11]提出的拉氏金字塔分解以及 Bamberger 和 Smith 提出的二維方向性濾波頻帶，下面分別簡述這兩個參考文獻。

拉氏金字塔分解可以達到多重解析度的分解，此分解可以使圖片分成高低頻成分，低頻部分圖片由原始圖片產生，並且同時執行下採樣，至於經過反向預測的低頻圖片和原始圖片的差異部分就形成高頻成分圖片。二維方向性濾波頻帶基本上會把頻譜分解成像風扇的樣子如圖 6 所示，每一個分解區域會對應到一個次頻帶，在實現的過程中我們會使用樹狀架構，頻帶分解的個數是依照此樹狀架構的層數來決定。

0 2

4 7

0 1 1

3 4

5 6

ω

(

π,π

)

π,-π

)

圖 6：二維方向性濾波頻帶對頻譜的分解示意圖

C.2 內嵌式零區塊編碼

內嵌式零區塊編碼(Embedded zero block coding，EZBC)可用於連續小波轉換後的係數 [15]。內嵌式編碼方法藉著兩個強大的內嵌是編碼技巧--階層分割(set partitioning)和內容模型(context modeling)，達到低計算量但有效率壓縮。從小波係數建立的四元樹節點 (quad-tree nodes)有極大的統計相關性，利用此特性可以達到高效率的壓縮。

D. 研究方法

D.1 方向性多重解析度轉換

輪廓轉換包含方向性和多重解析度的分解，多重解析度的分解先將圖片分成

高頻成分和低頻成分圖片，多重解析度分解可以一直遞迴應用在低頻部分圖片，經過多重解析度分解後產生的高頻成分圖片會接著做方向性分解，圖 7 是輪廓轉換的區塊示意圖。前述的兩項分解在實作時主要是使用拉氏金字塔分解和二維方向性濾波頻帶，因此在研究步驟上要先建立這兩項分解的模組。

圖 7：輪廓轉換區塊示意圖

z 拉氏金字塔分解

圖 8 為拉氏金字塔分解的架構圖，

M M

H G

+ -X

P D

圖 8：拉氏金字塔分解的分析端，C 為拉氏金字塔分解的低頻訊號，D 為高頻成分，也就是輸入圖片 X 和C 之千的差異處。

圖 9 為相對應的合成端，H 和 G 是使用 9/7 Daubechies 濾波器[12]

M G

+ -C

X＇

圖 9：拉氏金字塔分解的合成端，X’為重建圖片

z 二維方向性濾波頻帶

二維方向性濾波頻帶主要是由扇形濾波器和quincinx 次取樣所組成，在我們實際現實時，扇形濾波器利用Phoong 所提出的方法[13]，再做頻域調變；quincinx 次取樣主要是參考[14]。圖 10 為四個方向的二維方向性濾波頻帶的架構圖。

H1 H0

F1 F0

H1 H0

F0 F1

F1 d_Q0 Q0

d_Q0 Q0

Q0 d_Q0 Q1

d_Q0 Q1

Stage 1 Stage 2 Stage 2

Analysis Synthesis

Stage 3

圖 10：四個方向的二維方向性濾波頻帶之架構圖，分別包括分析端和合成端

D.2 有效位元整併法

為了達成研究目的，我們提出並說明significant 位元整併法。在 MPEG Wavelet Coding

SB)，我們在每一個位元面建立另一個位元面叫做有效位元整併面(SB-reach plane)，圖 11 所示。若在此位元面上的一個數值代表其 N x N 平方區塊的係數位元面。當對應區塊越大有效位元整併平面越小，當對應區塊中有一個係數變成significant，有效位元整併面(SB-reach plane)的數值會被設為 1，反之，當整併面的參數為 0 代表其相對應區塊全部為0。

圖 11：整併平面參數對應 4X4 位元平面區塊

修正過後的編碼過程如下：如圖 12 所示，我們首先建立有效位元整併面(SB-reach plane)直到有效位元整併深度(SB-reach depth)之內的位元面。接著對整併面編碼，編碼方式包括Significant Propagation pass 和 Normalization pass，這些步驟跟核心實驗軟體中的方法是一樣的，若是整併面在之前的位元面就已經significant，其相對應的整併面參數必為1，但此資訊因之前已經被傳遞出去，所以不需要再編碼。

圖 12：『有效位元整併深度』之說明

編碼完整併面後，我們對原來的位元面編碼。如果之前整併面的數值為0，其位元

面上相對應區塊就都不需要編碼，若整併面上的參數為1，其位元面編碼過程在圖 13

說明。位元面的編碼步驟和核心實驗軟體中是一樣的，圖 14 是一個簡單說明我們編碼方式的例子，此例子中的位元會被送到算數編碼器作編碼。

圖 13：有效位元整併面與對應位元面之編碼過程

圖 14：我們提出編碼步驟一例

根據上面所提的方法，我們嘗試所有不同的對應區塊和整併深度，挑選出效率最好的配對，此配對關係將會被編碼以供解碼器使用。

E. 結果與討論

在方向性多重解析度轉換研究方面，表 1 和表 2 分別是測試圖片為 barbara 和

fingerprint 的壓縮結果比較，MSSVC(Microsoft 的 MPEG Wavelet Coding Software)為原

表 1：測試圖片 barbara 的 PSNR 比較表

barbara

256(k byte) ratio(%) PSNR

512(width) MSSVC JPEG2000 MSSVC_MDT 512(height) 0.625 21.41 22.44 22.43

0.9375 23 23.33 22.8

1.25 23.89 23.97 23.86

5 30.85 29.56 28.18

10 35.5 33.97 31.89

表 2：測試圖片 fingerprint 的 PSNR 比較表

fingerprint

256(k byte) ratio(%) PSNR

512(width) MSSVC JPEG2000 MSSVC_MDT 512(height) 0.625 17.26 18.26 18.08

0.9375 18.79 19.41 19.68

1.25 20.62 20.75 20.53

5 27.48 26.63 25.53

10 31.62 30.25 29.41

MSSVC_MDT 在低位元比率時（0.625% 和 0.9375%）有比原本的方法要來的好，

尤其當圖片包含較多的線條成分時，例如：fingerprint，PSNR 和視覺品質的差異會更加明顯，然而在PSNR 比較表也可以看到當位元比率高時，MSSVC_MDT 沒辦法和原方法或是JPEG2000 一樣好。

在熵編碼方面，我們提出有效位元整併方法(SB-reach plane)來提升三維嵌入式塊最佳截斷編碼，位元率的節省百分比在表 3 到表 5，在這些表顯示從第一層位元平面到目前指定位元面累加節省的總位元數。舉例來說，累加到第三層位元面表示第一、

第二和第三位元面節省位元數，而若為負百分比表示位元率比原來的方法還要多，表上也顯示出空間上每個次頻帶的節省位元數。在低位元比率時，在第一、第二有較明顯節省位元減少比例。

表 3：節省位元數(百分比) FOREMAN 與 BUS (H frames at temporal levels 1 and 2).

FOREMAN BUS Cumulative

bitplane

LL LH HL HH LL LH HL HH 2 0.22% 0.17% 0.27% 0.18% -1.86% -0.63% -0.59% -0.17%

3 0.67% 0.45% 0.51% 0.37% 0.36% 0.51% 0.30% 0.45%

4 0.46% 0.25% 0.28% 0.23% 0.18% 0.23% 0.17% 0.22%

表 4：節省位元數(百分比) (H frames at temporal levels 3 and 4).

FOREMAN BUS Cumulative

bitplane

LL LH HL HH LL LH HL HH

在文檔中基於MPEG標準之多媒體通訊整合平台及其應用---子計畫五:MPEG智財管理與保護系統及強韌視訊解碼器之設計與模擬(II) (頁 13-26)

第二部份 用於影像壓縮之方向性多重解析度轉換和區塊位元平 面算數編碼

ω

ω

π,π

π,-π

第二部份用於影像壓縮之方向性多重解析度轉換和區塊位元平面算數編碼