trellis 解碼器 - 基於 AWGN 通道的多重描述向量量化系統

第四章基於 AWGN 通道的索引指定

4.3 基於 AWGN 通道的多重描述向量量化系統

4.3.2 trellis 解碼器

顧名思義，柵狀解碼器(trellis decoder)就是利用柵狀碼圖結構做解碼的動作，完整的柵狀圖(trellis diagram)包含路徑的輸出以及狀態的表示。為了簡化柵狀圖的建構，我們需要重新安排產生矩陣使其轉化成為一個 trellis-oriented form(TOF)的特殊格式。首先透過第三章所介紹的演算法，找出某個產生矩陣

G

的所格式的產生矩陣

G

_TOGM，其中 TOGM 代表 trellis oriented generator matrix，舉例而言，給定一產生矩陣：

1 0 1 0 1 0 0 0 1 1 1 0 0 0 0 0 0 0 1 1 1 G

TOGM

⎡ ⎤

⎢ ⎥

= ⎢ ⎥

⎢ ⎥

⎣ ⎦

一輸入訊號

a = [ a a

₀

,

₁

,..., a

_k₋₁

]

_{經過產生矩陣}

G

_TOGM _{的編碼處理，而}

得到一個合法碼字

V = [ , ,..., v v

₀ ₁

v

_n₋₁

]

輸出，針對每時刻的狀態表示及狀態轉移所衍生出的路徑輸出，主要依據該時刻輸入訊號與

G

_TOGM

的對應產生，其對應關係則需進一步統計 TOF 各個特性的列集合。值得注意的是，柵狀圖上任一條完整路徑上所有表示的輸出即為一合法碼字，換句話說，根據此

G

_TOGM 所編碼而得的碼字可用此柵狀圖完整呈現。接下來將統計

G

_TOGM 所有列向量的對應關係，將來柵狀圖就是根據這些畫分的列向量慢慢刻畫出來。

針對

G

_TOGM _{所屬的任一列向量}

g = ( g g

₀

,

₁

,..., g

_n₋₁

)

，我們定義其位元展開(bit span)

φ ( ) g = [ , ] i j

= { , i i + 1,.... } j

_{，代表此列向量之中}

包含所有非零元素的最小索引區間。換句話說，

g

= 1

且

g

= 1

分別是此列集合的起頭 1 以及收尾 1。舉例而言：

其中

φ ( g

₀

) = [0, 4]

_、

φ ( g

₁

) = [1, 3]

_以及

φ ( g

₂

) = [4, 6]

_{。接著定義}

{ g g

₀

,

₁

} φ ^{{ }} g

{ } a

₂ ¹

{ g g

₀

,

₁

} φ ^{{ }} ^g

₂

{ } a

₂ 1 7

{ g g g

₀

,

₁

,

₂

} φ φ φ

⁰

表 4.1 狀態分析表

一個完整的柵狀圖，每條路徑上都具有兩種含意，一是個代表狀態(state)的轉移，另一個代表對應的輸出，藉由柵狀圖架構可計算每一路徑的 metric。以 AWGN 通道模型為例，所屬的 metric 為訊號接收值與狀態輸出的歐幾里得距離(Euclidean distance)平方。而解碼的程序依據 Viterbi 演算法，計算可能的碼字輸出所對應的累積 metric，其中具有最小 metric 的可行路徑解也將會是最大似然率 (maximum likelihood)的解碼結果。有鑑於此，定義每個時刻狀態的表示及對應的輸出就顯得非常重要。

首先定義狀態的表示，舉例而言，針對第 3 個時刻

G =

₃^s

{ , g g

₀ ₁

}

因此對應

A

₃^s

= { , } a a

₀ ₁ _{，具有的狀態組合為(}

a a

₀

,

₁_{)，所以共有 4 種}

狀態，分別為 (0,0) 、 (0,1) 、 (1,0) 以及 (1,1) ，而第 5 個時刻

5^s

{ }

G = g

₂ _對應

A

₅^s

= { } a

₂ ，因此具有的狀態組合為(

a

₂_{)，所以其所}

有的狀態為 0 以及 1。如圖 4.3 所示。

接下來說明從第 i 個時刻到第 i+1 個時刻的輸出位元。其值根據

有無

a

^*的出現有兩種情況發生。在第 i 個時刻其

G

_i^f _{若有列向量符合}

42 一時刻的 metric，前一時刻所累積的 metric 和該時刻所得歐幾里得距離平方的相加即為該時刻該狀態的 metric。若該狀態具有兩個以上的來源路徑時，會互相比較其 metric，選擇其中具有最小 metric 的路徑當做該狀態的資訊。待最後一個時刻，亦即接受碼字結束之時，

當時第二個時刻收到的資訊為 3.14 ，則 (01) 狀態其 metric 為

1.25 (3.14 (1)) + −

= 5.8296

，而(10)狀態其 metric 則為

2.64 (3.14 ( 1)) + − −

= 19.7796

。

最後根據解碼出的碼字，將此碼字按照[I,J]的畫分，前半部的二進位表示可以對應到一個列索引，而碼字後半部的碼字對應一個行索引，這樣的解碼過程輸出結果絕對是一個合法的碼字，因此在指定矩陣之中絕對不會發生對應到空的位置而無法判斷的錯誤。此改良的結果會在下一章實驗結果中探討，並且運用在 AWR-WB 編碼參數上呈現整個解碼效果。

第五章

實驗模擬與結果分析

三種不同的系統設計，第一種即為第二章所介紹的系統架構，第二種及第三種則分別為第三章以及第四章所介紹的系統。為了方便區別，我們分別將之命名為 MDC1、MDC2 及 MDC3。第二章所介紹的 MDC1 系統架構中，使用通道匹配二元置換演算法經過一次次的置換運算，

逐漸找到與當時通道環境匹配的最佳指定矩陣，此指定矩陣可有效提升系統的整體效能，將在第一節用實驗結果加以驗證。第二節則是在指定索引的同時，找尋一些特殊的位置，使在該位置的索引所對應的列索引及行索引可成為一個碼字。解碼端可利用此結構以改善系統效能，此技術將會依序運用在錯誤位元以及 AWGN 通道環境之下。第三節則是將三種不同的多重描述向量量化應用在 AMR-WB 系統，並比較不同設計的效能評比差異。

5.1 通道匹配二元置換的實驗

5.1.1 系統模擬之步驟說明

在此節之內容中，主要是將貫徹整篇論文的二元置換演算法進行系統模擬與結果分析。利用包含了男聲與女聲的大量語料，經過 AMR-WB 編碼器得到 194881 組 ISF 索引，並記錄其個別索引的機率做

為事前機率使用。在這些語料內中取出一段 200 秒長度的語音作為參 考，利用 AMR-WB 編碼器產生出 10000 組 ISF 索引，每組 ISF 索引具 有 7 個索引值，事前訓練好各個索引值的量化碼字書，提供解碼端解 碼的依據。本節實驗將使用每組 ISF 索引的第一個索引當作訊號源，

意即第二章所介紹的索引值 ID1，經過指定矩陣的對應每個索引值可以對應其列索引以及行索引，通過二位元相位鍵移（BPSK）調變，把每一位元由原來的

{0,1}

映對成

{1, 1} −

。列索引及行索引分別經過不同的通道傳送至接收端。模擬通道則使用位元錯誤通道環境，為了簡化模擬實驗，設定兩個通道的位元錯誤率是一致的。接收端接受來自兩個通道的資訊之後，隨即啟動多重描述解碼器，配合事前訓練的量化碼書執行解碼的動作。

5.1.2 結果分析

不同的指定矩陣所對應的列索引及行索引存在明顯差異，因而反應在解碼端的效能也有所不同。因此本實驗利用二元置換演算法持續做運算，並記錄每次置換之後的指定矩陣。而系統效能的評量方式則是根據每個索引在事前訓練的量化碼書所對應的碼字，和在多重描述解碼器輸出的結果做比較，最後再總合計算其訊雜比(SNR)。實際的運算如下式：

5.2 兩階段索引指定的實驗

表 5.1 位元錯誤率與訊雜比的對應關係

訊號源和第一節實驗使用的相同，第二章所介紹的量化索引值 ID1，

經過根據不同的通道環境預先設計的指定矩陣，通過錯誤通道環境之後，在解碼端對接收訊號做解碼的動作。如果是位元錯誤通道，則會先經過查核矩陣的檢查之後再做多重描述解碼器的解碼動作，如果是 AWGN 通道，則直接利用柵狀解碼器做解碼的動作，其平均值設定為 0，

變異數則根據上表的對照表作改變。

5.2.2 結果分析

採用訊雜比衡量三種不同的系統設計概念，第一種設計 MDC1 即第二章所介紹的系統架構，而 MDC2、MDC3 則分別為第三章以及第四章所介紹的系統架構。後兩種系統因為具有一定程度的錯誤更正的能力，我們預期其系統效能會勝於 MDC1 系統，實驗結果如圖 5.2 所示。

MDC1 與 MDC2 兩個系統在錯誤率較高的環境下，其解碼效能其實非常接近，這是因為通道錯誤超出 MDC2 的查核矩陣可以更正的能力範圍。

MDC3 系統則因為考量在軟性領域之下，所有的解碼並沒有事先做硬性的判別，同時具備錯誤更正的能力，使得其效能在各種錯誤環境之下都明顯優於其他兩個系統。

圖 5.2 MDC1、MDC2 及 MDC3 訊雜比比較圖

( )

評估(Perceptual Evaluation of Speech Quality；PESQ)，比較原始與解碼重

0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 0.11

建的語音檔，評量分數(Mean Opinion Score,MOS)範圍從 0 到 4.5。

評分 4.5 代表重建的音質與原音檔非常接近，0 則代表重建語音品質

第六章

結論與未來展望

不同的應用服務所對應的通道模型存在明顯的差異，例如位元錯誤通道、可加性高斯白雜訊通道、網路封包漏失通道以及雷利衰弱通道(Rayleigh fading channel)。多重描述量化原本是針對網路封包漏失而發展的訊源編碼技術，本論文將此技術推廣應用於行動通訊常見的位元錯誤通道以及 AWGN 通道。在多重描述量化中指定索引的設計扮演重要的角色，最佳化的索引指定設計有助提升解碼的效果。本論文主要的構想是將索引指定分解為位置指定與位元對應兩階段，在指定索引的同時預先決定好特定位置，讓對應的列索引以及行索引可以合併成為一個碼字。此結構於解碼端可更正一定程度的位元錯誤，

進而有效提升解碼輸出的語音品質。在第五章的實驗模擬證實，我們提出的兩階段索引指定設計，不但大幅減少二元置換演算法的運算量，

在位元錯誤或 AWGN 通道環境解碼輸出的音值也顯著改善。

目前研究是假設位元錯誤呈現隨機分佈，但這並不符合真實通道環境的叢發性位元錯誤。此外，我們只考量兩個通道下傳輸，未來可將此系統擴展到更多的通道傳輸，對於索引指定上的設計也更靈活。

通道的擴展其實和多輸入多輸出 (Multiple Input Multiple Output,MIMO)的系統架構有其相同之處，而雷利衰弱通道更是無線通

參考文獻

[1] V. A. Vaishampayan, “Design of multiple description scalar quantizers,” IEEE Trans. Inform. Theory, vol. 39, pp. 821‐834, May 1993.

[2] Y. Zhou and W.‐Y. Chan, “Multiple description quantizer design using a channel optimized quantizer approach,” in Proceedings of the 38th

Annual Conference on Information Sciences and systems, 2004.

[3] P. Yahampath, “On index assignment and the design of multiple description qiantizers,” in Proceedings of 2004 International Conference

[5] N. Gortz and P. Leelapornchai, “Optimization of the index assignments for multiple description vector quantizers,” IEEE Trans.

Commun., vol. 51, no. 3, pp.336‐340, Mar. 2003.

[6] Rui Ma and Fabrice Labeau, “Robust index assignment for MDSQ encoder over noisy channels,” Proc. MMSP’06, pp. 286–290, Oct. 2006.

[8]S. Lin and D. J. Costello, Jr., Error Control Coding. Englewood Cliffs, NJ:

Prentice‐Hall, 2004.

[9]L. Hanzo, F. C. A. Somerville, and J. P. Woodard, Voice Compressionand

Communications. New York: Wiley, 2001.

[10]B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola‐Pukkila, J.

Mikkola, H. Vainio, and K. Jarvinen, “The Adaptive Multirate Wideband Speech Codec(AMR‐WB).” IEEE Transcations on speech and audio

processing, vol.10, no.8, pp.620‐636, Nov. 2002.

[11]Yugang Zhou,”Analysis and Design of Multiple Desciption Codes For Wired And Wireless Channels,”qspace.library.queensu.ca , pp68‐101 , September 2007

在文檔中通道匹配的多重描述量化索引指定之研究 (頁 47-0)

trellis 解碼器

第四章 基於 AWGN 通道的索引指定

4.3 基於 AWGN 通道的多重描述向量量化系統

4.3.2 trellis 解碼器

G

G

1 0 1 0 1 0 0 0 1 1 1 0 0 0 0 0 0 0 1 1 1 G

⎡ ⎤

⎢ ⎥

= ⎢ ⎥

⎢ ⎥

⎣ ⎦

a = [ a a

,

,..., a

]

G

V = [ , ,..., v v

v

]

G

G

G

G

g = ( g g

,

,..., g

)

φ ( ) g = [ , ] i j

= { , i i + 1,.... } j

g

= 1

g

= 1

φ ( g

) = [0, 4]

φ ( g

) = [1, 3]

φ ( g

) = [4, 6]

{ g g

,

} φ { } g

{ } a

{ g g

,

} φ { } g

{ } a

{ g g g

,

,

} φ φ φ

G =

{ , g g

}

A

= { , } a a

a a

,

{ }

G = g

A

= { } a

a

a

G

1.25 (3.14 (1)) + −

= 5.8296

2.64 (3.14 ( 1)) + − −

= 19.7796

第五章

實驗模擬與結果分析

5.1 通道匹配二元置換的實驗

5.1.1 系統模擬之步驟說明

{0,1}

{1, 1} −

5.1.2 結果分析

5.2 兩階段索引指定的實驗

5.2.2 結果分析

( )

第四章基於 AWGN 通道的索引指定

} φ ^{{ }} g

} φ ^{{ }} ^g