第四章 基於 AWGN 通道的索引指定
4.3 基於 AWGN 通道的多重描述向量量化系統
4.3.2 trellis 解碼器
顧名思義,柵狀解碼器(trellis decoder)就是利用柵狀碼圖 結構做解碼的動作,完整的柵狀圖(trellis diagram)包含路徑的 輸出以及狀態的表示。為了簡化柵狀圖的建構,我們需要重新安排 產生矩陣使其轉化成為一個 trellis-oriented form(TOF)的特殊 格式。首先透過第三章所介紹的演算法,找出某個產生矩陣
G
的所 格式的產生矩陣G
TOGM,其中 TOGM 代表 trellis oriented generator matrix,舉例而言,給定一產生矩陣:38
1 0 1 0 1 0 0 0 1 1 1 0 0 0 0 0 0 0 1 1 1 G
TOGM⎡ ⎤
⎢ ⎥
= ⎢ ⎥
⎢ ⎥
⎣ ⎦
一輸入訊號
a = [ a a
0,
1,..., a
k−1]
經過產生矩陣G
TOGM 的編碼處理,而得到一個合法碼字
V = [ , ,..., v v
0 1v
n−1]
輸出,針對每時刻的狀態表示 及狀態轉移所衍生出的路徑輸出,主要依據該時刻輸入訊號與G
TOGM的對應產生,其對應關係則需進一步統計 TOF 各個特性的列集合。值 得注意的是,柵狀圖上任一條完整路徑上所有表示的輸出即為一合法 碼字,換句話說,根據此
G
TOGM 所編碼而得的碼字可用此柵狀圖完整 呈現。接下來將統計G
TOGM 所有列向量的對應關係,將來柵狀圖就是 根據這些畫分的列向量慢慢刻畫出來。針對
G
TOGM 所屬的任一列向量g = ( g g
0,
1,..., g
n−1)
,我們定義其位 元展開(bit span)φ ( ) g = [ , ] i j
= { , i i + 1,.... } j
,代表此列向量之中包含所有非零元素的最小索引區間。換句話說,
g
i= 1
且g
j= 1
分別 是此列集合的起頭 1 以及收尾 1。舉例而言:其中
φ ( g
0) = [0, 4]
、φ ( g
1) = [1, 3]
以及φ ( g
2) = [4, 6]
。接著定義40
5
{ g g
0,
1} φ { } g
2{ } a
2 16
{ g g
0,
1} φ { } g
2{ } a
2 1 7{ g g g
0,
1,
2} φ φ φ
0表 4.1 狀態分析表
一個完整的柵狀圖,每條路徑上都具有兩種含意,一是個代表狀 態(state)的轉移,另一個代表對應的輸出,藉由柵狀圖架構可計算 每一路徑的 metric。以 AWGN 通道模型為例,所屬的 metric 為訊號 接收值與狀態輸出的歐幾里得距離(Euclidean distance)平方。而解 碼的程序依據 Viterbi 演算法,計算可能的碼字輸出所對應的累積 metric,其中具有最小 metric 的可行路徑解也將會是最大似然率 (maximum likelihood)的解碼結果。有鑑於此,定義每個時刻狀態的 表示及對應的輸出就顯得非常重要。
首先定義狀態的表示,舉例而言,針對第 3 個時刻
G =
3s{ , g g
0 1}
因此對應
A
3s= { , } a a
0 1 ,具有的狀態組合為(a a
0,
1),所以共有 4 種狀 態 , 分 別 為 (0,0) 、 (0,1) 、 (1,0) 以 及 (1,1) , 而 第 5 個 時 刻
5s
{ }
G = g
2 對應A
5s= { } a
2 ,因此具有的狀態組合為(a
2),所以其所有的狀態為 0 以及 1。如圖 4.3 所示。
接下來說明從第 i 個時刻到第 i+1 個時刻的輸出位元。其值根據
有無
a
*的出現有兩種情況發生。在第 i 個時刻其G
if 若有列向量符合42 一時刻的 metric,前一時刻所累積的 metric 和該時刻所得歐幾里得 距離平方的相加即為該時刻該狀態的 metric。若該狀態具有兩個以 上的來源路徑時,會互相比較其 metric,選擇其中具有最小 metric 的路徑當做該狀態的資訊。待最後一個時刻,亦即接受碼字結束之時,
當 時 第 二 個 時 刻 收 到 的 資 訊 為 3.14 , 則 (01) 狀 態 其 metric 為
1.25 (3.14 (1)) + −
2= 5.8296
,而(10)狀態其 metric 則為2.64 (3.14 ( 1)) + − −
2= 19.7796
。最後根據解碼出的碼字,將此碼字按照[I,J]的畫分,前半部的 二進位表示可以對應到一個列索引,而碼字後半部的碼字對應一個行 索引,這樣的解碼過程輸出結果絕對是一個合法的碼字,因此在指定 矩陣之中絕對不會發生對應到空的位置而無法判斷的錯誤。此改良的 結果會在下一章實驗結果中探討,並且運用在 AWR-WB 編碼參數上呈 現整個解碼效果。
44
第五章
實驗模擬與結果分析
三種不同的系統設計,第一種即為第二章所介紹的系統架構,第 二種及第三種則分別為第三章以及第四章所介紹的系統。為了方便區 別,我們分別將之命名為 MDC1、MDC2 及 MDC3。第二章所介紹的 MDC1 系統架構中,使用通道匹配二元置換演算法經過一次次的置換運算,
逐漸找到與當時通道環境匹配的最佳指定矩陣,此指定矩陣可有效提 升系統的整體效能,將在第一節用實驗結果加以驗證。第二節則是在 指定索引的同時,找尋一些特殊的位置,使在該位置的索引所對應的 列索引及行索引可成為一個碼字。解碼端可利用此結構以改善系統效 能,此技術將會依序運用在錯誤位元以及 AWGN 通道環境之下。第三 節則是將三種不同的多重描述向量量化應用在 AMR-WB 系統,並比較 不同設計的效能評比差異。
5.1 通道匹配二元置換的實驗
5.1.1 系統模擬之步驟說明
在此節之內容中,主要是將貫徹整篇論文的二元置換演算法進行 系統模擬與結果分析。利用包含了男聲與女聲的大量語料,經過 AMR-WB 編碼器得到 194881 組 ISF 索引,並記錄其個別索引的機率做
為事前機率使用。在這些語料內中取出一段 200 秒長度的語音作為參 考,利用 AMR-WB 編碼器產生出 10000 組 ISF 索引,每組 ISF 索引具 有 7 個索引值,事前訓練好各個索引值的量化碼字書,提供解碼端解 碼的依據。本節實驗將使用每組 ISF 索引的第一個索引當作訊號源,
意即第二章所介紹的索引值 ID1,經過指定矩陣的對應每個索引值可 以對應其列索引以及行索引,通過二位元相位鍵移(BPSK)調變,把 每一位元由原來的
{0,1}
映對成{1, 1} −
。列索引及行索引分別經過不同 的通道傳送至接收端。模擬通道則使用位元錯誤通道環境,為了簡化 模擬實驗,設定兩個通道的位元錯誤率是一致的。接收端接受來自兩 個通道的資訊之後,隨即啟動多重描述解碼器,配合事前訓練的量化 碼書執行解碼的動作。5.1.2 結果分析
不同的指定矩陣所對應的列索引及行索引存在明顯差異,因而反 應在解碼端的效能也有所不同。因此本實驗利用二元置換演算法持續 做運算,並記錄每次置換之後的指定矩陣。而系統效能的評量方式則 是根據每個索引在事前訓練的量化碼書所對應的碼字,和在多重描述 解碼器輸出的結果做比較,最後再總合計算其訊雜比(SNR)。實際的 運算如下式:
46
5.2 兩階段索引指定的實驗
48
表 5.1 位元錯誤率與訊雜比的對應關係
訊號源和第一節實驗使用的相同,第二章所介紹的量化索引值 ID1,
經過根據不同的通道環境預先設計的指定矩陣,通過錯誤通道環境之 後,在解碼端對接收訊號做解碼的動作。如果是位元錯誤通道,則會 先經過查核矩陣的檢查之後再做多重描述解碼器的解碼動作,如果是 AWGN 通道,則直接利用柵狀解碼器做解碼的動作,其平均值設定為 0,
變異數則根據上表的對照表作改變。
5.2.2 結果分析
採用訊雜比衡量三種不同的系統設計概念,第一種設計 MDC1 即 第二章所介紹的系統架構,而 MDC2、MDC3 則分別為第三章以及第四 章所介紹的系統架構。後兩種系統因為具有一定程度的錯誤更正的能 力,我們預期其系統效能會勝於 MDC1 系統,實驗結果如圖 5.2 所示。
MDC1 與 MDC2 兩個系統在錯誤率較高的環境下,其解碼效能其實非常 接近,這是因為通道錯誤超出 MDC2 的查核矩陣可以更正的能力範圍。
MDC3 系統則因為考量在軟性領域之下,所有的解碼並沒有事先做硬 性的判別,同時具備錯誤更正的能力,使得其效能在各種錯誤環境之 下都明顯優於其他兩個系統。
圖 5.2 MDC1、MDC2 及 MDC3 訊雜比比較圖
50
n
( )
評估(Perceptual Evaluation of Speech Quality;PESQ),比較原始與解碼重0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 0.11
52
建的語音檔,評量分數(Mean Opinion Score,MOS)範圍從 0 到 4.5。
評分 4.5 代表重建的音質與原音檔非常接近,0 則代表重建語音品質
第六章
結論與未來展望
不同的應用服務所對應的通道模型存在明顯的差異,例如位元錯 誤通道、可加性高斯白雜訊通道、網路封包漏失通道以及雷利衰弱通 道(Rayleigh fading channel)。多重描述量化原本是針對網路封包 漏失而發展的訊源編碼技術,本論文將此技術推廣應用於行動通訊常 見的位元錯誤通道以及 AWGN 通道。在多重描述量化中指定索引的設 計扮演重要的角色,最佳化的索引指定設計有助提升解碼的效果。本 論文主要的構想是將索引指定分解為位置指定與位元對應兩階段,在 指定索引的同時預先決定好特定位置,讓對應的列索引以及行索引可 以合併成為一個碼字。此結構於解碼端可更正一定程度的位元錯誤,
進而有效提升解碼輸出的語音品質。在第五章的實驗模擬證實,我們 提出的兩階段索引指定設計,不但大幅減少二元置換演算法的運算量,
在位元錯誤或 AWGN 通道環境解碼輸出的音值也顯著改善。
目前研究是假設位元錯誤呈現隨機分佈,但這並不符合真實通道 環境的叢發性位元錯誤。此外,我們只考量兩個通道下傳輸,未來可 將此系統擴展到更多的通道傳輸,對於索引指定上的設計也更靈活。
通 道 的 擴 展 其 實 和 多 輸 入 多 輸 出 (Multiple Input Multiple Output,MIMO)的系統架構有其相同之處,而雷利衰弱通道更是無線通
54
參考文獻
[1] V. A. Vaishampayan, “Design of multiple description scalar quantizers,” IEEE Trans. Inform. Theory, vol. 39, pp. 821‐834, May 1993.
[2] Y. Zhou and W.‐Y. Chan, “Multiple description quantizer design using a channel optimized quantizer approach,” in Proceedings of the 38th
Annual Conference on Information Sciences and systems, 2004.
[3] P. Yahampath, “On index assignment and the design of multiple description qiantizers,” in Proceedings of 2004 International Conference
[5] N. Gortz and P. Leelapornchai, “Optimization of the index assignments for multiple description vector quantizers,” IEEE Trans.
Commun., vol. 51, no. 3, pp.336‐340, Mar. 2003.
[6] Rui Ma and Fabrice Labeau, “Robust index assignment for MDSQ encoder over noisy channels,” Proc. MMSP’06, pp. 286–290, Oct. 2006.
56
[8]S. Lin and D. J. Costello, Jr., Error Control Coding. Englewood Cliffs, NJ:
Prentice‐Hall, 2004.
[9]L. Hanzo, F. C. A. Somerville, and J. P. Woodard, Voice Compressionand
Communications. New York: Wiley, 2001.
[10]B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola‐Pukkila, J.
Mikkola, H. Vainio, and K. Jarvinen, “The Adaptive Multirate Wideband Speech Codec(AMR‐WB).” IEEE Transcations on speech and audio
processing, vol.10, no.8, pp.620‐636, Nov. 2002.
[11]Yugang Zhou,”Analysis and Design of Multiple Desciption Codes For Wired And Wireless Channels,” qspace.library.queensu.ca , pp68‐101 , September 2007