第三章 基於位元錯誤通道的索引指定
3.3 基於位元錯誤通道的多重描述向量量化系統
圖 3.5 位元錯誤通道的多重描述量化系統
此系統架構和前一章最大的不同就是增加了查核矩陣的錯誤 更正機制,利用 3.1.2 的方法經過位置指定以及位元對應之後,可 以確保[I,J]的二進位表示式絕對是一個合法的碼字。經過通道雜 訊的干擾,在做多重描述解碼之前,我們會將兩個通道的索引接收 值經由查核矩陣做預先的判定與錯誤更正的動作。這時候會有下列 各種情況發生:
1、 發現錯誤位元,並正確的更正回來,才繼續做後續的多重描 述解碼處理。
2、 發現錯誤位元,卻更正成另外一個合法碼字,才繼續做後續 的多重描述解碼處理。
3、 發現錯誤位元,卻無法更正回來,對碼字不做任何的變更動
30
第四章
基於 AWGN 通道的索引指定
在前二章所探討的系統都是基於位元錯誤通道的考慮而設計,
此章則將通道模型推廣到更複雜的 AWGN 環境。因應此通道環境,軟 性輸入輸出系統的通道轉移機率計算以及解碼器也有所不同,而二元 置換演算法也基於通道匹配的原則做最佳化的設計。這章和前一章的 核心概念大致相同,包括資訊量化、具有線性區段碼結構的位置指定 以及其位元對應。最大的不同在於解碼模組,由於經由 AWGN 雜訊干 擾而接受到的訊號皆為實數,無法適用前一章採用的查核矩陣。有鑑 於此,我們引入柵狀(trellis)解碼的機制,取代前一章的查核矩陣 檢查機制以及多重描述解碼器。接下來,會依序介紹通道轉移機率,
以及通道匹配的二進位置換演算法,最後介紹柵狀解碼機制。
4.1 通道轉移機率推導
第二章所推導的通道轉移機率是建構在位元錯誤環境之下,使用 漢明距離並配合各自錯誤環境計算其錯誤機率,並據以設計通道匹配 的二元置換演算法。此章的通道轉移機率雖然不再用漢明距離計算錯 誤率,但仍先從後驗機率出發。
圖 4.1 AWGN 通道的多重描述量化系統
32
( ) ( ) 2 ( ) ( ) 2 2
34
而其推導為一個難以分析的問題。因此我們參考[10]利用此式的上限 來近似
p Y X ( | )
:( | ) { ( | )} ( | )
p Y X ≤ prob MAP X → Y X = prob X → Y X
( | ) ( | )
p Y X ≈ p X → Y X
此一公式將會在接下來小節介紹的失真度公式中計算運用,提供二元 置換演算法運算的依據。
4.2 通道匹配的二元置換演算法
前一章我們考量在位元錯誤通道下,因此在接收端所收到的訊號 皆為二位元表示的列索引以及行索引。收到的兩個索引值透過解碼輸 出的結果與編碼端的碼字數,配合通道轉移機率,計算出每個指定矩 陣的失真度及矩陣中每個索引的成本值,以供二元置換演算法的置換 根據。如式(2.4)所示,不難發現收到的列索引以及行索引已有範圍 限制,意即在未傳輸之前解碼端已經明確知道將會收到的索引型態。
此章則考量在 AWGN 的通道環境之下,在軟性輸入輸出的領域中,接 收端收到的訊號可能為任意實數,無明確的範圍可供解碼器預先做解 碼的動作。使用的失真度評定方式為:
2 2
36
4.3 基於 AWGN 通道的多重描述向量量化系統
圖 4.2 多重路徑量化系統架構圖
4.3.1 系統架構
此章的系統架構圖如圖 4.2 所示,向量量化的輸出索引,經過位 置指定以及位元對應之後,以[I,J]的二進位表示某個產生矩陣所產 生的合法碼字,再分別經由兩個通道傳送其列索引以及行索引。在經 過 AWGN 雜訊干擾之後,在接收端收到的是實數,因此查核矩陣並不 適用在此系統。取而代之的是可以運用在軟性空間領域的 trellis 解 碼器,在解碼過程考慮所有可能的碼字,並輸出一個最大可能性的碼 字。在最後判斷的時候再將此碼字分割為兩部分,前半部對應到列索 引,後半部對應到行索引,再配合經過通道匹配二元置換演算法處理 的指定矩陣,最後可以決定一個索引值出來。接下來介紹 trellis 解 碼器。
4.3.2 trellis 解碼器
顧名思義,柵狀解碼器(trellis decoder)就是利用柵狀碼圖 結構做解碼的動作,完整的柵狀圖(trellis diagram)包含路徑的 輸出以及狀態的表示。為了簡化柵狀圖的建構,我們需要重新安排 產生矩陣使其轉化成為一個 trellis-oriented form(TOF)的特殊 格式。首先透過第三章所介紹的演算法,找出某個產生矩陣
G
的所 格式的產生矩陣G
TOGM,其中 TOGM 代表 trellis oriented generator matrix,舉例而言,給定一產生矩陣:38
1 0 1 0 1 0 0 0 1 1 1 0 0 0 0 0 0 0 1 1 1 G
TOGM⎡ ⎤
⎢ ⎥
= ⎢ ⎥
⎢ ⎥
⎣ ⎦
一輸入訊號
a = [ a a
0,
1,..., a
k−1]
經過產生矩陣G
TOGM 的編碼處理,而得到一個合法碼字
V = [ , ,..., v v
0 1v
n−1]
輸出,針對每時刻的狀態表示 及狀態轉移所衍生出的路徑輸出,主要依據該時刻輸入訊號與G
TOGM的對應產生,其對應關係則需進一步統計 TOF 各個特性的列集合。值 得注意的是,柵狀圖上任一條完整路徑上所有表示的輸出即為一合法 碼字,換句話說,根據此
G
TOGM 所編碼而得的碼字可用此柵狀圖完整 呈現。接下來將統計G
TOGM 所有列向量的對應關係,將來柵狀圖就是 根據這些畫分的列向量慢慢刻畫出來。針對
G
TOGM 所屬的任一列向量g = ( g g
0,
1,..., g
n−1)
,我們定義其位 元展開(bit span)φ ( ) g = [ , ] i j
= { , i i + 1,.... } j
,代表此列向量之中包含所有非零元素的最小索引區間。換句話說,
g
i= 1
且g
j= 1
分別 是此列集合的起頭 1 以及收尾 1。舉例而言:其中
φ ( g
0) = [0, 4]
、φ ( g
1) = [1, 3]
以及φ ( g
2) = [4, 6]
。接著定義40
5
{ g g
0,
1} φ { } g
2{ } a
2 16
{ g g
0,
1} φ { } g
2{ } a
2 1 7{ g g g
0,
1,
2} φ φ φ
0表 4.1 狀態分析表
一個完整的柵狀圖,每條路徑上都具有兩種含意,一是個代表狀 態(state)的轉移,另一個代表對應的輸出,藉由柵狀圖架構可計算 每一路徑的 metric。以 AWGN 通道模型為例,所屬的 metric 為訊號 接收值與狀態輸出的歐幾里得距離(Euclidean distance)平方。而解 碼的程序依據 Viterbi 演算法,計算可能的碼字輸出所對應的累積 metric,其中具有最小 metric 的可行路徑解也將會是最大似然率 (maximum likelihood)的解碼結果。有鑑於此,定義每個時刻狀態的 表示及對應的輸出就顯得非常重要。
首先定義狀態的表示,舉例而言,針對第 3 個時刻
G =
3s{ , g g
0 1}
因此對應
A
3s= { , } a a
0 1 ,具有的狀態組合為(a a
0,
1),所以共有 4 種狀 態 , 分 別 為 (0,0) 、 (0,1) 、 (1,0) 以 及 (1,1) , 而 第 5 個 時 刻
5s
{ }
G = g
2 對應A
5s= { } a
2 ,因此具有的狀態組合為(a
2),所以其所有的狀態為 0 以及 1。如圖 4.3 所示。
接下來說明從第 i 個時刻到第 i+1 個時刻的輸出位元。其值根據
有無
a
*的出現有兩種情況發生。在第 i 個時刻其G
if 若有列向量符合42 一時刻的 metric,前一時刻所累積的 metric 和該時刻所得歐幾里得 距離平方的相加即為該時刻該狀態的 metric。若該狀態具有兩個以 上的來源路徑時,會互相比較其 metric,選擇其中具有最小 metric 的路徑當做該狀態的資訊。待最後一個時刻,亦即接受碼字結束之時,
當 時 第 二 個 時 刻 收 到 的 資 訊 為 3.14 , 則 (01) 狀 態 其 metric 為
1.25 (3.14 (1)) + −
2= 5.8296
,而(10)狀態其 metric 則為2.64 (3.14 ( 1)) + − −
2= 19.7796
。最後根據解碼出的碼字,將此碼字按照[I,J]的畫分,前半部的 二進位表示可以對應到一個列索引,而碼字後半部的碼字對應一個行 索引,這樣的解碼過程輸出結果絕對是一個合法的碼字,因此在指定 矩陣之中絕對不會發生對應到空的位置而無法判斷的錯誤。此改良的 結果會在下一章實驗結果中探討,並且運用在 AWR-WB 編碼參數上呈 現整個解碼效果。
44
第五章
實驗模擬與結果分析
三種不同的系統設計,第一種即為第二章所介紹的系統架構,第 二種及第三種則分別為第三章以及第四章所介紹的系統。為了方便區 別,我們分別將之命名為 MDC1、MDC2 及 MDC3。第二章所介紹的 MDC1 系統架構中,使用通道匹配二元置換演算法經過一次次的置換運算,
逐漸找到與當時通道環境匹配的最佳指定矩陣,此指定矩陣可有效提 升系統的整體效能,將在第一節用實驗結果加以驗證。第二節則是在 指定索引的同時,找尋一些特殊的位置,使在該位置的索引所對應的 列索引及行索引可成為一個碼字。解碼端可利用此結構以改善系統效 能,此技術將會依序運用在錯誤位元以及 AWGN 通道環境之下。第三 節則是將三種不同的多重描述向量量化應用在 AMR-WB 系統,並比較 不同設計的效能評比差異。
5.1 通道匹配二元置換的實驗
5.1.1 系統模擬之步驟說明
在此節之內容中,主要是將貫徹整篇論文的二元置換演算法進行 系統模擬與結果分析。利用包含了男聲與女聲的大量語料,經過 AMR-WB 編碼器得到 194881 組 ISF 索引,並記錄其個別索引的機率做
為事前機率使用。在這些語料內中取出一段 200 秒長度的語音作為參 考,利用 AMR-WB 編碼器產生出 10000 組 ISF 索引,每組 ISF 索引具 有 7 個索引值,事前訓練好各個索引值的量化碼字書,提供解碼端解 碼的依據。本節實驗將使用每組 ISF 索引的第一個索引當作訊號源,
意即第二章所介紹的索引值 ID1,經過指定矩陣的對應每個索引值可 以對應其列索引以及行索引,通過二位元相位鍵移(BPSK)調變,把 每一位元由原來的
{0,1}
映對成{1, 1} −
。列索引及行索引分別經過不同 的通道傳送至接收端。模擬通道則使用位元錯誤通道環境,為了簡化 模擬實驗,設定兩個通道的位元錯誤率是一致的。接收端接受來自兩 個通道的資訊之後,隨即啟動多重描述解碼器,配合事前訓練的量化 碼書執行解碼的動作。5.1.2 結果分析
不同的指定矩陣所對應的列索引及行索引存在明顯差異,因而反 應在解碼端的效能也有所不同。因此本實驗利用二元置換演算法持續 做運算,並記錄每次置換之後的指定矩陣。而系統效能的評量方式則 是根據每個索引在事前訓練的量化碼書所對應的碼字,和在多重描述 解碼器輸出的結果做比較,最後再總合計算其訊雜比(SNR)。實際的 運算如下式:
46
5.2 兩階段索引指定的實驗
48
表 5.1 位元錯誤率與訊雜比的對應關係
訊號源和第一節實驗使用的相同,第二章所介紹的量化索引值 ID1,
經過根據不同的通道環境預先設計的指定矩陣,通過錯誤通道環境之 後,在解碼端對接收訊號做解碼的動作。如果是位元錯誤通道,則會 先經過查核矩陣的檢查之後再做多重描述解碼器的解碼動作,如果是
經過根據不同的通道環境預先設計的指定矩陣,通過錯誤通道環境之 後,在解碼端對接收訊號做解碼的動作。如果是位元錯誤通道,則會 先經過查核矩陣的檢查之後再做多重描述解碼器的解碼動作,如果是