結果分析

第五章實驗模擬與結果分析

5.1 冗息應用於訊源解碼之實驗

5.1.2 結果分析

表 5.1、表 5.2 與表 5.3 中，分別為在不同 AWGN 通道環境下，

針對重建的

ISF

n係數與索引X 利用量化碼書查表得到_n ISF 係數之間n

的訊雜比(Signal-to-Noise Ratio,SNR)作為衡量標準：

( )

10000 2

10 10000 2

SNR 10log [dB]

i i

ISF ISF ISF

−

∑

^(5.1)

表中 ISF_1 代表 ISF 第一組係數。HD(Hard Decision)是指接收到的訊息，解碼時僅執行硬判斷，不做任何後驗機率的運算。從表中可以

發現 IMAP1 利用不均勻的索引分布機率而取得比 HD 更好的解碼效均頻譜失真(Spectrum Distortion)。對第個音框而言，其頻譜失真為

濾波器，。其模擬結果如圖 5.1 所示。從圖中也不難發現當利用越多的索引間相關性，其解碼效果也就越好。更值得一提的是，在 AWGN 通道雜訊比較大時，不同訊源解碼機制的優劣差異會更明顯呈現。

12800 Fs =

5.2 訊源控制通道解碼之模擬

5.2.1 系統模擬之步驟說明

本小節主要是將 3.3 節之解碼演算法進行系統模擬與結果分析，同時採用迴旋碼(Convolutional Code,cc)的通道編碼器，如圖 3.3 所示。所用的事前機率與訊號源與 5.1 節模擬一樣，不同的是將訊號源經過量化處理所得的索引通過迴旋編碼器再進行 BPSK 調變，

然後送進 AWGN 通道。在接收端分別利用 3.3 節所推導出來的 IMAP 與 SMAP1 計算其後驗機率，所預估出來的索引再比對量化碼書可得

。實驗結果如圖 5.2 所示。

Xˆ

ISF

圖 5.2 訊源控制通道解碼器平均頻譜失真結果

5.2.2 結果分析

在圖 5.2 中，由於 SMAP1 比 IMAP 多利用了相鄰框架間索引的殘餘冗息，從圖中可以發現 SMAP1 的解碼效能會比 IMAP 來的好。在前一小節中的模擬顯示出在通道較好的環境下，訊源解碼所能提升的效能並不明顯。由於本節加入的通道編碼處理，不僅在通道環境不好時，

SMAP1 比起 IMAP 的解碼效能有明顯上升外；在通道環境好時，解碼效能也有不錯提升。除此之外，與 5.1 節的訊源解碼實驗比較，不難發現加入迴旋碼能有效提昇其解碼效，而所付出的代價是較高的位元傳輸率。

5.3 整合多重敘述與訊源控制通道解碼之實驗

5.3.1 系統模擬之步驟說明

圖 4.3 為本小節系統模擬之架構。其事前機率與訊號源與前面的實驗相同。當訊號源經過 S-MSVQ 後，會產生出七組索引，將七組索引X 分別利用其對應的索引指定矩陣分成兩敘述_n I 與_n 。在這裡我們將模擬兩種索引指定矩陣對於重建訊號的影響，第一種為亂數索引指定矩陣，其產生方法為在 1000 個任意產生的指定矩陣中，選擇最小失真

D

的矩陣。第二種矩陣則是將亂數索引指定矩陣視為起始矩陣，利用 4.2 節所提的 MD-BSA 方法，求得最佳的指定矩陣，而各索引所配置的指定矩陣大小，如表 5.4 所示。輸出兩敘述分別利用迴旋編碼器後送入兩個獨立的 AWGN 通道。在接收端接收到兩通道過去與現在的訊息 ˆI 與 ˆ_n J ，利用(4.22)的最大後驗機率解碼器預估出的索引_n

ˆn

X ，最後查詢量化碼書重建出訊號

ISF

n。其實驗結果如圖 5.3 所示。

表 5.4 各索引所配置的指定矩陣

圖 5.3 多重敘述通道解碼的平均頻譜失真結果

5.3.2 結果分析

RAM 表示此系統模擬的索引指定矩陣是從 1000 組任一產生矩陣中找出最小失真的矩陣，MD-BSA 代表索引指定矩陣是有利用 MD-BSA 設計。相較於 RAM，我們可以發現 MD-BSA 所設計的索引指定矩陣能有效提昇其解碼效能。

與前一小節實驗模擬中的 SMAP1 相比，不論是使用 RAM 產生或是 MD-BSA 所設計的索引指定矩陣，多重敘述的編碼模式都能進一步減少解碼的頻譜失真。但特別強調的是，多重敘述編碼模式會增加額外

表 5.5 不同解碼機制的位元傳輸數目

第六章結論與未來展望

本論文提出一個基於軟性輸出通道解碼演算法的錯誤隱匿機制，主要是整合訊號源在經由訊源編碼後索引間的殘餘冗息以及多重敘述向量量化，以提昇在接收端通道解碼的錯誤更正能力。首先分析訊號源在經由 AMR-WB 編碼器量化後，紀錄並分析其不同層級的索引間所殘留的訊源冗息。實驗模擬證實利用越多的索引間的殘餘冗息，

在接收端越能提昇解碼效能，尤其當通道環境劣時改善效能格外明顯。最後，並將所記錄的事前訊息應用於所提出的 SMAP1 及 MD-SMAP1 的演算法中，對於解碼效能都能提供很大的幫助。

在第五章的實驗模擬證實，結合訊號源的殘餘冗息與多重敘述向量量化，確實大幅提昇解碼器的錯誤更正的能力。但目前在模擬中所使用的通道環境，僅考慮無記憶性的可加性高斯白雜訊通道，而這樣的通道假設並不符合真實通道環境觀察到的叢發現位元錯誤。因此在未來，可以針對通道模擬環境加以改善，並且考慮具有記憶性的通道環境，例如 Glibert 通道，。若能通道記憶特性整合於解碼過程，相信亦能提昇寬頻語音系統的強健性。除此之外，在本論文中所推導的後驗機率演算法，當索引位元數目增大，其計算量更為龐大且複雜，

在解碼的效率上將有所延遲，其即時製作的具體實現有賴於演算法的進一步簡化。還有第四章所提出的編碼架構，其輸出位元數目約為原本的 2.4 倍，應考慮設計的更低位元率的編碼器。

參考文獻

[1]C.E. Shannon,“A Mathematical Theory of Communication,” Bell Sust.Tech.J.,vol.27,pp.379-423,pp.623-656,1948.

[2] T. Fingscheidt and P. Vary, “Softbit speech decoding:A New Approach to Error Concealment,”IEEE Trans. Speech and Audio Processing, vol.9, no 3, pp 240-251, March 2001.

[3]A.M. Peinado, V. Sanchez, J.L. Perez-Cordoba, and A. Torre,

“HMM-based channel error mitigation and its application to distributed speech recognition,”Speech Communication, vol.41, pp. 549-531,2003.

[4]H.U. Reinhold, and I. Valentin, “Soft features for improved distributed speech recognition over wireless networks,” 8^th International Conference on spoken Language Processing, pp.2125-2128, Jeju Island, Korea, Oct 2004.

[5]J. Hagenauer, “Source-Controlled Channel Decoding,”IEEE Trans.

Commun., vol.43, pp.2449-2457, Sep. 1995.

[6]L. Hanzo, F. C. A. Somerville, and J. P. Woodard, Voice Compressionand Communications. New York: Wiley, 2001.

[7]B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J.

Mikkola, H. Vainio, and K. Jarvinen, “The Adaptive Multirate Wideband Speech Codec(AMR-WB).” IEEE Transcations on speech and audio processing, vol.10, no.8, pp.620-636, Nov. 2002.

[8]S. Lin and D. J. Costello, Jr., Error Control Coding. Englewood Cliffs, NJ: Prentice-Hall, 2004.

[9]K. Sayood and J.C. Borkenhagen, “Use of residual redundancy in the design of joint source/channel coders,” IEEE Trans. Commun., vol. 39, No. 6, pp. 838-846, June 1991.

[10]V. Cuperman, F.H. Liu, and P. Ho, “Robust vector quantization for noisy channel using soft decision and sequential decoding,” Eur. Trans.

Telecomm., vol.5, no.5, pp.7-18, Sept 1994.

[11]K.P. Ho, “Soft-decoding vector quantizer using reliability information from turbo-codes,” IEEE Commun, Lett., vol.3, pp.208-210, July 1999.

[12]F. Lahouti and A. K. Khandani, “Soft Reconstruction of Speech in the Presence of Noise and Packet Loss,” Technical Report 2003-4, Department of E&CE, University of Waterloo, 2004, available at www.cst.uwaterloo.ca, Submitted to IEEE Trans. Inform. Theory, Revised Expected publication.

[13]N. Gortz, and P. Leelapornchai, “Optimization of the index assignment for multiple description vector quantizers,” IEEE Trans.

Commun., vol.51, no.3, pp.336-340, Mar. 2003.

在文檔中強健性寬頻語音編碼系統之研究 (頁 53-0)

第五章 實驗模擬與結果分析