整合多重敘述與訊源控制通道解碼之實驗

第五章實驗模擬與結果分析

5.3 整合多重敘述與訊源控制通道解碼之實驗

5.3.1 系統模擬之步驟說明

圖 4.3 為本小節系統模擬之架構。其事前機率與訊號源與前面的實驗相同。當訊號源經過 S-MSVQ 後，會產生出七組索引，將七組索引X 分別利用其對應的索引指定矩陣分成兩敘述_n I 與_n 。在這裡我們將模擬兩種索引指定矩陣對於重建訊號的影響，第一種為亂數索引指定矩陣，其產生方法為在 1000 個任意產生的指定矩陣中，選擇最小失真

D

的矩陣。第二種矩陣則是將亂數索引指定矩陣視為起始矩陣，利用 4.2 節所提的 MD-BSA 方法，求得最佳的指定矩陣，而各索引所配置的指定矩陣大小，如表 5.4 所示。輸出兩敘述分別利用迴旋編碼器後送入兩個獨立的 AWGN 通道。在接收端接收到兩通道過去與現在的訊息 ˆI 與 ˆ_n J ，利用(4.22)的最大後驗機率解碼器預估出的索引_n

ˆn

X ，最後查詢量化碼書重建出訊號

ISF

n。其實驗結果如圖 5.3 所示。

表 5.4 各索引所配置的指定矩陣

圖 5.3 多重敘述通道解碼的平均頻譜失真結果

5.3.2 結果分析

RAM 表示此系統模擬的索引指定矩陣是從 1000 組任一產生矩陣中找出最小失真的矩陣，MD-BSA 代表索引指定矩陣是有利用 MD-BSA 設計。相較於 RAM，我們可以發現 MD-BSA 所設計的索引指定矩陣能有效提昇其解碼效能。

與前一小節實驗模擬中的 SMAP1 相比，不論是使用 RAM 產生或是 MD-BSA 所設計的索引指定矩陣，多重敘述的編碼模式都能進一步減少解碼的頻譜失真。但特別強調的是，多重敘述編碼模式會增加額外

表 5.5 不同解碼機制的位元傳輸數目

第六章結論與未來展望

本論文提出一個基於軟性輸出通道解碼演算法的錯誤隱匿機制，主要是整合訊號源在經由訊源編碼後索引間的殘餘冗息以及多重敘述向量量化，以提昇在接收端通道解碼的錯誤更正能力。首先分析訊號源在經由 AMR-WB 編碼器量化後，紀錄並分析其不同層級的索引間所殘留的訊源冗息。實驗模擬證實利用越多的索引間的殘餘冗息，

在接收端越能提昇解碼效能，尤其當通道環境劣時改善效能格外明顯。最後，並將所記錄的事前訊息應用於所提出的 SMAP1 及 MD-SMAP1 的演算法中，對於解碼效能都能提供很大的幫助。

在第五章的實驗模擬證實，結合訊號源的殘餘冗息與多重敘述向量量化，確實大幅提昇解碼器的錯誤更正的能力。但目前在模擬中所使用的通道環境，僅考慮無記憶性的可加性高斯白雜訊通道，而這樣的通道假設並不符合真實通道環境觀察到的叢發現位元錯誤。因此在未來，可以針對通道模擬環境加以改善，並且考慮具有記憶性的通道環境，例如 Glibert 通道，。若能通道記憶特性整合於解碼過程，相信亦能提昇寬頻語音系統的強健性。除此之外，在本論文中所推導的後驗機率演算法，當索引位元數目增大，其計算量更為龐大且複雜，

在解碼的效率上將有所延遲，其即時製作的具體實現有賴於演算法的進一步簡化。還有第四章所提出的編碼架構，其輸出位元數目約為原本的 2.4 倍，應考慮設計的更低位元率的編碼器。

參考文獻

[1]C.E. Shannon,“A Mathematical Theory of Communication,” Bell Sust.Tech.J.,vol.27,pp.379-423,pp.623-656,1948.

[2] T. Fingscheidt and P. Vary, “Softbit speech decoding:A New Approach to Error Concealment,”IEEE Trans. Speech and Audio Processing, vol.9, no 3, pp 240-251, March 2001.

[3]A.M. Peinado, V. Sanchez, J.L. Perez-Cordoba, and A. Torre,

“HMM-based channel error mitigation and its application to distributed speech recognition,”Speech Communication, vol.41, pp. 549-531,2003.

[4]H.U. Reinhold, and I. Valentin, “Soft features for improved distributed speech recognition over wireless networks,” 8^th International Conference on spoken Language Processing, pp.2125-2128, Jeju Island, Korea, Oct 2004.

[5]J. Hagenauer, “Source-Controlled Channel Decoding,”IEEE Trans.

Commun., vol.43, pp.2449-2457, Sep. 1995.

[6]L. Hanzo, F. C. A. Somerville, and J. P. Woodard, Voice Compressionand Communications. New York: Wiley, 2001.

[7]B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J.

Mikkola, H. Vainio, and K. Jarvinen, “The Adaptive Multirate Wideband Speech Codec(AMR-WB).” IEEE Transcations on speech and audio processing, vol.10, no.8, pp.620-636, Nov. 2002.

[8]S. Lin and D. J. Costello, Jr., Error Control Coding. Englewood Cliffs, NJ: Prentice-Hall, 2004.

[9]K. Sayood and J.C. Borkenhagen, “Use of residual redundancy in the design of joint source/channel coders,” IEEE Trans. Commun., vol. 39, No. 6, pp. 838-846, June 1991.

[10]V. Cuperman, F.H. Liu, and P. Ho, “Robust vector quantization for noisy channel using soft decision and sequential decoding,” Eur. Trans.

Telecomm., vol.5, no.5, pp.7-18, Sept 1994.

[11]K.P. Ho, “Soft-decoding vector quantizer using reliability information from turbo-codes,” IEEE Commun, Lett., vol.3, pp.208-210, July 1999.

[12]F. Lahouti and A. K. Khandani, “Soft Reconstruction of Speech in the Presence of Noise and Packet Loss,” Technical Report 2003-4, Department of E&CE, University of Waterloo, 2004, available at www.cst.uwaterloo.ca, Submitted to IEEE Trans. Inform. Theory, Revised Expected publication.

[13]N. Gortz, and P. Leelapornchai, “Optimization of the index assignment for multiple description vector quantizers,” IEEE Trans.

Commun., vol.51, no.3, pp.336-340, Mar. 2003.

在文檔中強健性寬頻語音編碼系統之研究 (頁 57-63)

第五章 實驗模擬與結果分析

5.3 整合多重敘述與訊源控制通道解碼之實驗

D

ISF

第六章 結論與未來展望

參考文獻

第五章實驗模擬與結果分析

第六章結論與未來展望