第五章 實驗模擬與結果分析
5.3 整合多重敘述與訊源控制通道解碼之實驗
5.3.1 系統模擬之步驟說明
圖 4.3 為本小節系統模擬之架構。其事前機率與訊號源與前面的 實驗相同。當訊號源經過 S-MSVQ 後,會產生出七組索引,將七組索 引X 分別利用其對應的索引指定矩陣分成兩敘述n I 與n 。在這裡我 們將模擬兩種索引指定矩陣對於重建訊號的影響,第一種為亂數索引 指定矩陣,其產生方法為在 1000 個任意產生的指定矩陣中,選擇最 小失真
Jn
D
的矩陣。第二種矩陣則是將亂數索引指定矩陣視為起始矩 陣,利用 4.2 節所提的 MD-BSA 方法,求得最佳的指定矩陣,而各索 引所配置的指定矩陣大小,如表 5.4 所示。輸出兩敘述分別利用迴旋 編碼器後送入兩個獨立的 AWGN 通道。在接收端接收到兩通道過去與 現在的訊息 ˆI 與 ˆn J ,利用(4.22)的最大後驗機率解碼器預估出的索引nˆn
X ,最後查詢量化碼書重建出訊號
ISF
n。其實驗結果如圖 5.3 所示。表 5.4 各索引所配置的指定矩陣
圖 5.3 多重敘述通道解碼的平均頻譜失真結果
5.3.2 結果分析
RAM 表示此系統模擬的索引指定矩陣是從 1000 組任一產生矩陣 中找出最小失真的矩陣,MD-BSA 代表索引指定矩陣是有利用 MD-BSA 設計。相較於 RAM,我們可以發現 MD-BSA 所設計的索引指定矩陣能 有效提昇其解碼效能。
與前一小節實驗模擬中的 SMAP1 相比,不論是使用 RAM 產生或是 MD-BSA 所設計的索引指定矩陣,多重敘述的編碼模式都能進一步減 少解碼的頻譜失真。但特別強調的是,多重敘述編碼模式會增加額外
表 5.5 不同解碼機制的位元傳輸數目
第六章 結論與未來展望
本論文提出一個基於軟性輸出通道解碼演算法的錯誤隱匿機 制,主要是整合訊號源在經由訊源編碼後索引間的殘餘冗息以及多重 敘述向量量化,以提昇在接收端通道解碼的錯誤更正能力。首先分析 訊號源在經由 AMR-WB 編碼器量化後,紀錄並分析其不同層級的索引 間所殘留的訊源冗息。實驗模擬證實利用越多的索引間的殘餘冗息,
在接收端越能提昇解碼效能,尤其當通道環境劣時改善效能格外明 顯。最後,並將所記錄的事前訊息應用於所提出的 SMAP1 及 MD-SMAP1 的演算法中,對於解碼效能都能提供很大的幫助。
在第五章的實驗模擬證實,結合訊號源的殘餘冗息與多重敘述向 量量化,確實大幅提昇解碼器的錯誤更正的能力。但目前在模擬中所 使用的通道環境,僅考慮無記憶性的可加性高斯白雜訊通道,而這樣 的通道假設並不符合真實通道環境觀察到的叢發現位元錯誤。因此在 未來,可以針對通道模擬環境加以改善,並且考慮具有記憶性的通道 環境,例如 Glibert 通道,。若能通道記憶特性整合於解碼過程,相 信亦能提昇寬頻語音系統的強健性。除此之外,在本論文中所推導的 後驗機率演算法,當索引位元數目增大,其計算量更為龐大且複雜,
在解碼的效率上將有所延遲,其即時製作的具體實現有賴於演算法的 進一步簡化。還有第四章所提出的編碼架構,其輸出位元數目約為原 本的 2.4 倍,應考慮設計的更低位元率的編碼器。
參考文獻
[1]C.E. Shannon,“A Mathematical Theory of Communication,” Bell Sust.Tech.J.,vol.27,pp.379-423,pp.623-656,1948.
[2] T. Fingscheidt and P. Vary, “Softbit speech decoding:A New Approach to Error Concealment,”IEEE Trans. Speech and Audio Processing, vol.9, no 3, pp 240-251, March 2001.
[3]A.M. Peinado, V. Sanchez, J.L. Perez-Cordoba, and A. Torre,
“HMM-based channel error mitigation and its application to distributed speech recognition,”Speech Communication, vol.41, pp. 549-531,2003.
[4]H.U. Reinhold, and I. Valentin, “Soft features for improved distributed speech recognition over wireless networks,” 8th International Conference on spoken Language Processing, pp.2125-2128, Jeju Island, Korea, Oct 2004.
[5]J. Hagenauer, “Source-Controlled Channel Decoding,”IEEE Trans.
Commun., vol.43, pp.2449-2457, Sep. 1995.
[6]L. Hanzo, F. C. A. Somerville, and J. P. Woodard, Voice Compressionand Communications. New York: Wiley, 2001.
[7]B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J.
Mikkola, H. Vainio, and K. Jarvinen, “The Adaptive Multirate Wideband Speech Codec(AMR-WB).” IEEE Transcations on speech and audio processing, vol.10, no.8, pp.620-636, Nov. 2002.
[8]S. Lin and D. J. Costello, Jr., Error Control Coding. Englewood Cliffs, NJ: Prentice-Hall, 2004.
[9]K. Sayood and J.C. Borkenhagen, “Use of residual redundancy in the design of joint source/channel coders,” IEEE Trans. Commun., vol. 39, No. 6, pp. 838-846, June 1991.
[10]V. Cuperman, F.H. Liu, and P. Ho, “Robust vector quantization for noisy channel using soft decision and sequential decoding,” Eur. Trans.
Telecomm., vol.5, no.5, pp.7-18, Sept 1994.
[11]K.P. Ho, “Soft-decoding vector quantizer using reliability information from turbo-codes,” IEEE Commun, Lett., vol.3, pp.208-210, July 1999.
[12]F. Lahouti and A. K. Khandani, “Soft Reconstruction of Speech in the Presence of Noise and Packet Loss,” Technical Report 2003-4, Department of E&CE, University of Waterloo, 2004, available at www.cst.uwaterloo.ca, Submitted to IEEE Trans. Inform. Theory, Revised Expected publication.
[13]N. Gortz, and P. Leelapornchai, “Optimization of the index assignment for multiple description vector quantizers,” IEEE Trans.
Commun., vol.51, no.3, pp.336-340, Mar. 2003.