• 沒有找到結果。

第五章 實驗模擬與結果分析

5.1 冗息應用於訊源解碼之實驗

5.1.2 結果分析

表 5.1、表 5.2 與表 5.3 中,分別為在不同 AWGN 通道環境下,

針對重建的

ISF

n係數與索引X 利用量化碼書查表得到n ISF 係數之間n

的訊雜比(Signal-to-Noise Ratio,SNR)作為衡量標準:

( )

10000 2

1

10 10000 2

1

SNR 10log [dB]

i i

i i

i

ISF ISF ISF

=

=

=

(5.1)

表中 ISF_1 代表 ISF 第一組係數。HD(Hard Decision)是指接收到的 訊息,解碼時僅執行硬判斷,不做任何後驗機率的運算。從表中可以

發現 IMAP1 利用不均勻的索引分布機率而取得比 HD 更好的解碼效 均頻譜失真(Spectrum Distortion)。對第 個音框而言,其頻譜失 真為

濾波器, 。其模擬結果如圖 5.1 所示。從圖中也不難發現 當利用越多的索引間相關性,其解碼效果也就越好。更值得一提的 是,在 AWGN 通道雜訊比較大時,不同訊源解碼機制的優劣差異會更 明顯呈現。

12800 Fs =

5.2 訊源控制通道解碼之模擬

5.2.1 系統模擬之步驟說明

本小節主要是將 3.3 節之解碼演算法進行系統模擬與結果分 析,同時採用迴旋碼(Convolutional Code,cc)的通道編碼器,如圖 3.3 所示。所用的事前機率與訊號源與 5.1 節模擬一樣,不同的是將 訊號源經過量化處理所得的索引通過迴旋編碼器再進行 BPSK 調變,

然後送進 AWGN 通道。在接收端分別利用 3.3 節所推導出來的 IMAP 與 SMAP1 計算其後驗機率,所預估出來的索引 再比對量化碼書可得

。實驗結果如圖 5.2 所示。

Xˆ

ISF

圖 5.2 訊源控制通道解碼器平均頻譜失真結果

5.2.2 結果分析

在圖 5.2 中,由於 SMAP1 比 IMAP 多利用了相鄰框架間索引的殘 餘冗息,從圖中可以發現 SMAP1 的解碼效能會比 IMAP 來的好。在前 一小節中的模擬顯示出在通道較好的環境下,訊源解碼所能提升的效 能並不明顯。由於本節加入的通道編碼處理,不僅在通道環境不好時,

SMAP1 比起 IMAP 的解碼效能有明顯上升外;在通道環境好時,解碼 效能也有不錯提升。除此之外,與 5.1 節的訊源解碼實驗比較,不難 發現加入迴旋碼能有效提昇其解碼效,而所付出的代價是較高的位元 傳輸率。

5.3 整合多重敘述與訊源控制通道解碼之實驗

5.3.1 系統模擬之步驟說明

圖 4.3 為本小節系統模擬之架構。其事前機率與訊號源與前面的 實驗相同。當訊號源經過 S-MSVQ 後,會產生出七組索引,將七組索 引X 分別利用其對應的索引指定矩陣分成兩敘述n I 與n 。在這裡我 們將模擬兩種索引指定矩陣對於重建訊號的影響,第一種為亂數索引 指定矩陣,其產生方法為在 1000 個任意產生的指定矩陣中,選擇最 小失真

Jn

D

的矩陣。第二種矩陣則是將亂數索引指定矩陣視為起始矩 陣,利用 4.2 節所提的 MD-BSA 方法,求得最佳的指定矩陣,而各索 引所配置的指定矩陣大小,如表 5.4 所示。輸出兩敘述分別利用迴旋 編碼器後送入兩個獨立的 AWGN 通道。在接收端接收到兩通道過去與 現在的訊息 ˆI 與 ˆn J ,利用(4.22)的最大後驗機率解碼器預估出的索引n

ˆn

X ,最後查詢量化碼書重建出訊號

ISF

n。其實驗結果如圖 5.3 所示。

表 5.4 各索引所配置的指定矩陣

圖 5.3 多重敘述通道解碼的平均頻譜失真結果

5.3.2 結果分析

RAM 表示此系統模擬的索引指定矩陣是從 1000 組任一產生矩陣 中找出最小失真的矩陣,MD-BSA 代表索引指定矩陣是有利用 MD-BSA 設計。相較於 RAM,我們可以發現 MD-BSA 所設計的索引指定矩陣能 有效提昇其解碼效能。

與前一小節實驗模擬中的 SMAP1 相比,不論是使用 RAM 產生或是 MD-BSA 所設計的索引指定矩陣,多重敘述的編碼模式都能進一步減 少解碼的頻譜失真。但特別強調的是,多重敘述編碼模式會增加額外

表 5.5 不同解碼機制的位元傳輸數目

第六章 結論與未來展望

本論文提出一個基於軟性輸出通道解碼演算法的錯誤隱匿機 制,主要是整合訊號源在經由訊源編碼後索引間的殘餘冗息以及多重 敘述向量量化,以提昇在接收端通道解碼的錯誤更正能力。首先分析 訊號源在經由 AMR-WB 編碼器量化後,紀錄並分析其不同層級的索引 間所殘留的訊源冗息。實驗模擬證實利用越多的索引間的殘餘冗息,

在接收端越能提昇解碼效能,尤其當通道環境劣時改善效能格外明 顯。最後,並將所記錄的事前訊息應用於所提出的 SMAP1 及 MD-SMAP1 的演算法中,對於解碼效能都能提供很大的幫助。

在第五章的實驗模擬證實,結合訊號源的殘餘冗息與多重敘述向 量量化,確實大幅提昇解碼器的錯誤更正的能力。但目前在模擬中所 使用的通道環境,僅考慮無記憶性的可加性高斯白雜訊通道,而這樣 的通道假設並不符合真實通道環境觀察到的叢發現位元錯誤。因此在 未來,可以針對通道模擬環境加以改善,並且考慮具有記憶性的通道 環境,例如 Glibert 通道,。若能通道記憶特性整合於解碼過程,相 信亦能提昇寬頻語音系統的強健性。除此之外,在本論文中所推導的 後驗機率演算法,當索引位元數目增大,其計算量更為龐大且複雜,

在解碼的效率上將有所延遲,其即時製作的具體實現有賴於演算法的 進一步簡化。還有第四章所提出的編碼架構,其輸出位元數目約為原 本的 2.4 倍,應考慮設計的更低位元率的編碼器。

參考文獻

[1]C.E. Shannon,“A Mathematical Theory of Communication,” Bell Sust.Tech.J.,vol.27,pp.379-423,pp.623-656,1948.

[2] T. Fingscheidt and P. Vary, “Softbit speech decoding:A New Approach to Error Concealment,”IEEE Trans. Speech and Audio Processing, vol.9, no 3, pp 240-251, March 2001.

[3]A.M. Peinado, V. Sanchez, J.L. Perez-Cordoba, and A. Torre,

“HMM-based channel error mitigation and its application to distributed speech recognition,”Speech Communication, vol.41, pp. 549-531,2003.

[4]H.U. Reinhold, and I. Valentin, “Soft features for improved distributed speech recognition over wireless networks,” 8th International Conference on spoken Language Processing, pp.2125-2128, Jeju Island, Korea, Oct 2004.

[5]J. Hagenauer, “Source-Controlled Channel Decoding,”IEEE Trans.

Commun., vol.43, pp.2449-2457, Sep. 1995.

[6]L. Hanzo, F. C. A. Somerville, and J. P. Woodard, Voice Compressionand Communications. New York: Wiley, 2001.

[7]B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J.

Mikkola, H. Vainio, and K. Jarvinen, “The Adaptive Multirate Wideband Speech Codec(AMR-WB).” IEEE Transcations on speech and audio processing, vol.10, no.8, pp.620-636, Nov. 2002.

[8]S. Lin and D. J. Costello, Jr., Error Control Coding. Englewood Cliffs, NJ: Prentice-Hall, 2004.

[9]K. Sayood and J.C. Borkenhagen, “Use of residual redundancy in the design of joint source/channel coders,” IEEE Trans. Commun., vol. 39, No. 6, pp. 838-846, June 1991.

[10]V. Cuperman, F.H. Liu, and P. Ho, “Robust vector quantization for noisy channel using soft decision and sequential decoding,” Eur. Trans.

Telecomm., vol.5, no.5, pp.7-18, Sept 1994.

[11]K.P. Ho, “Soft-decoding vector quantizer using reliability information from turbo-codes,” IEEE Commun, Lett., vol.3, pp.208-210, July 1999.

[12]F. Lahouti and A. K. Khandani, “Soft Reconstruction of Speech in the Presence of Noise and Packet Loss,” Technical Report 2003-4, Department of E&CE, University of Waterloo, 2004, available at www.cst.uwaterloo.ca, Submitted to IEEE Trans. Inform. Theory, Revised Expected publication.

[13]N. Gortz, and P. Leelapornchai, “Optimization of the index assignment for multiple description vector quantizers,” IEEE Trans.

Commun., vol.51, no.3, pp.336-340, Mar. 2003.

相關文件