５．２．４實驗結果：隨機錯誤對語音辨識的影響

位元錯誤率高斯混合數＝２高斯混合數＝４高斯混合數＝８附加說明

0 42.64 49.20 55.31 基礎實驗

0 40.64 48.03 52.88

10^-5 40.64 48.03 52.87 10^-4 40.57 47.94 52.84 10^-3 40.21 47.60 52.36 10^-2 35.94 43.05 47.66

表５．１實驗結果：隨機錯誤對辨識結果的影響。如表中所示，

列出的是在不同的位元錯誤率底下，中文大字彙連續語音的音節辨識正確率。

上表５．１列出在無線通道發生隨機錯誤時，在各種不同的位元錯誤率下，中文大字彙連續語音的音節辨識正確率。在第一欄中所列出的，是各種不同的位元錯誤率：這一項的是所有發生錯誤的位元

數，除以所有的位元總數而得來，我們取１０^－２〜１０^－５之間的值

；中間三欄是在不同的高斯混合數下，所得到的辨識正確率。另外

，在表中的第一列所列出的是未經量化的基礎實驗的結果，第二列所列出的是在傳輸端用”７７６６６６６”的碼本組合做向量化、

但在無線通道中沒有錯誤干擾時的辨識正確率；列出這兩列是為了要做比較：以第一列做基準可以看出當發生傳輸錯誤時，因無線傳輸所帶來辨識正確率的總和影響（量化錯誤＋傳輸錯誤），由第二列可以看出單單傳輸錯誤所帶來的影響。以下我們先將上面的數據製圖如圖５．３，接下來再討論實驗結果。

圖５．３（Ａ）在高斯混合數＝２時，發生隨機錯誤時位元錯誤率和音節辨識正確率的關係。

圖５．３（Ｂ）在高斯混合數＝４時，發生隨機錯誤時位元錯誤率和音節辨識正確率的關係。

圖５．３（Ｃ）在高斯混合數＝８時，發生隨機錯誤時位元錯誤率和音節辨識正確率的關係。

●隨機錯誤之位元錯誤率與辨識正確率的關係

上面的三張圖中各列出三條線：第一條是在發生隨機錯誤的情況下

，不同的位元錯誤率所對應的辨識正確率；第二條是基礎實驗所得的結果；第三條是沒有發生隨機錯誤時的情況。如前所述，列出第二條和第三條是為了比較之用：第一條線和第二條線中的間距，代表發生因無線傳輸所帶來的辨識效能下降；第一條線和第三條線中的間距，則是單獨代表因隨機錯誤所帶來的辨識效能下降。若間距愈大，表示辨識效能所受的影響愈大。三張圖中，觀察第一條線和第三條線中的間距，不難發現：當高位元錯誤率的時候（約１０^－２

），單獨考慮隨機錯誤的因素，辨識正確率大約下降５％。但是當位元錯誤率下降到１０^－３的時候．此時辨識正確率就只有微幅的、

約０．５％的下降，如果位元錯誤率更進一步下降到１０^－４、或是１０^－５的低位元錯誤率時，此時辨識正確率就幾乎沒有下降了。

以上所得到的結果，由以下的分析可以得到解釋。

一．在我們所使用的語料中，一個字的平均時間長度大約是０．５秒。在第三章曾提到，對於音節的描述，我們是採用「聲母加上界音、韻母模型」的方式來描述；假設「聲母加上界音」以

及「韻母」兩個次音節單位的時間長度一樣長，那麼上述兩部分音素的平均時間長度就是０．２５ｓ。

二．由語料中所取出的音框，其時間長度是１０ｍｓ（０．０１ｓ

），故對於每一個次音節單位，取出的音框平均數大約為０．２５／０．０１＝２５音框／次音節單位，

又一個音框取出一組特徵向量，故對於每一個次音節單位，取出的特徵向量平均數即為２５特徵向量／次音節單位。

三．而在主從式架構中，對於每一個特徵向量，在向量量化後我們用４４個位元來描述其所得到的量化代碼（使用“７７６６６６６”的碼本），

因此，當位元錯誤率＝１０^－２時，平均每２．２７個特徵向量會發生一個錯誤，在每個次音節單位中有２５／２．２７≒

１１個特徵向量會發生１個錯誤；當位元錯誤率＝１０^－３時，

平均每２２．７個特徵向量會發生一個錯誤，在每個次音節單位中有２５／２２．７≒１個特徵向量會發生１個錯誤；當位元錯誤率＜１０^－３時，則在每個次音節單位中不到１個特徵向量會發生錯誤；

四．當次音節單位所對應的特徵向量發生改變的時候，那麼所得到的辨識結果就有可能發生改變。如圖５．４所示，當發生辨識

辨識結果

次音節單位所對應的２５個特徵向量中，若特徵向量改變的數目愈多，原先辨識正確的愈有可能辨識錯誤，因此α會愈小，

對β的影響也是一樣，因此原先辨識錯誤的愈有可能辨識正確

。只不過變動的程度會有所不同：對於一個已知的次音節單位而言，辨識錯誤的可能性總共有４２８種，辨識正確的可能性只有１種（所有次音節單位總數為４２９）。因此α值要比β 值大得多，所以我們可以很合理的假設：在特徵向量改變時，

只有α值會小於１，β值可假設為１；而且特徵向量改變得愈多，α值變得愈小。

五．由第三點以及第四點可以得知，因為在位元錯誤率＝１０^－２時

，每個次音節單位中平均發生錯誤的向量個數多達１１個，α 值下降的幅度必然很大；但在位元錯誤率＝１０^－３時，每個次音節單位中平均發生錯誤的向量個數只有１．１個，α值不會比１小太多，若位元錯誤率更小時，那麼α值會更接近１。因此，當位元錯誤率＝１０^－２時，因為α變小，造成辨識效能的大量下降；但是在位元錯誤率＝１０^－３、或是更低的時候，α 的改變不大，因此辨識結果跟沒有發生錯誤時，並不會有太大的差別。

●隨機錯誤對音節辨識的影響小於向量量化所帶來的影響

在前一小節曾提到：圖５．３中，第一條線和第三條線中的間距，

代表因為無線通道中發生隨機錯誤而造成的辨識效果下降。另外，

第二條線和第三條線的差距代表因為向量量化的量化誤差所導致的辨識效果下降。若第一條線和第三條線中的間距，比第二條線和第三條線中的間距要來得大，代表隨機錯誤的影響大過量化錯誤的影響；反之，則是量化錯誤的影響大過隨機錯誤的影響。由圖５．３可以知道，在位元錯誤率大於１０^－３時，隨機錯誤的影響大過量化錯誤的影響，但在位元錯誤率小於１０^－３時，隨機錯誤的影響就極小，主要的錯誤來自於量化錯誤。在無線通訊中，要將位元錯誤率降到１０^－３以下其實是並不困難的，也就是說，在一般的狀況底下

，通道若發生隨機錯誤，對於整個音節辨識結果影響並不是很大；

主要的辨識率下降，還是取決在因向量量化所帶來的量化錯誤－－

也正因為量化錯誤還是主要的辨識正確率下降的來源，更顯出如何找到一個具有代表性的碼本的重要。由以上所述，在５．２這一節中，我們得到的結論是：在主從式對於音節的辨識，若致力使整個通訊系統的位元錯誤率維持在１０^－３以下，那麼我們就可以忽略通道中的隨機錯誤所帶來的影響；此時若想進一步改善辨識正確率，

主要應從如何使碼本最佳化著手。

５．３無線通道錯誤的模擬（二）－－群集錯

在文檔中子計畫一：無線通訊環境下國語語音之分散式辨認(3/3) (頁 70-78)

５．２．４ 實驗結果：隨機錯誤對語音辨識的影響

５．３ 無線通道錯誤的模擬（二）－－群集錯

５．３無線通道錯誤的模擬（二）－－群集錯