• 沒有找到結果。

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 音框錯誤率 0 52.13% 51.92% 52.05% 0.27%

50 52.13% 51.90% 52.04% 0.28%

100 52.13% 51.85% 52.05% 0.35%

250 52.13% 50.05% 51.69% 1.56%

Data Rate --- 4.4 kbps 4.8 kbps 4.8 kbps

GPRS (TU) CS3

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 音框錯誤率 0 52.13% 51.10% 51.82% 0.73%

50 52.13% 50.96% 51.92% 0.78%

100 52.13% 50.77% 51.93% 0.98%

250 52.13% 47.36% 50.57% 3.09%

Data Rate --- 4.4 kbps 4.8 kbps 4.8 kbps

GPRS (HT) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 音框錯誤率 0 52.13% 47.64% 49.07% 12.32%

50 52.13% 47.57% 49.04% 12.78%

100 52.13% 46.90% 48.46% 14.90%

250 52.13% 39.55% 41.50% 30.57%

Data Rate --- 4.4 kbps 4.8 kbps 4.8 kbps

GPRS (TU) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 音框錯誤率 0 52.13% 43.76% 45.49% 18.42%

50 52.13% 43.27% 45.07% 18.82%

100 52.13% 42.53% 44.77% 21.10%

250 52.13% 33.72% 35.56% 35.81%

Data Rate --- 4.4 kbps 4.8 kbps 4.8 kbps

表 5-4 傳統分割式向量量化法的效能

圖 5-4 使用分割式向量量化法,資料傳輸速率為 4.4/4.8 Kbps 在丘陵地 勢通道、CS4 的系統效能

圖 5-5 使用分割式向量量化法,資料傳輸速率為 4.4/4.8 Kbps 在典型都

市通道、CS4 的系統效能

圖 5-6 使用分割式向量量化法,資料傳輸速率為 4.4/4.8 Kbps 在丘陵地 勢通道、CS3 的系統效能

圖 5-7 使用分割式向量量化法,資料傳輸速率為 4.4/4.8 Kbps 在典型都

市通道、CS3 的系統效能

首先我們觀察使用傳統分割式向量量化法與用內插法進行錯誤 補償的電腦模擬效能。其中為了系統的及時特性需求,所使用的內插 法只在此錯誤音框的前 4 個與後 4 個音框間尋找正確的音框,以進行 內插補償。表 5-4 為它們的電腦模擬結果。我們所傳用的訓練語料與 聲學模型與第 2 章所述相同,而我們所選用的實驗語料為聲碩語料庫 中的測試語料,共有男性與女姓各三名、每人三百二十七句話。

由表 5-4 中,我們可以發現,當通道狀況極差、平均位元錯誤率 極高時,使用內插法的錯誤補償技術得到的效果有限,尤其是在 CS4 典型都市的情況下,平均音框錯誤率高於 10% ,這使得需要執行錯 誤補償的錯誤音框而言找不到合適且相鄰的正確音框進行補償,因此 對於辨識率的提升作用有限。而總結來看,使用傳統分割式向量量化 法的系統效能很差,當移動速率很高時( 100 km/hr ),系統辨識率 比無錯誤位元的辨識率下降約 2-10 &,而在移動速率為 250 km/hr 時,系統的辨識率更只有 35.56%。

5.2.2 餘弦與向量量化壓縮法的基礎實驗

在這裡我們分析若不外加 BCH 區塊碼,並且討論內插法與第 4 章 所提新的條件機率錯誤補償法對於系統效能的影響。由表 5-5 我們可

以發現,因為我們所提出的餘弦與向量量化壓縮法是取 4 個音框特徵 參數作壓縮,因此有別於傳統分割式向量量化,少量的位元錯誤將會 影響反壓縮後 4 個音框的特徵參數,因此通道位元錯誤對它的影響將 會比較大。同樣地,每個量化符號在時間軸上代表 4 個音框長度,因 此彼此間的相關性沒有分割式向量量化法的量化符號間那樣的大,所 以當平均位元錯誤率高時,條件機率補償法不但沒有增加系統辨識 率,反而會有降低的現象。

圖 5-8 餘弦向量量化壓縮法之系統的方塊圖 語音訊號

8k 餘弦向量量化壓縮法

外加循環冗贅錯誤偵測碼

GPRS 傳輸通道

錯誤補償機制

餘弦向量量化反壓縮

語音辨識器

語音特徵參數向量 封包錯誤偵測

無錯誤補償

GPRS (HT) CS3

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 53.90% 53.95% 53.97% 0.31%

50 54.12% 53.83% 53.90% 53.97% 0.39%

100 54.12% 53.83% 53.91% 53.96% 0.42%

250 54.12% 52.04% 52.67% 52.95% 2.02%

Data Rate --- 1.55 kbps 1.65 kbps 1.65 kbps 1.65 kbps

GPRS (TU) CS3

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 52.90% 53.50% 53.55% 0.96%

50 54.12% 52.89% 53.49% 53.62% 0.92%

100 54.12% 52.61% 53.24% 53.45% 1.18%

250 54.12% 47.70% 50.59% 51.27% 4.08%

Data Rate --- 1.55 kbps 1.65 kbps 1.65 kbps 1.65 kbps

GPRS (HT) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 48.68% 47.11% 46.47% 14.82%

50 54.12% 48.23% 46.51% 46.13% 15.73%

100 54.12% 47.52% 45.55% 44.78% 18.02%

250 54.12% 38.77% 35.83% 34.81% 35.74%

Data Rate --- 1.55 kbps 1.65 kbps 1.65 kbps 1.65 kbps

GPRS (TU) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 44.57% 42.33% 42.05% 21.38%

50 54.12% 44.71% 42.49% 41.72% 21.74%

100 54.12% 43.58% 41.42% 40.63% 24.20%

250 54.12% 34.09% 30.90% 29.77% 40.79%

Data Rate --- 1.55 kbps 1.65 kbps 1.65 kbps 1.65 kbps

表 5-5 餘弦與向量量化壓縮法的效能

圖 5-9 使用餘弦與向量量化,資料傳輸速率為 1.55/1.65 Kbps 在丘陵環 通道、CS4 的系統效能

圖 5-10 使用餘弦與向量量化,資料傳輸速率為 1.55/1.65 Kbps 在典型都

市通道、CS4 的系統效能

圖 5-11 使用餘弦與向量量化,資料傳輸速率為 1.55/1.65 Kbps 在丘陵環 通道、CS3 的系統效能

圖 5-12 使用餘弦與向量量化,資料傳輸速率為 1.55/1.65 Kbps 在典型都

市通道、CS3 的系統效能

5.2.3 使用外加傳送與接收機制對系統效能的影響

圖 5-13 本論文提出之分散式語音辨識系統的方塊圖 語音訊號

8k 餘弦與向量量化壓縮法

外加循環冗贅錯誤偵測碼

外加 BCH 區塊碼與位元分散

GPRS 傳輸通道

錯誤補償機制 &

BCH 區塊碼重新解碼

餘弦與向量量化反壓縮

語音辨識器

語音特徵參數向量 外加傳送機制

外加接收機制 封包錯誤偵測

BCH 區塊碼解碼與位元反分散

圖 5-13 是我們整體系統的方塊圖。在我們的第一個實驗中,我 們選用 BCH (n=15,k=11,t=1) 區塊碼,並且搭配位元分散器幫忙分 散叢集錯誤。而為了考慮系統的及時特性,在使用條件機率補償法 時,我們只暫存了一個封包的長度(4 音框),若某錯誤封包其前後封 包也被偵測到錯誤,則對該封包內所有的量化符號,我們不使用條件 機率補償法進行錯誤補償。表 5-6 為此系統在 GPRS 上的模擬結果。

比較表 5-5 與 5-6 我們發現使用 BCH 區塊碼使得系統不論在典型 都市與丘陵環境下辨識率都有進步。其中觀察 CS4 的結果我們發現雖 然 BCH 區塊碼更正了相當多錯誤,使得系統的平均音框錯誤率不論是 在哪個移動速率都相對下降了約 50% (由 40.79%->19.18%),但若沒 有進行錯誤補償的動作,系統的辨識率只有增加約 1%。而在進行了 錯誤補償後,系統辨識率進步的幅度相當的大,以典型都市、移動速 率為 250 km/hr 為例,沒進行錯誤補償的系統辨識率為 35.8%,在以 條件機率錯誤補償法加以補償後,系統辨識率進步成 44.75%,進步 了 9%。但整體系統的辨識率仍然略顯不足,為了使系統能夠提供穩 定的語音辨識品質,我們勢必繼續降低通道錯誤對系統的影響。

GPRS (HT) CS3

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 53.87% 54.00% 54.04% 0.23%

50 54.12% 53.82% 53.99% 53.99% 0.28%

100 54.12% 53.67% 53.93% 53.94% 0.32%

250 54.12% 51.28% 52.76% 52.91% 1.73%

Data Rate --- 2.25 kbps 2.25 kbps 2.25 kbps 2.25 kbps

GPRS (TU) CS3

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 53.13% 53.50% 53.56% 0.74%

50 54.12% 53.12% 53.48% 53.54% 0.80%

100 54.12% 52.86% 53.41% 53.53% 0.98%

250 54.12% 48.79% 50.78% 51.36% 3.50%

Data Rate --- 2.25 kbps 2.25 kbps 2.25 kbps 2.25 kbps

GPRS (HT) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 49.74% 51.15% 52.33% 4.92%

50 54.12% 49.88% 51.02% 52.28% 5.05%

100 54.12% 49.06% 50.44% 51.78% 5.82%

250 54.12% 41.60% 45.58% 48.74% 13.54%

Data Rate --- 2.25 kbps 2.25 kbps 2.25 kbps 2.25 kbps

GPRS (TU) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 46.04% 47.87% 49.95% 8.57%

50 54.12% 45.93% 47.88% 50.17% 8.63%

100 54.12% 44.95% 47.15% 49.59% 10.00%

250 54.12% 35.80% 40.59% 44.75% 19.18%

Data Rate --- 2.25 kbps 2.25 kbps 2.25 kbps 2.25 kbps

表 5-6 使用 BCH(15,11,1)對系統的效能影響

圖 5-14 使用餘弦與向量量化,資料傳輸速率為 2.25 Kbps 在丘陵地勢通 道、CS4 的系統效能

圖 5-15 使用餘弦與向量量化,資料傳輸速率為 2.25 Kbps 在典型都市通

道、CS4 的系統效能

圖 5-16 使用餘弦與向量量化,資料傳輸速率為 2.25 Kbps 在丘陵地勢通 道、CS3 的系統效能

圖 5-17 使用餘弦與向量量化,資料傳輸速率為 2.25 Kbps 在典型都市通

道、CS3 的系統效能

GPRS (HT) CS3

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 53.98% 54.03% 54.04% 0.20%

50 54.12% 53.94% 53.99% 54.01% 0.20%

100 54.12% 53.86% 53.99% 54.02% 0.26%

250 54.12% 52.57% 53.36% 53.50% 1.23%

Data Rate --- 3.45 kbps 3.45 kbps 3.45 kbps 3.45 kbps

GPRS (TU) CS3

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 53.48% 53.75% 53.89% 0.58%

50 54.12% 53.30% 53.66% 53.79% 0.60%

100 54.12% 52.96% 53.50% 53.69% 0.83%

250 54.12% 49.83% 51.83% 52.38% 2.89%

Data Rate --- 3.45 kbps 3.45 kbps 3.45 kbps 3.45 kbps

GPRS (HT) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 53.73% 53.34% 53.84% 1.81%

50 54.12% 53.69% 53.48% 53.87% 1.83%

100 54.12% 53.61% 53.35% 53.83% 2.14%

250 54.12% 52.40% 51.63% 52.96% 5.81%

Data Rate --- 3.45 kbps 3.45 kbps 3.45 kbps 3.45 kbps

GPRS (TU) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 52.97% 52.93% 53.42% 3.30%

50 54.12% 53.10% 52.87% 53.47% 3.34%

100 54.12% 52.93% 52.54% 53.36% 3.91%

250 54.12% 50.91% 50.13% 51.79% 8.87%

Data Rate --- 3.45 kbps 3.45 kbps 3.45 kbps 3.45 kbps

表 5-7 使用 BCH(15,7,2)對系統的效能影響

圖 5-18 使用餘弦與向量量化, 資料傳輸速率為 3.45 Kbps 在丘陵地勢通 道、CS4 的系統效能

圖 5-19 使用餘弦與向量量化,資料傳輸速率為 3.45 Kbps 在典型都市通

道、CS4 的系統效能

圖 5-20 使用餘弦與向量量化, 資料傳輸速率為 3.45 Kbps 在丘陵地勢通 道、CS3 的系統效能

圖 5-21 使用餘弦與向量量化,資料傳輸速率為 3.45 Kbps 在典型都市通

道、CS3 的系統效能

為了提高系統的辨識率,我們使用更正能力更強的 BCH 區塊碼作 為位元錯誤更正的機制—BCH(15,7,2),其實驗結果如表 5-7。由表 5-7 我們發現除了在 CS4、典型都市與移動速率為 250 km/hr 這個情 況(a)以外(辨識率為 50.91%, 50.13%, 51.79%),其餘的所有情況,

我們的系統辨識率都相當的高。其中使用條件機率補償對於上述情況 (a)而言,它的辨識率由原本的 50.91% 進步成 51.79%,距離無位元 錯誤的情況 54.12% 仍然有約 2.5% 的進步幅度需要努力,但與傳統 分割式向量量化法相比,我們系統的辨識率已經有很大幅的進步。

為了使系統的辨識率能夠更加提升,我們需要再使用錯誤更正能 力更強的 BCH 區塊碼,然而若我們對所有的傳送資料(62 個壓縮位元) 以 BCH(15,5,3)的區塊碼保護,則我們系統所需要的傳輸速率將高達 約 4.8 Kbps,雖然這樣的傳輸速率與傳統分割式向量量化的傳輸速 率相同,但我們當初正是覺得如此的傳輸速率太高而希望能提出其它 改善的方法。

如同第 2 章所述,在前人的研究中發現梅爾倒頻譜係數的前幾維 對於辨識器的影響比後幾維來的大。基於這個特性,我們對於 C1-C4 與 CE壓縮後的量化符碼給予更正能力更強大的 BCH 區塊碼作為位元 錯誤更正的機制;而後幾維壓縮後的資料我們以更正能力較小的 BCH 區塊碼作為位元錯誤更正的機制。表 5-8 為混合使用 BCH(15,7,2)與

BCH(15,5,3)兩種不同更正能力的 BCH 區塊碼作為錯誤更正機制的實 驗結果:

GPRS (HT) CS3

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 54.01% 54.06% 54.07% 0.10%

50 54.12% 53.98% 54.08% 54.09% 0.10%

100 54.12% 53.93% 54.00% 54.03% 0.16%

250 54.12% 52.91% 53.48% 53.61% 0.93%

Data Rate --- 4.00 kbps 4.00 kbps 4.00 kbps 4.00 kbps

GPRS (TU) CS3

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 53.44% 53.76% 53.79% 0.44%

50 54.12% 53.33% 53.74% 53.76% 0.55%

100 54.12% 53.04% 53.64% 53.75% 0.58%

250 54.12% 50.99% 52.11% 52.65% 2.35%

Data Rate --- 4.00 kbps 4.00 kbps 4.00 kbps 4.00 kbps

GPRS (HT) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 53.96% 53.91% 54.00% 0.69%

50 54.12% 53.97% 53.89% 53.98% 0.72%

100 54.12% 53.98% 53.75% 53.93% 0.86%

250 54.12% 53.52% 53.34% 53.72% 2.49%

Data Rate --- 4.00 kbps 4.00 kbps 4.00 kbps 4.00 kbps

GPRS (TU) CS4

Speed (km/hr) 無位元錯誤 無錯誤補償 內插法 條件機率 音框錯誤率 0 54.12% 53.74% 53.58% 53.81% 1.72%

50 54.12% 53.55% 53.45% 53.72% 1.77%

100 54.12% 53.51% 53.25% 53.56% 2.01%

250 54.12% 52.00% 52.06% 52.81% 4.66%

Data Rate --- 4.00 kbps 4.00 kbps 4.00 kbps 4.00 kbps

表 5-8 結合 BCB(15,5,3)、BCB(15,7,2)對系統的效能影響

圖 5-22 使用餘弦與向量量化,資料傳輸速率為 4.00 Kbps 在丘陵地勢通 道、CS4 的系統效能

圖 5-23 使用餘弦與向量量化,資料傳輸速率為 4.00 Kbps 在典型都市通

道、CS4 的系統效能

圖 5-24 使用餘弦與向量量化,資料傳輸速率為 4.00 Kbps 在丘陵地勢通 道、CS3 的系統效能

圖 5-25 使用餘弦與向量量化,資料傳輸速率為 4.00 Kbps 在典型都市通

道、CS3 的系統效能

綜合上面的實驗中,我們可以發現當我們使用餘弦與向量量化壓 縮法時,若不外加 BCH 區塊碼更正一些傳輸錯誤位元,則系統的辨識 率在不作任何錯誤補償的情況下,與使用傳統分割式向量量化壓縮法 的系統效能差不多;但是若同樣對它們進行錯誤補償,則我們發現使 用餘弦與向量量化壓縮法的辨識率在某些情況下比較差,甚至比不作 任何錯誤補償方法的辨識率更低,形成這個狀況的原因可能是因為我 們系統的平均音框錯誤率太高,而每個音框中並不是所有的特徵參數 都有錯誤,如此一來我們反而會將正確的特徵參數修改成錯誤的值。

因此若我們有外加 BCH 區塊碼,BCH 區塊碼將幫助我們更正大部 分的傳輸錯誤位元,這可以使得我們降低系統的平均音框錯誤率,而 使得在進行錯誤補償動作後,可以得到更高的辨識率。觀察使用 BCH (15,11,1)與 BCH(15,7,2)這兩種狀況,我們發現利用錯誤補償可以 使得系統的辨識率有大幅度的進步,尤其是當我們使用第四章所提到 的利用相鄰封包資訊與接收位元串的重新 BCH 解碼,可以使得系統的 辨識率進步非常多。

相關文件