第 4 章 最小音素錯誤訓練
4.3 實驗結果
~ 38 ~
成為詞弧正確度的期望值,同樣也在每一步利用上一步已經算出的前接或後續詞 弧的詞弧正確度的期望值來算出目前詞弧正確度的期望值。在整個詞圖的詞弧都 計算完成之後,就可以依照圖 4.6 的方式計算出Cavg、γq、C 和q γqMPE。
另外,在圖 4.6 中的 x 代表的意義為該觀測語句O的事前機率,也就是目標 函數(4.1)式中的
∑
u W∈ hP O u P uλ(
r|) ( )
Γ ;而γq =α βq q x則是詞弧 q 在整句語句中的 事後機率。Cavg為所有結尾詞弧的前向相似度αq的期望正確度,由於αq本來就是 代表詞弧 q 的所有前接路徑的期望正確度,因此 Cavg 等於是由結尾詞弧把全部的 期望正確度都加總起來,於是 Cavg就是整句觀測語句O 的期望正確度。 r4.3 實驗結果
本實驗使用 3.3 節基礎實驗的聲學模型作為初使模型進行最小音素錯誤聲學 模型訓練,由4.1.1 節的推導可知最小音素錯誤訓練法是經由反覆疊代來調整聲學 模型的,因此本實驗會經過多次訓練的疊代,每一次疊代都是把上一次疊代的訓 練結果做為新的初始模型。實驗中也使用了這兩種不同的詞圖,分別為4.2.1 節說 明的兩種詞圖產生方式;另外在4.1.4 節說明的 I 平滑,需要一個平滑係數τ ,本 實驗也測試了許多不同的τ 值。
實驗結果如表 4.1~表 4.8 及圖 4.7~圖 4.14 所示:實驗使用的詞圖分為詞 圖N 以及詞圖 T 兩種,詞圖 N 代表由 NDecoder 產生,為詞弧保留原則為分數排 名的詞圖;詞圖t 代表由 TTK 產生,為詞弧保留原則為分數比值的詞圖。兩種詞 圖都測試了多個平滑係數τ 值:5、10、25、100、200、400,表中的 itr 代表疊代 的次數。
實驗結果使用詞、字、音節、聲韻母四種層級來呈現,在正確率的表現上,
最小音素錯誤訓練法在四種層級上都有進步,而且在疊代初期時的進步量較多,
到接近最後幾次的疊代時,進步就會趨緩,之後正確率便不再提升,甚至有出現 下降的情形。正確率在疊代數次達到最大值後下降,在鑑別式訓練法中是十分普 遍的現象,一般認為是因過度訓練(over training)所造成的,過度訓練是指模型訓練
4.4 本章結論
~ 39 ~
得與訓練集太過匹配而失去了一般性,導致對評估集的辨識率下降。
平滑係數在 25 時的詞正確率與字正確率為實驗中的最大值,平滑係數為 10 時的音節與聲韻母正確率為實驗中的最大值。在詞圖N 的實驗中,平滑係數 25 時,
字正確率會進步 2.46%(相對 9.91%);在詞圖 T 的實驗中,平滑係數 25 時,字正 確率會進步2.31%(相對 9.30%)。
實驗中發現不同的平滑係數對於正確率的影響,若使用的平滑係數的數值較 接近得到正確率最高時的平滑係數的數值時,就會有較高的正確率,反之在使用 的平滑係數的數值較遠離得到正確率最高時的平滑係數的數值時,就會有較差的 正確率,因此在經驗上可以假設在正確率最高時的平滑數值十分接近最佳值。波 式(Povey)在【32】中提出關於平滑係數的看法,認為平滑係數的最佳值與分子詞 圖和分母詞圖的統計值(即(4.26)式中的θmnum
( )
O 與(4.27)式中的θmden( )
O )成正比,因 此在本論文之後的實驗中,會基於這個假設選擇平滑係數的數值,減少調整參數 的時間。4.4 本章結論
本章詳細介紹了最小音素錯誤訓練法,包括目標函數的最佳化過程到模型參 數的更新,音素正確度的估算到詞弧正確度的計算方式,使用詞圖做為辨識可能 近似的演算法。由實驗結果可以看出,在公視新聞的語料上,最小音素錯誤訓練 法在詞、字、音節、聲韻母四種層級上的正確率都有進步。
4.4 本章結論
~ 40 ~
圖 4.7 最小音素錯誤訓練法-詞圖 N-詞正確率
57.50 58.00 58.50 59.00 59.50 60.00 60.50 61.00 61.50
0 1 2 3 4 5 6 7 8 9 10
詞正確率 (%)
訓練次數
最小音素錯誤訓練法-詞圖N
τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
MPE 詞圖N 詞正確率(%)
itr τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
0 57.99 57.99 57.99 57.99 57.99 57.99 1 58.56 58.68 58.63 58.66 58.75 58.58 2 59.31 59.38 59.48 59.13 59.09 58.97 3 59.87 59.97 59.88 59.47 59.18 58.89 4 59.88 60.17 60.29 59.77 59.18 59.08 5 59.98 60.29 60.38 59.82 59.39 59.06 6 60.06 60.43 60.73 59.92 59.59 59.09 7 60.20 60.50 60.59 60.10 59.58 59.08
8
60.26
60.67 60.79 60.18 59.5159.16
9 60.13
60.74
60.78 60.1559.66
59.07 10 59.92 60.60 60.8760.19
59.56 59.09表 4.1 最小音素錯誤訓練法-詞圖 N-詞正確率
4.4 本章結論
~ 41 ~
圖 4.8 最小音素錯誤訓練法-詞圖 N-字正確率
75.00 75.50 76.00 76.50 77.00 77.50 78.00
0 1 2 3 4 5 6 7 8 9 10
字正確率 (%)
訓練次數
最小音素錯誤訓練法-詞圖N
τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
MPE 詞圖N 字正確率(%)
itr τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
0 75.17 75.17 75.17 75.17 75.17 75.17 1 75.79 75.89 75.84 75.84 75.86 75.64 2 76.52 76.57 76.58 76.17 76.12 75.97 3 77.01 77.10 77.03 76.49 76.21 75.94 4 77.02 77.26 77.39 76.69 76.23 76.08 5 77.09 77.32 77.41 76.70 76.35 76.07 6 77.13 77.34 77.60 76.83 76.52 76.10
7
77.18
77.34 77.46 77.00 76.52 76.198 77.10
77.46
77.62 77.10 76.59 76.24 9 76.81 77.45 77.63 77.1376.74 76.25
10 76.60 77.19 77.6177.18
76.63 76.21表 4.2 最小音素錯誤訓練法-詞圖 N-音節正確率
4.4 本章結論
~ 42 ~
圖 4.9 最小音素錯誤訓練法-詞圖 N-音節正確率
81.00 81.50 82.00 82.50 83.00 83.50 84.00 84.50
0 1 2 3 4 5 6 7 8 9 10
音節正確率 (%)
訓練次數
最小音素錯誤訓練法-詞圖N
τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
MPE 詞圖N 音節正確率(%)
itr τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
0 81.42 81.42 81.42 81.42 81.42 81.42 1 82.06 82.17 82.15 82.09 82.04 81.82 2 82.76 82.81 82.80 82.34 82.27 82.15 3 83.22 83.30 83.23 82.64 82.39 82.11 4 83.38 83.54 83.58 82.87 82.40 82.20 5 83.46 83.63 83.65 82.89 82.52 82.22 6 83.60 83.65 83.82 83.04 82.69 82.23
7
83.68
83.68 83.77 83.19 82.70 82.308
83.68
83.90 83.8583.33
82.7582.34
9 83.32 83.87 83.84 83.32
82.85
82.33 10 83.04 83.5683.86 83.33
82.76 82.28表 4.3 最小音素錯誤訓練法-詞圖 N-音節正確率
4.4 本章結論
~ 43 ~
圖 4.10 最小音素錯誤訓練法-詞圖 N-聲韻母正確率
84.50 85.00 85.50 86.00 86.50 87.00 87.50
0 1 2 3 4 5 6 7 8 9 10
聲韻母正確率 (%)
訓練次數
最小音素錯誤訓練法-詞圖N
τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
MPE 詞圖N 聲韻母正確率(%)
itr τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
0 84.76 84.76 84.76 84.76 84.76 84.76 1 85.40 85.48 85.47 85.36 85.29 85.11 2 85.93 85.97 86.00 85.62 85.51 85.41 3 86.37 86.44 86.38 85.89 85.66 85.42 4 86.51 86.66 86.66 86.07 85.68 85.50 5 86.58 86.73 86.72 86.09 85.80 85.52 6 86.70 86.78
86.88
86.21 85.94 85.54 7 86.72 86.73 86.83 86.33 85.94 85.608
86.74
86.92 86.8786.42
86.0185.64
9 86.37 86.90 86.86 86.39
86.06
85.60 10 86.19 86.5686.88
86.41 86.00 85.55表 4.4 最小音素錯誤訓練法-詞圖 N-聲韻母正確率
4.4 本章結論
~ 44 ~
圖 4.11 最小音素錯誤訓練法-詞圖 T-詞正確率
57.50 58.00 58.50 59.00 59.50 60.00 60.50 61.00 61.50
0 1 2 3 4 5 6 7 8 9 10
詞正確率 (%)
訓練次數
最小音素錯誤訓練法-詞圖T
τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
MPE 詞圖T 詞正確率(%)
itr τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
0 57.99 57.99 57.99 57.99 57.99 57.99 1 58.46 58.57 58.68 58.83 58.65 58.57 2 59.12 59.24 59.26 59.26 59.14 58.88 3 59.70 59.93 59.93 59.49 59.13 58.95 4 60.03 60.38 60.29 59.75 59.26 58.88 5 59.95 60.27 60.49 60.00 59.41 58.97 6 60.24 60.43 60.66 60.11 59.40 59.05 7 60.26 60.54 60.90
60.28
59.42 59.18 8 60.27 60.61 60.85 60.23 59.46 59.18 9 60.4960.84
60.97 60.1959.75 59.33
10
60.58 60.84
61.03 60.22 59.6859.33
表 4.5 最小音素錯誤訓練法-詞圖 T-詞正確率
4.4 本章結論
~ 45 ~
圖 4.12 最小音素錯誤訓練法-詞圖 T-字正確率
75.00 75.50 76.00 76.50 77.00 77.50 78.00
0 1 2 3 4 5 6 7 8 9 10
字正確率 (%)
訓練次數
最小音素錯誤訓練法-詞圖T
τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
MPE 詞圖T 字正確率(%)
itr τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
0 75.17 75.17 75.17 75.17 75.17 75.17 1 75.62 75.73 75.87 75.91 75.72 75.61 2 76.13 76.28 76.31 76.26 76.12 75.92 3 76.76 76.91 76.85 76.46 76.18 75.96 4 76.99 77.24 77.21 76.63 76.29 75.92 5 76.87 77.16 77.22 76.87 76.36 75.94
6
77.12
77.18 77.32 76.97 76.36 76.027 77.04 77.22 77.48
76.99
76.35 76.13 8 76.97 77.21 77.37 76.89 76.43 76.15 9 76.9877.31
77.45 76.9376.57
76.27 10 76.84 77.23 77.47 76.92 76.50 76.29表 4.6 最小音素錯誤訓練法-詞圖 T-字正確率
4.4 本章結論
~ 46 ~
圖 4.13 最小音素錯誤訓練法-詞圖 T-音節正確率
81.00 81.50 82.00 82.50 83.00 83.50 84.00
0 1 2 3 4 5 6 7 8 9 10
音節正確率 (%)
訓練次數
最小音素錯誤訓練法-詞圖T
τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
MPE 詞圖T 音節正確率(%)
itr τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
0 81.42 81.42 81.42 81.42 81.42 81.42 1 81.97 82.06 82.14 82.11 81.95 81.81 2 82.48 82.56 82.59 82.45 82.26 82.05 3 83.08 83.17 82.99 82.63 82.34 82.10 4 83.31 83.43 83.35 82.77 82.42 82.10 5 83.33 83.52 83.35 82.96 82.51 82.14
6
83.56
83.62 83.49 83.03 82.54 82.207 83.54 83.65 83.58 83.05 82.52 82.28 8 83.50 83.68 83.54 83.01 82.59 82.26 9 83.50 83.77 83.65 83.05
82.68
82.33 10 83.41 83.7083.71 83.06
82.6182.34
表 4.7 最小音素錯誤訓練法-詞圖 T-音節正確率
4.4 本章結論
~ 47 ~
圖 4.14 最小音素錯誤訓練法-詞圖 T-聲韻母正確率
84.50 85.00 85.50 86.00 86.50 87.00
0 1 2 3 4 5 6 7 8 9 10
聲韻母正確率 (%)
訓練次數
最小音素錯誤訓練法-詞圖T
τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
MPE 詞圖T 聲韻母正確率(%)
itr τ=5 τ=10 τ=25 τ=100 τ=200 τ=400
0 84.76 84.76 84.76 84.76 84.76 84.76 1 85.27 85.34 85.42 85.38 85.25 85.13 2 85.69 85.72 85.78 85.69 85.51 85.33 3 86.23 86.27 86.12 85.83 85.62 85.41 4 86.48 86.52 86.45 85.96 85.70 85.41 5 86.49 86.65 86.45 86.12 85.77 85.45
6
86.69
86.73 86.58 86.16 85.77 85.507
86.69
86.74 86.66 86.17 85.78 85.568 86.68 86.77 86.62 86.15 85.82 85.54 9 86.68 86.84 86.71 86.18
85.91
85.60 10 86.63 86.8086.74 86.21
85.8785.61
表 4.8 最小音素錯誤訓練法-詞圖 T-聲韻母正確率
5.1 最小音素音框錯誤訓練 5.1.1 目標函數
~ 48 ~