第三章 加權有限狀態機之語音辨識分析
3.1 有限狀態機
3.1.1 有限狀態機的簡介
有限狀態機可以分為兩類,有限狀態自動機(finite state automata)和有限狀態 轉換機(finite state machine),有限狀態自動機的圖中,可看到點(node)在此稱為狀 態(state)、邊(arc)在此稱為轉移(transition)及邊上的字元為此轉移的輸入字元 (input symbol),初始狀態(initial state)由粗線圈表示,終止狀態(final state)由雙線 圈表示,若狀態同時為初始與終止狀態,則以粗雙線圈表示,有限狀態自動機由 五個元素(Q, I, F, Σ, δ)組成,Q 為所有狀態的集合,I 為初始狀態,F 為終止狀態 的集合,Σ 為輸入字元集合,δ 為轉移函式,若給一串輸入字串(input string),經 由狀態轉移後,得到輸出為接受(accept)或拒絕(reject);相較於有限狀態自動機,
有限狀態轉換機則在邊上多了輸出字元(output symbol),因此,輸入一串輸入字 串,有限狀態轉移機輸出不僅得到接受或拒絕,還會得到一連串經由狀態轉移後
31
的輸出字串,有限狀態轉換機可以看成是有限狀態自動機的延伸,實際應用通常 邊上會有權重,加了權重後的有限狀態自動機與有限狀態轉換機分別為加權有限 狀態自動機與加權有限狀態轉換機。
0 1
a:x/1
b:y/2
圖 3 1: 有限狀態轉換機
有限狀態機由六個元素(Q, I, F, Σ, △, δ)所組成:
1) Q:所有狀態的集合,Q={0,1}
2) I:初始狀態,有限狀態機只會有一個初始狀態,I={0}
3) F:終止狀態,有限狀態機的結束狀態,有限狀態機至少有一個以上終止狀態,
F={1}
4) Σ:輸入字元集,Σ={a, b}
5) △:輸出字元集,△={x, y}
6) δ:轉移函式,表示輸入字元經過狀態後,轉移至另一狀態且輸出字元。
下面為上述的名詞解釋:
1) 狀態
有限狀態機必須為有限個狀態,其中包含一個初始狀態與一個以上的終止狀 態,開始接由初始狀態進入,經過一連串的狀態轉移,當最後一個狀態轉移 完成後,若此時的狀態停止在終止狀態,則表示此條路徑為接受;反之,非 停止於終止狀態,則此路徑為拒絕。
32
2) 游標
有限狀態機的輸入字串有一游標,表示有限狀態機目前正在執行的字元,起 始時,游標位於輸入字串的第一個字元,每當一轉移發生,游標即往後移動 一個字元,直到字串結束為止。
3) 轉移
轉移表示狀態與狀態間的轉移關係,由轉移函式 δ 表示,轉移 t 包含來源狀 態(source state,符號為 s[t])、目的狀態(destination state,符號為
d[t])、輸入字元(input symbol,符號為 i[t])、輸出字元(output symbol,
符號為 o[t])和權重(weight,符號為 w[t]),轉移寫作為 I:O/W,I 為輸入字 元,O 為輸出字元,W 為權重;轉移方式為狀態由來源狀態轉移至目的狀態,
當游標指一輸入字元時,若有限狀態機無對應的來源狀態和輸入字元,則輸 出為拒絕。
4) 輸入輸出
在轉移上以文字表示,輸入和輸出會以冒號隔開,若輸入為 x,輸出為 y,則 表示為 x:y。
5) 空轉移
空轉移的表示法為 (eplison),當轉移上的輸入字元為 時,表示此轉移不需 要輸入也可以進入下一狀態;而當轉移上的輸出字元為 時,表示此轉移並不 會輸出字元
6) 路徑
路徑由一連串相連的轉移所組成,假設 P= 為一條路徑,其中 表示路徑上第 i 個轉移,s[ ]=d[ ],當結束狀態為 d[ ],則此為一條被接 受的路徑。
7) 加權值
有限狀態機可以藉由加權值賦予不同的權重,以 w[t]表示轉移 t 的加權
33
值,在描述語音辨識所用的有限狀態機時,利用加權值來表示各種模型的分 數,除了在轉移上會帶有權重之外,每個結束狀態也可以再賦予加權值,一 般採用 log semi-ring 的數學模型,對機率的轉移取 negative nature log,尋找 最佳路徑時則為搜尋累積加權最小的路徑。
8) 等價性
若兩個有限狀態機所接受的語言相同,稱它們為等價(equivalent),但它們的 狀態與轉移不一定相同。語音辨識中,提升搜尋效率與有效的利用空間相當 重要,如何使處理後的有限狀態機在等價的情況下,將有限狀態機的狀態和 轉移數減少是一大學問。