• 沒有找到結果。

利用 利用 利用決策樹 利用 決策樹 決策樹 決策樹預估四大停頓類別標記 預估四大停頓類別標記 預估四大停頓類別標記 預估四大停頓類別標記

第四章 停頓韻律 停頓韻律 停頓韻律 停頓韻律標記 標記 標記 標記產生器 產生器 產生器 產生器

4.1 利用 利用 利用決策樹 利用 決策樹 決策樹 決策樹預估四大停頓類別標記 預估四大停頓類別標記 預估四大停頓類別標記 預估四大停頓類別標記

利用決策樹的訓練以及預估方塊圖如圖 4.1,在訓練階段,除了使用原本詞階層以及語句 階層的語言參數之外,另外再加入第三章介紹的詞組及片語階層的語言參數,訓練決策樹的方 法為,將不同類型的音節邊界分別用不同的問題集做決策樹的訓練,依據第三章的介紹,我們 分別對不同類型詞組的詞組內邊界訓練決策樹,使用的語言參數如表 4.1。對連接詞前、後邊 界訓練分別訓練一顆決策樹,使用的語言參數如表 4.2。對不同類型「的」字結構片語中「的」

字的後邊界分別訓練決策樹使用的語言參數如表 4.3。對不同類型的頓號也分別訓練決策樹,

使用的語言參數如表 4.4。最後剩餘的音節邊界則使用詞階層以及語句階層的語言參數訓練一 顆決策樹,使用的語言參數如表 4.5。而決策樹使用的分裂準則為最大概似函數增益。本研究 將只使用詞階層及語句階層的語言參數預估停頓韻律的方法稱為方法一,而加入詞組以及片語 的語言參數預估停頓韻律的方法稱為方法二,在方法一中只會使用表 4.5 的語言參數,在方法 二中則會使用表 4.1~表 4.5 的語言參數,在本節中將比較使用方法一以及方法二訓練決策樹並 且預估停頓標記的結果。

圖 4.2: 決策樹的(a)訓練階段,(b)預估停頓標記

56

表 4.1 : 詞組階層的語言參數列表 SB 音節邊界類型 : Type-1 intra-word, Type-2 intra-word.

WC_type

詞組類型 : 一般的名詞詞組、緊密結合的名詞詞組、構成詞的名詞詞組、組織架構 的名詞詞組、地址的名詞詞組、職稱接人名的名詞詞組、時間的名詞詞組、並列結 合的名詞詞組、重複強調的名詞詞組、一般的副詞動詞介系詞詞組、緊密結合的副 詞動詞介系詞詞組、並列結合的副詞動詞介系詞詞組、省略數詞詞組

DBB Distance to the beginning boundary of word chunk DEB Distance to the ending boundary of word chunk

表 4.2 : 連接詞詞組的語言參數列表 DBB Distance to the beginning boundary of Caa word chunk DEB Distance to the ending boundary of Caa word chunk

表 4.3 : 「的」字結構片語的語言參數列表

De_phrase_type 「的」字結構片語類型 : 名詞性「的」字結構片語、副詞性「的」字結構片 語、省略性「的」字結構片語、形容詞性「的」字結構片語

DBB Distance to the beginning boundary of De phrase.

DEB Distance to the ending boundary of De phrase.

表 4.4 : 頓號的語言參數列表

Dunhao_type 頓號類型 : 單一頓號單字詞、單一頓號非單字詞、連續頓號單字詞、連續頓號 非單字詞

DBB Distance to the beginning boundary of Dunhao sentence DEB Distance to the ending boundary of Dunhao sentence DPD Distance to previous Dunhao

DFD Distance to following Dunhao

表 4.5 : 詞階層以及語句階層的語言參數列表

SB Type of syllable boundary: inter-phrase intra-phrase inter-word, Type-1 intra-word, Type-2 intra-word.

POS1 11-type POS: A, C, D, N, I, P, T, V, DE, SHI, DM

POS2 19-type POS : A, C, Dfa, Dfb, D, N, Nd, Ne, Ng, Nh, P, T, VA, VC, VH, V_2, DE, SHI, DM

POS3 46-type POS : A, Caa, Cab, Cba, Cbb, Da, Dfa, Dfb, Di, Dk, D, Na, Nb, Nc, Ncd, Nd,

57

Neu, Nes, Nep, Neqa, Neqb, Nf, Ng, Nv, Nh, I, P, T, VA, VAC, VB, VC, VCL, VD, VE, VF, VG, VH, VHC, VI, VJ, VK, VL, V_2, DE, SHI, DM

WL Length of word in syllable: 1, 2, 3, 4

PM Type of PM: comma, period, question mark and others LS Length of sentence in syllable

LPS Length of previous sentence LFS Length of following sentence

DPP Distance to previous PM (the beginning of the sentence) DFP Distance to following PM (the end of the sentence)

依據表 4.1-表 4.5 所使用的語言參數來設計決策樹要問的問題,決策樹問題集附在附錄一。

58

59