• 沒有找到結果。

第五章 基於 PLM 演算法之韻律產生器

5.1 停頓標記預估

在第四章停頓標記結果分析中,可得到中英文夾雜語料庫之停頓標記的特點,無論是在 code-switch 處的特性,亦或是整個 BG/PG 中停頓標記的相對關係,一旦有了停頓標記之後,

我們尌可以區分出韻律詞、韻律短語等上層韻律邊界,並利用這些停頓標記產生出更多文脈 相關資訊,藉由更豐富的文脈相關資訊,使得 HTS 在產生韻律參數上能有更精確的數值。

5.1.1 節將介紹停頓標記預估方法一:All-in-one CART-based,5.1.2 節將介紹停頓標記預估方 法二:Two-stage CART-based。

5.1.1 All-in-one CART-based

方法一演算法的方塊圖如圖 5.1 所示,藉由語言參數和七類停頓標記之間的相互關係,

訓練一顆停頓標記語言模型決策樹,使用分類準則為最大概似函數增益。透過此決策樹即可 由輸入文字之語言參數預估出七類停頓標記,而使用的語言參數則如表 5.1 所示,包含音節 邊界種類、當前詞長、詞類、前後兩個( 1 、 2 )詞長、詞類、現在音節前後之標點符號,及 當前句長、前後句子長度等,其中詞類分類是依據中研院 46 類詞類,依實詞、虛詞、八大

詞類及其他特殊詞類集合。

決策樹訓練 All-In-one CART

All-In-one CART (a)

(b)

圖 5.1:停頓標記預估之 All-in-one CART-based,(a)決策樹訓練階段,(b)停頓標記預估

表 5.1:All-in-one CART-based 之語言參數列表

SB Type of syllable boundary: inter-phrase intra-phrase inter-word, Type-1 intra-word, Type-2 intra-word.

POS0 Broad class of preceding/following word: substantive word, function word POS1 11-type POS: A, C, D, N, I, P, T, V, DE, SHI, DM

PM Type of PM: comma, period, question mark, dun hao and others LS Length of sentence in syllable

LPS Length of previous sentence LFS Length of following sentence

DPP Distance to previous PM (the beginning of the sentence) DFP Distance to following PM (the end of the sentence)

CS Code-switch: C-E-Interword, E-C-Interword, C-C-Interword, E-E-Interword

表 5.2 顯示出此演算法在訓練語料之韻律標記的辨認結果,可觀察到 B1 有最高的辨認 率,依次再來為 B0、B4、B3 及 B2-2,而 B2-1 和 B2-3 則是辨認率偏低。分析 B2-2、B2-1 與 B2-3 之錯誤原因為大部分都辨認成 B1,因 B1 本身數量過大且 B1 是有可能標記在詞外邊

其本身對應到之語言參數也類似。而 B0 之錯誤情形則大都標記成 B1,但 B0 與 B1 皆定義 為韻律詞之詞內邊界(Intra-PW),所以此錯誤對往後韻律參數預估影響不大。

在原本韻律架構中,B0、B1 為一個韻律詞內的邊界,B2-1、B2-2、B2-3 為區分韻律詞 的邊界,B3、B4 則是區分更大韻律單元包含 PPh、BG/PG 等邊界,因此我們將七類停頓標 記簡化成三類,即 Non-Break{B0,B1},Minor Break{B2-1,B2-2,B2-3},Major Break{B3,B4},

如此一來其停頓標記辨認率如表 5.3 所示。簡化後的三類辨認率明顯提升許多,但 Minor Break 仍然受到 Non-Break 的影響甚巨,一旦辨認不出 Minor Break,將無法區分出韻律詞的 邊界,代表抓不到 BG/PG 中更細微的韻律結構變化,因此必需加強提升 Minor Break 的辨認 率。

表 5.2:All-in-one CART-based 之停頓標記預估辨認率

Tar\Pre B0 B1 B2-1 B3 B4 B2-2 B2-3 Total B0 84%

13% 2% 0% 0% 1% 0% 1625

B1

6%

90%

2% 0% 0% 2% 0% 6645

B2-1

6% 38%

44%

2% 0% 8% 2% 840

B3

2% 4% 2%

66%

9% 16% 1% 697

B4

0% 1% 0% 17%

77%

5% 0% 407

B2-2

3% 15% 7% 8% 0%

64%

2% 1069

B2-3

9% 43% 12% 3% 0% 17%

16%

417

表 5.3:All-in-one CART-based 之三類韻律標記預估辨認率 ,(NB: Non-Break, MiB: Minor Break, MB: Major Break)

Tar\Pre NB MiB MB Total

NB 96%

4% 0% 8270

MiB

33%

62%

5% 2326

MB

4% 13%

82%

1104

5.1.2 Two-stage CART-based

由前 5.1.1 節中的方法可發現 Minor Break 很容易被辨認成 Non-Break,而太少的 Minor Break 會使得合成語音的韻律太過呆板且急速,因而降低其自然度,為了改善 Minor Break 的辨認率,本研究提出 Two-stage CART-based 的方法,其方塊圖如圖 5.2 所示。此方法是採 取兩階段式辨認,首先第一級辨認是透過一顆簡化成三類停頓標記訓練出的三類決策樹

CART NB CART

B2-1, B2-2 or B2-3 B0 or B1

B2-1 與 B2-3。而此方法之所以可行的原因在於,原本是將七類停頓標記對應到所有語言參

Prosody level

/a:F_Syl_in_PW /b:B_Syl_in_PW /c:F_Syl_in_PPh /d:B_Syl_in_PPh

Syllable position in a PW(forward) Syllable position in a PW(backward) Syllable position in a PPh(forward) Syllable position in a PPh(backwrad) /e:Pre_1_PW

/f:Cur_PW /g:Fol_1_PW

Word length of previous PW Word length of current PW Word length of following PW /h:Pre_1_PPh

/i:Cur_PPh /j:Fol_1_PPh

Word length of previous PPh Word length of current PPh Word length of following PPh

/k:Cur_B_PW Break type bounding current Prosodic word

相關文件