第二章 四縣客語語料庫介紹:介紹客語音節結構、音韻以及本論文之語料庫 第三章 斷詞系統:介紹本論文的客語斷詞系統
第四章 基於 HMM 之語音合成系統:介紹基於 HMM 之語音合成系統原理、文 脈相關資訊以及決策數問題集
第五章 停頓預估:介紹停頓預估模型之訓練及實驗結果
第六章 實驗結果:評估本論文之斷詞系統效能以及基於 HMM 之語音合成系統 效能
第七章 結論與未來展望:對本篇論文所提出的方法下結論,並說明未來的改進 方法
4
第二章 四縣客語語料庫介紹
在進行客語語音合成 HMM 模型的訓練之前,我們需要準備一套客語語料庫,而 合成單元的選取更直接影響了合成語音的品質,本章將介紹四縣腔客家話的音節結構 以及聲調,並且說明本論文語料庫來源以及其錄製方法。
2.1 四縣客家話之簡介
台灣的客家話有四縣客家、海陸客家、饒平客家、紹安客家等,其中四縣客家是 最通行的腔調,不同腔調在聲調及詞彙上有不同程度的差異。本論文採用四縣腔調做 為研究之語料來源,為了方便起見以下以「四縣客家話」指稱本論文的客語語料腔調。
客語有 671 個音節(syllable),客家話的音節結構和國語一樣,分為聲母和韻母,
韻母又再分為介音及韻腳,韻腳內是主要原音和韻尾,圖 2-1 為客家話音節結構。客 語的結構因素(聲調、聲母、介音、主要元音、韻尾)中,聲調和主要元音是不可缺 少的。
聲調
音節
聲母 韻母
介音 韻腳
主要元音 韻尾
圖 2-1 客語音節結構
5
6
7
表 2-3 四縣客家話聲調表
調類 陰平 陰上 陰去 陰入 陽平 陽入
調號 1 2 3 4 5 8
例字 千 錢 淺 賤 絕 切
四縣客家話和中文相同,也有變調的情形,變調規則會跨詞出現,但不會出現在 句子與句子之間。其中變調規則共有三種:
1. 由兩個陰平(調號 1)字構成的字彙,讀時前字變調讀陽平(調號 5) 陰平(調號 1) + 陰平(調號 1) → 陽平(調號 5) +陰平(調號 1) 例: 「新衫」sin1 sam1 → sin5 sam1
「買新衫」 mai1 sin1 sam1 → mai5 sin5 sam1
2. 陰平(調號 1)字與陰去(調號 3)字構成的詞彙,讀時前字變調讀陽平(調號 5) 陰平(調號 1) + 陰去(調號 3) → 陽平(調號 5) +陰去(調號 3)
例: 「針線」 ziim1 sien3 → ziim5 sien3
「拿針線」 na1 ziim1 sien3 → na5 ziim5 sien3
3. 陰平(調號 1)字與陽入(調號 8)字構成的詞彙,讀時前字變調讀陽平(調號 5) 陰平(調號 1) + 陽入(調號 8) →陽平(調號 5) +陽入(調號 8)
例: 「音樂」 im1 ngok8 → im5 ngok8
「聽音樂」 tang1 im1 ngok8 → tang5 im5 ngok8
2.3 四縣客家話之音節
客語文章中紀錄的單元大多是音節,一個中文字代表一個音節。依據聲韻組合規 則,四縣客家話可以衍生出 13 種不同的類型,這也是四縣客家以及其它漢語方言所有 音節的縮影,表 2-4 列出這 13 種音節結構,由於聲調是每個音節所必備,在下表音節 類型裡,聲調用數字表示。而實際上四縣客家話的音韻系統共有 671 個音節,詳細列
8
表如附錄一。
表 2-4 四縣客家話音節類型表
音節類型 例字
元音 o2(襖)、i5(于)
元音化的鼻音輔音 m5(毋)、ng5(魚)
元音 + 輔音韻尾 it4(一)、ap4(鴨)
元音 + 元音韻尾 ai2(矮)、oi3(要)
介音 + 元音 iu3(柚)、ia5(爺)
介音 + 元音 + 輔音韻尾 iok8(浴)、iuk4(育)
介音 + 元音 + 元音韻尾 ieu5(謠)、iau1(飫)
輔音 + 元音 ho5(何)、pa1(爸)
輔音 + 元音 + 輔音韻尾 nap8(納)、ziip4(汁)
輔音 + 元音 + 元音韻尾 cai2(採)、tui3(退)
輔音 + 介音 + 元音 mia1(摸)、dui3(對)
輔音 + 介音 + 元音 + 輔音韻尾 giuk(趨)、liok8(略)
輔音 + 介音 + 元音 + 元音韻尾 tiau5(跳)、diau3(釣)
2.4 語料庫簡介
本論文所採用的四縣客家話語料庫有男性語料庫及女性語料庫,語料發音人分別 為龔萬灶老師和陳碧娥老師,文章來源主要由龔萬灶老師所主筆的「阿啾箭个故鄉」
一書。男性語料庫包含 42 篇文章,語音檔分為 639 個,共有 63158 個音節,音檔為 20kHz 的取樣頻率及 16-bit 之單聲道 pcm 格式。語音檔是由發音人在錄音室依照文稿 唸出,平均發音速度為0.24 second/syllable,錄音軟體為 Adobe Audition 1.0,並使用單一 指向性麥克風。女性語料庫中包含 57 篇文章,325 個語音檔,總音節數為 42337 個,由 發音人在普通房間依照文稿唸出,音檔取樣頻率 16kHz,16-bit 之單聲道 pcm 格式,
平均發音速度為0.21 second /syllable。
9
2.4.1 客語詞典
詞典在 TTS 系統中有非常重要的功能,在分詞和標記詞性階段能提供詞和其詞性 資訊,在合成語音前的文字分析器當中必頇查詢詞典得到對應的音標和聲調。我們主 要的收集來源為「完整版中級詞彙彙整檔案」、「台北市客委會-現代客語詞彙彙編」、
「教育部客家語常用詞辭典」等;詞典內容包含詞、四縣音標、音節碼、詞性、中文 翻譯以及詞來源。目前所收錄的客語詞之數量如表 2-5 所示:
表 2-5 客語詞典統計表
詞數
一字詞 6747 二字詞 18078 三字詞 5095 四字詞 4217
五字詞 250
六字詞 80
七字詞 60
八字詞 14
總計 34541
10