• 沒有找到結果。

章節概要說明

第一章 緒論

1.3 章節概要說明

本論文的內容共分為七章,我們將各章的內容以條列式的方式做概略性地呈述。

第一章第一章

第一章第一章 緒論緒論緒論緒論:::

本章首先對於論文的研究動機做呈述,而後對於研究方向做闡述,最後再 對於論文的各個章節做概要說明。

第二章 第二章 第二章

第二章 漢語漢語漢語漢語語音特性和語音特性和語音特性和語音特性和漢語漢語漢語 TTS 系統概述漢語 系統概述系統概述系統概述::

本章對於漢語語音特性和本實驗室過去所發展的漢語 TTS 系統做概略性地 介紹,而對於漢語 TTS 系統尤其針對韻律產生器的部份將做較詳細的說明,因 為韻律方面是本論文的研究重點。

第三章 第三章 第三章

第三章 音長模型的原理和數學說明音長模型的原理和數學說明音長模型的原理和數學說明音長模型的原理和數學說明:::

在這章中首先對於本論文的研究目標做闡述,而後再回顧一些過去在此研 究方向的相關文獻內容,最後針對所要建立的音長模型做原理和數學的說明。

第四章 第四章 第四章

第四章 音長模型的實驗結果分析音長模型的實驗結果分析音長模型的實驗結果分析音長模型的實驗結果分析::

本章對於所建立的音長模型在符合收斂條件狀態下分析其參數,以觀察是 否符合我們所知道的各種語音特性,藉此來判斷所建立的模型是否正確。

第五章第五章

第五章第五章 音節之韻律狀態類型的分析音節之韻律狀態類型的分析音節之韻律狀態類型的分析音節之韻律狀態類型的分析:::

本章對於音長模型在收斂狀態下對語料庫中每一個音節所標示的韻律狀態 類型做分析,我們希望能從中觀察出其代表著高階語言層次之音長特性的現 象。我們也使用參考文獻[11]裡作者以韻律訊息中的音高訊息和停頓訊息以及一 些語言參數對本語料庫所標示的音節間之停頓類型的 Break Type,來觀察其和 音節之韻律狀態類型的相關性。最後我們也使用文獻裡作者對語料庫中每一個 音節所標示的音高韻律狀態類型,來觀察其和本論文的音長韻律狀態類型之相 關性。

第 第 第

第六六六六章章章 高階音長模型的原理和數學說明章 高階音長模型的原理和數學說明高階音長模型的原理和數學說明高階音長模型的原理和數學說明:::

本章依據第五章所述的漢語語音階層韻律結構搭配著所觀察到的音長軌跡 現象建立一個高階音長模型,以數學的方式呈現出每一個階層之音長軌跡的

Pattern。本章內容首先對於高階語言層次的韻律訊息做介紹,而後對於模型的 原理和數學做說明。

第七章 第七章 第七章

第七章 高階音長模型的實驗結果分析高階音長模型的實驗結果分析高階音長模型的實驗結果分析高階音長模型的實驗結果分析:::

本章對於所建立的高階音長模型在符合收斂條件狀態下分析其參數,以觀 察是否符合我們所認知的語音特性,藉此來判斷所建立的模型是否正確,並且 呈現出各個漢語語音階層韻律結構的階層之高階音長軌跡 Pattern。

第 第 第

第八八八八章章章 結章 結結結論論論論與未來展望與未來展望與未來展望與未來展望::

本章首先對於本論文所完成的工作做整體性的回顧和結論,而後提出幾個 方向以在未來能夠做更進一步的研究。

第二章 第二章

第二章 第二章 漢語 漢語 漢語語音特性和 漢語 語音特性和 語音特性和 語音特性和漢語 漢語 漢語 TTS 系統 漢語 系統 系統 系統 概述 概述 概述

概述

本章對於漢語語音特性和本實驗室過去所發展的漢語 TTS 系統做概略性地介紹,而對 於漢語 TTS 系統尤其針對韻律產生器的部份將做較詳細的說明,因為韻律方面是本論文的 研究重點。

2.1 漢語 漢語 漢語 漢語語音特性 語音特性 語音特性 語音特性

漢語的音系特點不同於英語為音節(Syllable)界線分明和音節帶有聲調,其發音單位 (Pronunciation Unit)是帶有聲調(Tone)的基本音節(Base-Syllable)。漢語在語言上的單位為字 (Character)而在語音上的單位是音節,也就是字的發音一個字對應一個音節。漢語文字常見 的有 12000 多個,但在發音上同音字很多,總共的音節約略是 1300 個。漢語的音節包含基 本音節和聲調兩個部份,其分別有 411 個基本音節類型和五個聲調類型,我們將漢語 411 個 基本音節碼與對應的注音符號、22 個聲母碼、40 個韻母碼列於附錄一。

音節的基本音節包含聲母(亦可稱為為子音或輔音)和韻母(亦可稱為為母音或元音)兩個 部份,聲母是位於音節開頭的位置因此其英文為 Initial 也就是首音的意思,如果一個音節是 屬於沒有聲母者則稱其為空聲母的音節。連同空聲母漢語共有 22 個聲母,我們將漢語 22 個 聲母碼與對應的注音符號列於附錄二,各聲母之發音方法、發音部位、清音或是濁音和送氣

與否的對應表如表二.1;韻母是位於音節尾端的位置因此英文稱為 Final 也就是尾音的意思,

音節中聲母之後的部份即為韻母,如果一個音節是屬於沒有韻母者則稱其為空韻母的音節。

連同空韻母漢語共有 40 個韻母其中兩個為不同類型的空韻母,我們將漢語 40 個韻母碼與對

應的注音符號列於附錄三,韻母之發音方法、發音部位和組成結構的對應表如表二.2所示。

表二.1:漢語聲母之發音方法及發音部位對應表。

發音部位 發音部位 發音部位 發音部位 發音方法發音方法發音方法

發音方法 清音清音清音清音/濁音濁音濁音濁音 送氣送氣送氣送氣/不送氣不送氣不送氣不送氣 唇 唇 唇

唇 齒齒齒齒 齒齦齒齦齒齦 捲舌齒齦 捲舌捲舌 齶捲舌 齶齶齶 軟齶軟齶軟齶軟齶

不送氣 ㄅ ㄉ ㄍ

爆破音 清音

送氣 ㄆ ㄊ ㄎ

鼻音 濁音 ㄇ ㄋ

清音 ㄈ ㄙ ㄕ ㄒ ㄏ

摩擦音 濁音 ㄖ

邊音 濁音 ㄌ

不送氣 ㄗ ㄓ ㄐ

塞擦音 清音

送氣 ㄘ ㄔ ㄑ

表二.2:漢語韻母之發音方法及發音部位對應表。

發音方法 發音方法 發音方法

發音方法 單韻母單韻母單韻母單韻母 複韻母複韻母複韻母複韻母 聲隨韻母聲隨韻母聲隨韻母聲隨韻母 開口呼 ㄚ ㄛ ㄜ ㄝ

ㄦ ㄞ ㄟ ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ

齊齒呼 一 一ㄚ 一ㄛ 一ㄝ 一ㄞ

一ㄠ 一ㄡ 一ㄢ 一ㄣ 一ㄤ 一ㄥ

合口呼 ㄨ ㄨㄚ ㄨㄛ ㄨㄞ ㄨㄟ ㄨㄢ ㄨㄣ ㄨㄤ ㄨㄥ

撮口呼 ㄩ ㄩㄝ ㄩㄢ ㄩㄣ ㄩㄥ

音節具有聲調是漢語的一項重要特徵,漢語有五種聲調,分別是第一聲、第二聲、第三 聲、第四聲和第五聲(輕聲),聲調之主要特徵是由音高軌跡(Pitch Contour)形狀、聲音響度 (Loudness)和音長(Duration)來呈現,我們將漢語四個聲調(輕聲除外)的音高軌跡和時間的關

係繪出如下的圖二.1所示。

圖二.1:漢語四個聲調(輕聲除外)的音高軌跡和時間的關 係圖。

至於第五聲,其音高軌跡非常容易受到前後音節聲調的影響,因此它沒有固定的音高軌

音高軌跡

時間

第一聲 第二聲 第三聲 第四聲

跡形狀,而且它的音長明顯比其他四個聲調短很多,音量也小很多,因此我們可以很容易地 以音長和音量來判斷一個音節是否為第五聲。

依照漢語的聲母、韻母和聲調之音系結構,可能的音節組合形式共有 22 40 5 4400× × = 種,但是實際上漢語有嚴格的聲母和韻母的組合規則並不是每一種聲母和韻母的組合皆為合 法的,而且也不是每一種基本音節組合都有五種聲調,因此漢語僅有 1300 種左右的聲母、

韻母和聲調之組合音節。

2.2 漢語 漢語 漢語 漢語 TTS 系統概述 系統概述 系統概述 系統概述

本實驗室長期以來致力於語音辨識技術和語音合成技術的研究,而對於語音合成技術方 面本實驗室自行發展了一套漢語 TTS 系統,它是運作於電腦上的軟體程式,其基本架構如 圖二.2所示。

圖二.2:漢語 TTS 系統的基本架構圖。

這套系統是由四個主要的部份所組成,分別是文字分析器、韻律產生器、語音合成器和 411 基本音節語音波形樣本資料庫。文字分析器的功能是將輸入文字轉換成為語言參數和合 成音節的 411 基本音節碼,而後將語言參數送入韻律產生器以產生每個音節的韻律訊息,合 成音節的 411 基本音節碼則送入 411 基本音節語音波形樣本資料庫以取出對應的 411 基本音 節類型之樣本波形。最後將每一個音節的韻律訊息和對應的 411 基本音節類型之樣本波形送

輸入文字

語言參數 文字分析器

韻律產生器

語音合成器 韻律參數

合成的語音 411 基本音節

語音波形樣本資料庫 韻律模型 語言模型

入語音合成器,如此便可以產生每一個音節的合成語音。我們將在以下四個小節中分別對漢 語 TTS 系統的四個主要部份做進一步的概述,其中將特別著墨於韻律訊息產生器,因其為 本論文的研究重點。

2.2.1 文字分析器 文字分析器 文字分析器 文字分析器

文字分析器的功能是要將一段文字做剖析(Parsing),以將所含的詞彙及構詞資訊抽取出 來送入韻律產生器。不同於英語般漢語的文句在詞(一般所指的詞是指 Lexical Word,有別於 在本論文的後段部分所提及的 Prosodic Word 我們將其翻譯為韻律詞。)和詞之間不會以空白 表示,因此文字分析器需要對漢語文句進行斷詞的動作,而斷詞如果想要更準確語言模型便 是一項不可少的要素。在完成了文字分析器的工作之後便可以得到一些語言參數,這些語言 參數由低層次到高層次我們將其條列呈述如下:

1. 音節層次音節層次音節層次音節層次:::基本音節類型、聲調類型和音節於詞中的位置等; : 2. 詞層次詞層次詞層次詞層次::::詞長和詞類(Part of Speech, POS)等;

3. 語法片語語法片語語法片語語法片語(Syntactic Phrase)層次層次層次:層次:::如動詞片語和名詞片語等;

4. 語法樹語法樹語法樹語法樹(Syntactic Tree)層次層次層次層次;

5. 語意語意語意語意(Semantic)層次層次層次。 層次

2.2.2 韻律產生器 韻律產生器 韻律產生器 韻律產生器

TTS 系統想要能夠合成出自然流暢的語音其關鍵便是在於韻律產生器所產生的韻律訊 息,一般而言韻律訊息包含了音高的高低、音量(Energy)的大小、音長的長短和停頓(Pause) 的長短。而韻律訊息的產生是要依據事先所建立好的韻律模型,我們將在下一個小節中對於

TTS 系統想要能夠合成出自然流暢的語音其關鍵便是在於韻律產生器所產生的韻律訊 息,一般而言韻律訊息包含了音高的高低、音量(Energy)的大小、音長的長短和停頓(Pause) 的長短。而韻律訊息的產生是要依據事先所建立好的韻律模型,我們將在下一個小節中對於

相關文件