• 沒有找到結果。

音節層次之影響型態

第五章 :實驗結果

5.1 音節韻律模型

5.1.1 音節層次之影響型態

在5.1.1.1、5.1.1.2 以及 5.1.1.3 節將觀察音節層次中基頻、音節長度以及音節能量,各 影響因子AP 的變化狀況。

5.1.1.1 音節層次中基頻之影響型態

-0.1 -0.08 -0.06 -0.04 -0.02 0 0.02 0.04 0.06 0.08

log-F0

Tone 1 Tone 2 Tone 3 Tone 4 Tone 5

圖5.2:五個中文聲調之 AP

首先觀察考慮連音現象之聲調影響因子,由於此影響因子經由一個聲調分類器之決策樹 所產生,因此藉由觀察每一個聲調決策樹的根節點(root node)來顯示未考慮連音現象時,

每一個聲調之AP,如圖 5.2 所示,由此圖與朗讀式語音之聲調【7】相比,發現在自發性語 音當中,聲調之AP 之動態範圍(dynamic range)以及基頻軌跡之曲度都較小,在此我們推 測原因有以下幾點:

¾ 首先為自發性語音之語速較朗讀式語音快,音節會產生緊密連接的狀況較多,因此音節 基頻軌跡會受鄰近音節的嚴重干擾,以及自發性語音中發音經常不完全而使聲調之基頻 軌跡相當凌亂。

¾ 接著又因為語速較快,人類為了節省發音所需之力氣而刻意降低音節基頻變化之幅度,

因此弱化了基頻軌跡之曲度以及動態範圍。

¾ 最後由於本研究所得到之音節切割乃利用聲學模型強迫對齊得來,而自發性語音至今仍

無良好的聲學模型,因此會造成切割位置不準確的狀況而影響音節中基頻軌跡之求取。

以上幾點也是使自發性語音中各個AP 之 TRE 值較小之原因。

接著藉由觀察決策樹之各節點,找出考慮連音現象各聲調之AP,決策樹之示意圖如圖 5.3 所示;各個聲調之決策樹如圖 5.4 至圖 5.7 所示。首先在這四張圖中詢問音節邊界左右之 停頓標記皆以「是否為B0」或「是否為 B1」的問題為主且位於決策樹較上層之節點,而在 決策樹分裂之演算法中,會將較具鑑別性之問題先詢問,這表示連音現象在音節沒有產生韻 律上的停頓時較為嚴重;接著觀察「左邊音節邊界是否為B0」或「左邊音節邊界是否為 B1」

的問題皆位於決策樹之根節點或第二層之節點,這表示連音現象是受前一音節之影響較大,

這些現象都與【7】中觀察到連音現象之結果相同。此外觀察各聲調節點中與根節點之標準 型態(typical pattern)相差甚大之 AP,如下:

¾ 一聲之決策樹,如圖 5.4 所示:

(1) 觀察節點 4 及節點 12,前一音節皆為三聲,且一聲之起頭較三聲之結尾高,而產生 low-to-high mismatch,使一聲之 AP 起頭下沉,其中又以節點 12 與前一音節為緊密 連接而產生較嚴重之連音現象。

(2) 觀察節點 22,後一音節皆為四聲且為緊密連接,且一聲之結尾與四聲之開頭皆為位 處高的層級,但人類為了突顯四聲之基頻軌跡,而刻意提高一聲之結尾。

(3) 另外在節點 34 中之音節之結尾也發生上揚的現象,是由於音節後邊界皆標記為 B2-1,而一聲本身之結尾已經是處在高的狀態,為了突顯基頻跳躍而拉高一聲結尾 之音高。

1=LBreak=B1

四聲,且二聲之起頭較一聲或四聲之結尾低,而產生high-to-low mismatch,使二聲 之AP 起頭上揚,尤其又以節點 43 以及節點 53 與前音節為緊密連接而更加嚴重。

(2) 觀察節點 57,後一音節皆為三聲,且二聲之結尾較後一音節三聲之起頭低,而產生 low-to-high mismatch,使二聲之 AP 結尾上揚。

40=LTone=1 之起頭低,而產生low-to-high mismatch,使三聲 AP 之結尾上揚

(3) 而節點 84 則是因為音節後邊界皆標記為 B2-1,為了突顯基頻跳躍而拉高三聲之結 尾。

71=LBreak=B0 產生low-to-high mismatch,使四聲之 AP 起頭下沉。

(2) 觀察節點 125、161 及 157 ,前一音節皆為一聲,且一聲之結尾與四聲之開頭皆為 位處高的層級,人類為了突顯四聲之基頻軌跡,而刻意提高四聲之開頭。

(3) 觀察節點 129、151 及 153,後一音節皆為四聲,且四聲之結尾較後一音節四聲之起 頭低,而產生low-to-high mismatch,使四聲 AP 之結尾上揚。

112=LBreak=B0 particular syllable type

1 2 3 4 5

5.1.1.2 音節層次中音節長度之影響型態

接著觀察各個影響因子下音節長度之 AP,並與特殊音節做比較,如圖 5.9 所示。在基 本音節中一聲及四聲之音節長度較長,五聲明顯較短,而基本音節與特殊音節相比,其動態 範圍差不多,但特殊音節之長度以偏長稍多。

(a) (b) (c)

1 2 3 4 5

-0.06 -0.04 -0.02 0 0.02 0.04 0.06 0.08

tone

sec

0 20 40 60 80

-0.06 -0.04 -0.02 0 0.02 0.04 0.06 0.08

base syllable type

sec

0 5 10 15 20

-0.06 -0.04 -0.02 0 0.02 0.04 0.06 0.08

particular syllable type

sec

圖5.9:基本音節中 (a)聲調、 (b) 基本音節型態以及特殊音節中 (c)特殊音節型態之音節長 度AP

5.1.1.3 音節層次中音節長度之影響型態

最後觀察各個影響因子能量之AP,並與特殊音節做比較,如圖 5.10 所示。在基本音節 中一聲及四聲之能量較大,五聲能量較小。而基本音節與特殊音節相比,其動態範圍差不多,

但特殊音節之能量大部分明顯偏小,由此可知語者在特殊音節發音時,因為其大多數為語音 中較不帶訊息之篇章提語、感歎詞或語助詞,因此不會加強其能量,這些基頻、音節長度或 能量上的現象可提供未來在偵測篇章提語、感歎詞或語助詞時,作為一個有用的訊息。

1 2 3 4 5 -8

-6 -4 -2 0 2 4

tone

dB

0 10 20 30 40

-8 -6 -4 -2 0 2 4

final type

dB

0 5 10 15 20

-8 -6 -4 -2 0 2 4

particular syllable type

dB

圖5.10:基本音節中 (a)聲調、 (b) 韻母型態以及以及特殊音節中 (c)特殊音節型態之能量 AP

相關文件