• 沒有找到結果。

Treebank 語料庫實驗結果分析 語料庫實驗結果分析 語料庫實驗結果分析 語料庫實驗結果分析

5.2 使用國語 使用國語 使用國語語料庫 使用國語 語料庫 語料庫 語料庫之實驗結果 之實驗結果 之實驗結果 之實驗結果

5.2.2 Treebank 語料庫實驗結果分析 語料庫實驗結果分析 語料庫實驗結果分析 語料庫實驗結果分析

利用第四章所述之自動語音分段的方法,來印證在國語 Treebank 語料庫的效能,並以音 節層級和聲/韻母層級訂定目標函數進行自動語音分段,最後得到對國語 Treebank 語料庫兩 種不同層級的自動分段實驗結果。

Treebank 語料庫有人為時間標記的資訊,首先針對音節層級之實驗結果統計 HMM 自動 分段位置和實驗結果對人為標記的端點位置的誤差在不同絕對偏差值之包含比率,如圖 5.12。在音節層級方面,本論文所提出之方法相較於 HMM 自動分段結果之準確率也有大幅 度地提升。此數據顯示本研究方法能有效地的改正原本 HMM 音節層級的自動分段結果,提 升自動語音分段的精確度效能。

另一方面,在實驗結果的分析上同樣發生與 TCC300 語料庫相同的問題,圖 5.12 以絕對 偏差值為 30 毫秒做為分界點,可以觀察出分界點左邊的包含比率相較於分界點右邊的上升 幅度較大,這種現象表示出在本研究方法確實能將 HMM 自動分段位置調整至更精確,但分 界點右邊代表越難找到一個合適的端點位置使得偏差值的增高,造成分界點右邊包含比率上 升幅度趨緩的原因。

圖 5.12:實驗方法與人為標記位置之誤差在不同絕對偏差值的包含比率直方圖,藍色線(左 側)為本論文所提出之方法,紅色線(右側)為使用 HMM 之初始自動分段位置

本論文同樣將聲/韻母層級的端點測器以修正 HMM 自動語音分段之實驗結果顯示了與 TCC300 語料庫類音素層級以及 Treebank 語料庫音節層級實驗相似之實驗結果,在此不多作 敘述。而將音節層級與聲/韻母層級之實驗結果相比,可以發現左側音節層級和右側聲/韻母 層級有一段包含比率的差距,且聲/韻母層級之實驗結果較佳,如下圖 5.13 所示。此圖凸顯 出不同音節結構的層級對自動語音分段效能的影響,其原因將在以下做討論。

由於音檔抽取之取樣點式聲學參數以及挑選音素候選端點的過程為相同步驟,則影響效 能差異的關鍵即是對候選端點依照不同層級音節架構所標記之目標函數,而目標函數中所代 表不同分類之間的轉移狀態即為自動分段所能調整的端點位置。由第四章所述,對描述語音 單元中邊界端點轉移狀態的定義分別由音素端點偵測只有一種描述音素邊界端點的轉移狀 態;音節層級轉移狀態有兩種;聲/韻母層級則有四種;最後類音素層級共有五種描述語音 邊界端點轉移狀態的目標函數。然而,轉移狀態的個數也象徵候選端點對描述語音單元邊界 端點的分類,與只有一種描述音素邊界端點轉移狀態相比,若邊界端點的類型適當地增多便 能顯現各轉移狀態統計特性的差異,減低因輸入候選端點之聲學參數特性相似讓端點偵測器 產生混淆的可能性。

語音之結構亦隱含前後轉移狀態之間的順序關聯性,以聲/韻母層級舉例,目前候選端 點為聲母的狀態,則下一個候選端點就只能為聲母至韻母的轉移狀態或仍是聲母的狀態而不 會跳過結構中的分類。在另一方面,此順序之關聯性也可能造成分段位置之絕對偏差值增 大,如類音素層級之鼻音韻尾分類,欲在韻母狀態之後尋找最佳韻母至鼻音韻尾轉移狀態之 候選端點,但語音信號卻有鼻音弱化的現象,使得維特比搜尋在該音段選擇轉移狀態相對較 大的端點造成自動分段效能變差的情形。

因此綜合以上所述且考量語音信號所挑選出候選端點數目以及觀察候選端點之位置,自 動語音分段屬聲/韻母與類音素之層級較為合適,也就是圖 5.13 聲/韻母層級之實驗結果較佳 的原因。

圖 5.13:不同音節結構實驗結果與人為標記位置之誤差在不同絕對偏差值的包含比率直方 圖,藍色線(左側)為音節層級,紅色線(右側)為使用聲/韻母層級

在此可作延伸討論,實驗結果顯示對候選端點經過適當地分類標記,可有助於實驗效能 之提升。但換句話說,候選端點間之音段也同樣經過了分類標記,那麼以音段為基礎的聲學 特性來建立分類的模型,即可應用至語音屬性偵測甚至是語音辨認中。