• 沒有找到結果。

第五章 實驗結果與分析

6.2 未來展望

語音辨認結果之最終目的乃為辨識出較長且具有意義的詞,本研究針對辨認結果 和較長且有意義的詞做分析後,發現若將有意義的長詞,以較長的 subword 半詞串取 代後,subword 集合詞條數量過於龐大,以致無法全收錄於辭典內,是故,subword 短詞之收錄方法就顯得極為重要。基此,建議未來研究可繼續運用 two-stage 概念,針 對 word lattice 上的 subword 半詞串,將其構詞回到原先較有意義的長詞,並分別透過

建立有意義的各類長詞之構詞模型進行構詞,例如:人名的模型、詞綴模型和 OOV 等的構詞模型,不再以目前查表方式來當作構詞的依據,進而推動第二級之辨認,使 辨認語料之更多 subword 半詞串得以被偵測出來並構回有意義的長詞;另一方面,在 人名和數量複合詞內部機率之分數配置,可採取階層式的架構,人名可針對不同特性 的人名,建立與前後詞的關連性,而數量複合詞則可在 FSM 架構下對數詞部份或量 詞等地方加以細緻分類,依據相似結構,可針對分開建立的數詞 FSM 共享相同的機 率。

另外,混合式辭典中仍有 4,529 條的集合空間尚未完整運用(原本收錄未出現之ㄧ字 詞),往後可運用此空間來收錄更多對於語音辨識效能有所助益的 subword 短詞。

參考文獻

【1】B.H.Juang and S.Furui,“Automatic recognition and understanding of spoken language—A first step towards natural human-machine communication,”in Proc IEEE,88,8,pp.1142-1165,2000

【2】L.R.Rabiner and B.H.Juang,“Fundamental of speech Recognition,”New Jersey,Prentice-Hall,Inc.,1993

【3】S.Young, G..Evermann, T.Hain, D.Kershaw, G,Moore, J,Odell,D.Ollan, D.Povey, V.Valtchev, P.Wooland,“The HTK Book(for HTK version 3.4)”

【4】Slava M. Katz,“Estimation of Probabilities from Sparse Data for the Language Model Component of a Speech Recognizer,”IEEE Transactions on Acoustic,Speech and Signal Processing,Vol.ASSP-35,NO.3,MARCH 1987

【5】江振宇(2004)。中文斷詞器之改進。國立交通大學電信工程學系碩士論文。

【6】張隆勳(2005)。國語廣播新聞語音基本辨認系統之建立。國立交通大學電信工程 學系碩士論文。

【7】P.Geutner,“Using Morphology Towards Better Large-Vocabulary Speech Recognition Systems”in: Proc .Int. Conf. on Acoustics, Speech, and Signal Processing, Detroit, pp. 445-448 ,1995

【8】Mathias Creutz,Teemu Hirsimaki,Mikko Kurimo,Antti Puurula,Janne Pylkkonen,Vesa Siivola,Matti Varjokallio,Ebru Arisoy,Murat Saraclar,and Andreas Stolcke,

”Analysis of Morph-Based Speech Recognition and the Modeling of Out-of- Vocabulary Words Across Languages”,Helsinki University of Technology,2007

【9】Issam Bazzi and James R. Glass, “Modeling Out-of-Vocabulary words for robust

speech recognition”, Laboratory for Computer Science Massachusetts Institute of Technology Cambridge, 2000

【 10 】 Issam Bazzi and James R. Glass, “A Multi-class Approach for Modeling Out-of-Vocabulary words”, MIT Laboratory for Computer Science Cambridge, 2002

【11】Ali Yazgan and Murat Saraclar, “Hybrid Language Models for Out-of-Vocabulary word Detection in Large Vocabulary Conversational Speech Recognition”, Center for Language and Speech Processing, 2008

【12】Koichi Tanigaki, Hirofumi Yamamoto, and Yoshinori Sagisaka, “A Hierarchical language model incorporating class-dependent word models for OOV words recognition”, ICLSP, 2008

【13】Shigehiko Onishi, Hirofumi Yamamoto, “Structured language model for class identification of out-of-vocabulary words arising from multiple word-classes”, European Conference on Speech Communication and Technology, 2001

【14】Koichi Tanigaki, Hirofumi Yamamoto, Yoshihiki Ogawa, and Yoshinori Sagisaka,

“Out-of-vocabulary word recognition with a hierarchical doubly markov language model”, IEEE, 2005

附錄一

華氏

件 任 份 列 名 回 地 夸 州 年 式 曲 朵 次 色 行

刀 元 文 毛 令 卡 打 瓦 角 圓 塊 綸 赫 鎊 籮 千卡 千瓦 千赫 大籮 分貝 文錢 日元 日圓 牛頓 仟卡 仟瓦 仟赫 台幣 瓦特 伏特 兆赫 先令 安培 位元 里拉 周波 居里 法郎 法朗 便士 美元 美金 馬力 馬克 毫巴 莫耳 港幣 焦耳 塊錢 達因 爾格 赫茲 歐姆 盧比 盧布 辨士 燭光

. ‧ ﹒

: ︰ ﹕

FAX: fax:

TEL: tel:

AM am PM pm

中 初 底 年級

學年 年度 學年度 年代

世紀

仁 平 孝 良 和 忠 信 勇 恭 智 愛 溫 義 簡 讓

附錄二

六萬

四分

十五分 十六分 十七分 十八分 十九分 二十分 二十一分 二十二分 二十三分 二十 四分

二十五分 二十六分 二十七分 二十八分 二十九分 三十分 三十一分 三十二分 三十 三分

三十四分 三十五分 三十六分 三十七分 三十八分 三十九分 四十分 四十一分 四十 二分

四十三分 四十四分 四十五分 四十六分 四十七分 四十八分 四十九分 五十分 五十 一分

五十二分 五十三分 五十四分 五十五分 五十六分 五十七分 五十八分 五十九分 一秒 二秒 三秒 四秒 五秒 六秒 七秒 八秒 九秒 十秒 十一秒 十二秒 十三秒 十 四秒

十五秒 十六秒 十七秒 十八秒 十九秒 二十秒 二十一秒 二十二秒 二十三秒 二十 四秒

二十五秒 二十六秒 二十七秒 二十八秒 二十九秒 三十秒 三十一秒 三十二秒 三十 三秒

三十四秒 三十五秒 三十六秒 三十七秒 三十八秒 三十九秒 四十秒 四十一秒 四十 二秒

四十三秒 四十四秒 四十五秒 四十六秒 四十七秒 四十八秒 四十九秒 五十秒 五十 一秒

五十二秒 五十三秒 五十四秒 五十五秒 五十六秒 五十七秒 五十八秒 五十九秒

相關文件