未來展望

第五章實驗結果與分析

6.2 未來展望

語音辨認結果之最終目的乃為辨識出較長且具有意義的詞，本研究針對辨認結果和較長且有意義的詞做分析後，發現若將有意義的長詞，以較長的 subword 半詞串取代後，subword 集合詞條數量過於龐大，以致無法全收錄於辭典內，是故，subword 短詞之收錄方法就顯得極為重要。基此，建議未來研究可繼續運用 two-stage 概念，針對 word lattice 上的 subword 半詞串，將其構詞回到原先較有意義的長詞，並分別透過

建立有意義的各類長詞之構詞模型進行構詞，例如：人名的模型、詞綴模型和 OOV 等的構詞模型，不再以目前查表方式來當作構詞的依據，進而推動第二級之辨認，使辨認語料之更多 subword 半詞串得以被偵測出來並構回有意義的長詞；另一方面，在人名和數量複合詞內部機率之分數配置，可採取階層式的架構，人名可針對不同特性的人名，建立與前後詞的關連性，而數量複合詞則可在 FSM 架構下對數詞部份或量詞等地方加以細緻分類，依據相似結構，可針對分開建立的數詞 FSM 共享相同的機率。

另外，混合式辭典中仍有 4,529 條的集合空間尚未完整運用(原本收錄未出現之ㄧ字詞)，往後可運用此空間來收錄更多對於語音辨識效能有所助益的 subword 短詞。

參考文獻

【1】B.H.Juang and S.Furui,“Automatic recognition and understanding of spoken language—A first step towards natural human-machine communication,”in Proc IEEE,88,8,pp.1142-1165,2000

【2】L.R.Rabiner and B.H.Juang,“Fundamental of speech Recognition,”New Jersey,Prentice-Hall,Inc.,1993

【3】S.Young, G..Evermann, T.Hain, D.Kershaw, G,Moore, J,Odell,D.Ollan, D.Povey, V.Valtchev, P.Wooland,“The HTK Book(for HTK version 3.4)”

【4】Slava M. Katz,“Estimation of Probabilities from Sparse Data for the Language Model Component of a Speech Recognizer,”IEEE Transactions on Acoustic,Speech and Signal Processing,Vol.ASSP-35,NO.3,MARCH 1987

【5】江振宇(2004)。中文斷詞器之改進。國立交通大學電信工程學系碩士論文。

【6】張隆勳(2005)。國語廣播新聞語音基本辨認系統之建立。國立交通大學電信工程學系碩士論文。

【7】P.Geutner,“Using Morphology Towards Better Large-Vocabulary Speech Recognition Systems”in: Proc .Int. Conf. on Acoustics, Speech, and Signal Processing, Detroit, pp. 445-448 ,1995

【8】Mathias Creutz,Teemu Hirsimaki,Mikko Kurimo,Antti Puurula,Janne Pylkkonen,Vesa Siivola,Matti Varjokallio,Ebru Arisoy,Murat Saraclar,and Andreas Stolcke,

”Analysis of Morph-Based Speech Recognition and the Modeling of Out-of- Vocabulary Words Across Languages”,Helsinki University of Technology,2007

【9】Issam Bazzi and James R. Glass, “Modeling Out-of-Vocabulary words for robust

speech recognition”, Laboratory for Computer Science Massachusetts Institute of Technology Cambridge, 2000

【 10 】 Issam Bazzi and James R. Glass, “A Multi-class Approach for Modeling Out-of-Vocabulary words”, MIT Laboratory for Computer Science Cambridge, 2002

【11】Ali Yazgan and Murat Saraclar, “Hybrid Language Models for Out-of-Vocabulary word Detection in Large Vocabulary Conversational Speech Recognition”, Center for Language and Speech Processing, 2008

【12】Koichi Tanigaki, Hirofumi Yamamoto, and Yoshinori Sagisaka, “A Hierarchical language model incorporating class-dependent word models for OOV words recognition”, ICLSP, 2008

【13】Shigehiko Onishi, Hirofumi Yamamoto, “Structured language model for class identification of out-of-vocabulary words arising from multiple word-classes”, European Conference on Speech Communication and Technology, 2001

【14】Koichi Tanigaki, Hirofumi Yamamoto, Yoshihiki Ogawa, and Yoshinori Sagisaka,

“Out-of-vocabulary word recognition with a hierarchical doubly markov language model”, IEEE, 2005

附錄一

第

華氏

件任份列名回地夸州年式曲朵次色行

刀元文毛令卡打瓦角圓塊綸赫鎊籮千卡千瓦千赫大籮分貝文錢日元日圓牛頓仟卡仟瓦仟赫台幣瓦特伏特兆赫先令安培位元里拉周波居里法郎法朗便士美元美金馬力馬克毫巴莫耳港幣焦耳塊錢達因爾格赫茲歐姆盧比盧布辨士燭光

． ‧ ﹒

％

，

／

：︰ ﹕

ＦＡＸ：ｆａｘ：

ＴＥＬ：ｔｅｌ：

ＡＭａｍＰＭｐｍ

＄

中初底年級

學年年度學年度年代

世紀

仁平孝良和忠信勇恭智愛溫義簡讓

附錄二

六萬

四分

十五分十六分十七分十八分十九分二十分二十一分二十二分二十三分二十四分

二十五分二十六分二十七分二十八分二十九分三十分三十一分三十二分三十三分

三十四分三十五分三十六分三十七分三十八分三十九分四十分四十一分四十二分

四十三分四十四分四十五分四十六分四十七分四十八分四十九分五十分五十一分

五十二分五十三分五十四分五十五分五十六分五十七分五十八分五十九分一秒二秒三秒四秒五秒六秒七秒八秒九秒十秒十一秒十二秒十三秒十四秒

十五秒十六秒十七秒十八秒十九秒二十秒二十一秒二十二秒二十三秒二十四秒

二十五秒二十六秒二十七秒二十八秒二十九秒三十秒三十一秒三十二秒三十三秒

三十四秒三十五秒三十六秒三十七秒三十八秒三十九秒四十秒四十一秒四十二秒

四十三秒四十四秒四十五秒四十六秒四十七秒四十八秒四十九秒五十秒五十一秒

五十二秒五十三秒五十四秒五十五秒五十六秒五十七秒五十八秒五十九秒

在文檔中中文大詞彙語音辨認之語言模型改進 (頁 67-78)

第五章 實驗結果與分析

6.2 未來展望

參考文獻

第五章實驗結果與分析