第五章 語音辨認後處理之改良
6.2. 展望
辨認結果的最終目的是辨認出來的詞為較長且有意義的,本實驗只針對結果 和最後目的做分析,也就是辨認結果和較長且有意義的詞做分析,沒進一步處 理。若把有意義的長詞,用較長的subword 取代後,並且短詞全收錄在詞典內,
而短詞的收錄極為重要,就是本論文提到,以較短的短詞取代長詞會使辨識率下 降,所以短詞的收錄是一門學問。未來可利用 two-stage【8】【9】【10】的想
43
法,從辨認結果的word lattice 重新估算分數,使辨認結果構回較有意義的長詞,
就是在第一級辨認出word lattice,再分別建立有意義的長詞模型,例如:人名的 模型、構詞規則所構出的詞之模型,利用模型及word lattice 重新計算分數,使 辨認出來的詞是一句長且有意義的長詞,而非第一級所辨認的短詞串。
44
參考文獻
【1】B.H.Juang and S.Furui,“Automatic recognition and understanding of spoken language—A first step towards natural human-machine communication,”in Proc IEEE,88,8,pp.1142-1165,2000
【2】L.R.Rabiner and B.H.Juang,“Fundamental of speech Recognition,”New Jersey,Prentice-Hall,Inc.,1993
【3】S.Young, G..Evermann, T.Hain, D.Kershaw, G,Moore, J,Odell,D.Ollan, D.Povey, V.Valtchev, P.Wooland,“The HTK Book(for HTK version 3.4)”
【4】Slava M. Katz,“Estimation of Probabilities from Sparse Data for the Language Model Component of a Speech Recognizer,”IEEE Transactions on
Acoustic,Speech and Signal Processing,Vol.ASSP-35,NO.3,MARCH 1987
【5】江振宇,中文斷詞器之改進,國立交通大學電信工程學系碩士論文,民國 九十三年七月
【6】張隆勳,國語廣播新聞語音基本辨認系統之建立,國立交通大學電信工程 學系碩士論文,民國九十四年七月
【7 】 P.Geutner,“Using Morphology Towards Better Large-Vocabulary Speech Recognition Systems” in: Proc .Int. Conf. on Acoustics, Speech, and Signal Processing, Detroit, pp. 445-448 ,1995
【8】Koichi Tanigaki, Hirofumi Yamamoto, and Yoshinori Sagisaka, “A Hierarchical language model incorporating class-dependent word models for OOV words recognition”
【9】Shigehiko Onishi, Hirofumi Yamamoto, “Structured language model for class identification of out-of-vocabulary words arising from multiple word-classes”
45
【10】Koichi Tanigaki, Hirofumi Yamamoto, Yoshihiki Ogawa, and Yoshinori Sagisaka, “Out-of-vocabulary word recognition with a hierarchical doubly markov language model”
46
47
48
49
50
***(**立委)
52
53
54
招生單位(詳見附表) 招生單位 692
基諾李維(見右圖左)在「駭 基諾李維在「駭 434
圖片註解
好下場了(見圖表)。 好下場了。 377
聖先師孔子票數最高(十票) 聖先師孔子票數 最高
297 就業獎助(每人每月一萬五千元) 就業獎助 4,373
韓國(一.一%)還低 韓國還低 1,538
單位註解
第四選區(新興、前金、苓雅區) 第四選區 505
路名註解
松平路(松仁路至松智路段)兩旁 早松平路兩旁早 175
書名註解
戀戀北投溫泉(洪德仁編著) 戀戀北投溫泉5
影片註解
樓學賢演的「三十而立」(護) 樓學賢演的「三十而立」 57
無意義註解
家專資投與(㊣㊣㊣)終數指業工 家專資投與終數 指業工112
國家名註解
(新加坡)(大陸)(台灣)(日本)(韓國)(香港)(臺灣) 394
55
56
57
58
59
刀 元 文 毛 令 卡 打 瓦 角 圓 塊 綸 赫 鎊 籮 千卡 千瓦 千赫 大籮 分貝 文錢 日元 日圓 牛頓 仟卡 仟瓦 仟赫 台幣 瓦特 伏特 兆赫 先令 安培 位元 里拉 周波 居里 法郎 法朗 便士 美元 美金 馬力 馬克 毫巴 莫耳 港幣 焦耳 塊錢 達因 爾格 赫茲 歐姆 盧比 盧布 辨士 燭光
. ‧ ﹒
%
,
/
: ︰ ﹕
FAX: fax:
TEL: tel:
AM am PM pm
$
中 初 底 年級
學年 年度 學年度 年代
世紀
仁 平 孝 良 和 忠 信 勇 恭 智 愛 溫 義 簡 讓
60
61
一日 二日 三日 四日 五日 六日 七日 八日 九日 十日 十一日 十二日 十三日 十四日 十五日 十六日 十七日 十八日 十九日 二十日 二十一日 二十二日 二十三日 二十四日 二十五日 二十六日 二十七日 二十八日 二十九日 三十日 三十一日
一月 二月 三月 四月 五月 六月 七月 八月 九月 十月 十一月 十二月
一時 二時 三時 四時 五時 六時 七時 八時 九時 十時 十一時 十二時 十三時 十四時 十五時 十六時 十七時 十八時 十九時 二十時 二十一時 二十二時 二十三時 二十四時 一分 二分 三分 四分 五分 六分 七分 八分 九分 十分 十一分 十二分 十三分 十四分 十五分 十六分 十七分 十八分 十九分 二十分 二十一分 二十二分 二十三分 二十四分 二十五分 二十六分 二十七分 二十八分 二十九分 三十分 三十一分 三十二分 三十三分 三十四分 三十五分 三十六分 三十七分 三十八分 三十九分 四十分 四十一分 四十二分 四十三分 四十四分 四十五分 四十六分 四十七分 四十八分 四十九分 五十分 五十一分 五十二分 五十三分 五十四分 五十五分 五十六分 五十七分 五十八分 五十九分
一秒 二秒 三秒 四秒 五秒 六秒 七秒 八秒 九秒 十秒 十一秒 十二秒 十三秒 十四秒 十五秒 十六秒 十七秒 十八秒 十九秒 二十秒 二十一秒 二十二秒 二十三秒 二十四秒 二十五秒 二十六秒 二十七秒 二十八秒 二十九秒 三十秒 三十一秒 三十二秒 三十三秒 三十四秒 三十五秒 三十六秒 三十七秒 三十八秒 三十九秒 四十秒 四十一秒 四十二秒 四十三秒 四十四秒 四十五秒 四十六秒 四十七秒 四十八秒 四十九秒 五十秒 五十一秒 五十二秒 五十三秒 五十四秒 五十五秒 五十六秒 五十七秒 五十八秒 五十九秒