灰色理論運用於混音辦識之研究 胡允中、鍾翼能
E-mail: [email protected]
摘 要
語音意指為用人類發音器官產生帶有語音訊息的聲音。而以電腦技術處理語音訊號,就叫做語音訊號處理。另一個名詞,
就是所謂的口述語言處理。語音處理可以有更廣泛的概念,它可以是與語言本身有關,也可能與語言沒有相關。有些語音 處理則是與語音絕對相關的,例如語音辨認、語音合成與混音。語音訊號處理和許多的科學相關,在應用的範圍上包括通 訊系統、航太科技、影音娛樂、聲光效果、錄音科技、軍事、工業與生活等,這些科技依賴著語音訊號處理的技術來使生 活更舒適更方便。 本論文研究是運用灰色理論的辨識程式,對混音做辨識找出特徵值,並以(Visual Basic)語音辨識程式 做比對以確定辨識之正確。運用此研究方法可得到結果為: (a)在製作聲音混音的技術上較為簡單與方便。 (b)可使 用(Gold Wave)數位錄音編輯程式簡單且方便的製作 不同形式與合成混音效果的聲音樣本。 (c)利用(Visual Basic)
與灰關聯語音辨識程式可使語音辨識過程更簡單更容易。 (d)可運用灰色理論來辨識大量的聲音數據值。 (e)不需太 過於複雜或昂貴的硬體設備。 (f)運用兩種辨識程式做比對可使實驗更具準確性提高辨識效率 。 (g)驗證灰色理論在 此研究的實用性與準確性。 運用灰色理論原理可有效的辨識出聲音的相似度與關連性,在混音方面,可運用各種不同的聲 音效果來增加辨識的困難度。(Gold Wave)數位語音編輯程式可錄製各種類型的聲音模型,並可混入不同的效果,對於 聲音的錄製與修改具有相當大的研究空間。
關鍵詞 : 語音辨識 ; 語音訊號處理 ; 灰關聯 ; 混音
目錄
簽名頁 授權書..................... iii 中文摘要....................
iv 英文摘要.................... vi 誌謝...................... viii 目 錄...................... ix 圖目錄..................... xii 第一章 緒論 1.1 前言....................1 1.2 文獻探討..................2 1.3 研 究動機與目的...............3 1.4 研究方法與步驟...............4 1.5 系統架構圖
.................8 1.6 章節內容概述................9 第二章 語音訊號處理 2.1 前言....................10 2.2 聲音的基本特性...............11 2.3 語音訊 號處理技術..............16 2.4 語音訊號處理程序..............19 2.5 特徵值說明.
................22 第三章 灰色系統理論 3.1 灰色理論簡介................25 3.2 灰色系統的產生...............25 3.3 灰色系統理論的意義及目的..........26 3.4 灰色系 統理論的優點.............27 3.5 灰色系統理論的缺點.............29 3.6 灰關聯度的數 學模式.............30 3.7 灰關聯推導.................33 3.8 修飾型灰關聯度..
.............35 3.9 灰預測與灰建模之介紹............38 3.10 灰關聯架構分析.....
......... 40 第四章 現代混音科技與專業錄音器材 4.1 錄音與混音.................42 4.2 錄音技術基本原理..............43 4.3 錄音檔案的儲存與錄音環境..........47 4.4 Gold Wave 錄音製作程式與 Visual Basic介紹................49 4.5 Gold Wave聲音特效介紹.......
.... 58 4.6 Visual Basic語音辨識方法..........61 4.7 專業錄音設備與器材介紹..........
.65 第五章 實驗與辨識結果 5.1 聲音樣本錄製與效果製作...........74 5.2 聲音樣本辨識實驗......
........80 第六章 結論與未來展望 6.1 結論....................124 6.2未來展望...
............... 125 參考文獻....................127 參考文獻
【1】張偉哲、溫坤禮、張廷政,灰關聯模型方法與應用。台北高立圖書有限公司,2006。 【2】王怡然,灰色理論應用於指紋辨識之 研究。私立大業大學電機工程研究所碩士論文, 2002。 【3】洪欽銘、李龍鑣,灰色關聯與優勢分析之應用研究。技術學刊,1997。
【4】翁慶昌、陳嘉叢、賴宏仁,灰色系統基本方法及其應用。台北高立圖書有限公司, 2001。 【5】馬西聰,利用灰色關聯度辨識車 牌字母的研究。國立台灣工業技術學院電機工程技術 研究所碩士論文,1997。 【6】張偉哲、陳朝光,灰色系統理論與發展應用。中華 民國資訊協會通訊學刊,2000。 【7】黃有評、陳朝光,灰色系統理論之應用與展望。模糊系統學刊,1998。 【8】溫坤禮,灰色系統
理論的簡介及其與機率統計、模糊理論的差異性,2000。 【9】鄧聚龍,灰色系統理論教程。大陸武漢華中理工大學出版社,1992。
【10】鄧聚龍,灰色系統理論與應用。台北高立圖書有限公司,2000。 【11】鄧聚龍、郭洪、溫坤禮、張廷政、張偉哲,灰預測模型 方法與應用。台北高立圖書 有限公司,1999。 【12】溫坤禮,灰關聯度的定量化研究。灰色系統學刊1999。 【13】楊鎮光,Visual Basic 與語音辨識 ”讓電腦聽話”。文魁資訊股份有限公司, 2005。 【14】林宸生,數位信號、影像與語音處理。全華科技圖書股份有 限公司,2006。 【15】易克初、田賦、付強,語音信號處理。國防工業出版社,2000。 【16】林輝彥,應用具聽覺效應之模型於噪音 環境中語音辨識。國立成功大學資訊工程研 究所碩士論文,2001。 【17】張紅、黃泰翼、李治,基於半波差分譜的語音信號音節切分
。聲學學報,2000。 【18】黃國璋,國語語音強健辨識之研究。國立中央大學博士論文,2003。 【19】王文德,台語語音辨識與文字 處理之研究。國立交通大學碩士論文,2003。 【20】王玉,以內容為基礎的音訊號之切割與分類之研究。國立成功大學碩士論文,
1999。 【21】高名揚,以聲音內容為主的音樂資料庫檢索系統的加速方法。清華大學碩士論文, 2001。 【22】楊永泰,隱藏式馬可夫 模型應用於中文語音辨識之研究。中原大學碩士論文, 2000。 【23】陳柏琳,中文語音資訊檢索”以音節為基礎之索引特徵、統計式 檢索模型及進一步 技術”。台灣大學博士論文,2001。 【24】呂道誠,不特定語者”國台雙語大詞彙語音辨識之聲學模型研究”。長 庚大學碩士 論文,2001。 【25】王小川,語音訊號處理。全華科技圖書股份有限公司,2005。 【26】陳桂明、張明照、戚紅雨,應用 MATLAB 語言處理信號與數字圖像。科學出版社, 2001。 【27】劉振源,類神經網路模型與語音辨識。全華科技圖書股份有限公司
,1999。 【28】張錚, ”MATLAB 教學程式設計與應用”。知城數位科技股份有限公司,2003。 【29】吳駖, ”MATLAB.6 與基礎 自動控制”。文魁資訊股份有限公司,2003。 【30】羅華強, ”訊號處理 MATLAB 的應用”。全華科技圖書股份有限公司,2005。
【31】A.Paulraj,R.Roy, and T. Kajlath,”Estimation of signal parameters via rotationinvar iance techniques ESPRIT” ,in Proc.19th
Asilomarconf.PacificGrove,CA,Nov.1985. 【32】H.Wang and M.Kaveh,”Coherent signal subspace process for the detection and the estimation of angles of arrival of multiple wide-bandsources”,IEEET rans.Acoust.Speech,Signal Processing,Vol.ASSP-33,pp.823-831,Aug.1985. 【33
】R.O.Schmidt,“Multiple emitter location and signal paramet erestimation”,in proc. RADC Spectrum Estimation Workshop,Rome,NY,1979.
【34】D.H.Johson and D.E.Dugeon,“Array Signa Processing :Concepts and Techniques”,Prentice Hall,New Jersey 1993. 【35
】V.F.Pisarenko,“The Retrieval of Harmonics From a Convariance Function,Geophys”.J.R.Astron.Soc.pp.347-366,1973. 【36
】T.J.Shan,M.Wax,and T.Kailath,”On spatial Smoothing for direction of arrival estimator of coherent signals”,IEEE
Trans.Acoust.Speech,Signal Process,Vol.ASSP-33, pp.806- 811,Aug.1985. 【37】H.Ney ,“ The use of a one stage dynamic programming algorithm for connected word recognition,”IEEE Trans.Acoustic,Speech,Signal Processing,vol.32, no.2,April 1984. 【38】L. R. Rabiner and B.H.Juang,Fundamentals of speech recognition,Prentice Hall,New Jersey,1993. 【39】Mellor B.A.and Varga ,”Noise masking in the MFCC domain for the recognition of speech in background noise ”,in Proc.IOA,A.P.1992.