第一章 緒論
第一節 研究背景
二十一世紀是數位科技蓬勃發展的時代,由軟、硬體界中執牛耳 的微軟(Microsoft)與英特爾(Intel)所推廣的生活數位化、行動 化中可得到最佳的佐證。在未來,不論是個人娛樂與商務資訊都將與 數位科技更緊密的結合。例如現今的行動終端設備,已經逐步由單純 的通訊工具,演變成為一台可攜式的個人多媒體設備。這正顯示出行 動終端朝向多媒體(multimedia)應用發展的趨勢。近年來,電子消 費產品的市場以驚人的速度成長,其中數位多媒體系列的產品更是推 陳出新,而我們的生活也與其緊密的結合在一起。從人手一支的 MP3 隨身聽、數位相機;影音功能兼具的高科技手機以及蘋果電腦生產造 成搶購熱潮的數位影音設備 iPod shuffle。以目前最先進的手機來 說,照相功能的解析度不但上看 300 萬畫素,同時具備數位/光學變 焦以及景物、肖像、夜間、運動等多重設定模式與白平衡、防手振、
人臉偵測等附加功能;在手機音訊方面,除了對 MP3、AAC 等規格的 支援外亦可收聽 FM 廣播節目。更甚者則可支援 DVB-H 規格,讓手機 搖身一變成為手持式電視機。由此可見數位影音訊號的處理在未來必 定扮演著非常重要的角色。尤其是結合了網路和數位電子語音技術的 網際網路電話。例如時下當紅的 Skype、 MSN、Yahoo messager、ICQ 等即時通訊(instant messaging,IM)軟體。也因此數位訊號處理 將掀起未來通訊方面的革命。加上『後 PC 時代』的來臨,人類生活
將從普及運算(pervasive computing)進入到游牧運算(nomadic computing,又稱為無所不在的運算)。游牧運算讓周遭環境具有自動 偵測人的移動並掌握相關的資訊的能力,在不同的環境下,提供不同 的資訊與服務,並可以將個人的喜好資訊放入,提供更貼心的智慧型 服務。而提及游牧運算就會令我們聯想到嵌入式系統,因為游牧運算 當中的運算核心絕大多數採用的即是嵌入式系統的架構。在我們生活 當中嵌入式系統扮演著日益重要的角色。如同影音產品逐步走向輕便 化且同時具有低耗電、高運算效率特性的趨勢。上述的特徵正是嵌入 式系統的特點。好比資訊家電(information appliances,IA)、通 訊產品、個人數位助理(personal digital assistant,PDA)以及 其他各類工業電子產品皆可看見嵌入式產品的影子。而我們所強調的 有限硬體環境諸如各種系統開發平台(system on board,SoB)就是 將整個包含了 CPU、Memory、周邊、通訊、中斷控制等結構完整發展 於一個硬體平台上面,並且透過一個穩定的作業系統(operation system,OS)來運行。而隨著半導體(semiconductor)製程技術的快 速進步,使得一個單晶片可包含超過數千萬個電晶體元件,而讓超大 型積體電路(VLSI)邁入系統化晶片的時代(system on chip,SoC)。 SoC 使得原本於前段所發展的 SoB 能夠更加的輕薄短小並且更加省 電。一個多媒體的 SoC 系統有著按鍵、LCD、聲音、影像、儲存媒介、
無線通訊、Ethernet 或 USB 等溝通介面。而其效能必須足夠處理通 訊、影像、和聲音的即時呈現。因此要比 SoB 系統考慮到更加多的細 節,諸如記憶體的管理以及各種軟硬體介面的溝通和穩定性。
第二節 研究動機
所有與語音相關的研究重點如語音辨識(speech recognition)、
語音合成(speech synthesis)皆必須考慮到噪音干擾的問題。亦即 都需要對原始的語音訊號先進行降噪(noise reduction)以及語音 增強(speech enhancement)的預處理。除外,噪音消除的運用層面也 是非常的廣泛的,除了上述數位語音領域的應用外,對於工業噪音消 除以及心理聲學上控制環境噪音的危害等等,都有其研究的價值。舉 例來說,以人工電子耳(助聽器)而言,如何避免回聲干擾使得聽障 者可以接收到更清晰的聲音,或是用於新生嬰兒保溫箱中抑制噪音,
使新生兒入睡得更安穩。甚至於是一般家庭中常見的抽油煙機、冷 氣、電冰箱、除濕機等機器運轉音量過大的家用電器皆可對其進行噪 音控制的處理,使我們擁有一個更為安靜舒適的生活環境。
要進行上述家電噪音控制的研究,則必須考慮其處理器都屬於嵌 入式系統。嵌入式系統最講究的是『即時』(real time)的觀念,即 時性是指某項特定的操作能夠在限定的時間內完成並且做出正確的 回應。以相機的防手振為例,其必須在每個畫面(frame)儲存之時算 出移動向量的偏移植並且作補償,使得真正被錄進去記憶卡的修正畫 面沒有抖動的現象。是故我們希望發展出必須在有限硬體環境下也能 夠做到符合嵌入式系統需求之即時且穩定運算的演算法。因此演算法 不但必須考慮到演算法邏輯設計與結果的正確性,也必須考慮到執行 該演算法的時間相關性是否合乎『即時』的要求。故我們在 PC 模擬 後也將程式移植至嵌入式平台上,測試本演算法程式於嵌入式平台下 的穩定性。
第三節 研究目的
一般在實現傳統主動式噪音控制演算法時,我們將感測器放置於 雜訊源,回饋雜訊源訊號給予一個適性濾波器[1],而於輸出端的揚 聲器輸出後,此一感測器會再回饋一個訊號給適性濾波器而適性濾波 器再予以調整 FIR 系統的權重集合(weight set),進而消除輸入訊號 中的週期雜訊[2][3],當中著名的演算法有 LMS[13][14]及 XLMS[19]
和 FX-LMS 等。而主動式噪音控制技術中的適性等化器(adaptive equalizer),可對一輸入訊號中的某特定頻率給予不同的權重,藉由 適當的放置一感測器。而予以增大或縮小且不影響原來重要的訊號 [4][5]。但此處我們主要欲消除的是輸入訊號中的非週期性且非穩定 的同頻域雜訊。(例如在一般數位相機上的快門噪音或是鏡頭伸縮的 聲音此頻域分佈與人聲的頻率範圍是相同的),且不能藉由如上所述 的誤差偵測器(error sensor)的幫助,加上在有限硬體元件(嵌入式 系統平台)的限制下,如何利用一個有效且快速的演算法,將其從輸 入聲音訊號中消去,便是此篇論文所要探討的問題。
第四節 研究方法與步驟
根據前一小節所述,我們可以知道若是在噪音與原始訊號的頻率 重疊的情況之下,則以往我們常見的噪音消除的方法並無法針對這類 型的噪音進行消除或衰減。以頻譜偵測法來說,其通常會假設語音訊 號經過漢明窗後的前 n 個音框(例如取前十個)的平均功率頻譜來當
作噪音功率頻譜(noise power spectrum),可是事實上噪音訊號通 常不具有穩定的頻譜。也就是說隨著時間的不同對於原始訊號的干擾 也有所不同。當然,也有其他的噪音偵測技術對於這種情況有比較改 善的作法,但這並非本論文要探討的重點。但是透過主動式噪音控制 的觀念,只要我們能夠先行擷取出與欲消除的噪音非常相似的樣本
(sample),並且透過統計的方式去建構出一個非常穩定的噪音樣版
(noise template),然後將這個樣版和混合了噪音的聲音訊號透過 我們所提出的動態搜尋演算法找出正確的插入點,並且透過離散餘弦 轉換於頻域上作消除的動作,最後將處理過的結果作反離散餘弦轉換 轉回時域當中。在 PC 模擬之後則於新華電腦的 PreSOCes 嵌入式系統 平台實現演算法的架構,並對效能作進一步的改良,以求達到即時的 成果。於此同時也達到熟悉嵌入式系統開發環境的目的和瞭解其與一 般 PC 端程式開發的差異處。而經由本論文所提出之動態搜尋演算法 可 以 百 分 之 百 正 確 的 找 到 插 入 點 的 位 置 , 在 不 加 上 平 滑 濾 波 器
(smooth filter)的情況下消除 85%以上的噪音能量。而且不破壞 原本音訊重要特徵。若於加上平滑濾波器進行後處理則可達到九成以 上的消除率。並且使得主觀音質評量分數達到 4.5 級分的優良品質。
第五節 論文組織與大綱
本論文共分六章,各章概要說明如下:
第一章 緒論:介紹語音訊號處理中噪音消除的相關研究,以及 論文主題的研究背景與動機,並且闡述其結合了嵌入式系統與 SoC 平 台之於我們現今科技生活的重要性與前瞻性。以及簡短的說明論文的 研究方向與研究成果。以及本論文後續章節的配置與綱要。
第二章 文獻探討:針對本論文研究之主要兩大領域,濾波器和 主動式噪音控制進行前人研究文獻之收集與分析,並從中獲取寶貴的 經驗和靈感以利於研究之進行。
第三章 語音訊號之前處理:主要介紹我們在本論文當中所使用 的語音訊號相關知識與技術。諸如聲學的基本觀念,越零率與音高(頻 率)的偵測和音訊編碼。以及演算法所會使用到的音訊處理相關知 識,例如離散餘弦轉換(discrete cosine transform ,DCT)。與音 質的主客觀評量,並且說明我們對此作了哪些改良。
第四章 系統架構:於本章對於演算法發展當中所採用之軟硬體 平台之系統架構作一簡單之介紹。並呈現本論文所提出演算法之系統 架構流程圖與每個流程之說明。
第五章 語音消噪演算法與實驗結果:對於本論文所提出之演算 法之消噪結果、效能以及如何改進作完整的陳述與比較。並且說明如 何於目標發展平台上實現噪音消除演算法。
第六章 結論與未來展望:關於本論文的研究結論,以及未來研 究方向,並且提出未來可行之展望。
文末將本論文中所參考之中、英文文獻書目以及期刊論文一一盧 列。