• 沒有找到結果。

臨界頻帶頻域獨立成份分析法

第三章 方法

3.1 臨界頻帶頻域獨立成份分析法

此篇論文中,我們並沒有選擇時域獨立成份分析法,而使用頻域獨立成份分析法,是因 為聲音在一般的空間中,所接收到的訊號並不是線性混合的方式,與時域獨立成份分析法假 設不同,而實際上我們接受的訊號是會因卷積混合方式(其聲源訊號之延遲、衰減及反射之效 應)所產生,所以時域獨立成份分析法的分離效果有限,對我們使用在提升人工電子耳使用者 的目標,並無顯著差異,所以將訊號轉換成頻域去做訊號處理,成為了我們首要目標。

而在獨立成份分析演算法的部份,我們選用的是 complex-valued FastICA[23-25],其選用 原因是因為轉換頻域後有必須針對複數進行運算且 FastICA 運算較迅速,其分離出的訊號結 果,雖然訊號由演算法收斂計算分離的訊號每次皆不同,但相較於其他演算法,例如:

InfomaxICA,其結果變動較穩定,且計算時間也降低很多。相較於頻域獨立成份分析,時域 獨立成份分析的應用比較多,但是訊號分離的效果卻沒有頻域分析好,如圖 3.1 經分離後兩 個訊號皆比原始訊號差,因為錄製的混合訊號皆有卷積(convolution)的特性,所以提出 FastICA 演算法的作者,將其演算法改成針對複數(complex-valued)的部分處理,也就是頻域獨立成份 分 析 , 由 時 域 訊 號 轉 換 為 頻 域 訊 號 , 訊 號 在 時 域 時 原 本 只 需 執 行 時 域 獨 立 成 份 分 析

15 的頻帶訊息落在 1000-6300Hz,在此頻帶其訊息重要度共佔約 72%[26],由於我們實驗所使 用語料皆是中文語料,所以本研究將著重於較為重要的頻帶訊息進行頻域轉換,減少其他頻

5x 10-3

Single-Sided Amplitude Spectrum of y(t)

Frequency (Hz)

|Y (f )|

16

聲音訊號,我們將訊號轉為頻域後,其頻域分布圖,在 0~5kHz 間其振幅(amplitude)佔的比例 最多,反而到 10kHz 之後振幅顯的並不是那麼的多,其他語句有相同趨勢,而我們也發現人 耳對不同頻率的解析度不同,其耳蝸頻率分布,低頻頻寬部分較為密集,高頻部分頻寬則比 較廣,共可分為 23~26 個臨界頻帶,所以我們假設以臨界頻帶的頻率分布,當作頻域獨立成 份分析的分頻方式(簡稱臨界頻帶頻域獨立成份分析法),但是我們也不能保證經由臨界頻帶 的分頻方式會比傳統的(STDFT)頻域獨立成份分析方式效果好,所以我們進行了兩種分頻方 式進行實驗並且比較其結果。

人耳可以聽到的頻率分布,可由耳蝸頻率分布圖得知,又因人工電子耳的患者,目前所 聽到的聲音訊號其取樣頻率為 17.4kHz,所以我們根據臨界頻帶[27]公式計算出人耳在 17.4kHz 時的頻率分布,如圖 2.2 總共可分為 21 個頻帶,並且將其分頻方式套用在使用 complex-valued FastICA 演算法前,主要更改加入步驟為第 3 步驟,因此大幅縮減了計算量,

其圖 3.3 為流程圖,其步驟為:

1. 將混合時域訊號 X(t)輸入 2. 經過 FFT 轉換成頻域訊號

3. 依 critical-bandwidth 頻率分布將訊號轉換成 21 個頻帶 X(f,t) 4. 將 X(f,t)帶入 complex-valued FastICA 得到解混合矩陣 W(f)

圖 3.3 以人耳分布進行頻域獨立成份分析流程圖

17 (critical bandwidth)分頻方式後的還原訊號圖

0 1 2 3 4 5 6

ISTDFT FDICA 1

Sample

ISTDFT FDICA 2

Sample

CriticalBand FDICA 1

Sample

CriticalBand FDICA 2

Sample

Amplitude

18

相關文件