• 沒有找到結果。

利用波束形成器之多聲源切 音與分離

第三章 系統架構與實作

3.5 利用波束形成器之多聲源切 音與分離

經過前面的運算,我們將可以得 到如圖 3.5 中的角度追 蹤資訊。圖中的原 始訊號為環狀陣列同時接收四個方向此起彼落的人聲,經過運算所得到的結 果。

圖 3.5 四聲源角度追蹤資訊

此運算結果為每一個 Data block 增加一筆資訊。如前所述,本論文使用兩種波 束形成器來進行聲源分離,接著就這兩種實作上的方法進行探討。

30

3.5.1 Least Square Solution

圖 3.6 LS 多聲源切音與分離架構

圖 3.6 為利用 LS 解來進行多聲源切音與分離的系統架構。首先對於當下 Data Block 的追蹤資訊會先觀察是否有新的追蹤組,有的話將會增加一筆輸 出的音軌數。對於每一筆輸出的音軌,從追蹤組一出現聲源存在時就會開始 每個 Block 都輸出一波束形成的結果。

為了能對變動的聲源做出最好的聲源分離效果,波束形成器的各項參數 (角度、限制)會基於對角度追蹤資訊的觀察而做出相對應的調整而更新。

在 2.4 章裡可以知道,LS 解最後可 以得出一最佳解 ˆw來當作波束形成 器:

ˆ (A A) A gH 1 H

w (3.6.1) 其中,A a( )1 H a( )2 H a(C)HT為針對 C 個目標方向相對應的陣列拓樸向 量矩陣,這些方向都是希望能施加限制(Constraint)的角度,而g

g1 g2 gC

T

則代表了對此 C 個目標方向,希望施加的限制條件。

31

為了得到多聲源切音與分離的效果,最直覺的做法就是對於想要獲得的聲源角 度,施加限制為 1,而此刻同時存在的其他聲源角度施加限制為 0。這麼一來所算出 來的波束形成器將擁有去除其他聲源,並保留目標聲源語音的效用 。

在實際運算(3.6.1)中的反矩陣時,會碰到因為A AH 為奇異矩陣而造成無法計 算的情況。此時需要為此矩陣添加一 Diagonal Loading:

ˆ (A A+ I) A g

H 1 H

w  

(3.6.2) 其中為此 Loading 的大小。

圖 3.7 LS 解得出的波束形成器,=0.1

(聲源於 0 度,干擾於 90 度及 180 度,右圖為 1000Hz 的情況)

圖 3.8 LS 解得出的波束形成器,=10

(聲源於 0 度,干擾於 90 度及 180 度,右圖為 1000Hz 的情況)

32

圖 3.9 LS 解得出的波束形成器,=0

(聲源於 0 度,干擾於 90 度及 180 度,右圖為 1000Hz 的情況)

如圖 3.7,3.8,3.9, Loading 的大小會對波束形成器的形狀產生影響:理 論上越小會使得波束形成器越接近限制好的條件,當太大時,如圖 3.8,會使得 限制條件對波束形成器結果的約束力下降,造成限制不明顯的現象。而當太小或 是不使用 Diagonal Loading 時,雖然解出來的波束形成器完美合乎限制條件,卻因 為自由度不夠反而放大了非限制條件下方向的權重。經過實驗結果,當介於 0.01 到 0.1 之間時能擁有最佳的效果。

除了 Loading 的大小之外,由角度以及限制條件個數來決定的陣列拓樸向量 矩陣A,對於算出來的波束形成器效果也有很大影響。角度的資訊會因為聲源方位 變動而跟著改變,每一個 Block 變動的角度都會藉由一個設定好的Forgetting Factor 來更新陣列拓樸向量矩陣中對應聲源做限制的角度,進而對波束形成器產生改變。

至於限制條件的個數,基本上就是當下的目標聲源以及干擾聲源的個數。而每 個干擾聲源的存在與否是藉由觀察過去多個 block 的角度追蹤資訊 來取得。在處 理每一個 block 時,會記 錄每一個建立的 聲源在過去 observe_blocks 個 blocks 裡出現的次數(count),而在為目標聲源 計算波束形成器 時,會藉由判斷 count 是否有達到預先給定之數值,以此來衡量聲源數目。圖 3.10 為聲源存在性觀 察演算法,圖 3.11 則為其效果。

33

圖 3.10 聲源存在性觀察演算法

圖 3.11 聲源存在性觀察演算法效果

(藍色部分為分離的訊 號,紫 色此訊號的存在 count,紅 色虛線為判斷存 在結果)

這樣的做法是因為,是因 為雖然每個 block 都會將波束形成器更新,不過為 了確保音軌中的聲源語音連續性,在此聲源存在時(角度追蹤有值),不會變 動使用中的波束形成器;而 當此聲源不存在 時,才會以預設的 Forgetting Factor 來漸進式更新波束形成器。因為聲源存在時不能變動波束形成器,所以必須 要使用上述類似 hangover 的作法來謹 慎處理空間中可 能還存在,卻在 變更波 束形成器的當下不存在的一些聲源,藉此提升分離的效果。

LS 解為一資料 獨立解型的波束形 成器,雖然不依賴輸入訊號的狀 況就能計 算出最佳解,此解對於排除它向的干擾與降噪卻有其極限。

34

3.5.2 Linearly Constrained Minimum-Variance Beamformer

在 2.4 章裡可以知道, LCMV 解 最後可以得出最 佳解 ˆw當作波束形成器 :

source1 (source1 not present )

1

35

相關文件