• 沒有找到結果。

第五章 模擬結果

5.1 實驗設置

5.2.1 模擬一

圖 5-3(a)為一男一女的音源聲譜圖,圖 5-3(b)為(45,-20)混和情況下的混和訊號,圖 5-3(c)為(30,70) 混和情況下的混和訊號;表 5-1 為兩種不同角度的混和情況下,混和訊 號的 SIR。以下為三種方法之結果。

圖 5-2 訊號來源方向示意圖

法一:ISBS 影像分離演算法

(45,-20) (30,70) mixture x1 x2 x1 x2

SIR -5.4592 -2.9114 -1.6474 3.3033 圖 5-3 音源與混和訊號之聲譜圖

(a) (b) (c)

表 5-1 混和訊號的 SIR

圖 5-4 ISBS 分離聲譜圖

(a) (45,-20)分離出的聲譜圖 (b) (30,70)分離出的聲譜圖

圖 5-4 為 ISBS 影像分離演算法對於兩種不同混和情況所分離出的聲譜圖,表 5-2 為其 SAR、SDR、SIR 值。可以看出當音源分為位於不同邊時可以有不錯的分離效果,

但位於同邊時,分離效果不佳。

在(30,70)的混和情況下,兩個音源位在頭的同一邊,表示右耳所收到的混和訊號中 兩個音源都比較大聲,左耳所收到的混和訊號中兩個音源都比較小聲,所以兩個混和訊 號其實是很像的,我們以兩個很稀疏的語音混和後的情況為例,圖 5-5(a)為(45,-20)混和 下 X1與 X2的邊緣圖(E1, E2)的散佈圖,圖 5-5(b)為(30,70)混和下 E1與 E2的散佈圖,可 以看出在(45,-20)的情況下會有兩個不同的方向,但在(30,70)的情況下,兩個混和訊號的 值趨於一致。在這種情況下,ISBS 的分離結果就沒有那麼好。

(45,-20) (30,70) separated

signal y1 y2 y1 y2

SAR 10.1254 5.1701 -12.3089 13.8885 SDR 9.626 5.0818 -15.8396 1.725

SIR 19.6693 23.20041 -0.7369 2.1711 表 5-2 ISBS 分離結果

圖 5-5 混和訊號聲譜圖邊緣之散佈圖

(a) (45,-20)之邊緣散佈圖 (b) (30,70)之邊緣散佈圖

法二:Nonlinear Projection

圖 5-6 為加入非線性投影後的影像分離演算法,在兩種不同混和情況下所分離出的 聲譜圖,表 5-3 為其 SAR、SDR、SIR 值。可以看出此方法與只做影像分離的結果相差 不大,都是在音源位於不同邊的情況下可分離,音源位於同邊時效果不佳。且雖然在 (45,-20)狀況下的 SIR 值頗高,但因為訊號經過非線性處理,會使聲音變得比較不自然,

因此 SAR 與 SDR 比原本的 ISBS 方法還要低。

(45,-20) (30,70) separated

signal y1 y2 y1 y2 SAR -15.1541 -8.5498 -13.0611 13.9385 SDR -15.4488 -8.5601 -16.3242 1.7358

SIR 11.6672 26.8111 -0.2822 2.1775 圖 5-6 NP 分離聲譜圖

(a) (45,-20)分離出的聲譜圖 (b) (30,70)分離出的聲譜圖

表 5-3 NP 分離結果

圖 5-7(a)為混和訊號聲譜圖的邊緣,E1與 E2的散佈圖,用 NPCM 找出兩個主要方 向,圖 5-7(b)為使用非線性投影將所有訊號點投影到該方向上,圖 5-7(c)為圖 5-7(b)做白 化處理後的結果,可以看出因為音源 1 和音源 2 位於頭的兩側,左右耳所收到的聲音有 大小聲之分,所以方向會很明確,投影到兩個方向上的訊號點數量也很平均,因此在做 白化處理後可以達到 de-correlation 的效果。

音源位於同邊的分離結果與 ISBS 類似,因為左右耳所收到的混和訊號很像,所以 找出的兩個方向角度也很接近(圖 5-8(a)),做了非線性投影後,方向也很不明確(圖 5-8(b)),所以經過白化處理後,也很難達到 de-correlation 的效果(圖 5-8(c))。

圖 5-7 音源位於不同邊之非線性投影效果

圖 5-8 音源位於同邊之非線性投影效果

(a) (b) (c)

(a) (b) (c)

法三:Nonlinear Masking

由圖 5-9 及表 5-4 的結果中可看出,此方法對於音源位於同邊的混和訊號也可以有 很好的分離效果,在音源位於不同邊的混和情況,SIR 值也比前兩種方法要高。且此方 法並沒有非線性的轉換,只是將混和訊號中來自音源的 T-F unit 抽取出來,因此對聲音 的失真情形並不嚴重,SAR 和 SDR 皆為正值且每個分離出的訊號的情況皆一致。

(45,-20) (30,70) separated

signal y1 y2 y1 y2 SAR 6.8963 6.6124 6.2153 9.0356 SDR 6.8886 6.6009 5.6118 8.815

SIR 35.2297 33.2403 15.4121 22.3759 圖 5-9 NM 分離聲譜圖

(a) (45,-20)分離出的聲譜圖 (b) (30,70)分離出的聲譜圖

表 5-4 NM 分離結果

-20

相關文件