條件結合加入 Feed Back 機制效能比較

第三章電腦模擬

3.6.2 條件結合加入 Feed Back 機制效能比較

這節中我們模擬回授機制加入我們的演算法獨立結合(預分群)的改善，看到成果

圖.70 及圖.71，可以看到回授機制在左聲道(干擾較小聲道)較有改善；在平均上加入 FB 機制後再左聲道比原本好了 0.8dB；右聲道則是差了 1dB 左右(干擾較大聲道)。

圖. 70 雙聲源獨立結合(預分群)回授演算法成效(左聲道)

圖. 71 雙聲源獨立結合(預分群)回授演算法成效(右聲道)

我們仿造 3.6.1 節設立檢測標準，如下

μ_, ：估計 μ 與真實 μ 的差距，也就是 μ 的估計誤差，

估計誤差越小代表估計越準確，可以用以評斷估計的效能。

μ_, = μ_, − μ_,

∆μ ：μ_α, 與 μ_α, 的差距，用以評估分離的難易。(距離越大越容易分離，且整體效能越好，在下面會證實 )。

∆μ = μ _, − μ _,

從圖.72 中，可以看到加了回授後 μ _, 比原本來的平均小 0.8；圖.73 中，可以看到加了回授後 μ _, 比原本來的平均小 0.6dB。

圖. 72 μ_, 曲線圖，獨立結合(黑)、獨立結合+回授(紅) [註]橫軸每點約等於 32Hz

圖. 73 μ , 曲線圖，獨立結合(黑)、獨立結合+回授(紅) [註]橫軸每點約等於 32Hz

在 ∆μ ( 圖.74 )方面，有好有壞，難以分別好壞。

圖. 74 ∆μ 曲線圖，獨立結合(黑)、獨立結合+回授(紅) [註]橫軸每點約等於 32Hz

總而言之，由於對參數估計的準確度上升，對整體效能也會有上升。

1.17 3.7 三聲源分離情況下討論

此段落中，我們討論 MESSL-SP、聲道差非獨立(MESSL 修正型)與獨立結合(預分群)

三種方法在三聲源分離的表現。我們會再 3.6.1 節中先測試這三種方法的 SDR 對角度測試，而我們發現我們改善的兩種方法，在三聲源的情況下並沒有大幅的改善 SDR，

只有約 0~0.5dB 不等的改善；接著在 3.6.2 節中我們切入各方法在機率模型上的表現，

可以看出我們提出的兩種方不管在聲道差平面或是左右聲道強度平面上表現都比原 MESSL-SP 來的好。

1.17.1 3.7.1 三聲源下演算法成效比較

從圖.75 及圖.76 中我們看到 MESSL 修正型與獨立結合(預分群)的 case 分別與

MESSL-SP 相比，若從平均成效上看的話，MESSL 修正型與 MESSL-SP 相比：左聲道平均 SDR 上升 0.4 dB；右聲道上升 0.6，而 MESSL 修正型在低角度有分離錯誤的發生(未分離前 SDR 基準線為 3~5dB 不等)；獨立結合(預分群)與 MESSL-SP 相比：左聲道平均 SDR 上升 4.2 dB；右聲道上升 3.1dB。

圖. 75 三聲源演算法成效圖(左聲道)

圖. 76 三聲源演算法成效圖(右聲道)

1.17.2 3.7.2 機率模型比較

1. 30 度樣本下，比較聲道差機率估計

(1) 聲道差邊際機率估計部分

首先，先看到圖.77 及圖.78，可以看到在修正獨立性後，不管再 Mean 的方面還是 Variance 的方面都比原本好上許多。

圖. 77 三聲源 MESSL-SP 聲道差平面機率等高線圖(1500Hz)，綠點為 Data

圖. 78 三聲源 MESSL 修正型聲道差平面機率等高線圖(1500Hz)，綠點為 Data

而 MESSL 修正型和獨立結合(預分群)比起來(圖.78 與圖.79)，基本上是相同的。

圖. 79 三聲源獨立結合(預分離)聲道差平面機率等高線圖(1500Hz)

(2) 左右聲道邊際機率估計部分

比較圖.80 和圖.81 後，可以很明顯的發現我們提出的方法在(L, R) 資料

的估計上確實有比源 MESSL-SP 來的好，但式依然有缺陷，例如可以看到在圖.81 中，中間(黑 x)的高斯分布太過細長，這是由於在 3.1 章節中提到的 (L, R) 資料分群機制採用硬式二分法，二分法會使得夾在中間的資料群被兩旁壓縮，若兩旁的數目過多會導致中間的群組完全被壓榨，可能會造成分離錯誤發生。

圖. 80 MESSL-SP 左右聲道平面機率等高線圖(1500Hz)

圖. 81 獨立結合(預分群)左右聲道平面機率等高線圖(1500Hz)

1.17.3 3.7.3 三聲源下加入回授機制

我們測試在獨立結合(預分群)演算法下加入回授機制會如何，成果如下圖.82 及

圖.83，可以看到平均上加了 FB 的結果都比沒加前來的差。

圖. 82 三聲源獨立結合(預分群)回授成效(左聲道)

圖. 83 三聲源獨立結合(預分群)回授成效(右聲道)

接著我們採用 3.6.1 節中的檢視方法：

在μ 方面，從徒.84 我們發現在主要目標參數 μ 的估計上準確性變差(平均下降 1.2)；圖.85 及圖.86 部分，其餘目標 μ 、μ 的估計都有變準確，可以推論回授的機制再干擾較大的聲源估計上部會得以改善。(可以與圖.70 呼應)

圖. 84 μ , 曲線圖，獨立結合(黑)、獨立結合+回授(紅)

圖. 85 μ , 曲線圖，獨立結合(黑)、獨立結合+回授(紅)

圖. 86 μ , 曲線圖，獨立結合(黑)、獨立結合+回授(紅)

1.18 3.8 實測效能

本段落我們用下圖.87 中的 Sony 的 ICD-UX543F 錄音筆和 ECM-DS70P 外接立體聲麥克風(兩麥克風間距 3cm)於大小為 10(m)X7.6(m)的房間中間對雙聲源分離測試兩種設置：如圖.88 大角度(兩聲源分別放置在距麥克風 1 公尺±35度角)、小角度(兩聲源分別放置在距麥克風 1 公尺±15度角)。並由大小為 100 的 TIMIT 語音庫中任選兩聲源為一組，每種設置各測試 10 組平均之結果。

圖. 87 綠音設備：(1)麥克風 (2)綠音筆 (3)組合

在文檔中以聲道差與回授作語音分離之研究 (頁 53-62)

第三章 電腦模擬