• 沒有找到結果。

第二章 獨立成分分析法(Independent Component Analysis ,ICA)之原理

2.2 ICA 之限制

由於 ICA 的演算法就是用聲源彼此獨立的特性來發展出來的,因此所有的聲源 必須滿足彼此獨立的特性,而在大部分訊號分離的問題中,聲源也的確是彼此獨 立的。

在統計上,若是隨機變數(random variables)s1,s2,....,sn是彼此獨立的,則其 joint probability density function 可以拆為 marginal probability density function 的乘積。

) ( )...

( ) ( ) ,..., ,

(s1 s2 sn p1 s1 p2 s2 pn sn

p =

) ( i

i s

ps 之i marginal probability density function

2.獨立元素必須為 Nongaussian distributions

由於 ICA 尋找獨立元素的方法來自中央極限定理(central limit theorem),這個定 理告訴我們:Nongaussian 分佈且互相獨立的隨機變數之和的分佈會比其中任意 隨機變數的分佈更加接近 gaussian。因此,在尋找獨立元素時,可利用此一特性,

讓找出來的隨機變數的分佈盡可能的不是 gaussian 分佈,當我們找到一組 W 可 以使得計算出來的結果最不接近 gaussian 分佈時,也就找出原來的獨立聲源了。

如 2.4 式,希望算出之y 盡可能不是i gaussian 分佈。

=

= n

j j ij

i w x

y

1

基於這個觀念,若是原來的聲源就是 gaussian 分佈,則不管 W 如何尋找,所計 算出來的結果的分佈皆還是 gaussian 分佈,因此就無法找到讓結果最 nongaussian 的 W,也就無法找出原來的獨立聲源了。

(2.3)

(2.4)

雖然對於聲源有如此之限制,但由於語音本身並非 gaussian,因此 ICA 在實 用上並不會因此受到侷限。語音訊號在統計上是 super-Gaussian 如圖所示(圖中灰 線是 gaussian 分佈以做比較),其分佈比 gaussian 較狹窄一些。

圖 2- 2 super-Gaussian 之統計分佈圖

2.2.2 對感測器的限制

考慮收到 m 個麥克風訊號X = AS,其中 A 是 mixing matrix;S 是聲源訊號,有 n 個。以線性方程式的角度來看:若 m=n, 則S = A1X ,有解;若 m>n,則此 方程式為 over-determined linear equations,也就是方程式比未知數多,在這種情 形之下,可先將維度(dimension)降回 n,再執行 ICA;若是 m<n,方程式比未知 數少,則缺乏足夠的資訊找到原來的獨立元素。

2.2.3 不確定性

在 ICA 的模型中 (2.1) 我們可以看出有以下兩點不確定性 a) 無法確定獨立元素的 variance:

第j個麥克風所接收到的訊號可以表示成

=

i i ji

j a s

x

其中由於 a 與 s 皆未知,若是s 被放大α 倍,則a 只要除以α 就可以互相抵銷 (2.5)

=

i

i i i ji

j a s

x ( α )( α )

因此假設聲源的 variance 假設為一。

1 } {si2 = E

b)無法決定獨立變數的順序:

這點不確定性也跟未知的 A 與 S 有關,由於未知的 A 與 S,我們無法定義哪一 個訊號源是”第幾個”。因此,當我們找到 demixing matrix W 時,希望經過 W 轉 換的結果完全等於原來的訊號是不可能的

S WAS

Y = = ( impossible)

由於不知聲源有哪些,更不可能將解出的訊號與原來的聲源做對應而使得 Y=S (Y =

[

y1y2....yn

]

T,S =

[

s1s2....sn

]

T)。

綜合以上兩點不確定性,對於 Y 與 S,我們可以整理出一個比較合理的關係

PDS WAS

Y = =

其中 P 是交換矩陣(permutation matrix),在此交換矩陣裡的每一行(column)與每一 列(row)只有一個 element 是 1,其餘皆為 0。D 是一個 diagonal matrix,其中只有 對角線上有值,其餘皆為 0,而對角線上的值相當於分出來的結果與原來訊號之 倍數。因此,分出來的 Y 應該是原來的 S 重新排過,且大小也改變了。

(2.6)

(2.8)

(2.9) (2.7)

相關文件