圖 3.29 北雀聲音段落的第一階梅爾倒頻譜係數的序列
圖 3.30 北雀聲音段落的第一階梅爾倒頻譜係數的序列按本論文的方式做完小波轉換後 的序列
應用於樣本識別、雜訊過濾、分類問題、函數合成及專家系統。
(2) 非監督式學習網路(Unsupervised Learning Network):
這類形的類神經網路的訓練資料僅有輸入值而無預期的輸出值,其學習方式是依照 輸入資料,學習範例間的內部分類原則,使網路可自行分類至一致或接近的輸出向 量。其主要應用於聚類問題、樣本識別及拓蹼映射。
(3) 聯想式學習網路(Associated Learning Network):
聯想式學習是從問題領域中取得訓練範例,並從中學習範例的內在記憶規則,以應 用於新的案例。通常應用於資料擷取與雜訊過濾。
(4) 最佳化應用網路(Optimization Application Network):
最佳化應用是指對一問題決定其設計變數值,使其在滿足設計限制的情形下,使得 設計目標達到最佳化的應用。主要應用於組合最適化問題。
目前類神經網路在使用上的主流是監督式學習(supervised learning)網路,在監督式 學習網路中訓練樣本必須要提供預設的輸出資訊,因此,我們可以把訓練樣本表示成
(
X,T) (
={
x1,t1) (
, x2,t2) (
,...xM,tM) }
其中 M 為訓練樣本的總數,x 為輸入i t 為對應的目標i 輸出,系統會按照真實輸出與目標輸出的差異來做修正,以達到更好的效果。依照訓練 樣 本 所 提 供 的 資 訊 , 監 督 式 學 習 網 路 可 分 為 兩 個 種 類 , 逼 近 式 的 方 法 (Approximation-Based Formulation)及決策式的方法(Decision-Based Formulation)[31],其 說明如下:(1) 逼近式的方法:
此種方法使用的時機是在訓練樣本能同時提供系統分類正確與否的資訊以及系統 的輸出與目標輸出之差異值。此方法的目的在找出能讓系統輸出與目標輸出的差異 最小的權重值,而差異量通常以均方差(Mean Square Error)來做評估。
(2) 決策式的方法:
這類型的方法針對訓練樣本只提供分類正確與否的資訊。其目的是找出一組權重 值,使得每個訓練樣本都被正確的分類到正確的類別裡。在分類的應用上,使用決 策式的方法會有比較好的效果[32]。
決策類神經網路(decision based neural network)是應用決策式的方法的類神經網路,此種 類神經網路使用一組輸入值分別通過各個類別的類神經網路,並且得到各自的輸出,最 後再由各類中找出最近似的,做為真正的輸出,決策類神經網路的基本架構如圖 3.27。
而類神經網路有一個非常重要的部份,即是學習,而決策類神經網路的學習與一般的類 神經網路略有不同。當一個辨識錯誤發生的時後,決策類神經網路會分成兩個部份來學 習,增強(reinforce)及反增強(antireinforce),增強的部份是針對預設輸出類別的類神經網 路中的權重值做修正,而反增強的部份則是針對實際輸出類別的類神經網路中的權重值 做修正。決策類神經網路修正的值可以寫成(3-14)式
( )
x ww=±η∇φ ,
∆ (3-14)
其中η 為學習速率,x 為輸入值,w 則為欲修正之權重,而區別函數(discriminant function) 的傾斜(gradient)∇φ
( )
x,w 則可以寫成( ) ( )
TwN
w w w
w w x
x
∂
∂
∂
∂
∂
= ∂
∂
= ∂
∇φ φ , φ , φ •••, φ
,
2 1
(3-15)
而依照其為增強學習或反增強學習可以將決策類神經網路的修正寫成
( )
( )
( )
(
,)
,
, ,
1 1
j m
j m
j
i m
i m
i
w x w
w
w η x
w w
φ η
φ
∇
−
=
∇ +
=
+ +
: 反增強學習
:
增強學習 (3-16)
其中 m 為訓練的次數。
由(3-14)式可以看出決策類神經網路的修正量,主要是依據其區別函數(discriminant function) φ
( )
x,w 的傾斜做修正,而此區別函數依照其類神經網路的類別有許多的計算方 式,在本實驗中我們採用了 Kohonen 的架構,而其區別函數則使用了( )
, 2
2 l l
w w x
x −
−
=
φ (3-17)
其中 l 為類別而w 為 l 類權重的質心,x 為輸入值的質心。也就是去計算輸入值的質心與l 各類別權重值的質心距離作為該類別之類神經網路的輸出,而距離最接近的,就成為整 個系統的輸出。而把(3-17)式導入(3-15)式後,(3-16)式就可以改寫成(3-18)式。
( )
(
( ))
( )
(
( )jm)
m j m
j
m i m
i m
i
w x w
w
w η x w w
−
−
=
− +
=
+ +
η
1 1
反增強學習:
:
增強學習 (3-18)
如此反覆修正直至所有的訓練樣本都正確的分類,或者是次數達到設定的次數。
圖 3.27 簡單的決策類神經網路架構
預 設 輸 出 類 別
分 類 A 的 類 神 經 網 路 分 類 B 的
類 神 經 網 路
Inpu t node 判 斷 是 否 需 要 修 正 , 及 需 修
正 的 類 別
將 所 有 類 別 中 差 異 量 最 小 的 當 做 輸 出 的 類 別
. . . . .
預 設 輸 出 -實 際 輸 出 預 設 輸 出 -實 際 輸 出
第肆章 實驗結果
本章將介紹我們的實驗結果,在實驗中使用 420 種鳥類的叫聲,但由於有 141 種鳥 種的叫聲含有警戒音,與平時的叫聲並不相同,因此,有警戒音的部份,被區分出來,
視為獨立的一種鳥叫聲,因此,本實驗所使用的資料庫,就擁有了 561 類鳥叫聲的模型。
鳥聲的取樣頻率為 44100Hz,每一個取樣用 16bits 的值做記錄,而每一個音框大小為 512 個 samples,每一個聲音檔案按照音節做切割,而切割出的音節一半做為系統的訓練樣 本,另一半則是做為系統辨識使用。
實驗分別使用 LPCC、MFCC 以及改進後的 MFCC 為特徵,各自搭配 BP 類神經網 路分類器以及 DBNN 分類器,DBNN 分類器中的子類神經網路採用 Kohonen,另外,
各個特徵分別搭配了本論文所提出的端點偵測法做進一步的改進。