第五章 實驗結果
5.1 實驗設置
音樂風格的研究,對於音樂風格本身的正確標籤,現有的研究大多採用專 家標籤或是群眾外包(crowd sourcing)的方式取得共識標籤,或採用使用者調 查方法以評估系統。然而本論文牽涉到變奏,變奏的結果亦可採用同樣方式調查 轉換的風格,將轉換後之歌曲給予使用者判斷是否為該類型。但音樂類作品是屬 於一種綜合的表現,無法確認使用者的判別結果是否來自於變奏抑或是它項變奏 無關之元素影響,因此在該類調查下較難驗證出變奏的效果。倘若以轉換前後之 作品比對的形式作為調查,則無法確認使用者是否聽過原曲而依既定印象判斷答 案,因此我們採用現有的音樂風格分類系統來驗證,並藉由分類系統透過統計方 式評估變奏系統的變奏效果。
由於現有的音樂風格分類系統無法完全準確預測一首歌的風格,我們將同 時考量分類系統和變奏系統之分類結果。對於變奏系統的評估,由於是以風格 A 轉換成風格 B,在實驗時,若不好取得相關風格之專家標註資料或是不具有該項 資料,需要額外確認風格 A 或風格 B 之曲目風格,才能確保之間之轉換。因此,
我們採用一個風格分類系統判斷輸入音樂的類別,而將輸入音樂轉換過後,又以 同一個的風格分類系統判斷分類結果,我們的實驗方法設置為圖 5.1。
23
圖5.1 : 實驗方法設置
我們的實驗以古典樂為例,判斷古典樂是否透過變奏系統轉換為流行樂,
並使用了 GenreXpose6系統。該系統為音樂風格分類系統,可以分析流行、古典、
搖滾等 10 類的風格系統。該系統由數個 one against all 的針對單一風格之分類器 組成,而後選擇最大機率的類別作為判斷結果。我們選擇該系統同時作為判斷流 行樂和古典樂之分類器,訓練集來自 GTZAN genre dataset7,計算特徵為梅爾頻 率倒譜(Mel-Frequency Cepstral Coefficient)特徵,並採用邏輯回歸(logistic
regression)的方法分類,我們根據其參數重建其工作,並展示其分類成果之混 淆矩陣和流行樂、古典樂之混淆矩陣(confusion matrix)如圖 5.1、圖 5.2、圖 5.3,
準確率如表(三)。
6 https://github.com/jazdev/genreXpose
7 http://marsyasweb.appspot.com/download/data_sets/
24
圖5.2 : GenreXpose 的混淆矩陣分類結果
圖5.3 : GenreXpose 的流行樂分類結果的 ROC 曲線
25
圖5.4 : GenreXpose 的古典樂分類結果
表格(三) GenreXpose 系統的分類準確率(10 類) GenreXpose 系統評估準確率(GTZAN dataset)
blues classical country disco Hip-hop jazz metal pop reggae rock 0.48 0.75 0.25 0.33 0.83 0.5 1.0 0.72 0.13 0.10
GenreXpose 系統對於古典樂和流行樂有良好的辨識能力,正確率分別為 0.75 以及 0.72。為了探討本論文之變奏系統所產生的變奏結果在樂理上的變化 和評估對於一般非主題樂段作為輸入進行變奏後是否具有流行樂風格,我們準備 了兩項資料集做為測試。第一個資料集為古典音樂主題的資料集8,含有 150 首 古典樂的主題片段,該片段為音樂主題研究教材,均為短句型式。第二個資料集 為從各大 Midi 網站上蒐集免費且帶有曲風標籤的歌曲中9,隨機選出 1000 首古
8 http://composer.themefinder.org/
9 https://github.com/albertmeronyo/MIDI-sources
26
典鋼琴樂並以節拍作為樂句分割集合資料集做為測試資料。
5-2 實驗結果以及討論
我們將變奏結果放置網站10,包含變奏之前與變奏之後的音樂,以及音樂風 格分類系統(GenreXpose)程式。GenreXpose 系統會計算輸入的音樂為 10 種類別 之機率,結果如表(四),我們以 C1、C2 標籤表示古典樂主題資料集(150 個主題 音樂)、以及古典樂樂句(1000 片段音樂樂句)資料集經 GenreXpose 系統判定之分
類結果,並以P1、P2 標籤代表該資料集經轉換過後被 GenreXpose 系統判定之
10 https://drive.google.com/drive/folders/0B1qqlsenojxhWXVJcGRPTFJnVlU?usp=sharing
27
分類結果顯示資料集1(150 首主題音樂)可以判別古典樂有 61.33%被轉成流 行樂(P1),資料集 2(1000 首樂句片段)中有 48.5%被轉成流行樂(P2)。我們為了 確認風格被確實的轉換,因此對資料集2(1000 首樂句片段)進行以下實驗,確認 輸入樂句經GenreXpose 分類為古典樂,該系統在被判定為古典樂的樂曲 730 首 中,有301 首被判定為流行樂,其準確率為 41.23%。雖然 GenreXpose 可能誤判,
資料集2(1000 首樂曲)之樂句音樂風格分類系統判定為古典樂,其實際上是否全 都是可被解釋為古典樂或其常用主題、內容等,仍然需要進一步做分析。例如:
小星星變奏曲,我們的切割片段並非小星星這首歌的任一段落,而是任一部份,
而該部分是否能為重複變化之片段、是否有含有常用的古典樂特徵而足以辨識為 古典樂(因為該樂曲之段落並非專家標籤),仍需拆開坐進一步檢驗或嘗試與找尋 現有古典樂之特徵研究進行關聯式分析。
由於古典樂與流行樂風格相差較遠,且音色、和弦行進會影響流行風格。也 由於風格分類系統考量了音樂的音高、音色、強度、節奏特徵來判定風格結果,
其因使用傳統音樂特徵如MFCC,快速傅立葉轉換、 (Short Time Fourier Transform,
STFT), 小波轉換(Wavelet Transform ,WT),特徵本身會影響到曲風分類結果。我 們使用之MFCC 特徵會反應音樂之動態資訊,倘若單純使用頻譜特徵作為曲風 分類之分類器,對於節奏變奏毫無辨識能力,因為節奏變奏須考量到音樂的動態 特徵。而採用類神經網路作為曲風分類系統,節奏變奏雖某種程度能反應結果,
28
但若要分析如何影響需要進一步的研究。
而在樂理分析上,因資料集僅有主題架構或段落,必須透過主題架構或是段 落的主題並以變化前所使用之變化技巧進行編曲,以了解該變奏之節奏經由重複 後,作為作曲元素,採用同樣方式編曲,才能從樂理上去判斷該變奏造成之樂理 意義,而在實際面上要自動達成此件事情,則需要再考量變奏片段辨識、模型化 相關研究。
29