第五章 建模分析
5.4 過濾歌詞中的重複詞問題
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
5.4 過濾歌詞中的重複詞問題
在流行歌曲中,作詞人為了讓歌曲的傳唱度增加,並且讓歌曲更有記憶點,歌 詞中常常會不斷的重複少數的特定詞彙,但這些重複的詞彙,並不能保證真的 與該歌曲中的情緒有關,因此我們提出方法三,構想在歌詞特徵擷取方法二 中,每首歌的歌詞斷完詞後,將重複的詞彙只計算一次,避免高估一首歌當中 反覆出現的詞彙在各個情緒標籤的分數。
按照前面的實驗流程,一樣預測目標分成歌詞標籤與旋律標籤,並且以悲傷 與快樂,兩類別的分類做探討,結果如表 11.A 與 表 11.B。
圖 4 以歌詞情緒標籤為預測目標,支持向量機放入歌詞與旋律特徵在三分類結果 的混淆矩陣
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
表格11.A預測歌詞情緒標籤(二分類),方法二與方法三的準確率比較
支持向量機 隨機森林 最近鄰居法
單用歌詞特徵 方法二 0.771 0.760 0.765
方法三 0.817 0.796 0.813
歌詞特徵與旋律特徵 方法二 0.855 0.797 0.778
方法三 0.864 0.798 0.817
表格11.B預測旋律情緒標籤(二分類),方法二與方法三的準確率比較
從 KKBOX-Song-Mood-Dataset 來看,除了使用歌詞特徵與旋律特徵預測旋律 情緒標籤之外,方法三確實是能提升模型的預測能力。為了測試此效果並不是 只表現於 KKBOX-Song-Mood-Dataset 資料集,我們另外使用了南京大學所整理 的 NJU-MusicMood-V1.0 資料集 [2],比較有無將重複歌詞刪除對分類結果的影 響。此資料集有 777 首英文歌曲,有四種情緒標籤,分別為悲傷、快樂、平靜 與憤怒,每一首歌都有對應的歌詞,此資料集並無音訊的特徵,因此以下實驗 只利用歌詞做分析。
支持向量機 隨機森林 最近鄰居法
單用歌詞特徵 方法二 0.767 0.787 0.794
方法三 0.824 0.809 0.806
歌詞特徵與旋律特徵 方法二 0.899 0.882 0.891
方法三 0.891 0.871 0.884
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
從 表格 12 可以發現南京大學所整理的 NJU-MusicMood-V1.0 英文歌曲,方 法三的準確率明顯高於方法二,顯示將重複詞只計算一次的前處理過程,不是 單單只表現於 KKBOX-Song-Mood-Dataset 資料集。
表格 12 NJU-MusicMood-V1.0 資料集使用方法二與方法三的準確率比較
支持向量機 隨機森林 最近鄰居法
方法二 0.327 0.345 0.309
方法三 0.407 0.401 0.378
5.5 探討方法二與方法三的優劣
此節會探討在方法三中,將重複歌詞只算一次的前處理,對歌詞特徵擷取的 影響與幫助。會從兩個面向觀察,面向一從測試資料集中,兩種方法分類結果 不一致的歌曲中觀察;面向二則從方法二與方法三分別計算出來的 TF-IDF 矩陣 的差異著手,其細節如下。
5.5.1 面向一
我們找出在使用方法二與方法三分類結果不同的歌曲中,有什麼共同特色,
來探究處理重複詞對模型的影響為何,其過程如下:
我們以預測目標為歌詞情緒標籤(快樂與悲傷二分類)且只使用歌詞特徵的 支持向量機模型來探究「是否重複詞只計算一次」對預測結果的影響。模型評 估的方法為 20 折的交叉驗證,因此所有的資料都會在 20 折交叉驗證中當過 一次的測試資料,我們將 20 折交叉驗證中的每一筆測試資料的預測結果記錄 下來,並觀察使用方法二的模型預測結果,與方法三的模型預測結果不同的歌 曲,有什麼共同特徵。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
在總共 405 筆資料當中,總共有 55 筆資料是在方法二與方法三中預測不同 的,其中「方法三」分類正確,「方法二」分類錯誤的有 35 筆;「方法二」分 類正確,「方法二」分類錯誤的有 20 筆,如 圖 5 所示。因此我們可知,使用
「歌詞特徵擷取方法三」的模型是表現較好的,但也有「方法二」分類正確,
「方法三」反而分類錯誤的例子發生。
然而,在「方法三」分類正確,「方法二」分類錯誤的 35 筆當中,發現有些 許歌曲的歌詞有反覆出現相同詞彙的現象,例子如嚴爵的「一直給」、卓文萱 的「不要不要」、潘瑋柏的「打呼」,其歌詞提供在附錄章節。
圖 5 55 筆預測結果不同的資料中,各個歌詞特徵擷取方法正確的資料筆數
‧
‧
性,並比較二方法選出詞彙的合理度。KKBOX-Song-Mood-Dataset 與 NJU-MusicMood-V1.0 [2] 的前二十重要的詞彙如表格 13.A 與 表格 13.B。‧
表格 13.A 方法二與方法三在 KKBOX-Song-mood-dataset 的各個前二十重要的情緒詞彙
排
‧
表格 13.B 方法二與方法三在 NJU-MusicMood-V1.0 資料集的各個前二十重要的情緒詞彙
排
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 6.A 以歌詞情緒標籤為預測目標,測試資料集中歌曲被預測為悲傷的機率 的分布圖
圖 6.B 以旋律情緒標籤為預測目標,測試資料集中歌曲被預測為悲傷的機率分 佈圖
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 7.A 與 圖 7.B 分別為以歌詞、旋律情緒標籤為預測目標,模型預測錯誤的 歌曲的悲傷機率分布圖,可以發現,兩個模型預測為悲傷的機率介於 0.2 到 0.8 之間的比例是明顯變多的,其結果是直觀的,但是模型預測悲傷的機率接近 1 或接近 0 的歌曲還是占大多數,我們可以推估,以歌詞情緒標籤為預測目標,
且模型預測錯誤的歌曲中,許多歌曲的情緒並不是模型覺得模稜兩可,而是完 全判斷錯誤,因此我們認為此模型還有改善的空間。
圖 7.A 以歌詞情緒為預測目標,模型預測錯誤歌曲中,歌曲 為悲傷機率的分布圖
圖 7.B 以旋律情緒為預測目標,模型預測錯誤歌曲中,歌曲為 悲傷機率的分布圖
‧
‧
KKBOX-Song-Mood-Dataset 與 NJU-MusicMood-V1.0 [2],從分類結果可以發現,有對重複 詞做處理的分類結果明顯好於沒處理的分類結果,因此如果要使用「視一種情‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
本文中的歌詞特徵擷取方法,都是使用與 TF-IDF 相關,然而 TF-IDF 相關的 方法有一個共同的缺點,正是沒有考慮到每個詞彙的先後順序關係,都是將所 有歌詞拆解成獨立的詞彙,因此會遺失掉許多句子中的重要資訊,未來建議可 以試著將詞與詞之間的先後順序關係納入考量,也許分類效果能夠往上提升。
‧
‧
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
吳克群 沒關係 (歌詞為悲傷、旋律為悲傷)
沒有一句對不起 對不起是我太執迷 你離開的時候沒有一句 沒有一句話說清 說清楚離開的原因 也許他可靠 他實際 他不一樣 他能夠給你安全感 不只夢想 誰還在乎一起傻傻說過的那些話 沒關係 我們分了沒關係 這不是你的問題 是 我沒那個福氣 沒福氣卻又愛上你 就算哭了沒關係 這不是你的問題 痛痛快快 給我一槍 我沒關係 沒關係 沒關係 你離開的時候沒有一句 沒有一句對不起 對不起是我太執迷 你離開的時候沒有一句 沒有一句話說清 說清楚你離開的原 因 也許他可靠 他實際 他不一樣 他能夠給你安全感 不只夢想 誰還在乎一起 傻傻說過的那些話 沒關係 我們分了沒關係 這不是你的問題 是我沒那個福氣 沒福氣卻又愛上你 就算哭了沒關係 這不是你的問題 痛痛快快給我一槍 我沒 關係 愛情裡面總有一個比較傻 怪就怪我放不下 痛苦給我幸福留給你和他 沒 關係 沒關係 沒關係 沒關係 我們分了沒關係 這不是你的問題 是我沒那個福 氣 沒福氣卻又愛上你 就算哭了沒關係 這不是你的問題 痛痛快快給我一槍 我 沒關係
刪減過後的歌詞(順序並無意義)
時候 不只 沒有 對不起 福氣 愛上 愛情 痛痛快快 這不 裡面 也許 我們 一 起 幸福 就算 說清楚 一樣 一槍 夢想 安全感 離開 在乎 傻傻 留給 問題 些 話 分了 比較 沒關係 實際 句話 放不下 能夠 可靠 原因 執迷 痛苦
‧
[1] MennovanZaanenandPieterKanters. AutomaticMoodClassificationUsingtf*idf BasedonLyrics. InJ. StephenDownieandRemcoC. Veltkamp, editors, 11thInternational SocietyforMusicInformationandRetrievalConference, August2010.
[2] HaoXue, LikeXue, FengSu.MultimodalMusicMoodClassificationbyFusionofAudio andLyrics. InProc. ofMMM2015, LNCS8936, pp26-37.
[3] Jen-YuLiuandYi-HsuanYang :EventLocalizationinMusicAuto-tagging, 2016, http://mac.citi.sinica.edu.tw/~yang/pub/liu16mm.pdf
[4] Wei-YunMaandKeh-JiannChen. Abottom-upmergingalgorithmforchinese unknownwordextraction. InProceedingsofthesecondSIGHANworkshop onChineselanguageprocessing, volume17, pages31–38. Association forComputationalLinguistics, 2003.
[5] Wei-YunMaandKeh-JiannChen. IntroductiontoCKIPchinesewordsegmentation systemforthefirstinternationalchinesewordsegmentationbakeoff.
InProceedingsofthesecondSIGHANworkshoponChineselanguage
processing, volume17, pages168–171. AssociationforComputationalLinguistics, 2003.
[6] McFee, Brian, ColinRaffel, DawenLiang, DanielPWEllis, MattMcVicar, EricBattenberg, andOriolNieto. "librosa: Audioandmusicsignalanalysisinpython." InProceedingsofthe 14thpythoninscienceconference, pp. 18-25. 2015.
[7] MartinF. McKinneyandJeroenBreebaart. FeaturesforAudioandMusicClassification. InProceedingsofInternationalConferenceonMusicInformationRetrieval, 2003.
[8] C. Laurier, J. GrivollaandP. Herrera: “MultimodalMusicMoodClassificationUsing AudioandLyrics,” ProceedingsoftheInternationalConferenceonMachineLearningand Applications, 2008.
[9] Y.-H. Yang, Y-C. Lin, H.-T. Cheng, I,-B. Liao, Y-C. Ho, andH. H. Chen. Towardmulti-modal musicemotionclassification. InProceedingsofPacific-RimConferenceinMultimedia, pages 70-79. Springer, 2008
[10] XingWang, XiaoouChen, DeshunYangandYuqianWu. MusicEmotionClassificationof ChineseSongsBasedonLyricsUsingTF*IDFandRhyme.