第五章 建模分析
5.6 模型輸出機率
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 6.A 以歌詞情緒標籤為預測目標,測試資料集中歌曲被預測為悲傷的機率 的分布圖
圖 6.B 以旋律情緒標籤為預測目標,測試資料集中歌曲被預測為悲傷的機率分 佈圖
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 7.A 與 圖 7.B 分別為以歌詞、旋律情緒標籤為預測目標,模型預測錯誤的 歌曲的悲傷機率分布圖,可以發現,兩個模型預測為悲傷的機率介於 0.2 到 0.8 之間的比例是明顯變多的,其結果是直觀的,但是模型預測悲傷的機率接近 1 或接近 0 的歌曲還是占大多數,我們可以推估,以歌詞情緒標籤為預測目標,
且模型預測錯誤的歌曲中,許多歌曲的情緒並不是模型覺得模稜兩可,而是完 全判斷錯誤,因此我們認為此模型還有改善的空間。
圖 7.A 以歌詞情緒為預測目標,模型預測錯誤歌曲中,歌曲 為悲傷機率的分布圖
圖 7.B 以旋律情緒為預測目標,模型預測錯誤歌曲中,歌曲為 悲傷機率的分布圖
‧
‧
KKBOX-Song-Mood-Dataset 與 NJU-MusicMood-V1.0 [2],從分類結果可以發現,有對重複 詞做處理的分類結果明顯好於沒處理的分類結果,因此如果要使用「視一種情‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
本文中的歌詞特徵擷取方法,都是使用與 TF-IDF 相關,然而 TF-IDF 相關的 方法有一個共同的缺點,正是沒有考慮到每個詞彙的先後順序關係,都是將所 有歌詞拆解成獨立的詞彙,因此會遺失掉許多句子中的重要資訊,未來建議可 以試著將詞與詞之間的先後順序關係納入考量,也許分類效果能夠往上提升。
‧
‧
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
吳克群 沒關係 (歌詞為悲傷、旋律為悲傷)
沒有一句對不起 對不起是我太執迷 你離開的時候沒有一句 沒有一句話說清 說清楚離開的原因 也許他可靠 他實際 他不一樣 他能夠給你安全感 不只夢想 誰還在乎一起傻傻說過的那些話 沒關係 我們分了沒關係 這不是你的問題 是 我沒那個福氣 沒福氣卻又愛上你 就算哭了沒關係 這不是你的問題 痛痛快快 給我一槍 我沒關係 沒關係 沒關係 你離開的時候沒有一句 沒有一句對不起 對不起是我太執迷 你離開的時候沒有一句 沒有一句話說清 說清楚你離開的原 因 也許他可靠 他實際 他不一樣 他能夠給你安全感 不只夢想 誰還在乎一起 傻傻說過的那些話 沒關係 我們分了沒關係 這不是你的問題 是我沒那個福氣 沒福氣卻又愛上你 就算哭了沒關係 這不是你的問題 痛痛快快給我一槍 我沒 關係 愛情裡面總有一個比較傻 怪就怪我放不下 痛苦給我幸福留給你和他 沒 關係 沒關係 沒關係 沒關係 我們分了沒關係 這不是你的問題 是我沒那個福 氣 沒福氣卻又愛上你 就算哭了沒關係 這不是你的問題 痛痛快快給我一槍 我 沒關係
刪減過後的歌詞(順序並無意義)
時候 不只 沒有 對不起 福氣 愛上 愛情 痛痛快快 這不 裡面 也許 我們 一 起 幸福 就算 說清楚 一樣 一槍 夢想 安全感 離開 在乎 傻傻 留給 問題 些 話 分了 比較 沒關係 實際 句話 放不下 能夠 可靠 原因 執迷 痛苦
‧
[1] MennovanZaanenandPieterKanters. AutomaticMoodClassificationUsingtf*idf BasedonLyrics. InJ. StephenDownieandRemcoC. Veltkamp, editors, 11thInternational SocietyforMusicInformationandRetrievalConference, August2010.
[2] HaoXue, LikeXue, FengSu.MultimodalMusicMoodClassificationbyFusionofAudio andLyrics. InProc. ofMMM2015, LNCS8936, pp26-37.
[3] Jen-YuLiuandYi-HsuanYang :EventLocalizationinMusicAuto-tagging, 2016, http://mac.citi.sinica.edu.tw/~yang/pub/liu16mm.pdf
[4] Wei-YunMaandKeh-JiannChen. Abottom-upmergingalgorithmforchinese unknownwordextraction. InProceedingsofthesecondSIGHANworkshop onChineselanguageprocessing, volume17, pages31–38. Association forComputationalLinguistics, 2003.
[5] Wei-YunMaandKeh-JiannChen. IntroductiontoCKIPchinesewordsegmentation systemforthefirstinternationalchinesewordsegmentationbakeoff.
InProceedingsofthesecondSIGHANworkshoponChineselanguage
processing, volume17, pages168–171. AssociationforComputationalLinguistics, 2003.
[6] McFee, Brian, ColinRaffel, DawenLiang, DanielPWEllis, MattMcVicar, EricBattenberg, andOriolNieto. "librosa: Audioandmusicsignalanalysisinpython." InProceedingsofthe 14thpythoninscienceconference, pp. 18-25. 2015.
[7] MartinF. McKinneyandJeroenBreebaart. FeaturesforAudioandMusicClassification. InProceedingsofInternationalConferenceonMusicInformationRetrieval, 2003.
[8] C. Laurier, J. GrivollaandP. Herrera: “MultimodalMusicMoodClassificationUsing AudioandLyrics,” ProceedingsoftheInternationalConferenceonMachineLearningand Applications, 2008.
[9] Y.-H. Yang, Y-C. Lin, H.-T. Cheng, I,-B. Liao, Y-C. Ho, andH. H. Chen. Towardmulti-modal musicemotionclassification. InProceedingsofPacific-RimConferenceinMultimedia, pages 70-79. Springer, 2008
[10] XingWang, XiaoouChen, DeshunYangandYuqianWu. MusicEmotionClassificationof ChineseSongsBasedonLyricsUsingTF*IDFandRhyme.