所謂的Pitch,是音樂訊號裡一個很重要的特徵,一般來說,Pitch代表聲音頻率的高 低,在這裡指的頻率是Fundamental Frequency ,也是Fundamental Period的倒數,至於從 基本頻率轉換到半音的公式如下:
13
14
15
從這些最大值中找出自相關係數rxx( )m 為正值者。函式rxx norm, ( )m 也有可能出現最大值在
xx( )
r m 為最小的時候。第三步將考慮b m0 的值,b 的係數值可能像是語音或是在噪音訊0 號中的0值。因此b 可以作為推估音高延遲的一種質量偵測,接著結合線性預測演算法,0 可以找到分析訊號中的基頻值,最後對應到標準音高。
3.3 Dynamic Time Warping (DTW)簡介
DTW 是 Dynamic Time Warping 的簡稱,中文可以翻譯成「動態時間扭曲」或是
「動態時間校正」,這是一套根基於「動態規劃」(Dynamic Programming,簡稱 DP)
的方法,可以有效地將搜尋比對的時間大幅降低。
DTW 的目標就是要找出兩個向量之間的最短距離。一般而言,對於兩個 n 維空間 中的向量 x 和 y,它們之間的距離可以定義為兩點之間的直線距離,稱為歐基里得距 離(Euclidean Distance),如圖 3.3.1
dist(x, y) = |x - y|2 (3.3.1)
圖 3.3.1 兩向量之最短距離
16
17
2. 遞迴關係:D(i,j) = ∣t(i) - r(j)∣ + min{D(i-1, j), D(i-1, j-1), D(i, j-1)}
3. 端點條件:D(1,1) = ∣t(1) - r(1)∣
4. 最後答案:D(m,n)
圖 3.3.3 DTW-1
另外包含以下幾種型態:
型態二:
18
19 弦。這種類型的和弦代表有大和弦(Major chord)、小和弦(Minor chord)、掛留和弦 (Suspended chord)、增和弦(Augment chord)等4種(如圖)。大三和弦的音色特點是明亮且 安定,是最常被廣泛應用的和弦;小三和弦的音色特點與大三和弦相較起來,音色特徵 較為暗淡;掛留和弦其音色特徵比較空靈;增三和弦其音色特徵是帶有不安定的感覺,
在使用上較有所限制,如圖3.4.1所示。
圖3.4.1 由三音所構成的和絃
20
二、四音構成的和弦部分:
此處主要介紹在三音構成的和弦上,加上「M6th(六度音) 、m7th(小七度)、M7th(大 七度)」這三個音符而成。
1. 加上M6th(六度音)的和弦:
加上M6th音的和絃,其和絃名稱就是在上面多寫一個「6」的數字。在音色的特徵 上,會比原本的大和弦更暗更柔;而以小和弦為基本的「小六和弦」,聽起來會強調出 小和弦的陰柔感;以減和弦(Diminish chord)加上M6th(六度音),在音色的特質上,聽起 來會有種不安感的獨特效果,如3.4.2所示。
圖3.4.2 四音構成的和弦-加上m6th 音的和弦
2. 加上m7th(小七度音)的和弦部分:
加上m7th音的和弦,其和弦名稱就是在上面多寫一個「7」的數字。七和弦(Dominant 7th chord)在音色的特徵上,比原本的大和弦聽起來更不安定,除了具有終止式的功能外,
經常被運用在藍調類的和弦進行中;屬七掛留和弦(Dominant 7th sus4 chord) 其音色特徵 比較空,常被運用在和以同一音為根音的七和弦樂句之句尾;小七和弦(Minor 7th chord) 會將小調樂句較暗的音色特質削弱,聽起來會有比較流行感,和小和弦一樣經常被使 用。小七減五和弦(Minor 7th Flat 5 chord) 其音色特徵為不安感,如圖3.4.3所示。
21
圖3.4.3 四音構成的和弦-加上m7th 音的和弦 3.關於加上M7th(大七度音)的和弦部分:
加上M7th音的和弦,其和弦名稱就是在上面多寫一個「M7」的記號。大七和弦(Major 7th chord)比原本大三和弦聽起來,更帶有洗錬過的透明感。小三大七和弦(Minor Major 7th chord) 聽起來更有強調出小和弦特質的感覺如圖3.4.4所示。
圖3.4.4 四音構成的和弦-加上M7th 音的和弦
三、引申和弦(Tension chord)部分:
在四音構成的和弦中,加上一個與根音相離一個八度上的和弦外音,這個和弦稱為
「引申和弦」,其音色特徵聽來有種獨特的張力。可添加在「引申和弦」上的音符,要 視其原和弦的種類而定。引申和弦可分為大和弦類的引申和弦、小和弦類的引申和弦及 屬七和弦類的引申和弦等3 類。說明如下:
1. 大和弦類的引申和弦部分:
在大和弦上加上 M6th 或M7th 音符的和弦,都屬於大和弦類,在這一類和弦上,
可加「9th 、#11th 、13th」音符,就變成引申和弦,因添加了引申音,讓整個音色聽 來更有深度的層次感如圖3.4.5所示。
22
圖3.4.5 大和弦類的引申和弦
2. 小和弦類的引申和弦部分:
以小和弦為基礎,再加上「9th、11th」的音作為引申音(11th 只加在小七和弦上),
音色比原本的和弦更添複雜性,如圖3.4.6所示。
圖3.4.6 小和弦類的引申和弦
3. 屬七和弦類的引申和弦部分:
雖然屬七和弦可以添加更多豐富的引申音,但實際上常被運用的引申音以 9th 及以 9th 音符作上下半音的變化(#9 th、b9th)延伸(altered tension )為主,如圖3.4.7所示。
圖3.4.7 屬七和弦類的引申和弦
23
四、其他和弦部分:
以常用的 Power Chord(五度和弦)、Add 和弦(添加和弦)及Slash Chord / On Chord(分割和弦)等三部分作為說明,並注意其結構和音色特徵。
1. Power Chord (五度和弦)部分:
Power Chord 僅以「根音、完全五度音(P5th)」兩個音符所構成的和弦,即被稱為「Power chord」或「五度和弦」。因為這種和弦內,沒有可決定是大和弦或小和弦的第三音,除 了根據曲子的調性來找出和弦名稱之外,在記譜上也以「根音音名+omit3」(省略3)的形 式作記錄,其音色特徵較為中性感如圖3.4.8所示。
圖3.4.8 Power Chord (五度和弦)的結構
2. Add 和弦(添加和弦)部分:
Add 和弦(添加和弦)就是直接在三音構成的和弦上添加音符,就是所謂的「Add 和弦」(添加和弦),記載表示方式即是「add+添加的音符度數」。以這9th 音符和 弦為代表,其音色為更有深度的層次感及複雜性。其解說譜例如下如圖3.4.9所示:
圖3.4.9 Add 和弦的結構
3. Slash Chord / On Chord(分割和弦)部分:
24
Slash Chord / On Chord 就是將根音以外的音指定為最低音(Bass 音)的和弦,共 分為兩種,一種是像轉位和弦一樣,將根音之外的和弦音當作是最低音;另一種 是將和弦外音的音符指定為最低音。Slash Chord / On Chord 常用於通俗音樂bass line 之行進中,使曲子的和弦進行更加順暢無阻如圖3.4.10所示。
圖3.4.10 Slash Chord / On Chord(分割和弦)
而所謂的和弦級數是相對於調式而言的。簡單的說,每一個大調都有一個 Do Re Mi Fa Sol La Si 的音階。換成簡譜的話,就是每一個大調都可以被記成:1 2 3 4 5 6 7
一個基本的三和弦(三個音組成的和弦)是由根音、加上三音與五音構成的。一般 的和弦記法都是記根音,比如 Cm 就是以 C 這個音為根音的小和弦。那麼如果記成 1m ,這個意思就是以一組音階中的 Do 這個音為根音所組成的小和弦。好比,在 A 大調 中 1m 就是 Am 和弦,而 5m 就是 Em 和弦。
此外,這裡所講的這些和弦級數,所代表的和弦都是各調的「自然和弦」。 所謂
「自然和弦」就是該和弦的組成音都是大調音階的「音階音」。換句話說,以 C 大調的 自然和弦為例,所有 C 大調的自然和弦的組成音都是鋼琴上的白鍵,沒有 任何黑鍵。
所以 C 大調的一到七級和弦。分別是:
C Dm Em F G Am B 減。
這七個和弦就是 C 大調的自然和弦。構成這七個和弦的音,都是 C 大調的大調音階 中的音階音。也就是所有鋼琴的白鍵的音。[25]
25
由於本文針對Bass Line做和弦辨認,辨認方法為針對該和弦的根音為主。Bass於 歌曲中在大多數情形下往往只彈奏和弦的根音,因此我們只辨認出該首歌曲的和弦級 數,由和弦級數的行進作為情緒的變化指標。
26 格,對應到四種情緒類別。舉例來說:Dance, Latin, Rock等風格,常常可以炒熱現場氣 氛,讓聽眾隨音樂起舞,因此歸類於Happy/Excited第一種情緒;Heavy Metal, Punk, Funk 比較容易使人激動,挑起人們高亢的情緒,因此歸類於Angry/Anxious第二類情緒;而Soul, Jazz, Blues等風格,比較傾向於較悲傷,令人黯然神傷,因此歸類於Depressed/Sad 第三 種情緒;Bossa Nova, Country等,讓人放鬆,心情舒適,因此歸類於 Peaceful/Relaxed 第 四種情緒,如表二所示。
Music Genres Emotion
Dance/Latin/Rock Happy/Excited/Pleased/Joyful Heavy Metal/Punk/Funk Angry/Anxious/Nervous
Soul/Jazz/Blues Depressed/Sad/Bored/Sleepy Bossa Nova/Country Peaceful/Relaxed/Serene
表2 音樂風格與情緒之對照表
4.2 演算法與系統架構
本文的系統架構描述如下:當音樂訊號進入系統後,萃取音樂中的 BASS 訊號,並 使用音高追蹤(Pitch Tracking)的方法分析音高及音長,接著利用 DTW(Dynamic Time Warping)演算法將音樂中的低音聲部、也就是辨識出的音符、與系統中提供的風格樣版
27
來比對,找出最相近的音樂風格,對應到最為相近的音樂風格之後,給予該風格相匹配 的音樂情緒,如表 2 所匹配之相對應情緒。而系統介面是由四個圓形所組成,圖 4.2.1 為系統概念圖,並且根據該音樂之風格、設定該情緒較大的起始值及較大的加權係數,
相反的情緒則設定較小的啟始值及較小的加權係數,之後再分析的和絃行進,藉由和弦 的走向給予不同情緒述職的改變,即時的改變介面的圓圈半徑大小,系統流程圖如圖 4.2.2 所示:
圖4.2.1 系統概念圖
28
圖4.2.2 系統流程圖
本系統使用Matlab R2008a作為系統開發軟體,開發主機CPU為Intel Centrino2 Duo P8400,記憶體為4G,Windows Vista 32位元。
於測詴的音樂檔,在此選用一段30秒的音樂片段來做為測詴,依序通過低通濾波 器,音高追蹤,比對相似音樂風格,細部方法如第三章所提。以下說明Bass-Line於各音 樂風格所出現的特徵。
Dance Music:在 Bass 彈奏中,時常使用根音與八度音交替使用的八分音符行進,
如圖 4.2.3 所示,頻率呈現一比二的整數比,音符區間為八分音符。
29
圖4.2.3 Dance Music的Bass特徵
Heavy Metal :Bass 常常使用的是密集連續的十六分音符根音彈奏,如圖 4.2.4
圖4.2.4 Heavy Metal的Bass特徵
30
Jazz: Bass 通常是由許多等長的四分音符所組成,一般稱做 Walking Bass,由和絃 內音及經過音所組成,如圖 4.2.5 所示
圖4.2.5 Jazz Music常用的Walking Bass
Bossa Nova: Bass 的彈奏通常為根音與上五度音或下五度音交替使用,如圖 4.2.6
圖4.2.6 Bossa Nova的Bass特徵
由以上分類圖可歸納得知,Bass-Line在各風格常見的伴奏手法。當歸類為該音樂風
31
格之後,給予給風格對應之音樂情緒較大分起始半徑20,對角線之相反情緒半徑給予8,
其餘兩者半徑則為10。
圖4.2.7 包含快樂情緒較大之風格系統起始值
圖4.2.8 包含憤怒情緒較大之風格系統起始值
32
圖4.2.9 包含哀傷情緒較大之風格系統起始值
圖4.2.10 包含舒適情緒較大之風格系統起始值
本系統以四個圓形來呈現,圖中的四個圓形會隨著音樂的播放,時間的行進,改變
33
以上係數給予: Happy+0.5, Angry+0.1, Relax+0.3, Sad-0.2
Angry
Case 4: 重複同樣和絃四小節以上
Case 4: 重複同樣和絃四小節以上