• 沒有找到結果。

音樂異質資訊整合

第二章、 相關研究

2.6 音樂異質資訊整合

在西洋音樂理論中,樂譜的記載係依靠五線譜來表示,五線譜組成分為第一線、第 二線、第三線、第四線、的五線,在線與線之間尚有第一間、第二間、第三間、第四間,

倘有超過部分則可自行往上或往下加線或間。五線譜除了記載該樂譜的調號、拍號,其 餘為分散在五線譜各處的音符與符號,如圖 7 所示。

圖 7 五線譜圖

音高的表示方法則依照音的高低將音符置放於五線譜中的不同位置。音高具有「音 名」、「唱名」兩種,為了便利看譜還有發展出「簡譜」來表示不同的音高,其對照表如 表 4 所示。

音名 C D E F G A B

唱名 Do Re Mi Fa Sol La Si

簡譜 1 2 3 4 5 7 7

表 4 音名、唱名、簡譜對照表

音符除了音高(Pitch)之外,還具備時值(Duration)資訊。最常見的時值表示方式,為 全音符、二分音符、四分音符、八分音符、十六分音符。全音符長度為二分音符的兩倍,

二分音符長度為四分音符的兩倍,其餘依此類推。音符時值除了前述兩倍式的成長之外,

還具有「附點」的表示方法,可以將時值增長為原本 1.5 倍的長度,亦為原時值加上原 時值二分之一之長度。例如,二分附點音符長度則為,二分音符長度加上四分音符長度 之總長。各式時值對照表如圖 8 所示。若無音高但有時值的則為休止符,各種休止符如 圖 9 所示。

全音符 二分音符 四分音符 八分音符 十六分音符 圖 8 各式時值音符

全休止符 二分休止符 四分休止符 八分休止符 十六分休止符 圖 9 各式休止符

若要將上述五線譜與人交換或共用,則必須將樂譜數位化編碼轉。在 Beyond MIDI 一書[64]中,描述了超過 20 種以上不同的樂譜儲存方式,而數位化的樂譜檔案長久以 來都呈現非常分歧的現象。例如,Finale 與 Sibelius 各有其專屬的檔案格式,彼此之間 缺乏共通的轉換標準。隨著網際網路的發展,在網路上交換數位樂譜檔案的需求日益增 加。目前數位樂譜的檔案以 PDF 為主,但其格式僅記錄了樂譜的印刷資訊,而沒有音 樂上的描述涵義。另一方面,MIDI 格式雖然成功地用於電腦合成音樂的領域,但 MIDI 檔所能記載的紀錄與資訊與樂譜相比顯得缺乏許多。

MIDI (Musical Instrument Digital Interface) 為一種工業電子的通訊協定,定義了各 種音符及彈奏控制訊號,訊號當中包含音調、強度、音量、顫音或相位等資訊,但不包 含聲音資訊。在 MIDI 技術規格中,可分為硬體標準介面與軟體標準介面兩種,硬體標 準介面部分可以使各種支援 MIDI 的硬體介面在輸出的時候為一致的規格,在軟體標準 介面部分定義了儲存與傳輸數位資料編碼的結構,包含了音量、音高、力度、計時器訊 號等,接收端收到訊號後即可依照其自身合成器,依據接收到的控制訊號合成出聲音。

在 MIDI 檔案當中,以 0~127 代表音高資訊,例如中央 C 音高為 60。但是,MIDI 音樂 卻無法反推出完整的樂譜。主要原因是,MIDI 檔案主要用於記載音樂合成資訊,無法 一對一反推出原始樂譜資訊,亦無小節 (Measure)、重複 (Repeat)、連奏 (Slurs)等概念。

雖然音樂撥放順序與原始樂譜相同,但是還原出來的樂譜卻與原始樂譜會有所差異。例 如,若兩個同樣的音符之間有連結線連接的話,在 MIDI 檔案中所記載的資訊是完全一 樣的。雖然在實際演奏中兩種樂譜可能是使用相同的彈奏方法演出,但是在其樂譜意義 上並不完全相同。例如,圖 10 和圖 11 若轉換為 MIDI 檔案,兩者所聽起來是完全一致 的。

圖 10 無連結線的樂譜

圖 11 有連結線的樂譜

為了解決 MIDI 無法完整記載樂譜的問題,在 1994 年的時候許多音樂軟體商共同發 展了 NIFF (Notation Interchange File Format) 格式,能夠完整描述音樂樂譜中的各項元素 及其結構性,但由於為二進位格式且複雜不易使用,最後未能成為流行的電子樂譜檔案 格式。另一種 SMDL (Standard Music Description Language) 格式,亦試圖解決樂譜記載 問題,但由於相容性差最終仍告失敗。在 2004 年,Recordare 公司發表了 MusicXML 格 式(Music Extensible Markup Language),利用人類及機器均能方便閱讀的 XML 技術為基 礎,發展一套數位樂譜的格式。由於閱讀方便且結構清晰,對於音樂樂譜的各種符號定 義的非常完整,並在網路上交換非常便利,故發展得非常快速。截至 2013 年 4 月為止,

已有超過 160 種商用軟體支援 MusicXML 格式。MusicXML 格式能夠快速發展成功的主 要原因為,在制定標準的過程中參考了的學術上的 MuseData 和 Humdrum 之設計,非常 複雜的音樂均能被完整記載,在各種不同的軟體之間具有相當佳的相容性表現。圖 12 的 MusicXML 的樂譜如圖 13 所示。

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<!DOCTYPE score-partwise PUBLIC

"-//Recordare//DTD MusicXML 2.0 Partwise//EN"

"http://www.musicxml.org/dtds/partwise.dtd">

<score-partwise version="2.0">

<part-list>

<score-part id="P1">

<part-name>Music</part-name>

</score-part>

</part-list>

<part id="P1">

<measure number="1">

<attributes>

<divisions>1</divisions>

<key>

<fifths>0</fifths>

</key>

<time>

<beats>4</beats>

<beat-type>4</beat-type>

</time>

<clef>

<sign>G</sign>

<line>2</line>

</clef>

</attributes>

<note>

<pitch>

<step>C</step>

<octave>4</octave>

</pitch>

<duration>4</duration>

<type>whole</type>

</note>

</measure>

</part>

</score-partwise>

圖 12 MusicXML 範例檔案

圖 13 MusicXML 範例樂譜

當談論到音樂的時候,不僅有聲音訊號與樂譜可以描述音樂,仍有許多不同觀點可 用於描述音樂。例如,演奏者習慣透過樂譜描述音樂,音樂賞析者則偏好瀏覽原始樂譜

手稿,音樂 DJ 則較偏好錄製完成的音訊來表達音樂。在聆聽者的觀點,最習慣的音樂 描述則是現場 LIVE 音樂或是錄音室錄製好的唱片。由上述的範例可得知,各種不同類 型的音樂資訊在本質上即為異質的,因為音樂本身包含了各式各樣不同的媒體與描述資 訊。以歌劇魅影 (Phantom of Opera) 作品為例,所包含的各式異質資訊可能包含但不限 於樂譜、音樂、影片、海報、照片、傳單等多種不同格式的描述資訊,但卻沒有一套整 合描述方式進行整合。

在數位的領域當中,若現實生活中的各種資訊若要轉換成電腦可以管理、組織的方 法, 必須要先轉換成電腦可以處理的二進位格式。但是,在此轉換過程中,往往只將 其資料內容與詮釋資料儲存成適當之格式,而未考慮到其資料真正的內涵資訊或與其相 關的處理程序。例如,目前數位樂譜檔案以 PDF 或是 JPEG、TIFF 等圖像檔案為主,

電腦合成音樂檔案以 MIDI 格式為主,音樂訊號檔以 MP3 為主。從上述格式可知,不 論是 PDF、JPEF、 TIFF、MIDI、MP3 都欠缺完整的音樂內涵意義,其個別格式具有 其本質上的限制,無法將所有與音樂有關的觀點進行整合描述。

MPEG-7 以 XML 語言為基礎,並再加入其延伸格式,作為影音(AV)內容的描述 結構(Multimedia Description Schemes, MDS)。用這種方式描述影音內容,其產生的格式 能夠 讓人們能夠了解所要呈現的內容,且使影音內容夠容易被搜尋、索引、過濾、使 用、管理[3-6]。惟 MPEG-7 係作為影音內容描述之用,並非針對紀錄音樂而專門設計,

且音樂資料的豐富度遠大於一般聲音。

有鑑於此,IEEE 組織便開始發展一套以 XML 為基礎的格式,能夠整合描述各種 音樂觀點與異質資訊,成為 IEEE 1599 標準[11],其架構圖如圖 14 所示。它依照音樂 的不同特性分成六層音樂內涵描述架構,可以完全整合不同異質形式的音樂資訊,其描 述檔以 XML 語言定義各層次音樂資訊的描述語法、含意及同步關係[9, 10]。最上層為 一般音樂描述層 (general layer)、邏輯層 (logical layer) 描述各種形式音樂資訊間的同部 與參照關係、結構層 (structural layer) 描述曲式與結構方面的資訊、譜號層 (notational layer) 描述樂譜相關的資訊、表演層 (performance layer) 描述音樂合成資訊、最底層為 描述音樂訊號的音訊層 (audio layer)。

圖 14 IEEE 1599 六層架構圖

由於完整的音樂資料是由各種異質資訊所組成,例如一般常見的 MP3 檔案、MIDI 檔案、樂譜手稿、電子樂譜檔案等多種格式,IEEE 1599[11]將各種異質音樂資訊依其特 性分為六層音樂內涵描述架構,可以完全整合不同異質形式的音樂資訊,其描述檔以 XML 語言定義各層次音樂資訊的描述語法及含意。最上層為一般音樂描述層(general layer)、邏輯層 (logical layer)描述各種形式音樂資訊間的同部與參照關係、結構層 (structural layer)描述曲式與結構方面的資訊、譜號層(notational layer)描述樂譜相關的資 訊、表演層(performance layer)描述音樂合成資訊、最底層為描述音樂訊號的音訊層(audio layer),其對應的 XML 描述如圖 15 所示。

General Logic Structural Notational Performance

Audio

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE ieee1599 SYSTEM "http://www.mx.dico.unimi.it/ieee1599.dtd">

<ieee1599>

<general>...</general>

<logic>...</logic>

<structural>...</structural>

<notational>...</notational>

<performance>...</performance>

<audio>...</audio>

</ieee1599>

圖 15 IEEE 1599 音樂描述範例

我 們 可 以 在 一 般 層 中 描 述 這 首 歌 曲 的 標 題 (main_title) 、 歌 手 (voice) 、 作 曲 者 (composer)、作詞者(lyricist)、曲目編號(number)、作品名稱(work_title)、發行日期(date)、

以及曲風(genres)、等關於此樂曲的詮釋資料(meta data),與此樂曲相關的音樂與影片等 相關檔案的參照,則以<related_files>標記方式進行整合,如圖 16 所示。

<general>

<genre name="POP" description="流行音樂" weight="100" />

</genres>

除此之外,IEEE 1599 標準在結構層包含音樂物件 (music object) 從作曲與樂理觀 點的因果關係之明確描述,例如音樂物件如何被描述成像之前的音樂物件的變化。但是,

這不是時間上 (timed) 或是實際上 (physically) 順序的變化,而是因果關係的變化。在 這層裡面的資訊不包含音樂事件的時間順序和絕對時間的明確描述,而是描述了在樂譜 的音樂物件的在合成或分析過程中的轉換和定位之間的因果關係,但是目前沒有已經確 切可以使用的標準來表示結構層的資訊,儘管如此,[65]指出仍有其他方法來表示其資 訊。第一種為使用 SMDL[66]、第二種使用包含高階音樂程序語言(high-level music programming languages) 與正規形式工具進行模型化。最後一種為本系統採用之方法,

將音樂結構資訊描述在 IEEE 1599 標準中的結構層,如圖 17 所示。

將音樂結構資訊描述在 IEEE 1599 標準中的結構層,如圖 17 所示。