• 沒有找到結果。

第一節 音樂內容檢索系統

隨著網際網路的普及,一般人在有資訊檢索的需求時,第一個想到的工具通 常是網頁上的搜尋引擎,根據使用者提供的關鍵字,搜尋引擎可以很快的找到相 關文件,並且已展現出令人滿意的效率及結果。目前越來越多數位音樂資料產 生,這些音樂資料內容也已經成為使用者所要搜尋的對象,發展一個有效率的音 樂檢索系統也就更為重要。由於音樂資料中有絕大部分是很難用文字去表達的,

因此我們無法利用關鍵字搜索來搜尋音樂資料內容,如果我們使用內涵式查詢

(content-based retrieval),這個問題就可以有效的解決。所謂的內涵式查詢簡而言 之,就是對所要尋找的多媒體,做內容的分析並擷取其特徵值,以作為查詢比對 的依據。

以前常見的音樂檢索方式是以傳統文字型態為主,使用者於系統輸入歌名、

作曲者等關鍵字,利用文字比對方式找出有關的音樂資料,這種檢索方式的最大 缺點在於,使用者大部分的時候,只記得音樂的旋律,或是突然聽到的一段喜歡 的旋律,但是若不知道其相關資訊時,使用者就無法利用此種方式搜尋。

直 接 針 對 音 樂 內 容 進 行 檢 索 的 系 統 , 也 就 是 所 謂 的 音 樂 內 容 檢 索 系 統 (Content-Based Music Retrieval, 簡稱 CBMR),是從音樂資料庫中擷取出每首歌的 特徵値如旋律(melody)和節拍(rhythm)等,將這些資料放入資料庫中,再將使用者

輸入的查詢轉換為相同的特徵値與資料庫做比對,最後回應給使用者最接近的音 樂資料,在查詢過程中,使用者不需輸入文字型態的查詢資料,取而代之的是輸 入音樂資料的內容,而現有的音樂內容檢索技術,大部分都提供使用者查詢一段 不完整的音樂片段,使用者可以經由鍵盤或哼唱的方式,而輸入的音樂資料內容 可不需與資料庫中的音樂完全相同。

第二節 研究問題

對於一個音樂內容檢索系統,必定要處理下列問題:

1. 使用者查詢時,可能無法記憶正確的旋律,以致於輸入不完整的片段,造成 輸入的曲調走音。

2. 由於使用者的起音可能會抓不太準,因此一首曲子必須可以以任何音高當作 起音,而還是同樣的旋律,也就是符合「音調無關」(key-invariant)。

3. 使用者對於碎音(fragmentation)與合併音(consolidation)的誤解,甚至對原始音 樂資料中許多裝飾音及合聲部份不易記憶或辨別。

根據上述問題可知,使用者不太可能輸入的片段完完全全和音樂內容相同,因此 音樂資料的比對必須以近似比對(approximate matching)的技術來處理,而其所需 的時間複雜度,又高於完全比對(exact matching)許多。

目前在音樂檢索的研究中,大部分都將旋律特徵以音符字串的方式表示,因 此有些音樂檢索系統會利用近似字串比對(approximate string matching)的技術,包 含允許字串的插入(insertion)、刪除(deletion)、取代(substitution)等情形,來當做比

對的方法。然而,以軟體來實現近似字串比對的技術通常需要相當高的運算複雜 度,導致需要一段時間才能回應使用者,對於一個檢索系統是相當不合適地。

以硬體實現近似字串比對技術,對於增進音樂檢索處理的速度是相當有效的 方法,目前已有許多研究報告提出近似字串比對的電路,不過這些電路很難直接 套用到音樂檢索上面,因為有些近似字串比對電路是實現動態規劃(dynamic

programming)的演算法 [3][4][5],要應付不同長度的音樂檢索片段缺乏彈性 (flexibility),雖然有別的電路架構[6]擁有較高的彈性,但此電路架構只允許字串 中的符號被取代的情形,而且實現這種電路架構需要相當高的 area cost。

第三節 研究目的

根據上述問題,本篇論文提出在近似字串比對的基礎下,利用硬體平行

(parallel)高速的運算來進行音樂的檢索,以減少運算的時間複雜度。有別於一般 硬體設計是用 ASIC(Application Specific Integrated Circuit)[7]的技術,我們是以

FPGA(Field Programmable Gate Arrays)[8][9]來實現電路。FPGA 技術除了擁有與 ASIC 技術相當的運算速度,更重要的是電路可隨時改變的特點,對於修改電路 僅需些許的時間。

整個系統分為系統端(server)及使用者端(client),之間透過網路進行資料的傳 輸。系統端以 FPGA 來實現,我們以硬體實現用在近似字串比對的 shift-and-or 演算法[10],此演算法由於簡單且具有彈性,是在近似比對技術中較有效率的一 個法則,該硬體具有 High Throughput、Low Latency 以及 Low Area Cost 等優點,

系統運作之後接收使用者端的查詢(query)請求,執行高速 CBMR 比對以後,將有 排名的比對結果傳回使用者端。

為了達到友善的檢索方式及便利的結果檢視,使用者端可輸入簡譜做查詢,

或在模擬的鋼琴鍵盤上彈奏,滑鼠點擊黑白鍵時就會發出對應音符的聲音,也可 直接以 MIDI(Musical Instruments Digital Interface)格式的檔案輸入做查詢,過程中 隨時都可試聽來減少輸入片段發生不正確的機率,而由系統端傳回的結果,也會 依照相似度由高到低排名,並可播放來欣賞。

第四節 論文架構

接下來的章節將依序由第二章說明論文中所用到的理論與技術背景;第三章 將介紹整個音樂檢索系統的架構;第四章為實驗結果及討論;第五章總結本論文 與未來研究方向。

相關文件