• 沒有找到結果。

第三章 研究方法

第三節 系統流程與架構

圖 3 - 1 系統流程圖

本系統的設計分為「資料處理」與「資料呈現」兩個階段,圖 3-1 為本 系統從資料的處理到呈現給使用者的整體運作流程圖。首先進入「資料處理」

階段,系統後端使用自行撰寫的 XML 處理器(XML Parser)將原始書目資 料讀入關聯式資料庫,接著使用索引工具與轉換工具建置索引庫(Index DB)

與三元組儲存庫(Triple Store);接著進入「資料呈現」階段,當使用者(User)

關鍵字(Keyword)後,將符合的書目紀錄取出(Record Match);接著將紀 錄中的關鍵字送往其他資料集(如 DBpedia)進行二次查詢(Endpoint Query), 鏈結資料集使用 SPARQL 語法查詢,非鏈結資料集使用 RDF 包裝器(RDF

36

Wrapper)完成之;再來將所取得的資料進行整合(Data Integration)並且呈 現(Data Display)給使用者。若使用者對於感興趣的關鍵字進行點擊

(Interaction),本系統會將點擊的關鍵字再次送入系統重複執行上述流程。

圖 3 - 2 系統架構圖

圖 3-2 為本系統之系統架構圖,分別以資料層、資料取用整合層、應用 層與網路資源等四個部分做說明。

一、資料層:本系統的資料取用來自於兩個資料庫,其一為存放書目資料 的資料庫,由於是關聯式資料庫,因此本系統存取該資料庫之前需要 轉換為三元組儲存庫;另一個則是經過斷詞過後的索引庫,因為書目 紀錄數量龐大,為了要快速取得符合關鍵字的書目紀錄。

37

二、資料存取整合層:本系統使用鏈結資料集作為額外資料來源,因此需 要設定 SPARQL 查詢以及彙整回傳的資訊。

三、應用層:本系統在此層級中提供檢索介面、層面分類檢索與自動建議。

檢索介面負責呈現各個網頁元件的擺置、畫面的呈現方式等;層面分 類幫助使用者過濾檢索結果;自動建議可幫助使用者輸入檢索詞彙時 自動補上剩餘字串。

四、網路資源:本系統需要透過存在於網路上的各類資料集來給予本系統 相關資料呈現給使用者,而各個資料集又彼此相串連成為資料網,使 本系統得以提供使用者除了作品本身的額外資訊。

依據上述之系統架構,本系統最終可達成以下功能:

一、使用者使用關鍵字進行檢索,系統回傳之查詢結果可結合 DBpedia 與 LibraryThing 等語意網服務來產生相關作品簡介、作者介紹、套書介 紹、電影改編資訊等。

二、本系統具有自動建議以及自動修正功能,故使用者在檢索過程中無需 擔心輸入錯誤以及不清楚使用正確主題詞。

三、透過虛擬國際權威檔(Virtual International Authority File,VIAF)輔 助,可使用不同語言檢索同一物件實體,使用者無需思考該實體之原 始名稱。

四、書目紀錄使用 RDF 方式儲存,提供讀者下載。每一筆紀錄皆擁有靜

38

態 URI 供使用者方便查找,也可讓開發者再利用。

相關文件