系統流程與架構

第三章研究方法

圖 3 - 1 系統流程圖

本系統的設計分為「資料處理」與「資料呈現」兩個階段，圖 3-1 為本系統從資料的處理到呈現給使用者的整體運作流程圖。首先進入「資料處理」

階段，系統後端使用自行撰寫的 XML 處理器（XML Parser）將原始書目資料讀入關聯式資料庫，接著使用索引工具與轉換工具建置索引庫（Index DB）

與三元組儲存庫（Triple Store）；接著進入「資料呈現」階段，當使用者（User）

關鍵字（Keyword）後，將符合的書目紀錄取出（Record Match）；接著將紀錄中的關鍵字送往其他資料集（如 DBpedia）進行二次查詢（Endpoint Query），鏈結資料集使用 SPARQL 語法查詢，非鏈結資料集使用 RDF 包裝器（RDF

Wrapper）完成之；再來將所取得的資料進行整合（Data Integration）並且呈現（Data Display）給使用者。若使用者對於感興趣的關鍵字進行點擊

（Interaction），本系統會將點擊的關鍵字再次送入系統重複執行上述流程。

圖 3 - 2 系統架構圖

圖 3-2 為本系統之系統架構圖，分別以資料層、資料取用整合層、應用層與網路資源等四個部分做說明。

一、資料層：本系統的資料取用來自於兩個資料庫，其一為存放書目資料的資料庫，由於是關聯式資料庫，因此本系統存取該資料庫之前需要轉換為三元組儲存庫；另一個則是經過斷詞過後的索引庫，因為書目紀錄數量龐大，為了要快速取得符合關鍵字的書目紀錄。

二、資料存取整合層：本系統使用鏈結資料集作為額外資料來源，因此需要設定 SPARQL 查詢以及彙整回傳的資訊。

三、應用層：本系統在此層級中提供檢索介面、層面分類檢索與自動建議。

檢索介面負責呈現各個網頁元件的擺置、畫面的呈現方式等；層面分類幫助使用者過濾檢索結果；自動建議可幫助使用者輸入檢索詞彙時自動補上剩餘字串。

四、網路資源：本系統需要透過存在於網路上的各類資料集來給予本系統相關資料呈現給使用者，而各個資料集又彼此相串連成為資料網，使本系統得以提供使用者除了作品本身的額外資訊。

依據上述之系統架構，本系統最終可達成以下功能：

一、使用者使用關鍵字進行檢索，系統回傳之查詢結果可結合 DBpedia 與 LibraryThing 等語意網服務來產生相關作品簡介、作者介紹、套書介紹、電影改編資訊等。

二、本系統具有自動建議以及自動修正功能，故使用者在檢索過程中無需擔心輸入錯誤以及不清楚使用正確主題詞。

三、透過虛擬國際權威檔（Virtual International Authority File，VIAF）輔助，可使用不同語言檢索同一物件實體，使用者無需思考該實體之原始名稱。

四、書目紀錄使用 RDF 方式儲存，提供讀者下載。每一筆紀錄皆擁有靜

態 URI 供使用者方便查找，也可讓開發者再利用。

在文檔中以鏈結資料建置圖書館目錄查詢系統之研究 (頁 44-47)