• 沒有找到結果。

第二章、 文獻探討

第一節 整合查詢的涵義

一、整合查詢的定義

整 合 查 詢 也 稱 為 integrated searching 、 simultaneous searching 、 cross-database searching、parallel searching、broadcast searching 及 federated searching(NISO, 2003),指的 是使用者分送出一個查詢到許多的資訊資源的過程,使用者的查詢廣送到每個資源,並 把結果回傳給使用者。這些資源在許多方面可能是異質性的,包含它們的位置、提供的 資訊格式、取得的技術、內含的資料格式。上述名詞反應出異質資料庫整合查詢的概念,

integrated searching 主要是指涉及搜尋多種資源的功能;simultaneous searching 強調同步 檢索多種資源;cross-database searching 強調跨越不同的檢索平台;parallel searching 強調 同時檢索的處理程度;broadcast searching 從將檢索指令傳輸至不同資訊來源解釋整合查 詢的概念;federated searching 強調檢索不同資訊來源的整合程度;雖從不同的角度強調 經由單一介面,以單一查詢同時檢索不同資源平台所能夠提供的資源,但是各種名詞強 調的面向所顯示的功能都是目前異質資料庫整合查詢所需具備的功能(羅思嘉,2006)。

維基百科(Wikipedia)對整合查詢的解釋為同時檢索各種不同的線上資料庫或是網站 資源,並且可作為入口網站或是整合查詢引擎,是自動化圖書館與資訊檢索系統的一項 新特色。整合查詢正逐漸檢索許多線上資料庫及其他知名的深度網站(deep Web),傳統的 搜尋引擎,如 Google,只有檢索那些已被爬蟲程式(crawler)索引化的資源,而以許多文 獻資料所構成的深度網站,因為網路爬蟲程式技術的限制,並未對一般的網站搜尋引擎 開放檢索。整合查詢解決了這個問題,使這些深度網站的文獻可被檢索外,亦對不同的 深度網站資料來源提供單一檢索介面,因此減少未具備個別檢索介面知識的使用者的負 擔(Wikipedia, 2010)。

Luther (2003)認為整合查詢並不是個新觀念,在 1970 年代後 Dialog 與 SilverPlatter 即以單一檢索在跨書目資料庫中進行同步的檢索,目前的整合查詢引擎可合併及去除重 複結果,還有依不同網路檢索引擎的結果排序,如Ask Jeeves、FAST 與 Overture 等皆是 具有整合查詢的基本觀念。整合查詢可視為是數十年前一般使用者介面研究的延伸,它 匯集了資訊的多種管道成單一的檢索點,並結合了電子期刊、資料庫、電子館藏,其他 數位典藏機構及網路,整合查詢減少執行檢索的時間,並且以一致化的方式顯示檢索結 果(Sadeh, 2001)。

Luther (2003)提出下列幾點整合查詢的精神:

1. 如同 Google 一般,提供簡單且容易理解的「一站購足」(One-Stop Shopping)之整 合查詢服務;

2. 使用者不需熟習各種資料庫介面及各式查詢方法,亦不需館員的教導,即可獨立操 作並檢索;

3. 從分散的資源管理系統中檢索出的結果可以整合於單一查詢介面之中;

4. 動態地去除重複的檢索結果,為真正達到不同系統之間的互通性,提供「一站購足」

(One-Stop Shopping)之整合查詢服務,單一查詢介面即顯得格外重要。

二、整合查詢的過程

整合查詢不只是具備有強調檢索多種資料庫的意義,在整合查詢中也有其他複雜的 運作過程,先轉換一個查詢,以適當的語法傳送至不同的資料庫群組,合併來自各資料 庫回傳的結果後,以簡潔且一致化的格式呈現之,並且允許圖書館使用者以不同的標準 或分類方式合併結果(Jacso, 2004)。整合查詢將電子資源匯集在一處,透過單一閘道或是 入口網站整合各種購置的電子資源、數位典藏及網路,以一致化的格式呈現檢索結果,

一方面減少使用者及館員在檢索資源所花費的時間;另一方面,使用者及館員因而可選 擇特定資料庫以繼續進行更深入的檢索,或是可選擇回到原資料庫介面持續檢索其他資 源(Craven, 2007)。在更複雜的形式中,整合查詢引擎可能建立一個虛擬的資料庫綱要 (schema)合併所有可能的資料庫,與各資料庫不同的查詢語言比對原始查詢,並只查詢那 些可回傳高度相似的檢索結果的資料庫,並且組合其檢索結果為一份合併清單(Linden, 2007)。

整合查詢即是利用單一檢索點,在各種不同通訊協定的異質性電子資料庫中執行同 步檢索的一種軟體應用。其運作過程為:

1. 整合查詢系統使用圖書館與特定資訊資源的知識資料庫(knowledge database),如各資 料庫的資料結構與格式、存取協定、查詢語法、索引、合法取用的URL 與授權等,

將使用者的查詢轉譯為資料庫可以辨識的查詢語言(query);

2. 以適當的語法傳送轉譯好的查詢到許多不同的資料庫或是其他網站資源,此時整合 查詢系統必須使用來自其知識資料庫的通訊協定,直接檢索該資料庫,以便於回傳 結果;

3. 同步地從所有可檢索的資料庫取回檢索結果,對之進行合併或去除重複的動作,並 以相關性或是類別群組呈現來自各資料庫的結果,或是合併成結果清單。整合查詢 系統提供一個自動地或是由使用者決定的方法排序合併過的檢索結果,這和現有的 爬蟲式檢索引擎相較之下,整合查詢系統的程序具有特殊的優勢,如整合查詢處理 增加的流量,不須更換任何的規格,也不會對擁有個別資訊來源的單位造成負擔,

並且可將結果格式化成一個標準的內部格式,以供更進一步的應用。

上述三個步驟是整合查詢系統的基本功能,除了檢索功能外,整合查詢系統一般還 提供其他服務,包含認證、個人化功能、輸出結果到書目管理軟體(EndNote 或是 RefWorks),還有列印、下載、或是 email 結果等,都是所有整合查詢系統的共同功能(Jacso, 2004 ; Elliott, 2004) 。

三、整合查詢引擎架構

整合查詢系統以一個集中化網站提供使用者查詢介面,在此網站上也可處理資源呈 現、資源排行及呈現結果。當送出特定查詢到資料庫執行檢索時,不同資料庫的檢索引 擎將決定哪些資料當作結果回傳給這查詢,因為資料庫的整合查詢引擎會影響整合查詢 系統品質的取得性、精確性、一致性及分類演算法,還有獨特或非標準化行為等方面,

因此檢索結果在某些方面是受限於資料庫檢索引擎的品質。

整合查詢在應用上就是以整合查詢引擎(metasearch engine)搜尋資料,然而這對現 有很多未索引化的文件資料來說並非是最好的解決方式,這些文件資料存在於各深度網 站或是不易尋見的網站上,而且許多的資訊來源尚未以電子格式儲存,所以無法取得之。

當檢索辭彙或是資料庫的資料模式不一致時,整合查詢系統就必須將使用者查詢轉譯到 每個外部的資料庫,這可能需要簡易的資料-元素轉譯(data-element translation) 或是語意 翻譯(semantic translation),成為資料庫可以理解的語法,如圖 1(Wikipedia, 2010)。

圖1 整合查詢引擎架構

圖片來源:http://en.wikipedia.org/wiki/File:Federated-search-en.svg by Jakob Voss

雖然整合查詢並非是個新觀念,但技術上仍需廠商持續地改善功能、增加系統升級 的能力,對圖書館來說,整合查詢是從 broadcast search 逐步發展而成的,同時可透過 Z39.50 協定來檢索圖書館的 OPAC、資料庫、網路、或是任一授權取用的電子資源。然 而系統廠商並不樂於將整合查詢視為整合查詢引擎,因為這會使人連想到如 Google、

AlltheWeb 及 Alta Vista 般的資料庫,為了行銷目的,這些系統廠商將其檢索功能作差異 化,令人感覺具有比 Dogpile、Vivisimo 及 Metacrawler 更好的功能。雖然 NISO(U. S.

National Information Standard Organization)與許多圖書館聲明整合查詢系統具備整合查詢 (metasearching)的功能,不同於網路上一般大眾使用的整合查詢引擎,因為網路的整合查 詢引擎係透過匯集開放式網站上的多種網路檢索引擎來執行檢索,包括多媒體來源在 內;而整合查詢引擎檢索大部份集中在原文的資訊資源,以及那些被網站導向的整合查 詢引擎忽視的優質內容的電子資源。另外,網站的查詢引擎提供免費檢索服務,而整合 查詢系統是須付費的商業軟體,費用之多寡視使用人數、設計及功能性而定(Fryer, 2004)。

整合查詢可以建立一個使圖書館成為使用者覺得很具吸引力的一站購足的入口網站 (Luther, 2003)。一站購足是圖書館服務的目標與目的,因為圖書館本身可說是以一站購 足的工具建置而成的,各種不同的資源皆匯集在此,令使用者便於檢索及擷取(Webster, 2004)。現今大部分進行研究的使用者必須處理散置於廣泛範圍的資訊資源,而整合查詢 系統呈現的檢索結果,基本上是一個書目資料或是有關資料描述的其他形式的詮釋資 料,從使用者的觀點來看,這份書目資料只能視為取得資料的方法之一,使用者不想受 到技術性問題的干擾,比如須尋找資料的格式與取用所需的軟體,如 Adobe Acrobat Reader、Microsoft Word、PowerPoint 或 MP3 等,為了提供給使用者對廣泛範圍資料作更 方便的取用,圖書館入口網站在無縫介面(seamless interface)下,必須整合前述之多種軟 體,用以呈現檢索結果的資訊格式,如有關資料描述的詮釋資料、錄音資料的書目記錄,

讓使用者不需擔心如何找到真正所需的資訊資源及如何檢視之(Sadeh, 2001)。

NISO Metasearch Initiative 整合圖書館的系統廠商、匯集者(aggregators)及出版商對整 合查詢系統的互通性提出幾點共識(NISO, 2007):

5. 必須是與 Project Counter、ARL E-Metrics 及 ICOLC 這些電子資源使用統計相關標準 共同決定如何處理整合查詢系統的使用統計數據。

為只有內容供應商才擁有完整的文章資料及索引,而整合查詢系統沒有這些資料,

只有引用資料以供使用者執行檢索。

4. 整合查詢系統是個軟體:整合查詢系統可以算是個軟體,但最好視為一項服務,整 合查詢系統檢索那些每年更新及改變數次的資料庫,這表示系統幾乎每天更新! 購

4. 整合查詢系統是個軟體:整合查詢系統可以算是個軟體,但最好視為一項服務,整 合查詢系統檢索那些每年更新及改變數次的資料庫,這表示系統幾乎每天更新! 購