• 沒有找到結果。

學術圖書館學術資源服務的新模式與實作

N/A
N/A
Protected

Academic year: 2021

Share "學術圖書館學術資源服務的新模式與實作"

Copied!
20
0
0

加載中.... (立即查看全文)

全文

(1)

學術圖書館學術資源服務的新模式與實作

A New Model and Its Implementation of Academic Resources

Services for Academic Libraries

陳光華

* 江玉婷**

Kuang-Hua Chen, Yu-Ting Chiang

摘 要

網際網路目前已成為學術資源查找的重要管道之一,學術圖書館在此間扮演的角色與提 供的支援服務亦需隨之轉變。多數的學術圖書館持續地建立資源主題指引,提供使用者以瀏覽 的方式,使用圖書館員精心挑選的學術資源,少有圖書館提供全文檢索的方式,讓使用者檢索 學術資源。本文從現況之介紹與分析著眼,說明圖書館建立學術資源查詢服務可為使用者帶來 的效益,提出一套圖書館與搜尋引擎業者的新合作模式,不僅可降低圖書館在人員與成本的負 擔,且能夠提供使用者有別於瀏覽的方式,取用各種學術資源。文中並說明臺灣大學圖書館發 展之學術資源網的設計精神、實作方法、介面使用、系統發展的各項考量,以及未來可以改進 的方向。 關鍵字: 學術圖書館、學術資源、搜尋引擎

Abstract

Internet has become one of the important channels for retrieval of academic resources in the recent years. The roles and service models of academic libraries has been changed accordingly. Most academic libraries have been providing subject directory (subject gateway) for users to browse the highly selected academic resources. On the contrary, few academic libraries managed to provide academic resources for user to retrieve. This article proposes a new model which the libraries will cooperate with search engine providers to support the full-text retrieval for academic resources in a low cost. We discuss the design and implementation of “NTU Scholars Gateway” based on the new model. In addition, the functionalities and future development of NTU Scholars Gateway are discussed as well.

Keywords: Academic Library; Academic Resources; Search Engines

* 國立臺灣大學圖書資訊學系副教授

Associate Professor, Department of Library and Information Science, National Taiwan University)

** 國立臺灣大學圖書館館員

(2)

壹、 緒論

對於一般的學術研究者而言,傳統的 研究資源主要依賴圖書、期刊、會議論文 等,而這些大多由圖書館的各式目錄、光碟 資料庫或微縮片等來源取得。然而,在1990 年代末期網際網路的熱潮來臨以後,許多的 知識及資源已經以網頁這種新興媒體的姿態 大量盛行於網際網路。由於這項傳播媒介的 普及,網路資源的重要性與學術性已逐漸彰 顯,其權威性雖未能與傳統印刷式的出版品 並駕其驅,但其豐富、新穎、自由、及時、 發表容易的特性,仍使其在教學與學術研究 領域中,佔有愈來愈重要的地位。 然而,也正因為網際網路已成為自由 且簡易的發表平台,不僅發表的技術門檻 低,也不需經由任何內容的審核,造成現今 網際網路積蓄極為龐大的資訊量,除了包羅 萬象的內容之外,傳播的對象與目的亦十分 分散,如個人網頁、機構網頁、日記、心情 分享、遊記、學習心得、會議論文等,內容 五花八門,且形式各有不同。目前雖有容易 使用的搜尋引擎可以輔助找尋資源,但是找 回的資訊多半動輒成千上萬,雖然查全率可 能很高,但若就檢索所得的前幾頁的回傳內 容來看,其查準率往往明顯不足。使用者礙 於時間及耐性,多半只會瀏覽回傳的前幾頁 資訊,而搜尋引擎對搜尋結果排序的方式, 又大多僅依據資訊的某些特徵(如查詢詞彙 出現的位置、頻率、或廣告收費),因此使 用者往往在短時間內無法精確地找到所需資 訊,抑或可能會受不具學術價值的回傳網頁 誤導,而取得錯誤的資訊。 若以一般使用者的角度來看,若其搜 尋目的只在找尋一般資訊的解答,搜尋引擎 如Google、YAHOO等應已十分足夠,因為 現在網路資源的數量愈來愈多,大多數的搜 尋行為只要瀏覽前幾頁,通常可以找到令人 滿意或至少差強人意的解答。但對於要進行 研究的學者或要撰寫報告或論文的使用者而 言,這些搜尋引擎無法區分網際網路的資源 型態與內容特性,其排序方式也可能受廣告 因素的影響,因此回傳結果中涵蓋所需資訊 的分散度(diversity)就會加大,若需要查 詢某一學術主題中較深入及詳盡的資訊,可 能就必須花費許多功夫逐一檢視,從眾多結 果去蕪存菁。因此,對於需要做較深入學術 研究的使用者來說,資訊的爆炸使他們在找 尋及篩選資訊的過程中,往往或多或少有過 痛苦的或是不知所措的經歷。 綜而言之,一般性的搜尋引擎雖然在 某些場合可以具有大海撈針的神奇能力,但 就支援學術性資源的搜尋行為方面,仍有其 限制,畢竟搜尋引擎是以全自動化的方式進 行資源擷取、索引、計算相關性等步驟,其 表現未必在每一種搜尋行為都一樣優異。因 此,即使許多人認為網際網路的盛行及搜 尋引擎技術的進展,會造成圖書館功能的式 微,然而在一些較為深入的資訊尋求行為的 層次中,特別是學術圖書館,仍有許多可以 發揮的面向,能夠有效地輔助使用者進行找 尋與過濾資訊的工作。由於圖書館具有整理 資訊與組織資訊的專業方法與人才,若能

(3)

擷取目前搜尋引擎技術的優點(快速、廣 泛),將專業知識架構於既有搜尋引擎之 上,為此新興的重要資源媒體提供新的加值 服務,網路資源就不再只是挑戰實體圖書館 存在價值的對手,而是提昇圖書館另一種專 業風貌的助力及推力。 以前述的背景與考量面向為前提,本 文嘗試從分析目前搜尋引擎的優勢與限制切 入,探討圖書館對網際網路資源搜尋行為中 可扮演的角色與提供的服務,以目前國內外 圖書館的學術搜尋應用為例進行分析,說明 吾人如何利用並結合現有搜尋引擎業者與圖 書館的優點,建構學術資源服務的新模式, 並展出適合學術圖書館使用者的搜尋服務, 並以臺灣大學圖書館的學術資源網為例,說 明其發展、功能及未來展望。

貳、 學術網路資源搜尋現況

一、 網際網路上的學術資源 網際網路作為一種資訊載體的興盛與成 熟,早已打破傳統以紙本式資源為主的傳播 型態,這種載體不限時間地點、容易發表創 作、方便取得散佈、具時效性等特性,使得 各式資源全面性地在網際網路上廣泛傳播, 其中當然亦包括具有學術價值的資訊在內, 如下數種類型的網站經常包含眾多的學術資 源。 • 學術、教育單位或權威機構網站。 • 研究計畫網站。 • 學術出版單位網站:如期刊出版商。 • 研究人員的個人網頁。 • 主題論壇或部落格。 這些網站通常富含學術資源且可免費 獲取,的確是學術研究時的重要探訪對象。 學術性的免費網路資源包含許多免費電子期 刊、技術報告、會議論文、視訊、投影片、 教學課程等,都是目前許多快速發展的學術 領域需求量極大的資料。一般而言,吾人可 以將學術網路資源分類如下所示。 • 依學術領域分類:可分為文學、藝術、物 理、數學,等各學術領域。 • 依資源型態分類:會議論文、電子期刊論 文、技術報告、教學資源、學術團體與學 會、研究計畫網站、學術討論群、學術部 落格、百科全書、字辭典等參考工具。 • 依資源格式分類:包括文字、影像、視 訊、音訊等檔案格式。 經由前述的分類方式,已有不少學者 進行相關的研究,以探討學術資源對於學 術研究的影響與助益,以及引用的行為。 Thelwall & Harries(2004)研究發現,較權 威的學者可能會有較多的網站內容產出,但 並未產生較高的影響力。Wilkinson等人則 對於學術網站之間建立的互聯體系進行分 析,歸結出主要產生參考連結的原因,90% 是由學術的相關活動而來,如研究參考相關 資源、指引、教學資料、研究夥伴網頁等 (Wilkinson, et al., 2003)。 二、 學術搜尋行為的轉變 透過搜尋引擎檢索網路學術資源,已 成為學術資源尋求過程中重要的一環,Bell

(4)

2004) 認為,「Google已成為學術圖書館 競爭的主要對象」。諸多有關使用者搜尋行 為的研究顯示,尤其是已經十分適應網際網 路環境的年輕一代,傾向於偏好使用一般搜 尋引擎,而不使用圖書館系統,原因主要如 下所述(Markland, et al., 2005)。 • 查找速度快:許多學生的搜尋行為只是要 快速地獲取答案,不著重深入的資源探 索,因此偏好簡單的關鍵詞檢索,鮮少使 用圖書館的主題式導引。 • 友善的介面:學習圖書館資訊服務系統的 門檻較高,使用者往往不知如何組織複雜 的檢索條件,或選擇查詢標的資料庫。 • 資源可得性(Accessibility):有別於圖書 館的傳統目錄式查詢,透過搜尋引擎或許 可以直接獲取檢索結果的內容。

Lawrence & Miller(2000)的研究報 告顯示,網路上可自由下載的文獻被引用 的機率較大,以Computer Science學術文 獻為例,引用次數多了157%。Bergstrom 2001)依據圖書館統計所做的引用文獻調 查發現,就經濟類期刊而言,圖書館的購置 經費中,有91%用來購置付費期刊,但只有 38%的引用文獻由此產出;而其餘9%的圖書 館經費所購置的其他資源、或是由免費途徑 所獲取的資料,卻能夠造成高達62%的引用 文獻產出。由此可見,讓研究成果透過網路 上的各種途徑,讓全世界的研究者使用,是 增加我國研究成果曝光率的一個重要途徑。

Pew Internet Project(2002)計畫早在 2002年的研究報告即指出,73%的一般使用 者會先從網際網路上查找資料,而只有9% 的使用者使用圖書館的頻率比網際網路高。 Banwell等人在2004年也進行類似的研究, 並指出大專院校學生中約有70%會使用一般 性搜尋引擎,其中45%使用Google,約9%使YAHOO(Banwell, et al., 2004)。 三、 搜尋引擎搜尋學術資源的查準率 要在網際網路的瀚海中查找資源,大 多數的使用者會透過搜尋引擎進行。然而, 搜尋引擎雖然使用便利,不需很高的門檻, 只要提供一個以上的關鍵詞就可以得到動輒 數以萬計的回傳結果,但回傳結果的數量雖 多,其中切合需求的比率(即查準率)卻是 影響檢索品質與效率的關鍵。雖然現行的搜 尋引擎已在其回傳的相關度判斷機制上做了 許多改進,不似以往只從字串比對的成功率 來排序,亦會從其他的面向來判斷,也提供 些許容錯或查詢詞彙擴展機制,但由於以下 因素,學術搜尋行為所獲得的結果查準率仍 不能達到滿意程度。 • 資源具學術性與否,難以利用關鍵詞在檢 索條件中限制。且使用者提出的查詢詞彙 通常十分片段且有限。 • 網際網路資源多樣化,學術性資源並未佔 大多數,因此具學術性的檢索結果並不一 定會排序在前面,降低搜尋引擎在學術搜 尋的查準率表現。 Markland等(2005)曾針對學術性的 Resource Discovery Network(RDN)搜尋服 務以及Google進行學術搜尋行為的實驗分析

(5)

比較,發現若僅使用Google將會遺漏一些 RDN能回傳的重要資源。Brophy & Bawden (2005)的研究則比較網際網路搜尋引擎和 學術圖書館所提供資源對使用者的效能,以 範圍、檢索結果的獨特性、查準率、品質、 以及可得性來比較兩者,發現Google在涵蓋 範圍與資源可得性上勝出,而圖書館資源的 品質仍然比較高。 Gelernter(2003)主張一般性的搜尋引 擎仍有其限制,若有特定需求仍建議求助於 專門的搜尋引擎。因此,使用者需要透過特 定學科導向專門性搜尋引擎來檢索較為專業 的資訊,如收錄現今電腦工程與電腦科學重 要研究資料的CiteSeer,以及美國國家醫學 圖書館的美國國家生技資訊中心(NCBI) 製作的生物醫學相關文獻的書目索引摘要資 料庫PubMed。然而這些搜尋引擎涵蓋的學 科領域有時又過於狹窄,若要搜尋比較一般 性主題的學術資源,則必須分別利用這些系 統進行檢索。因此,Aharoni等人發展一套網 路資源的虛擬搜尋引擎AcadeME(Aharoni, Frank, & Shoham, 2005),可以整合檢索 各領域的專題性資源,Aharoni等人主張 AcadeME與Google的不同在於其搜尋結果的 學術品質。研究結果發現,比較其與Google 進行細部實驗顯示,Google回傳結果比較屬 於指引性的網路資源,其內容不若AcadeME 的深入且比較具有學術性價值。 四、 使用者選擇學術資源的能力 網路資源太多,且分散各地,現今的 使用者不愁沒有資訊,而是擔心資訊的正確 性,如何發展過濾資訊的機制,或建構嚴謹 的資訊資源蒐藏機制,讓使用者可以很容易 取得正確且嚴謹的資訊資源,是目前努力的 目標。 當然,這並不意味著透過搜尋引擎無法 找到有價值的資訊,只是需要較高的判斷能 力及較多的篩選時間。許多研究顯示,學校 圖書館的學生使用者,大多缺乏判斷資訊品 質的能力(Troll, 2001),且由於喜好使用 快速、容易上手的一般性搜尋引擎檢索網路 資源,往往只能找到表層網頁資訊(Surface Web),而無法判其與深層網頁資訊(Deep Web)的差異(Wright, 2004)。

參、 國內外學術資源搜尋服務

國內外的學術資訊服務眾多,本文無意 完整列舉,以下僅列舉數個國內外圖書館建 置的學術資源服務,搜尋引擎業者之學術資 源搜尋服務,以及其他機構之學術資源搜尋 服務,可以對照三者的異同,並檢視目前圖 書館的學術資源服務模式。 一、 圖書館之學術資源服務 W r i g h t ( 2 0 0 4 ) 提 出 學 術 圖 書 館 應 作 為 存 取 及 過 濾 所 有 類 型 資 源 的 門 戶 (Gateway),方能真正地、有效地服務圖 書館的使用者。Aharoni等人則主張學術團 體應發展一套虛擬搜尋引擎,結合數個「主 題搜尋引擎」(specialty search engines)的 檢索結果,提供較切合學術搜尋行為的結

(6)

果。所謂的主題搜尋引擎應該包括以下功能 (Aharoni, Frank, & Shoham, 2005)。 • 具有以主題領域的做類別區分的網路指引 或目錄,可存取特定主題的網站。 • 提供一個meta搜尋介面,使用者可由此檢 索到特定範圍的資源。 目前臺灣各大學院校圖書館大多針對 館藏書目、全文資料庫等進行整合搜尋介面 的開發,較少針對網際網路資源進行篩選及 加值型的服務。Wright(2004)則分析美國 一百多所大學圖書館的網站,歸結其對網 際網路資源指引的輔助方式,主要為以下幾 類。 • 搜尋引擎推薦及其利用方法簡介。

• 網站指引(如KU Libraries: Information Gateway的Web Sites by Subject、鳳凰城大 學的Academic Info):提供主題的學術資 源導引,對每個主題推薦一些具代表性的 網站,並簡介其內容。

• 網路資源查找教學指引(如UTS Library - Internet Search Gateway):在網際網路上 提供文件式的指引,教導使用者如何搜尋 學術資源。 前述的作法,若不是建立主題式指引, 便是簡介如何使用搜尋引擎,或是介紹採用 何種搜尋引擎對於特殊網路資源的檢索特別 地有效,而不是直接提供一種全文檢索式的 服務,直接檢索網路上的學術資源。 1. 國家圖書館華文知識入口網 (http://search.ncl.edu.tw/LISP/hypage. cgi?HYPAGE=home.htm) 該入口網是臺灣目前較具規模及代表性 的學術資源網站(請參考圖一),除了提供 包括臺灣圖書館館藏目錄、國內資訊系統、 國家圖書館資訊系統、出版資訊系統等多個 資料來源的整合查詢之外,收錄了近6000個 網站,提供下列服務。 圖一 國家圖書館華文知識入口網首頁

(7)

(1) 網站指引:將學術資源網站分類呈 現,並對每個網站進行簡要介紹,亦 可依據網站之關鍵詞、網站名稱、內 容描述、建置單位等進行搜尋。 (2) 網站內容搜尋:鍵入關鍵詞可搜尋網 站指引中收錄網站中之網頁全文。 2. SMEALSearch (http://gunther.smeal.psu.edu/) SMEALSearch是由PennState SMEAL College of Business圖書館所提供的服務,主 要的主題內容為企業經營與管理,其搜羅 學校、商業機構、研究單位及政府機關的網 站中的學術文獻、白皮書、報告等,並提供 相關的引文分析。整個系統服務模式類似於 CiteSeer,提供學術文獻的摘要,各種檔案 型式的全文檔,相似學術文獻的檢索,並提 供讀者評鑑與評論文獻的功能。 二、 搜尋引擎業者之學術資源服務 近年來Google、YAHOO等以經營搜尋 引擎為主的公司,也開始注意到了學術搜尋 的重要性,駐足於學術資源檢索系統的開 發。因此除了針對一般性資源提供搜尋之 外,也特別為學術類資源設計搜尋服務,如 向各出版商合作提供期刊論文等學術資源查 詢,不過目前仍未對一般網路資源進行篩選 服務。 1. 臺灣YAHOO學術+ (http://tw.search.yahoo.com/academia) 臺灣YAHOO學術+收錄的內容包括: (1) 全國博碩士論文資訊網 (2) 中文期刊篇目索引影像系統 (3) 學術網路資源(與臺灣大學圖書館合 作提供之學術類相關網頁) (4) 數位典藏聯合目錄 圖三為臺灣YAHOO學術+的首頁,圖上 圖二 SMEALSearch之首頁

(8)

方粗線矩形即為臺灣大學圖書館與YAHOO 合作之學術網路資源檢索,也是本文欲探討 之合作模式,當然臺灣大學圖書館的學術資 源服務,更強調後分類,請見後文說明。 2. Google Scholar (http://scholar.google.com.tw/) Google Scholar與出版商及資料庫廠商 合作,可查詢期刊、論文、資料庫內文。檢 索結果除了一般關鍵詞前後文的摘要之外, 亦提供被引用的資訊,並可以交互查詢,是 其重點特色之一。 但由於版權問題,有些僅能查詢到書目 資訊,使用者並不一定能獲取全文內容。圖 書館可透過OpenURL,提供其使用者存取其 有付費購買資料庫的全文。圖四中粗線矩形 顯示臺灣大學圖書館的館藏與期刊論文資料 庫,可以透過OpenURL,在Google Scholar 檢索而得。 三、 其他機構之學術資源搜尋服務 1. Intute(http://www.intute.ac.uk/) Intute的前身即為Resources Discovery Network(RDN),此網站為英國的七個大 學聯合建置的聯合教育網,將學術資源仔細 地整理並作主題式分類(主要有社會科學、 藝術人文、科學技術、健康與生命科學四大 類),旨在提供有別於一般搜尋引擎的高品 質資訊存取平台。除了資源使用指引、主題 分類目錄及內容搜尋服務之外,也提供使用 者推薦網路資源,請參考圖五。 2. Athenus(http://www.athenus.com/) Athenus針對科學、工程等相關的主題 性網路資源進行索引,另外也收錄相關出版 品、新聞等資源,期能為學術性研究者提供 一個專業且新穎的搜尋入口網站。 圖三 臺灣YAHOO學術+首頁

(9)

3. BPubs.com(http://www.bpubs.com/) 提供有關商業出版品的網際網路資源指 引,目標在協助使用者篩選出他們想要的真 正「有價值內容」,而不是找到一堆個人首 頁等雜訊。 4. CNKI中國知識網(http://dir.cnki.net/) (1) 網站指引:將學術資源網站作樹狀結 構之主題分類呈現。 (2) 網頁搜尋:除了提供全文檢索及重要 欄位檢索(如標題、作者、關鍵詞、 圖四 Google學術搜尋首頁 圖五 Intute首頁

(10)

摘要)之外,針對檢索結果還提供特 性排序(依相關詞、引用次數、發表 時間、作者指數)及主題縮小範圍檢 索 ( 依 文 獻 類 型 、 學 科 分 類 、 相 關 詞)。 C N K I可說中國最重要的知識入口網 站,臺灣也有眾多的使用者,請參考圖六。 綜觀這些網站的內容與功能,會發現部 分網站由於其內部較缺乏學科資訊與圖書館 專業人才,就內容的選取僅能以系統輔助、 並未能十分精確;部分網站雖有學科資訊與 圖書館專業人才主其事,但是對網際網路之 外的資源本體的取得途徑仍十分受限,若欲 拓展領域仍需一些時日,因此其所能提供給 使用者的服務與資源的品質仍顯雜亂。 因此,本研究的目的在整合學術性圖書 館及商業性搜尋引擎的優點,以圖書館專業 知識對網路資源進行篩選,並能讓使用者對 網站內容進行全文檢索。

肆、 學術資源服務的新模式

正如前文所述,基本上圖書館提供的學 術資源服務模式就是瀏覽與檢索,分別以主 題指引與搜尋引擎的面貌為眾人所熟悉。目 前多數的學術圖書館是以主題指引的模式提 供服務;少數以搜尋引擎的模式提供服務, 短期而言,仍受到使用者的青睞。但是隨著 收錄的學術資源不斷地成長,長期下來,囿 於經費與人力資源的限制,使得硬體設備與 環境的投資不足,無法反應資源的成長,致 使最終檢索效率不彰。然而,使用者卻早已 習慣於網際網路上搜尋引擎業者回應的速 度,因此,這種圖書館營運模式的搜尋引擎 終究會失敗,實乃非戰之罪,學術圖書館畢 竟不是營利事業。 思考新的營運模式是希望藉助於以營 利為目的的搜尋引擎業者,業者提供穩定而 長期投資的軟硬體環境,而圖書館提供高品 質的學術網路資源,二者互助合作,共存共 圖六 CNKI中國知識網首頁

(11)

榮。這樣的營運模式可以用圖七表示。 圖書館學有專精的館員篩選高品質的學 術資源,製作成清單,提供給合作的搜尋引 擎業者;搜尋引擎業者負責擷取學術資源, 並製作索引。圖書館與搜尋引擎業者都可以 營運自己的學術資源服務,並各自進行可能 的加值型服務。當這些服務都已經正式運轉 後,對於使用者而言, 當然可以自行選擇圖 書館營運的服務或是搜尋引擎業者提供的服 務。圖書館要吸引使用者,當然必須著重於 加值型服務,而這是搜尋引擎業者比較做不 到的,或基於其他考量因素而不願意提供。

伍、 臺灣大學學術資源網

大學圖書館的中心任務,為支援滿足 師生等資訊需求。然而,隨著時代的進展, 這些資源的承載媒介與呈現型態已愈來愈多 元化。臺灣大學學術資源網於2000年開始策 劃,主要希望在思考如何滿足所有領域學者 的資訊需求時,不能僅著力於期刊論文,而 是應該依據不同學術領域而權衡不同的學術 資源典藏策略(項潔,2005)。 因此圖書館除了購置付費期刊等資源 供使用者參閱使用之外,更應該花費心力在 整合蒐集網路上的免費學術研究資源,讓研 究者的研究產能可有效地發揮。臺灣大學圖 書館基於前述的任務要求,思考以與搜尋引 擎業者合作的新模式,提供高品質的學術研 究資源,讓使用者可以全文檢索的方式, 取得所需的資源。這樣的學術資源服務, 稱之為臺灣大學學術資源網(NTU Scholars Gateway)。以下分述應用第肆節討論的新 模式,逐步建置NTU Scholars Gateway的各 項工作。由後文的說明,當可理解整個營運 新模式也是在實作過程中,而逐步釐清的, 此外,NTU Scholars Gateway強調的加值型 服務,便是檢索結果的後分類。

(12)

一、 收錄學術資源的方法 免費網路學術資源的蒐集方式為混合式 蒐集法,分述如下。 1. 館員建立清單:圖書館之學科館員利用其 本身對於圖書資訊學與特定學門領域的專 業知識,建立符合前述免費學術資源的 網站清單,並依據學術領域與資源型態分 類。 2. 半自動擴展清單:利用前述方法可產生各 學科領域的重要種子網站,再以人工或機 器人代理程式輔助,進一步透過超連結找 出更多符合條件的網站。 3. 使用者推薦清單:使用者可透過網頁或其 他管道建議合適之資源清單。 以上建立之資源清單,均需經由一套審 核機制確認是否適合收錄、連結是否有效、 以及註記的詮釋資料是否正確。整個收錄流 程,請參考圖八。 圖八 學術資源網站收錄流程

(13)

二、 系統實作 1. 開發平台與環境

本系統分為後台網站清單建立與管理系 統,以及前台使用者端檢索與推薦系統等二 大部分。使用JAVA語言開發系統,可以架 設於Windows based及Linux based的作業系 統,以Web瀏覽器為使用者介面,並搭配關 聯式資料庫以儲存資料。 2. 網頁擷取、索引及搜尋技術 讓使用者在網路上進行全文檢索,必須 先派遣網路擷取程式(Spider, Robot)擷取 網站內容,並進行索引,再透過搜尋引擎進 行檢索。系統建置初期曾經嘗試自行撰寫網 路擷取程式,但由於需處理的資料量愈來愈 龐大,需要大量高效能的主機及儲存空間支 援,才能完成需定時執行並在短時間內完成 的內容擷取及索引前置工作,而圖書館本身 因經費與硬體限制,無法獨立有效地完成此 項作業,因此改與搜尋引擎業者YAHOO合 作,由我方定時提供網站搜集整理完成的資 源清單,合作方提供索引及檢索機制。 依據清單產生的索引是放置於合作方 的遠端主機,檢索時亦是透過合作方提供的 API呼叫遠端的搜尋引擎,合作流程請參考 圖九。 3. 搜尋結果後分類 學科館員建立網站清單時,會依據主題 進行學術資源網站的分類,因此,在取得的 檢索結果回傳之後,NTU Scholars Gateway 會對回傳結果進行後分類的運算,將檢索結 果分門別類,除了使結果呈現地更為清晰且 有組織之外,也有助於使用者對檢索結果相 關度的判斷以及篩選檢索結果的速度。 然而,由於分類動作需要等待結果回 傳之後再進行比對,但是透過API,逐頁取 得全部檢索結果耗費的時間過長,實在無法 圖九 圖書館與搜尋引擎業者的合作流程

(14)

被一般使用者接受,因此本系統採用AJAXAsynchronous JavaScript And XML)之技 術,輔助分類結果的呈現,降低使用者等待 頁面載入的時間及不耐感,避免因分類的加 值服務影響系統的整體反應及效能,而減低 使用者的使用意願。

三、 系統功能

NTU Scholars Gateway的首頁如圖十所 示,畫面中央是該服務的簡要說明,上方提 供「歡迎推薦」、「聯絡我們」、以及「回 圖書館首頁」等鏈結,左方則是檢索功能。 1. 前台搜尋 (1) 自由詞檢索:使用者可以輸入一般關 鍵詞或結合布林邏輯進行檢索。 (2) 檢索結果呈現:檢索結果可分頁檢 視,亦可再依網站類別檢視。由於系 統需至遠端查詢,回傳速度會稍受影 響,因此使用分批回傳的技術,讓使 用者不必等所有結果回傳後才能檢視 頁面(請參考圖十一)。 2. 讀者推薦:系統亦接受讀者推薦有價值的 學術網站,這些清單會併入後端的資源審 核流程,若符合收錄標準,則予以收錄 (請參考圖十二)。 3. 後台管理 (1) 建立資源清單 a. 圖書館由專人依據學術資源網站收錄 原則,編輯網站清單鍵入系統。系 統提供重複性檢查以及網址格式檢 查,進行第一步之品質把關工作。 b. 使用者可經由前端推薦頁面推薦網 站。 c. 系統會自動對輸入之網站URL進行 去尾及重複性比對的工作。所謂的 去尾指的是系統提供給合作方之網 圖十 臺灣大學學術資源網檢索介面(首頁)

(15)

URL,僅註記到folder的層次。 例如:http://www.yahoo.com/index. html=>http://www.yahoo.com/ (2) 審核資源清單 依網站候選清單的類別,指派圖書館 學 科 館 員 進 行 審 核 工 作 , 包 括 網 站 內容是否符合收錄原則、所註記之詮 釋資料是否正確等。系統目前註記之 網站詮釋資料包括網站標題、網址、 製作者、網站介紹等欄位(請參考圖 圖十一 臺灣大學學術資源網檢索結果頁面 圖十二 臺灣大學學術資源網讀者推薦頁面

(16)

十三)。 (3) 匯出資源清單 管理者定期可利用系統之查詢功能, 篩選出一段時間內新產生並經過審核 之資料,匯出固定格式(目前為c s v 檔),交由合作方進行網站內容擷取 及索引。

陸、 系統實作方法研討

一、 系統特性 1. 分頁與分類檢視:系統提供分頁與分類檢 視供使用者選擇。分頁檢視模式著重回傳 速度;分類檢視模式利於觀看各主題分類 的結果,幫助判斷相關性。若事先鎖定主 題進行檢索也可以增進查準率。 2. 與搜尋引擎業者合作模式:如文中所提, 圖書館欲獨立完成學術資源網平台會遇到 一些推行與技術上的困難。因此本系統首 創與業界合作的模式,期能利用各自的長 處,也就是,圖書館提供對網路資源篩選 的專業知識,業者提供技術及空間支援, 以最有效率的方式、最低的成本,達成高 品質的服務。 二、 困難與挑戰 1. 圖書館缺乏建立大規模搜尋機制的能力 (1) 受限於圖書館的員額編制,缺乏軟體 程式開發人才。 (2) 缺乏硬體設備及專業的搜尋引擎開發 技術,無法自行建立大規模的搜尋系 統。 2. 與搜尋引擎業者合作的困難 (1) 回應速度:由於我方與合作方是透過 網路進行遠端API呼叫及結果回傳, 回應速度無法由我方完全控制,也可 能受到網路傳輸速度的影響。在進行 圖十三 後端資源審核頁面

(17)

效能測試的時候,由於涉及的層面複 雜 , 常 無 法 立 即 判 別 影 響 的 真 正 原 因。 (2) 回應筆數:目前YAHOO對每個查詢 提供的回傳筆數最多為1000筆。雖然 對一般使用行為而言,此數量應已足 夠,但就查全率的角度及使用者的感 受而言,仍為系統不盡完善的部分。 另外,由於搜尋引擎處理資料量十分 龐 大 , 對 於 檢 索 結 果 筆 數 多 為 預 估 值,而此點在限制1000筆回傳的情形 下 , 回 傳 總 筆 數 的 誤 差 就 會 更 加 顯 著,隨著分頁的切換,回傳筆數會有 不同的預估值,此點亦屬目前未能解 決的問題。 (3) 結果再整理及加值之困難:如分類、 排序等,需要花費一段時間等到結果 回傳之後再執行運算,因此容易拖慢 系統效能。目前本系統採用AJAX技 術,期能讓使用者對此作業的效能感 受影響度減到最低。 三、 系統尚待改進之處 1. 主題分類展現及結構 (1) 目前只區分為八大類,未來希望能以 樹狀結構呈現大類及細目。 (2) 目前一個網站只能歸屬於一類,未來 希望允許對應到多個類別。 (3) 增加各主題網站列表的瀏覽機制。 2. 檢索結果展現及加值 (1) 增加檢索結果排序的方式:目前是依 搜尋引擎回傳之相關度排序,未來希 望能增加依日期、依連結頻率排序等 功能。 (2) 除了呈現結果的分類之外,還可增加 被連結次數等資訊,提供使用者判別 檢索結果的品質。 3. 收錄範圍多元化 雖然本系統建立的主要目標在整理並 組織網際網路的學術資源,但整合利用與查 詢各種不同的資源型態是現今的趨勢,也是 圖書館的應發揮的專業價值。目前如Google Scholar、YAHOO學術搜尋等,都在積極整 合資料庫、電子期刊等學術內容,期能在學 術搜尋的領域佔一席之地,圖書館原本即具 有存取各類學術資源的優勢,未來應致力於 不分資源類型,提供單一檢索介面之整合服 務。 4. 合作對象的不同嘗試 本系統初期雖與YAHOO合作,但著重 系統的建置方法(methodology),其所建立 的運行架構,並非受限於固定的合作單位。 圖書館端前後台系統的開發方式,也植基於 搜尋引擎可抽換的基礎上。因此,未來的努 力方向與發展目標,除了致力於系統效能的 改善,更應該持續觀察市場中符合需求、可 以高度支援本系統的搜尋引擎,尋求更完善 的合作模式。

柒、 結語與展望

學術圖書館對學術資源的引介、選擇、

(18)

過濾、使用、評估,是責無旁貸的。網路資 源類型廣泛、來源多樣化、內容豐富但卻未 經品質控制,對於有特定目的的學術搜尋來 說,利用一般搜尋引擎進行檢索往往會有過 高查全率與過低查準率的現象,使用者要判 斷結果是否相關,的確需要花費許多精力, 又不一定可以做很精準正確的判斷。因此協 助篩選學術網路資源機制的建立,可說是十 分迫切需要的。觀察目前國內外此類似機制 的發展及作法仍未很成熟,圖書館目前提供 的網際網路資源的服務,大多仍停留在學術 資源的指引與學術網站的推廣為主,並未與 既有的目錄及搜尋服務做十分良好的整合。 有鑑於此,臺灣大學圖書館與搜尋引擎 業者合作,推出的NTU Scholars Gateway, 希望能以圖書館專業的角色,扮演學術網路 資源指引的舵手以及守門員,協助篩選網際 網路學術資源,讓使用者能在圖書館的把關 之下,以最有效率的方式查找高品質的學術 資源。雖然系統仍處於初步發展階段,有其 未臻完善之處,但系統建置的方式與精神, 確實可以做為未來的擴展及加值的基礎。 在網際網路的世代,相較於有著傳統 介面、複雜功能、不易上手的圖書館資訊服 務,簡單易用的搜尋引擎已然成為查找資 源的重要選擇之一,因此許多人認為圖書 館可能因此而式微。然而,二者有其不同的 價值所在,圖書館所具有的優勢也一直未被 取代。本文提出圖書館與搜尋引擎業者的合 作模式,足資證明二者之間可以是合作互惠 的,並期許圖書館能取他人之長、補己之 短,建立更好的資源整合服務。

致謝

感謝NTU Scholars Gateway計畫團隊成 員:項潔館長、張素娟主任、郭美玲編審、 何庭輝、高巧倫、洪筱盈、何浩洋等人的 貢獻,以及臺灣大學圖書館學科館員:林 鳳儀、劉雅姿、葉欣怡、姚建中、黃麗文、 黃文琪、劉應琳、林郁婕、蔣禮芸、廖敬華 同仁的協助。感謝二位匿名審查者的具體建 議。

參考書目

項潔(2005)。建置「臺灣學術研究資源中 心」運作架構、機制與執行策略計畫期 末報告。教育部委託之專題研究成果報 告,未出版。

Aharoni, Y., Frank, A. J. & Shoham, S. (2005). Finding information on the World Wide Web: A specialty meta-search engine for the academic community. First Monday,

10(12). Retrieved June 4, 2007, from

http://www.firstmonday.org/ issues/ issue10_12/ aharoni/index.html.

Banwell, L. et al. (2004). The JISC user behaviour monitoring and evaluation framework, Journal of Documentation,

60(3), 302-320.

Bell, S. (2004). The infodiet: how libraries can offer an appetizing alternative to Google.

(19)

50(24), B15.

Bergstrom, T. C. (2001). Free labor for costly journals? Journal of Economic

Perspectives, 15(4). Retrieved June 4,

2007, from http://www.econ.ucsb.edu/ ~tedb/Journals/jeprevised.pdf

Brophy, J. & Bawden, D. (2005). Is Google enough? Comparison of an internet search engine with academic library resources.

Aslib Proceedings, 57(6), 498-512.

Friend, F. (2006). Google Scholar: Potentially Good for Users of Academic Information.

Journal of Electronic Publishing, 9(1).

Retrieved June 4, 2007, from http://hdl. handle.net/2027/spo.3336451.0009.105 Gelernter, J. (2003). At the limits of Google:

Specialized search engines. Searcher,

11(1), 26-31

Lawrence, H. & Miller, W (2000). Academic Research on the Internet: Options for Scholars and Libraries, Haworth Information Press, New York, NY.

Markland, M. (2005). Does the student’s love of the search engine mean that high quality online academic resources are being missed? Performance Measurement

and Metrics: The international journal for library and information services, 6(1),

19-31.

Pew Internet Project (2002). Pew Internet

and American Life, The Internet Goes to

College: How Students Are Living in the Future with Today’s Technology. Sept.

15, 2002. Retrieved June 4, 2007, from http://www.perinternet.org/reports/reports. asp?Report=71&Section=ReportLevel1& Field=Level1ID&ID=312.

Thelwall, M. & Harries, G. (2004). Do the Web sites of higher rated scholars have significantly more online impact? Journal

of the American Society for Information Science and Technology, 55(2), 149-159.

Troll, D. (2001). How and Why Are Libraries Changing? Digital Library Federation, Jan. 7, 2001. Retrieved June 4, 2007, from http://www.diglib.org/use/whitepaper.htm. Vaughan, L. & Thelwall, M. (2002). Scholarly

use of the Web: What are the key inducers of links to journal Web sites? Journal

of the American Society for Information Science and Technology, 54(1), 29-38.

White, B. (2006). Examining the claims of Google Scholar as a serious information source. 50(1), 11-24.

Wilkinson, D., Harries, G., Thelwall, M., & Price, L. (2003). Motivations for academic web site interlinking: evidence for the Web as a novel source of information on informal scholarly communication. Journal

of information Science, 29(1), 49-56.

Wisdom, J. R., et al. (2006). An assessment of Web Accessibility Knowledge and Needs

(20)

at Oregon Community. College Review,

33(34), 19-37.

Wright, C. A. (2004). The Academic Library as

a Gateway to the Internet: AnAnalysis of the Extent and Nature of Search. College

& Research Libraries, 65(4), 276-286.

參考文獻

相關文件

Asia, and the History of Philosophy: Racism in the Formation of the Philosophical Canon, 1780–1830, New York: State University of New York Press, 2013) 等人 的 研 究。Garfield

First, this research integrates academic literature from management information systems, strategic management, knowledge management, and organizational theories, based on

(d) While essential learning is provided in the core subjects of Chinese Language, English Language, Mathematics and Liberal Studies, a wide spectrum of elective subjects and COS

1.5 In addition, EMB organised a total of 58 forums and briefings (45 on COS and 13 on special education) to explain the proposals in detail and to collect feedback from

SSPA Secondary School Places Allocation (中學學位分配/中一派位機制) 3+3+4 The New Academic Structure for Senior Secondary Education and Higher

(網站主頁 > 課程發展 > 學習領域 > 藝術教育 > 教學資源 >視覺藝術

美國麻省理工學院Peter Senge教授,於1990年 出版「第五項修練:學習型組織的藝術和實 務」(The Fifth Discipline: The Art and. Practice

  此外, 圖書館亦陸續引進英美文學、外語學習與研究等 相關資料庫,如 19 世紀以前出版的經典文學名著 Literature Online, Early English Books Online 與 Naxos