第二章 文獻探討
第五節 學者全文檢索需求
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
51
第五節 學者全文檢索需求
隨著科技的演變,數位時代已是無法避免的過程。傳統使用紙本資源的模式,
受到數位時代的影響,慢慢被電子資源取代,影響的不只有學者研究的習慣,圖 書館及各機構發展的方向,也朝著虛擬館藏的目標邁進。資源形式的轉變,對學 者的研究影響具衝擊性,尤其是人文學者,在研究資源使用上人文學者偏好紙本 資源,在數位時代電子資源充斥的環境下,勢必造成學者研究方法的轉變(Sinn、
Soares,2014;Kachaluba、Brady、Critten,2014)。隨著技術發展的純熟,全文 資料庫的建置變得可行,以全文資料庫為例,說明數位資源對學術研究影響的變 化,及人文學者對數位資源的看法。
本節根據數位資源使用上帶給學者的影響,說明人文學者對數位資源使用上 對研究所帶來的變化,及對於新興形式資源所產生的疑慮,並以古籍全文資料庫 為例,延伸出學者對數位全文檢索資源的期望。
壹、 數位資源影響
學者認為數位資源具有價值性,除了能提供資源進行檢索使用外,也能協助 進行跨領域的研究比對,更重要的是,能減少查找資料所耗費的時間及成本。數 位資源的使用,對學者查找資料上幫助很大,尤其是當原件因保存不當,造成毀 損不存在時,數位資源的使用被視為是閱讀的唯一手段,這也是學者無法完全否 認數位資源的原因所在(吳明德、黃文琪、陳世娟,2006;Sinn、Soares,2014)。
以下針對使用數位資源帶來的影響進行分述說明:
一、 資源搜尋的便利
雖然學者普遍偏好使用紙本資源,但數位資源的出現,改變了學者的研究模 式,善用網路資源數量龐大的特性,能協助學者進行大規模搜尋。除了能搜尋資 料外,也能協助判斷資料價值,某些學者進行翻閱查找時,容易忽略資料的價值 性,藉由機構典藏的方式,使學者重新認識資料內容,發掘出潛在的價值性(Sinn、
Soares,2014)。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
52
Sinn 與 Soares(2014)發現歷史學者在搜尋數位資源時,會將認為具潛在價 值的資源先行儲存,即使非目前進行的研究主題,仍可視為日後研究的參考。研 究顯示,藝術史學者在搜尋研究資源時,會先行使用館藏目錄進行資料篩選,各 典藏機構及博物館會將機構珍藏文物數位影像化,放置在網路上供使用者館藏檢 索瀏覽。數位資源的好處,在於不管身在何處,皆可透過上網搜尋的方式,有效 查找到所需的資源(Rose,2002)。
二、 協助跨領域的比較
資料庫能整合數量龐大的數位資源,提供跨領域的資源比對。以文學著作為 例,部份著作尤其是詩歌體裁,往往會引用原典句子,可觀察出的史料記錄及哲 學概念,需進行跨領域解讀,才能完全整握內容表達的含義。不僅如此,還能提 供縱向與橫向的資料比對,透過不同年代的比對,瞭解時空變遷下發展的過程;
透過不同領域的比對,瞭解跨領域間的相互影響性(羅鳳珠,2004)。
三、 減少時間及經費的耗費
人文學者經常收集資料的地點,分別為圖書館及檔案館,將圖書館視為實驗 室、紙本資源視為實驗器材,不難想像人文學者依賴圖書館的程度。由於人文學 研究涉及多層面向,所需資料往往分散於不同館中,藉由各機構建置的線上公用 目錄,提供學者進行館藏資源檢索,協助瞭解所需資源處在何處機構中(Rose,
2002;Kachaluba、Brady、Critten,2014)。
學者認為數位資源具有價值性,使用數位資源可直接進行線上檢索,不受限 於地點空間,能節省往來機構所耗費的時間。以全文資料庫為例,全文資料庫有 輔助搜尋的功能,透過關鍵字的檢索,能將不同文本古籍的詞彙整合顯示。跨文 本的比對,能降低古籍翻閱造成的損害,也能節省翻閱大量古籍所耗費的時間(吳 明德、黃文琪、陳世娟,2006;Sinn、Soares,2014;Kachaluba、Brady、Critten,
2014)。
數位資源帶給學者研究進行上很大的轉變,雖然多數的改變帶來了許多的便 利,但對於數位資源的使用仍有許多隱憂。人文學研究著重分析批判的特性,由
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
53
於這項特性,加深了對於使用數位資源的疑慮。下節針對學者使用數位資源所產 生的疑慮,進行分述說明。
貳、 數位資源使用疑慮
人文學者不依賴使用數位資源,除了使用方法上有所限制,最大問題在於資 源的數量。由於現今社會普遍不重視人文學科,使得收錄人文學相關的資料庫,
相比其他學科領域還來得稀少,加上資料庫強調收錄新穎資料的特性,與人文學 偏好回溯性資料的特性不合。雖然,人文學者對數位資源感到不信任,但並非代 表學者排斥使用,善用目錄資源的情況下,人文學者會經常接觸使用,認為數位 資源具有使用價值(鄭麗敏,1992;Levine-Clark,2007;Kachaluba、Brady、
Critten,2014)。
科技發展的趨勢下,人文學者無法避免在數位環境下從事研究。中研院史語 所前所長傅斯年先生曾提及影響後世深遠的思維:「學者在從事研究時,要接觸 研究材料、擴張研材料及善用能擴充研究的新工具,研究才會進步。」數位資源 對於人文學研究是新工具,雖然學者對數位資源感到不信任,但不同工具的使用,
能協助發掘新的問題,學者能藉機獲得傳統研究無法接觸到的問題。從這角度思 考,人文學者不應排斥數位資源的使用(中央研究院歷史語言研究所籌備處,1928;
項潔,2014)。
對於數位資源的疑慮,包括對資料的內容及資料庫的介面。對資料內容的疑 慮,包含影像解析度、內容多樣性等;對資料庫介面的疑慮,包含介面整合、影 像編目、個別影像混淆等(Sinn、Soares,2014)。以古籍全文資料庫為例,全文 資料庫不同於書目資料庫,能直接針對內容全文進行檢索,透過檢索結果方便查 找所需資料。以下針對學者使用全文資料庫產生的疑慮進行分述說明:
一、 內容正確性
人文學者使用數位資源上,偏好學術機構提供的資源,對學者而言,機構提 供的資源較具權威性。網路資源雖能協助檢索查找,但搜尋引擎的檢索結果過於
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
54
雜亂,多數資料被視為無用資源(Rose,2002)。典藏機構提供的數位資源,有 專業人員協助校對,內容的正確性較有保障,使得資源使用上較受學者青睞。
吳明德、黃文琪與陳世娟(2006)針對人文學者使用全文資料庫的情況進行 訪談,研究發現,使用全文資料庫的目的,包含研究及教學使用。研究透過檢索 人物或詞彙於不同古籍出現的頻率,瞭解詞彙的脈絡性;教學透過檢索,確認典 故的出處,當進行教材編制時忘記原典出處,可透過全文資料庫的檢索協助查 找。
兩種使用目的,均依賴內容的正確性。研究發現,人文學者會對資料庫的內 容感到質疑,質疑因素包含懷疑內容是否有錯字、漏字或標點位置著錄錯誤等情 形,會影響文獻的檢索結果。內容錯誤,包含古籍的錯誤或數位轉製產生的錯誤,
使用不同古籍版本,會因編撰者的取捨、修改,容易造成內容上的錯誤;數位轉 製時,容易因文字或編排的錯誤,產生字句不順的情形,造成研究的混淆。也因 此,學者在使用全文資料庫上,會對內容感到懷疑(吳明德、黃文琪、陳世娟,
2006;廖益賢,2012)。
為解決內容正確性的問題,除了古籍版本的提供需有公信力外,機構的校正 也要做到確實。古籍用詞與現在用詞在使用上有所差異,部份古體字現今沒使用,
因此沒合適的字碼輔助顯示,造成內容顯示不全產生漏字等情形。對學者而言,
全文內容的錯誤或缺漏,皆影響研究的結果,造成對全文資料庫使用的疑慮。
二、 古籍版本使用
古籍版本的類型,指通行雕版印刷後所產出的古籍,其不同產出形式的姿態,
包含刻本、活字本、抄本及批校本等。版本不等同於善本,依照黃永年(2005)
的分類,將善本的涵義分成校勘性及文物性。校勘性,指任何經校勘過的古籍皆 可稱作善本;文物性,指任何成為文物的古籍皆可稱作善本。不管何種涵義,皆 說明善本為古籍版本的一部份。
對於古籍研究來說,版本的選擇是必要的,經典古籍經後人傳抄、註解、批 校,產生數十甚至數百種不同的版本,每種版本因編撰者的差異,產生不同的內
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
55
容樣貌。全文資料庫在版本挑選上,應採用學界公認較佳的版本,作為資料庫的
「底本」,提供學者使用的依據。不同版本記載的內容差異,必有正確及錯誤之 分,人文學者憑著探索真實的求知慾,將不同古籍版本相互比對,找出最貼近事 實的內容(陳宏天,1992,頁 1-16;廖益賢,2012)。
好版本的選擇,能降低研究解讀錯誤的機率,也因此,人文學者研究解讀的 過程,攸關於資料庫使用的版本。版本的好壞,由學術人員對版本的解讀而評估,
學者除了對使用版本的好壞有所顧慮,典藏版本的數量也是擔憂的部份。人文學 者除了希望古籍版本具公信力外,也期望能典藏多種版本古籍,提供相同古籍的 版本比對。
三、 資料庫檢索模式
研究發現,使用線上公用目錄進行檢索時,若系統索引詞與輸入的檢索詞差 異過大,則無法顯示有用的檢索結果(,1998)。使用古籍全文資料庫進行檢索 時,檢索詞彙的輸入若與稱呼有落差,也會影響顯示的結果。
當搜尋「四季」相關資訊時,詞彙的直接輸入可能無法產生有效的結果。針 對「四季」概念,分別輸入「春」、「夏」、「秋」、「冬」等不同詞彙,擴大詞彙的
當搜尋「四季」相關資訊時,詞彙的直接輸入可能無法產生有效的結果。針 對「四季」概念,分別輸入「春」、「夏」、「秋」、「冬」等不同詞彙,擴大詞彙的