圖書資訊學學術期刊主題編目一致性之探討

(1)

圖書資訊學學術期刊文獻主題編目一致性之探討

The Investigation of the Consistency of Subject Cataloging for

Academic Journal Articles of Library and Information Science

陳光華+，羅思嘉*，林純如++

+_{國立台灣大學圖書資訊學系}

*_{國立成功大學圖書館}

++_{國立政治大學圖書資訊學研究所}

Kuang-hua Chen+, Szu-chia Lo*, and Chun-Ju Lin++

+_{Department of Library and Information Science, National Taiwan University} *_{National Cheng-Kung University Library}

++_{Graduate Institute of Library and Information Science, National Cheng-Chi University}

摘

要

本文探討台灣地區圖書資訊學學術期刊文獻主題編目的一致性，研究者運用一套主題分類體系，實際分析中國圖書館學會會報第一期至第六十五期出版的956 篇文獻，發現大類類號的一致性指數平均為 82.46%；子類類號的一致性指數則由 59.20%至 74.09%不等；完整類號（大類＋子類）的一致性指數平均為 69.82%。分析者對於期刊文獻與主題分類體系的熟悉度，對於主題編目的品質有明顯的影響。關鍵字：主題編目，一致性

ABSTRACT

This article investigates the consistency of subject cataloging for Taiwan academic journal articles of Library and Information Science. We utilize a subject framework to analyze 956 articles of Bulletin of The Library Association of China from No. 1 to No. 65. After preliminary analyses, we find that the average consistency of main categories is 82.46% and that of subcategories is 69.82%. The consistencies for respective subcategories are from 59.20% to 74.09%. The familiarities with academic articles and subject framework of the analyzers have significant impacts on the quality of subject cataloging.

(2)

壹、序論

學術研究是一個知識累積、消化、與創新的歷程，新的研究成果與學術理論是建構於既有的學術成果之上，在這個過程中，研究文獻扮演極為重要的角色。研究文獻承載著顯性知識（Explicit Knowledge），從事學術研究的學者與專家，由研究文獻瞭解既有的學術理論與技術、探究潛在的理論缺憾與技術缺點、發展新的學術理論與技術，然後，將成果發表於學術期刊，讓其他的研究者瞭解學術研究的最新發展。圖書資訊學的學術理論與研究成果，如分類編目、館藏發展、文獻傳遞、資訊檢索，都是為了有效地整理、組織、典藏、傳遞資訊，對於服務學術研究的社群而言，研究文獻當然是極為重要的一環。傳統上，圖書館為了整理並組織資訊（不論資訊的載體為何），會採用某種分類編目的程序，企圖將典藏的資訊置於特定的有序化狀態，讓資訊的使用者可以更有效率地取得有用的資訊。基本上，分類編目可分為記敘編目與主題編目，記敘編目處理的是題名、作者、出版項、稽核項等實際可考、無爭議的資料；主題編目處理的是分類號、標題等牽涉編目人員主觀的認知，因而，常有主題編目一致性的質疑與探討。所謂索引一致性或是主題編目一致性是指不同的編目人員或同一編目人員在不同時間對同一文獻、作品給予的標題、詞彙或類號的一致程度。不同的編目人員是指兩個以上的編目人員針對同一篇文獻或同一份作品，分別進行主題編目，依據文獻或作品的內容給定對應的標題、主題詞彙或類號；同一編目人員則是指以同一位編目人員在不同的時間，重複對同一篇文獻或作品進行主題編目，給定標題、詞彙或類號。利用一些公式或方法計算主題編目的結果，則可以衡量不同人或同一人主題編目的一致性。（註1） Lancaster 認為，一致性研究是衡量兩個或兩個以上索引人員的一致性，也就是索引人員給定文獻或作品的主題、標題詞彙以表達文獻或作品的內容之一致程度；或是衡量同一位索引人員在不同時間給定文獻或作品的主題、標題詞彙以表達文獻或作品的內容之

(3)

一致程度。（註 2）這表示一致性研究是以量化的方法，範圍包括索引人員之間的一致性以及索引人員本身的一致性。主題編目一致性的研究是分析影響一致性的各種可能因素，以尋求克服不一致性的方法，進一步提昇資訊檢索的效率。過去曾有研究指出，編目的一致性僅有30%（註 3），這樣的數據對於分類編目的工作，是一種質疑，還是一種支持？事實上，國外已有不少的研究探討英文文獻主題編目或是索引的一致性情形，但是少有相關的研究探討中文文獻主題編目的一致性問題。本文嘗試探討中文學術期刊文獻主題編目的一致性，並以《中國圖書館學會會報》出版的文獻為分析的對象。《中國圖書館學會會報》已有40 年以上的歷史，至今共出版了六十七期，會報刊載的文獻可以視為臺灣地區圖書資訊學發展的縮影，本文將運用羅思嘉、陳光華以及林純如發展的「圖書資訊學學術文獻主題分類體系」作為主題編目的依據（註 4），由兩位主題分析者分析自第一期至第六十五期所刊載的文獻。兩位分析者均具有圖書資訊學之專業訓練，分別具有研究、工作實務以及教學之經驗。透過分析的實作，並討論主題分析一致性相關的議題。兩位主題分析者依照文獻題名以及關鍵詞分析文獻，產生兩組分析結果，再透過與第三位分析者共同討論，確認最後的分析結果。本文的結構如下：第二部分將介紹相關的研究，第三部分說明分析進行的程序以及一致性的計算方式，第四部分討論主題編目的結果與不一致的情形，第五部分則是結論與建議。

貳、文獻探討

美國在 1954 年已有分類或標題一致性問題的研究，L. L. Leonard 於 1977 年發表了 1954-1975 年有關索引人員一致性研究的文獻與研究結果。1984 年 Karen Markey 於 LISR

(4)

的論文針對1940 年代中期以來約 25 個探討一致性研究或實驗，依研究成果的一致性高低排列比較，一致性程度的範圍在 4%-82%之間，也舉出 25 個影響分類、索引表現的因素，將這些文獻的內容予以歸納整理，並針對研究視覺性資料（visual materials）索引一致性的相關論文所研究的結果或發現進一步加以組織，作了回顧與評論。（註5）著名學者如 Lancaster、R. Rolling 也都曾對分類、編目的一致性問題作過研究，另外有不少學者針對書目資料庫、檢索系統，包括 ERIC、LISA、OCLC、MEDLINE 等的索引一致性進行實驗研究。不過，少數學者如W. S. Cooper 對研究一致性問題的必要性與意義提出質疑，1992 年 Robert Fugmann 也認為索引的一致性程度不一定能代表系統的品質好壞，索引人員選定錯誤或不適當的標題、詞彙也可能達到一致性的情況，即使索引不一致，也未必會影響到檢索效率。（註6）有關一致性研究的實驗顯示，若完全一致性設定為 100%，由六人對同一篇文獻進行索引，一致性只有15.8%；由二人對同一篇文獻進行索引，則一致性可達 54.3%；若同一人在不同時間同一篇文獻進行索引，一致性約為66.1%。索引人數越多，則越難達到一致，即使是同一人，本身的一致性也是有限的。（註7）（註 8） Funk 在文獻中指出，書目資料庫的期刊文獻索引品質是無法直接測量的，就如同沒有一種正確的方式去標示一個項目一樣，而一致性可以用來測量索引的可靠度。由於 MEDLINE 有較佳的控制詞彙、和較專業的索引人員，因此該研究以 MEDLINE 測量一致性。在此之前，Lancaster 也曾就 MEDLINE 的索引一致性進行分析，針對 16 篇文獻讓National Library of Medicine（NLM）的三位索引人員（indexer）重新索引，分析這兩種索引層次的結果為34.4%和 46.1%；學者 Leonard 則挑選了資料庫中的 100 篇文獻

讓十位索引人員進行索引，分析的結果則為36.5%以及 48.2%，差異不大。

(5)

（twice-indexed）文獻，比較其索引情形，主要依據兩種不同索引層次進行一致性測量，其一是checktag 加上主標題（main headings）與副標題（subheading）；另一種則是checktag 但只加上主標題。利用Hooper 發展的公式計算一致性。整體來說，只計算 checktag 時，

索引一致性最高。（註9）此外，Funk 的研究選擇的 760 篇文獻包含英語、俄語、德語

和芬蘭語四種語言，分析的結果為：俄語216 篇，一致性程度 58.7%；英語 528 篇，54.5%；德語40 篇，41.5%；芬蘭語 6 篇，41.2%。（註 10）

1989 年，Lois Mai Chan 發表了關於美國國會圖書館（LC）的 MARC 書目紀錄與 OCLC 的線上聯合書目紀錄兩者主題編目一致性的研究。該研究的目的有二，一為發展研究MARC 書目紀錄索引一致性（indexing consistency）的適用方法，另外則是研究美

國國會圖書館與非美國國會圖書館在主題編目工作一致性的情形。基於LC 和 OCLC 均

使用美國國會圖書館標題表（Library of Congress Subject Headings, LCSH），推測依循的

政策亦同，因此研究先從OCLC 線上資料庫中，排除三種情形的書目紀錄： 1. 外文書籍：排除不同編目館員可能因為語言專業而影響編目結果的因素。 2. 新版書籍：若一作品有新的版本，則 OCLC 的編目人員可能會參考 LC 已有的舊版書目紀錄，會使研究結果產生偏差。 3. 已含預行編目的書籍：由於作品上的預行編目資訊為 LC 所給定，亦會影響研究結果。然後選擇LC 與 OCLC 資料庫中 100 筆相同的書目紀錄進行分析，其中 LC 的 100 筆記錄中共有214 個標題；OCLC 的 100 筆記錄則有 190 個標題，意即 LC 一筆書目紀錄平均給予2.14 個標題、OCLC 則為 1.9 個標題，此與 1979 年 O’Neill 和 Aluri 的研究發現 OCLC 平均給予 1.41 個標題，增加了 0.49，而 LC 則增加了 0.73 個標題。

(6)

2 個標題的比例最高，分別為 33%及 38%，而 O’Neill 和 Aluri 當時的研究則顯示 44% 的書目紀錄偏向給予一個標題。在標題給定的一致性部分，100 筆記錄中有 15 筆完全一致、80 筆部分一致、另外 5 筆記錄則完全不一致。在 LC 和 OCLC 的 100 對書目紀錄中，55%至少有一個完全吻合的標題，意即 55 對書目記錄，其中的 43 對有一個吻合的標題、9 對有兩個吻合標題、另外 3 對有三個標題完全相同。以標題數目計算，LC 的 214 個標題中有 70 個和 OCLC 的 190 個標題中的70 個相同，一致性的比率分別為 32.71%及 36.84%。而 OCLC 其餘的 120 個標題中，有些屬於部分標題一致，如：主標題一致，複分標題不一致，研究中也就標題的不同層次，包括各類複分（形式複分、時代複分、地理複分等）深入比較；此外，還進一步將此 120 個標題與第十版的國會圖書館標題表進行比對，分析 OCLC 書目紀錄非控制詞彙的情形。（註11） Yasar Tonta 則於 1991 年發表美國國會圖書館（LC）與大英圖書館（BL）編目人員以美國國會圖書館標題表為編目準則的一致性研究。以1987 年於英國出版的圖書資訊學領域書籍為研究範圍，挑選了82 筆資料，LC 的編目人員給定了 282 個標題，而 BL 編目人員給了127 個標題。意即 LC 平均一筆記錄給予 3.44 個標題，BL 則為 1.55 個，其中 BL 編目人員只有 2 筆記錄給定的標題數量多於 LC，佔 2.4%。研究以 Hooper 發展的公式計算平均一致性指數，完全一致為 16%，而部分一致的比率達 36%。該研究另外假設若LC 與 BL 對同一書目給予同樣的標題數量，則一致性應該會較高，但就 82 筆書目記錄中符合限制的17 筆資料進行分析後，完全一致為 14%，部分一致則為 41% （註12），與 82 筆的分析結果差異不大，似乎不足以支持前述假設。由於少有探討中文學術文獻主題編目一致性的論文可資參考，這亦是本研究主要的研究目的，希望透過分析《中國圖書館學會會報》，了解中文學術期刊文獻主題編目一

(7)

致性的情形。下文將說明本研究進行實驗的程序，以及實驗分析使用的主題分類體系與一致性指數的計算公式。

參、期刊文獻分析

本文將探討中文學術期刊文獻主題編目的一致性，研究主要是透過分析實作，利用研究者訂定的「圖書資訊學學術文獻主題分類體系」，分析《中國圖書館學會會報》第一期至第六十五期所刊載的期刊文獻，表一為本研究使用的主題分類體系，僅列出主類表，複分表並未列出，主類表與研究者之前訂定的分類體系（註13），有稍許更動。藉由這樣的實作過程，除了掌握制定的類表對於圖書資訊研究主題分析的適用性，主要是希望能夠了解主題編目過程可能遭遇的問題。第一期至第六十五期的《中國圖書館學會會報》共收錄956 篇文獻，本研究依照其期別，以五期為一單位，共分為13 個分析組，每一分析組的文獻數量並不相同。以分析組為分析單元，兩位分析者同時分析同一組所包括的文獻，分別產生每一分析組的分析結果。分析者主要是以文獻題名、關鍵詞為判斷依據，判斷文獻所討論之內容主題，依照主題分析的結果從主題分類體系中選出1 至 3 個不同的主題類號，以及適當的複分號。必要時分析者可以就文獻作者的研究背景與曾發表的作品判斷其文獻之內容。分析結果產生後，兩位分析者就分析結果與第三位主題分析者共同討論分析結果，以及其中具爭議性的問題，最後確認所屬主題類號及複分號。主題分類體系必要時也會參照分析結果作適度的調整。本文所計算之一致性指數（見圖一），乃是指二位分析者在與第三位分析者共同討論前，各自進行主題編目結果的一致性。

(8)

表一：主題分類體系 1. 圖書館與圖書館事業 類號標目說明 1.1 通論 1.2 圖書館與社會 1.3 圖書館哲學、目的、功能 1.4 圖書館發展趨勢含以前、現在到未來的發展、圖書館事業發展議題 1.5 圖書館史 1.6 圖書資訊專業學會 1.7 人物經考證、研究的學術性文獻 1.8 國際關係 1.9 法規與標準含著作權、呈繳制度、查檢、討論標準本身或標準制定 1.10 館際合作與組織含資源共享議題 1.99 其他 2. 行政與管理 類號標目說明 2.1 通論 2.2 人員與人事包含行政倫理、圖書館內部人力資源等議題的探討 2.3 規章 2.4 組織不限於內部組織、職稱制度 2.5 經費 2.6 建築座位、燈光、動現 2.7 統計各類統計、調查分析 2.8 評鑑不只Lib 內部的評鑑、評估 2.9 決策與規劃含委外、管理政策或原則、經營策略ex~輔導體系 2.10 合作人員訓練 2.11 對外關係含公共關係議題 2.99 其他 3. 技術服務 類號標目說明 3.1 通論 3.2 採訪作業流程… 3.3 主題分析包括分類、標題、索引典 3.4 資訊組織包括編目、metadata 3.5 權威控制含廣義（書目控制）、狹義 3.6 館藏發展 ex~採訪政策、館藏發展政策、館藏量分析… 3.7 典藏 3.8 合作採訪 3.9 合作編目 3.10 合作館藏發展 3.11 合作典藏 3.99 其他 4. 讀者服務 類號標目說明 4.1 通論泛論資訊服務 4.2 閱覽含館內使用議題 4.3 流通如政策…

(9)

4.4 推廣[行銷] 讀書會、展覽 4.5 參考服務文獻傳遞(暫定) 4.6 參考資源 ex~特藏、參考工具書介紹、一般參考資源 (加學科分類)、圖書目錄（視內容） 4.7 利用指導與利用教育 4.8 特殊讀者服務 ex~視障、兒童各類讀者 4.9 讀者研究包括使用研究、資訊需求 4.10 資訊利用含資料利用 4.11 個人化服務原新知服務，改為個人化服務，包括新知服務、個人資訊空間 4.12 互惠閱覽 4.13 館際互借 4.99 其他 5. 圖書資訊理論與基礎 類號標目說明 5.1 圖書館學理論 5.2 資訊科學理論 5.3 研究方法 5.4 文獻計量學含書目計量學 5.5 圖書資訊學發展趨勢 5.6 圖書資訊學教育正式學程、繼續教育 5.7 圖書館專業專業與工作倫理、工作上繼續教育、圖書館員的角色、形象 5.8 資訊政策 5.9 資訊倫理含同儕審核 5.10 資訊傳播資訊超載 5.11 資訊素養終生學習、資訊利用or 需求 5.99 其他 6. 圖書資訊技術 類號標目說明 6.1 資訊媒體各種資訊載體 6.2 資訊技術多媒體製作、SGML、Markup、載體製作技術 6.3 資料處理編碼、造字或缺字處理 6.4 資料轉換如資料格式、資料庫 6.5 自動化系統廣義自動化作業… 6.6 資料庫與資訊系統 6.7 資訊儲存與檢索含資源共享所涉及的系統議題探討、簽名法（屬於自動分類與索引） 6.8 網際網路國家資訊基礎建設 6.9 數位圖書館 6.10 網站設計原為網頁設計，改為網站設計，含網頁設計在內 6.99 其他 7. 圖書與文獻 類號標目說明 7.1 通論 7.2 出版與書業含電子出版 7.3 檔案學屬於文獻範圍 7.4 目錄學古籍圖書分類、書體(說文) 7.5 版本學古籍版本 7.6 校勘學書目校正、較勘 7.7 各種目錄藏書目錄…（公） 7.8 私家藏書含印記、藏書樓、藏書票 7.99 其他

(10)

主題編目的一致性分析主要是分為大類以及子類兩個層次來看。分析所依據的類表將圖書資訊研究議題分為圖書館與圖書館事業、行政與管理、技術服務、讀者服務、圖書資訊理論與基礎、圖書資訊技術、以及圖書與文獻等七大類；各大類再依照其所屬相關議題分為不同子類。分析結果各自計算大類類號的一致性以及完整類號（大類+子類）的一致性。一致性指數是依照Hooper 提出的公式計算，參見圖一的公式。（註 14） 100A CP（%）= A + M + N A：兩位索引者共同選擇的詞彙數量 M：索引者 m 選取的詞彙數扣除 A 所得的詞彙數量 N：索引者 n 選取的詞彙數扣除 A 所得的詞彙數量圖一：Hooper 的一致性計算公式其中 CP（%）為一致性指數，範圍從 0%至 100%，A 為索引者 m 和索引者 n 共同給定的詞彙數量，M 為 m 給定的詞彙扣除 A，N 則為 n 給定的詞彙數扣除 A。表二與表三分別是就大類類號和完整類號以Hooper 的公式計算出的結果。表二：大類類號一致性指數計算範例文章篇名分析者 – m 分析者 – n 一致性指數美國遠東圖書館的專業教育 5.8 5.10 1/1*100%=100.00% 科技資料的整理 3.4+3.5 3.3+3.4 1/1*100%=100.00% 表三：完整類號（大類類號+子類類號）一致性指數計算範例文章篇名分析者 – m 分析者 – n 一致性指數 專科學校圖書館現況與困境之探討 2.1+1.10+4.7 1.10+4.7 2/(3)*100%=66.67% 大學圖書館服務品質評估之研究 4.1+2.8 4.1+2.8 2/(2)*100%=100.00%

(11)

肆、結果分析

《中國圖書館學會會報》發刊40 多年，本研究以第一期到第六十五期所刊載的文獻為主，時間橫跨民國43 年至 89 年。依照所訂定的分類體系分析文獻之特性，《中國圖書館學會會報》刊載的文獻可以粗分為學術論文及非學術論文兩大類，《中國圖書館學會會報》從第一期至第二十期有相當比例的文獻為非學術論文。其撰寫目的偏向溝通與交流，其中包括參與國內外專業會議之會議記錄、參訪之心情雜記、人物介紹、圖書館簡介以及書評等類型的文獻。二十期之後，隨時間演進學術論文佔會報文獻的比例逐漸提高，五十一期之後會報所收錄的文獻均以學術論文為主。有關第一至六十五期刊載之文獻總數與學術論文數的統計資料請參見圖二和表四。分析的 956 篇文獻當中包括各種不同類型的作品，其中 665 篇文獻是屬於學術論文，佔文獻比例69.56%，平均每一組所包括的文獻數量為 74 篇，平均 51 篇為學術論文；其中收錄最多文獻的是民國 68 年至 72 年出刊的三十一期至三十五期，共計 109 篇，學術文獻佔69.72%（76 篇）；收錄最少文獻的為第一期至第五期，收錄46 篇文章，其中11 篇為研究導向的學術論文，佔該分析組文獻量的 23.91%。分析每組文獻所需時間由30 分鐘至 90 分鐘不等，時間隨著文獻數量、題名的明確性以及分析者對文獻主題掌握程度而有所不同。（一）分析結果之一致性兩位分析者分析956 篇文獻，共給予 1,174 個主題類號索引詞彙，其中相同者 838 個。從分析結果來看，複分部份兩位分析者分析結果的一致性相當高，幾乎達到100% 的一致程度；但在主題部分的不一致問題則值得進一步探討。956 篇文獻中有 665 篇文獻為學術論文，當中9 篇文獻無法單就目前所掌握的資訊分析其內容屬性。就可辨識的 656 篇學術論文來看，主題的大類分布以討論「圖書館與圖書館事業」議題的文獻為多，

(12)

佔總數30.79%；「圖書文獻」類文獻所佔的比例最小，30 篇，佔文獻總數的 4.57%。行政管理、讀者服務以及理論基礎則所佔比例差距不大，技術服務與資訊技術兩主題也是學者關心的議題之一，文獻主題分布請參見圖三。扣除在分析過程中無法給予類號的52 篇文獻，計算大類類號的一致性指數，兩位分析者分析結果平均一致性指數為82.46%，完整類號則為 69.82%。若單就學術論文來計算一致性指數，則大類類號一致性指數為81.01%，完整類號為 67.53%，略為下降，但差距在2.5%之內。圖二：《中國圖書館學會會報》刊載文獻與學術論文統計表四：《中國圖書館學會會報》刊載文獻與學術論文比期別百 分比 期別百 分比 n. 01-05 23.91% n. 36-40 81.18% n. 06-10 39.44% n. 41-45 84.34% n. 11-15 43.68% n. 46-50 92.47% n. 16-20 28.77% n. 51-55 100.00% n. 21-25 64.41% n. 56-60 100.00% n. 26-30 67.16% n. 61-65 100.00% n. 31-35 69.72% n. 1-5 n.6-10 n.11-15 n.16-20 n.21-25 n.26-30 n.31-35 n.36-40 n.41-45 n.46-50 n.51-55 n.56-60 n.61-65 民國 (43-44) (45-48) (49-52) (53-57) (58-62) (63-67) (68-72) (73-76) (76-78) (79-82) (82-84) (85-87) (87-89)

(13)

圖三：文獻主題分布（二）主題類別對於分析結果一致性的影響除了整體分析結果的一致程度，研究者亦想了解分析者對於不同主題的分析是否對於主題分析的一致性有所影響，因此研究者再就各個不同類號計算一致性，詳細結果請參見表五。依照不同類別計算一致性指數，結果發現，「行政與管理」、「圖書文獻」、「資訊技術」、「理論基礎」等四類的一致指數較低，分別為 59.20%、60.71%、62.17%以及 64.58%。探討其中的原因發現，第二大類「行政與管理」及第六大類「資訊技術」兩類的文獻，所討論的議題具有多重特質，也就是討論某一子類的文獻常會同時牽涉分類體系中該大類的其他子類，因此在給予類號詞彙時，分析者會在是否給予多個類號詞彙決策上有所考慮。例如第二大類「行政與管理」包括統計以及評鑑兩子類，研究者分析的文獻屬於「行政與管理」的有不少是討論圖書館業務評鑑，佔該類文獻的25%。在評鑑文獻中，不乏利用統計方式評估圖書館業務表現，單就題名以及關鍵詞無法判定該篇文

(14)

獻是否運用統計方式進行評鑑，因此只能依賴分析者從可獲得的資訊中判斷是否同時給予評鑑以及統計兩子類類號，但是相對地，各種業務統計也多涉及業務評鑑的相關討論，是否除統計外也應同時給予評鑑類號，單從題名以及關鍵詞彙判斷，兩位分析者可能會有不同的解讀，往往需要進一步閱讀摘要，甚至全文才能夠確認。由於題名、關鍵詞對於議題定義的不明確，造成分析上的爭議，因此在決策考慮過程中，造成兩位分析者分析結果的差異。第六大類「資訊技術」在處理資訊檢索相關議題時，「資料庫與資訊系統」以及「資訊儲存與檢索」也常是造成分析者在分析結果出現差異性的因素之一。至於第七大類「圖書與文獻」分析結果不一致則是導因於分析者對於「圖書與文獻」這一類文獻的不熟悉，在分析過程中除了討論文獻所涉及的議題，也調整主題分類體系，以利後續的分析。表五：各主題類別分析結果類號數及一致性指數類別圖書館事業行政管理技術服務讀者服務理論基礎資訊技術圖書文獻所有詞彙數 _{270 114} ₁₇₇ ₁₀₉ ₁₁₆ _{189 43} 相同詞彙數 _{165 51} ₉₇ ₆₃ ₅₃ _{94 20} 一致性指數 _{74.09% 59.20%} _68.83% _70.95% _64.58% _{62.17% 60.71%} （三）分析者經驗對於分析結果一致性的影響本研究另一個關心的議題是分析者對於主題分類體系熟悉度的提高以及分析經驗的累積，透過共同討論，溝通彼此意見，是否能提升分析結果的一致程度？本研究的分析流程是從最近的刊期文獻開始進行分析，回溯分析至最早發刊的期刊文獻。從圖四的分析結果可看出不管是所有文獻或是針對學術論文，一致性指數均顯現出一定的趨勢。進一步探討分析的時間歷程，發現當分析者密集分析期刊文獻時，隨時間以及經驗的累

(15)

積，一致性指數呈現升高的趨勢，一旦分析密集度較低，一致性指數則出現下降的狀況。從圖四中發現，第三十六期至四十期，第四十一期至四十五期這兩分析組的一致性指數出現明顯下滑狀況。回顧這二組的分析時間，此時正值暑假過後，造成再度開始進行文獻分析工作時出現不穩定的狀態，經過一段時間的實作之後，一致性指數再度提升。若從大類分析層次來看，一致性指數的變異較小，平均在 83.00%以上。最佳的一致性指數超過90%，最小也在 70%以上。圖四：依分析單元分析一致性指數比較分析結果 - 完整類號（四）不同分析依據對於分析結果的影響研究文獻的分析均是以文獻題名以及關鍵詞為基準。研究者為了了解題名與關鍵詞是否提供了足夠的分析資訊，以及加入摘要及全文對於主題分析是否有顯著的影響，因此以第六十一期至第六十五期的54 篇文獻為測試組，分別就題名與關鍵詞、摘要、全文分析文獻主題，觀察結果的差異程度。加入摘要分析所獲得的結果，54 篇文獻中有 12 篇的分析結果異動。主要的異動在 n. 1-5 n.6-10 n.11-15 n.16-20 n.21-25 n.26-30 n.31-35 n.36-40 n.41-45 n.46-50 n.51-55 n.56-60 n.61-65 民國 (43-44) (45-48) (49-52) (53-57) (58-62) (63-67) (68-72) (73-76) (76-78) (79-82) (82-84) (85-87) (87-89) 分析時間

(16)

於大類或子類增刪以及子類類號的修改。加入摘要分析後，分析者會從摘要中辨識出未表現於題名或關鍵詞的主題，相對地也會發現部分主題並不在主題分類體系涵蓋的範圍，故必須調整分類體系。除此之外，會由摘要獲得更多的資訊，重新給予較適當的子類類號。全文的閱讀影響分析結果程度不大，僅有少部分的文獻由於題名不明確必須透過全文的閱讀確定文獻討論的內容。另外亦有小比例的文獻在閱讀文獻內容後被賦予完全不同的類號。（五）相同分析者在不同時間對於同一作品分析之一致性指數同一分析者在不同時間點，分析相同文獻的一致性也是研究者希望透過實作能夠探討的議題。但限於時間，無法容許兩位分析者在適當的時間間隔區段，對所有的文獻進行兩次主題分析。因此研究僅針對最早分析的文獻組，第六十一期至第六十五期所刊載的54 篇文獻進行第二次的主題分析，進行時間是在第一次分析後的一個月內，所獲得的結果與第一次討論結果相當接近。以其中一位分析者為例，其完整類號的一致性指數達85.19%，大類一致性指數達 94.91%。由於分析間隔時間不長，分析者可能仍舊保有第一次分析的印象；同時分析者對於文獻所討論議題內容的掌握度高，因此一致性指數相當高，但是由於測試數據有限，無法對同一分析者分析結果的一致性提供更多的說明。

伍、討論與建議

（一）分析結果的一致性分析者個人受文獻主題以及對主題分類體系（主題類表）的認知與熟悉度對於分析結果一致性的影響，隨著訓練及實作經驗的累積，不同分析者的分析結果逐漸趨向一

(17)

致，個人的差異性對於分析結果的影響逐漸降低。這樣的結果顯示受過訓練或具有分析經驗的分析者的一致性較高。反之若分析成果未受到訓練以及經驗累積的影響，那麼所表現出的是，對於索摘教育重新思考的必要。從實作所獲得的結果是實作經驗的累積對於分析者掌握主題的精確度有一定的影響，當實作經驗中斷，分析者重新開始分析工作，分析者需要一段時間建立對主題分類體系以及文獻的熟悉度，一旦分析者重新掌握主題分類體系，分析結果的表現回復至水平以上。除此之外，分析者對於文獻主題特性的熟悉度如預期地對於分析結果的一致性有決定性的影響。（二）分析與主題分類體系同時發展所造成的不一致性由於本研究使用的主題分類體系是以由上而下（Top-Down ）以及由下而上（Bottom-Up）並行的方式建立的，研究者首先將圖書資訊學的相關知識視為一整體，由上而下地建立其分類體系，再透過分析大量圖書資訊學學術文獻的內容，由下而上地調整主題分類體系，以資料驅動的模式（Data-Driven Model）建立類表。這樣的方式固然可兼顧全面性發展以及考慮文獻探討議題的實際情形，但是在分析過程當中卻可能使不同分析者在選擇既有類號或建立新類號的抉擇中造成第一次分析結果的不一致性。必須經過重新檢視類表以及分析結果的過程才能夠確認最後適當的類號。其優點是最後產生的結果更符合文獻所討論的內容，但是相對地，部分議題在分析過程初期必須投入較多的時間成本，以及容忍較高的不一致性。（三）題名、關鍵詞、摘要、全文提供資訊對於主題分析者的判斷之影響一般而言，期刊文獻的主題編目者對於主題的賦予，會隨者閱讀資訊的不同，而有些許的不同。判斷資訊的增加，一方面編目者可以更容易掌握主題，另一方面，干擾判斷的資訊也可能隨之增加。本研究發現，類號因而異動的比率為 22.22%，而且一致性指數均有提昇的情況，因此就本研究而言，判斷資訊的增加，其影響是正面的。

(18)

（四）進一步探討的議題由於本研究主要是就文獻題名以及關鍵詞進行分析，雖針對其中5%的文獻，就其摘要以及全文進行主題分析。但由於取樣不足，因此所獲得的結果對於題名、關鍵詞、摘要以及全文對於分析一致性的影響無法做有效的詮釋，對於文獻內文的閱讀是否對於主題分析有所助益，可以強化對主題的掌握，或是增加分析的雜訊有必要進一步探討。此外，對於作者所提供的文獻內容說明資訊（包括題名、摘要、關鍵詞等）適切性也無法進一步分析。後續研究可就下列議題進一步探討：比較題名及關鍵詞對主題編目的影響比較題名及摘要對主題編目的影響文獻作者使用主題關鍵詞的一致性除上述議題外，文獻研究主題的變遷、時間因素對於學術文獻主題、關鍵詞、摘要、題名結構的影響、關鍵詞的數量、以及最常出現在題名之詞彙將是後續研究繼續探討的議題。

附註

註1：周全明。「文獻分類標引一致性研究」。圖書館 6（1995）：33-36。

註2： Lancaster, F. Wilfrid. Information retrieval systems: characteristics, testing, and evaluation, 2nd. (New York: John Wiley & Sons, 1979), 198-199.

註3： Hodge, Gail. Automated Support to Indexing (Philadelphia, PA: National Federation of Abstracting and Information Services, 1992), 15-16.

註4：羅思嘉，陳光華，林純如。「圖書資訊學學術文獻主題分類體系之研究」。台灣

(19)

a Test of Consistency in Indexing Visual Materials,” LISR 6 (1984): 155-177.

註6： Fugmann, Robert. “Indexing quality: Predictability versus Consistency,” International Classification 19, no.1 (1992): 20-21.

註7：張正強。「文獻主題標引的一致性研究」。情報業務研究8 卷 1 期（1991）：13-16。註8：戴維民。「標引一致性研究論述」。情報學報 14 卷 2 期（Apr. 1995）：142-152。註9： checktag，可稱為「特徵詞彙」，The Online Services Reference Manual 對其定義

為：每篇被索引的文獻中用以形容大範疇類別的索引詞彙，如人類、動物、男性、女性等。

註10： Funk, Mark E. “Indexing Consistency in MEDLINE,” Bulletin of Medical Library Associations 7, no.2 (1984): 176-183.

註11： Chan, Lois Mai. “Inter-Indexer Consistency in Subject Cataloging,” Information Technology and Libraries 8, no.4 (Dec. 1989): 349-357.

註12： Tonta, Yasar. “A Study of Indexing Consistency between Library of Congress and British Library Catalogers,” Library Resources & Technical Services 35, no.2 (1991): 177-185.

註13：同註 4。註14：同註 12。