第二章 文獻分析
第二節 索引典
一、索引典的定義
索引典可以說是為分類所建立的字典。當分類是以詞彙語意關係在建立的時 候,就必須建立索引典來定義詞語間的語意關係。林信成、歐陽慧、歐陽崇榮(2003)
整理索引典的定義如下:
1. 索引典是控制索引語言正式組織的詞彙,以便將概念間的重要關係(如 廣義和狹義)明確的顯示出來。
2. 就功能而言,索引典是一種控制詞彙的工具,其用途是將文獻、索引人 員或使用者所用的自然語言,轉譯成更規範的「系統語言」(如文獻工 作語言、資訊語言);就結構而言,索引典是一部含有特定知識領域的 詞彙,詞彙間有語意或從屬上的關係,且詞彙是控制的、動態的。
3. 就資訊儲存與檢索的範疇而言,索引典乃收集足以表示知識概念的字或 詞,並將之以特定的結構加以排列,這些字彙控制了同義字,區別了同 形異義字,並顯現各相關詞彙間階層及語意互屬上的各種關係,以做為 索引者在分析處理資料及讀者在檢索資料時能選用一致的、經過控制的 詞彙。
ANSI/NISO Z39.19 中指出,索引典中控制詞彙的需求,是由於自然語言中,
兩個或兩個以上的字或詞,可以用來表達同一概念物件;兩個或兩個以上的字 具有同樣的拼音,卻可能代表不同的概念或內容物件的特質所引起。因此索引
典中控制詞彙的主要目的為:
1. 將自然語言轉換為控制詞彙;
2. 促進標引的一致性;
3. 指出詞彙間的語意關係;
4. 在導覽系統中提供一致且清楚的階層結構,幫助使用者找出目標內 容 物件;
5. 協助檢索目標內容物件。
索引典中用來定義各個詞彙間的語意關係,可以分為三種(林信成等,
2003):
1. 等同關係(Equivalency):具有這類關係的詞,表示彼此在概念或用法 上相同或視為相同;
2. 階層關係(Hierarchy):具有此關係的詞彙,彼此為上位與下位概念的 關係,又包括有屬種、集元與整部等三種關係;
3. 關聯關係(Association):是指兩個描述詞間雖無等同或階層關係,但 從索引或檢索效度而言,有相互參照、提醒使用者有另一詞存在的關 係。
二、索引典的編製
在計畫編製一套索引典時,一定要先明白整個資訊搜尋系統的設計,索引典 之內容一定要反映出此資訊搜尋系統使用者的特殊需要及觀點(李連揮,1977)。
ANSI/NISO Z39.19(2005)中也提到,在選擇哪些詞彙應該納入索引典時,必須 考量到這個索引典應用到的資訊空間或範圍領域,詞彙也應具有文獻、使用者及 組織保證原則;詞彙本身的明確性、具體性以及與其它控制詞彙間的關係,也會 影響到整個索引典被使用者接受的程度。
ANSI/NISO Z39.19(2005)提出建立索引典的方法如下:
1. ANSI/NISO 委員會採行方法
學科專家們從該特定領域中制定出主要詞彙列表,並經由控制詞彙設計 專家的協助,標示出這些詞彙間的語意關係。主要詞彙可以從不同來源或由 不同使用者或團體提出。目前委員會有兩種已使用的主要制訂方式:
(1) 由上而下建立(Top Down):
先辨識出涵義最廣泛的詞彙,其餘詞彙接續排列成階層結構並進 行詞彙間關係的建立。
(2) 從下往上建立(Bottom Up):
通常是列出的詞彙已經用於描述某一內容物件,而且已經被納入 控制詞彙當中。當遇到此情況時,同樣須建立階層結構並確立詞彙間 關係,但是由涵義範圍最狹窄的詞彙開始進行。
2. 採行實證方法 (1) 演繹法
在還沒有建立任何索引及詞彙關係前,利用人工或機器的方式從 內容物件中擷取詞彙,蒐集到足夠的有效詞彙後,讓專家小組(最好 包含資訊專家和主題領域專家)瀏覽,先選出涵義最廣的幾個詞彙階 層,再將剩餘的詞彙依照詞彙間的邏輯關係分配到方才建立的階層下,
建立出詞彙涵義由廣到窄的階層結構。
(2) 歸納法
當遇到內容物件時,新的詞彙就被納入潛在的詞彙範圍內。在一 開始詞彙就受到階層安排的控制,是一種由窄到廣的建立方式。此種 方法十分需要學科專家的協助,這些專家可以成為正式成員或編輯委 員。