分類架構概念之探討

第二章文獻分析

第一節分類架構概念之探討

一、分類架構應用於網路資訊檢索

（一）分類與資訊檢索

分類（classification）是圖書資訊學領域重要的概念，早期圖書館使用分類概念，主要用來分類實體物件（physical objects），例如：圖書、期刊；後來隨著資訊科技的進步，改變了人們對於資訊的概念，分類的概念也將延伸至數位物件

（digital objects），此時圖書館也開始分類以電子形式的文件，例如：電子期刊、

網路資源……等。

目前網路已經成為人們主要搜尋資訊管道之一，但是現今網路資訊量每日快速增加，根據 Netcraft 於 2006 年 5 月的報告，目前網路上已經高達八十億的網站，導致使用者將面臨到一些檢索的困境，例如：無法快速從大量檢索結果中找尋所需的資訊、辨認同義詞的問題。也因此許多資訊工具（information tools）以

及資訊擷取技術，用來協助使用者更有效率地從事資訊檢索，甚至圖書資訊學領域的分類工具（例如：標題表（subject heading）、索引典（thesauri））已經用來組織網路資源，並且幫助使者檢索網路資源。

目前網路使用者檢索網路資源有兩種方式：一種是透過關鍵字檢索

（keyword search）的方式，另外一種是透過瀏覽（browsing）的方式，使用者搜尋資訊通常有兩種情況，第一個情況是使用者清楚自己的資訊需求，通常使用者會利用關鍵字搜尋的方式，搜尋自己所需的資訊；另外一種情況是當使用者資訊需求模糊時，無法明確表達如何解決資訊問題，在這種情況之下，瀏覽是比較有效的檢索方式。使用者剛接觸新領域知識或是資訊空間（information spaces）時，

常使用瀏覽（browsing）的方式當作搜尋策略，使用者通常會根據本身的心智模型（mental models），去探索（explore）資訊空間內的組織架構。另外，使用者會根據和瀏覽服務所提供的原始架構互動的情形，發展出心智瀏覽模式（洪元元，

民 98；Chen, Houston, Swell & Schatz, 1998；Delphi group, 2002；Marchionini &

Shneidermn, 1988），所以資訊空間內之分類體系的優劣，將會影響使用者瀏覽的經驗，因此若資訊空間內架構一個良好的瀏覽環境，可以增進使用者搜尋資訊的速度。

過去有學者提出將資訊適當的分類，可以避免使用者瀏覽過多不相關的資訊

，並且改善使用者瀏覽與檢索速度（Samler & Lewellen, 2004；卜小蝶，民 96）。

另外，分類因具備一定的邏輯結構，所以一些學者認為分類可以幫助使用者提升檢索效益。Koch 與 Day（1997）認為分類可以幫助使用者過濾不相關資訊，以幫助使用者縮小檢索範圍；Chen 與 Dumais（2001）比較使用者分別在分類介

（category-interface）與條列式（list-interface）介面之檢索表現，研究結果顯示因為分類介面能夠提供檢索結果的脈絡（context）位置，讓使用者了解檢索結果之間的相關性，避免使用者瀏覽過多不相關的資訊，因此使用者在分類介面之檢索表現優於條列式介面。此外，分類可以幫助使用者觸類旁通，透過瀏覽各種形

式的分類架構介面，刺激聯想相關主題概念。總而言之，分類在某些地方的確可以幫助使用者提升檢索效益。

（二）分類架構與資訊檢索

分類架構（classification structures）的概念多元繁雜。一般而言，建立一個分類架構有兩種方式：一種是透過人工以及半自動的方式建立分類目錄，例如：

Yahoo 的分類目錄（web directory），此種方法必須要由人工制訂類別（pre-defined class），並且先行制定分類規則，之後必須訓練分類器（classifier），讓分類器學習人們怎麼去分類文件，但是若訓練文件不夠，分類器有可能分錯類別。圖 2.1 是輸入”HCI” 查詢，可以發現 HCI 其他相關的主題類別（category），例如：

Computer science、User interface。階層式分類架構可以讓使用者快速瀏覽整個檢索結果，並且知道欲查詢的主題概念，屬於哪一個類別：另外一種是透過自動分群（automatic clustering）的方式，自動產生分類架構（例如：Grokker 將檢索結果再分群），此種方法主要是根據系統跑出檢索結果最前面的幾筆，進行相似性比對，產生群集（cluster），由群集自動計算適當的類別之後，產生分類架構（陳思穎，民 96）。圖 2.2 同樣地利用”HCI”關鍵字進行檢索，畫面左方是透過自動分群（automatic clustering）技術自動產生的分類架構，此分類架構是以階層的方式呈現，並且顯示目前和使用者搜尋的關鍵字相關的主題概念，使得原本高達數十頁的檢索結果，重新組織成為數十筆的主題階層式清單（Delphi group, 2002），雖然這些類別並沒有嚴謹的從屬關係，只能稱作是一個樹狀結構（tree structure），

但是能夠提示使用者欲檢索主題之相關重要概念。

圖 2.1 Yahoo Directory Searching 之檢索結果舉例

圖 2.2 Grokker 之檢索結果舉例

過去一些學者認為分類架構工具（例如:Yahoo 的分類目錄（web directory）），

可以幫助使用者提升檢索精確率（Lee & Olson, 2005；Pahievi & kitagawa, 2005）。近年來雖然有許多研究探討使用者如何使用分類目錄，但是缺乏使用者如何從透過分類架構從事資訊尋求行為之研究，因此不論是人工或是自動產生的分類架構，對於研究者而言，應該關注使用者如何使用瀏覽分類架構介面。當使用者使用分類架構瀏覽介面，會根據自己心中的資訊需求，進行一連串的類目

（category）選擇與回應，藉由和介面互動的過程，找出系統中和心中符合的概念，但是有時候系統內自動產生的分類架構所產生的類目（category），不一定符合使用者心中的認知，這是因為在建構分類架構工具的過程，並不會牽涉到使用者，縱使分類架構工具所提供的詞彙類別，能夠幫助使用者聯想到其他相關主題的概念，並進一步幫助使用者查詢問句的再形成，但是對於使用者檢索時的實質效益，需要更進一步透過研究檢視。

二、自動分群技術應用於資訊檢索系統

自動分群技術（automatic clustering）應用於資訊檢索領域已經非常普遍，

分群應用於資訊檢索，主要有下列幾個用途：（1）幫助使用者瀏覽大量文件，（2）

過濾不相關的資訊，（3）幫助使用者釐清資訊需求，並且縮小檢索範圍。基本上，

自動分群的過程需要許多演算法，目前分群所使用的演算法：主要分為階層式

（hierarchical）、分割式（partitional）兩大類，前者不僅會將資料分群，也會自動產生階層式分類架構（Jain, Murty & Flynn, 1999；轉引自陳思穎，民 96）。

根據過去一些研究指出，使用者喜歡資訊檢索系統以自動分群（automatic clustering）的方式，重新組織檢索結果，但是在使用分群工具（cluster tools）的過程中，卻面臨到許多問題，根據 Pagan 與 Fagan（2000）的研究，受試者喜歡以分群的方式組織檢索結果，但是一些受試者指出分群架構（cluster structure）

工具在某些檢索問題類型上，自動所產生的群集標籤（cluster labels）和檢索結果不一致，代表自動分群所產生的群集（cluster）內容不一定會符合使用者心中的認知；Wu, Fuller 與 Wilkinson（2001）評估使用者在分群介面（cluster-based interface）與分類介面（category-based interface）之檢索表現，研究結果指出使用者對於介面以分群的方式重新組織檢索結果，抱持正面態度，但是研究者觀察受試者在分群介面的檢索表現，發現並非所有的受試者都能了解分群架構

（cluster structure）中每個群集名稱（cluster name）呈現上的意義，因此對於使用者而言，這些分群架構對於他們在檢索上的意義為何？是否能夠跟預期般一樣幫助使用者提升檢索效益？是一個值得探討的議題。

。

在文檔中視覺化資訊檢索介面評估—以EBSCOhost 2.0為例 (頁 25-31)

第二章 文獻分析

第一節 分類架構概念之探討

一、 分類架構應用於網路資訊檢索