• 沒有找到結果。

分類架構概念之探討

第二章 文獻分析

第一節 分類架構概念之探討

一、 分類架構應用於網路資訊檢索

(一)分類與資訊檢索

分類(classification)是圖書資訊學領域重要的概念,早期圖書館使用分類 概念,主要用來分類實體物件(physical objects),例如:圖書、期刊;後來隨著 資訊科技的進步,改變了人們對於資訊的概念,分類的概念也將延伸至數位物件

(digital objects),此時圖書館也開始分類以電子形式的文件,例如:電子期刊、

網路資源……等。

目前網路已經成為人們主要搜尋資訊管道之一,但是現今網路資訊量每日快 速增加,根據 Netcraft 於 2006 年 5 月的報告,目前網路上已經高達八十億的網 站,導致使用者將面臨到一些檢索的困境,例如:無法快速從大量檢索結果中找 尋所需的資訊、辨認同義詞的問題。也因此許多資訊工具(information tools)以

16

及資訊擷取技術,用來協助使用者更有效率地從事資訊檢索,甚至圖書資訊學領 域的分類工具(例如:標題表(subject heading)、索引典(thesauri))已經用來 組織網路資源,並且幫助使者檢索網路資源。

目 前 網 路 使 用 者 檢 索 網 路 資 源 有 兩 種 方 式 : 一 種 是 透 過 關 鍵 字 檢 索

(keyword search)的方式,另外一種是透過瀏覽(browsing)的方式,使用者搜 尋資訊通常有兩種情況,第一個情況是使用者清楚自己的資訊需求,通常使用者 會利用關鍵字搜尋的方式,搜尋自己所需的資訊;另外一種情況是當使用者資訊 需求模糊時,無法明確表達如何解決資訊問題,在這種情況之下,瀏覽是比較有 效的檢索方式。使用者剛接觸新領域知識或是資訊空間(information spaces)時,

常使用瀏覽(browsing)的方式當作搜尋策略,使用者通常會根據本身的心智模 型(mental models),去探索(explore)資訊空間內的組織架構。另外,使用者 會根據和瀏覽服務所提供的原始架構互動的情形,發展出心智瀏覽模式(洪元元,

民 98;Chen, Houston, Swell & Schatz, 1998;Delphi group, 2002;Marchionini &

Shneidermn, 1988),所以資訊空間內之分類體系的優劣,將會影響使用者瀏覽的 經驗,因此若資訊空間內架構一個良好的瀏覽環境,可以增進使用者搜尋資訊的 速度。

過去有學者提出將資訊適當的分類,可以避免使用者瀏覽過多不相關的資訊

,並且改善使用者瀏覽與檢索速度(Samler & Lewellen, 2004;卜小蝶,民 96)。

另外,分類因具備一定的邏輯結構,所以一些學者認為分類可以幫助使用者提升 檢索效益。Koch 與 Day(1997)認為分類可以幫助使用者過濾不相關資訊,以 幫助使用者縮小檢索範圍;Chen 與 Dumais(2001)比較使用者分別在分類介

(category-interface)與條列式(list-interface)介面之檢索表現,研究結果顯示 因為分類介面能夠提供檢索結果的脈絡(context)位置,讓使用者了解檢索結果 之間的相關性,避免使用者瀏覽過多不相關的資訊,因此使用者在分類介面之檢 索表現優於條列式介面。此外,分類可以幫助使用者觸類旁通,透過瀏覽各種形

17

式的分類架構介面,刺激聯想相關主題概念。總而言之,分類在某些地方的確可 以幫助使用者提升檢索效益。

(二)分類架構與資訊檢索

分類架構(classification structures)的概念多元繁雜。一般而言,建立一個 分類架構有兩種方式:一種是透過人工以及半自動的方式建立分類目錄,例如:

Yahoo 的分類目錄(web directory),此種方法必須要由人工制訂類別(pre-defined class),並且先行制定分類規則,之後必須訓練分類器(classifier),讓分類器學 習人們怎麼去分類文件,但是若訓練文件不夠,分類器有可能分錯類別。圖 2.1 是輸入”HCI” 查詢,可以發現 HCI 其他相關的主題類別(category),例如:

Computer science、User interface。階層式分類架構可以讓使用者快速瀏覽整個檢 索結果,並且知道欲查詢的主題概念,屬於哪一個類別:另外一種是透過自動分 群(automatic clustering)的方式,自動產生分類架構(例如:Grokker 將檢索結 果再分群),此種方法主要是根據系統跑出檢索結果最前面的幾筆,進行相似性 比對,產生群集(cluster),由群集自動計算適當的類別之後,產生分類架構(陳 思穎,民 96)。圖 2.2 同樣地利用”HCI”關鍵字進行檢索,畫面左方是透過自動 分群(automatic clustering)技術自動產生的分類架構,此分類架構是以階層的 方式呈現,並且顯示目前和使用者搜尋的關鍵字相關的主題概念,使得原本高達 數十頁的檢索結果,重新組織成為數十筆的主題階層式清單(Delphi group, 2002), 雖然這些類別並沒有嚴謹的從屬關係,只能稱作是一個樹狀結構(tree structure),

但是能夠提示使用者欲檢索主題之相關重要概念。

18

圖 2.1 Yahoo Directory Searching 之檢索結果舉例

圖 2.2 Grokker 之檢索結果舉例

19

過去一些學者認為分類架構工具(例如:Yahoo 的分類目錄(web directory)),

可以幫助使用者提升檢索精確率(Lee & Olson, 2005;Pahievi & kitagawa, 2005)。 近年來雖然有許多研究探討使用者如何使用分類目錄,但是缺乏使用者如何從 透過分類架構從事資訊尋求行為之研究,因此不論是人工或是自動產生的分類 架構,對於研究者而言,應該關注使用者如何使用瀏覽分類架構介面。當使用 者使用分類架構瀏覽介面,會根據自己心中的資訊需求,進行一連串的類目

(category)選擇與回應,藉由和介面互動的過程,找出系統中和心中符合的概 念,但是有時候系統內自動產生的分類架構所產生的類目(category),不一定 符合使用者心中的認知,這是因為在建構分類架構工具的過程,並不會牽涉到 使用者,縱使分類架構工具所提供的詞彙類別,能夠幫助使用者聯想到其他相 關主題的概念,並進一步幫助使用者查詢問句的再形成,但是對於使用者檢索 時的實質效益,需要更進一步透過研究檢視。

二、 自動分群技術應用於資訊檢索系統

自動分群技術(automatic clustering)應用於資訊檢索領域已經非常普遍,

分群應用於資訊檢索,主要有下列幾個用途:(1)幫助使用者瀏覽大量文件,(2)

過濾不相關的資訊,(3)幫助使用者釐清資訊需求,並且縮小檢索範圍。基本上,

自動分群的過程需要許多演算法,目前分群所使用的演算法:主要分為階層式

(hierarchical)、分割式(partitional)兩大類,前者不僅會將資料分群,也會自 動產生階層式分類架構 (Jain, Murty & Flynn, 1999;轉引自陳思穎,民 96)。

根據過去一些研究指出,使用者喜歡資訊檢索系統以自動分群(automatic clustering)的方式,重新組織檢索結果,但是在使用分群工具(cluster tools)的 過程中,卻面臨到許多問題,根據 Pagan 與 Fagan(2000)的研究,受試者喜 歡以分群的方式組織檢索結果,但是一些受試者指出分群架構(cluster structure)

20

工具在某些檢索問題類型上,自動所產生的群集標籤(cluster labels)和檢索結 果不一致,代表自動分群所產生的群集(cluster)內容不一定會符合使用者心中 的認知;Wu, Fuller 與 Wilkinson(2001)評估使用者在分群介面(cluster-based interface)與分類介面(category-based interface)之檢索表現,研究結果指出使 用者對於介面以分群的方式重新組織檢索結果,抱持正面態度,但是研究者觀察 受試者在分群介 面的檢索表 現,發現並 非 所有的受試者都 能了解分群 架構

(cluster structure)中每個群集名稱(cluster name)呈現上的意義,因此對於使 用者而言,這些分群架構對於他們在檢索上的意義為何?是否能夠跟預期般一樣 幫助使用者提升檢索效益?是一個值得探討的議題。

21