• 沒有找到結果。

資訊索引型式

第二章 相關技術討論

2.1 資訊索引型式

為了增進檢索的效率,並有效的彰顯資料的價值與意義,我們為『日治法 院檔案』引入了兩項互動式資訊檢索模式,1.多維度導覽之後分類資訊檢索系 統 2.標籤樹資訊呈現架構,以下兩小節將分別概述之。

2.1.1 多維度導覽之後分類資訊檢索系統

(Post-Query Multi-Dimensional Navigation System)(Faceted Browsing)

多維度導覽之後分類資訊檢索系統為杜協昌博士在 1999 年所提出的『互 動式網際網路檢索』模型[Tu99],在資訊檢索系統中,將 Metadata 中特定之欄 位視為描述資料的獨立維度(dimensions),如『年代』、『作者』等,使用者可 利用維度進行檢索,例如『年代:昭和 15 年』,當系統將符合檢索條件之文件,

依據各個維度進行分類與排序的功能,例如將搜尋的結果依『年代』、『出處』、

『作者』等分別列出維度下的分類,提供給使用者進行下一步的檢索動作。

《圖 2-1》台灣歷史數位圖書館資訊檢索系統

如《圖 2-1》所展示,此系統為『台灣歷史數位圖書館資訊檢索系統』,在 圖中我們以『明清檔案』資料庫作為系統範例。『明清檔案』為明清時期與台 灣相關的奏摺、行政文書等文件蒐集而成的資料庫。當我們用『林爽文』作為 查詢的關鍵字進行系統查詢後,在圖上紅色箭頭所指示的地方,系統將所有符 合的文件,依據『年代』、『出處』、『作者』三項維度對檢索結果進行各別的分 類,藉由這樣的機制,我們將可以很容易的利用後分類資訊,掌握檢索結果文 件的概況,並更容易進行下一步的檢索。在例子中我們可以藉由文件的統計,

發現與『林爽文』相關的文件在『乾隆』51-53 年間大幅度的增加,這樣的統 計資料極具意義,配合資料的特性,使用者從後分類的機制中立刻就可以知道

『林爽文』在這段時間於台灣發生緊密的關聯,這樣的結果是很難由文件排序 中顯現出來。

因此運用多維度的後分類資訊索引系統,將更容易彰顯資料本身的意義,

並利用簡單的屬性運算增進檢索效率,並提供使用者有效的檢索資源,達成檢 索目標。

2.1.2 標籤樹資訊呈現架構

(Presentation of Query Result Using Tag Trees)

在後分類的資訊索引下,標籤樹透過樹狀的結構與屬性組織檢索結果的 特徵,為一種屬性標籤的階層架構分類及整合呈現的方式[莊 06 ]。標籤樹組 織文件中屬性明確的關鍵詞,如『人名』、『地名』。使用者透過標籤樹的資訊 呈現架構,能夠簡單直覺的判別出檢索結果中的重點,並依據不同主軸的觀 察,如以『人名』為主軸、以『時間』為主軸,了解重要特徵的關聯性。並透 過可直接點選的方式,能夠方便的縮小文件範圍,修正檢索結果。

下圖《圖 2-2》為 THDL Prototype System V0.83,使用『古契書』文件集,

以『金廣成』為關鍵字檢索後,系統所顯示的標籤樹呈現介面。在本例子當中,

由時間的主軸下,我們可以觀察到系統將詞彙標籤,依據在文件中出現的次 數,利用字型的大小以及顏色排序與呈現。

《圖 2-2》標籤樹 - 階層式呈現架構

『金廣成』為墾號之名,是由一群人以此名稱向政府租地,再分租給其他 人的組織。由標籤樹的階層式呈現介面我們可以觀察到,第一階層的時間主軸 由『清光緒十三年』開始,表示與『金廣成』相關的契書文件從此年才開始再 資料庫內出現,而由第二階層的地名資訊中我們也可以發現,『竹北二堡』與

『十寮庄』兩個地名在『清光緒十三年』的 13 件文件中,就各都出現了 11 次,

『清光緒十五年』的 15 件文件中,就各出現了 13 次與 14 次,顯然的可以推 論出『金廣成』與這兩個地方有著高度的相關性,而從文件的全文中,也證實 了這個推論。

在後分類的檢索系統下,運用階層式資訊整合的標籤樹呈現架構,將檢索 結果作多主軸的方式呈現,以提供使用者在一次檢索下能夠得到更完整的文件 的資訊,這將提供無全文檢索的系統另一種資訊索引的幫助。

<root >

<name attribute

</root>

相關文件