第三章 資料蒐集與建庫
第二節 建立資料庫
三、 DocuSky 數位人文學術研究平台
此為臺灣大學數位人文研究中心與臺大資訊工程學系數位典藏與自動推論 實驗室合作建置的資訊整合平台,是一個以人文研究為核心,讓人文學者可自由 進行學術研究的平台(圖三-3)。其設計理念致力於符合人文研究者個人需求,能 收納多元媒材標準性,滿足研究多樣性,又能夠考量到人文研究者之研究進程,
讓人文學者學術研究自由可充分且不受任何限制地獲得實現。此外,DocuSky 不 僅提供研究者建置個人資料庫,方便的分析、統計工具及視覺化效果外,更收納 多元豐富的媒材,讓使用者可直接在平台上進行數位化文本處理、標記、資料格 式轉化、資料庫建置、統計分析及空間資訊視覺化呈現……等操作。
進一步說,DocuSky 提供探索材料、累積發現與再發現之數位人文研究方法 與工具。在此平台,人文研究者可以直接建置符合國際標準格式的個人雲端資料 庫,進行文本建庫、標記、探勘、分析及彙整……等個性化的研究執行,並上傳 個人編輯的文本,然後透過平台提供的研究方法與工具進行分析,包括非空間資 料的圖片,也可以透過GIS 工具讓使用者直接觀察圖像空間分佈,閱覽圖像及古 今地圖對位等。
40
由於此平台功能最符合本研究論文需求,特別是地理文本視覺化呈現上,透 過研究者所熟悉的 Excel 資料表編寫空間資訊、Metadata(詮釋資料)及屬性資 料等,即可將蒐集到的資料整合到研究資料上,再依據研究者的喜好與期望,建 立個人圖層。人文研究者需求譬如:我有一套文本,想知道文本中提到的地名究 竟在哪裡?想要把文本中的地理資訊放到地圖上觀察。一些歷史事件想知道它們 的地理分佈狀況……等。更重要的是,還可以進行古今圖層套疊對位,吸引使用 者深入探究的興趣,非常有助於一個地方文化觀光宣導與推廣,特別是小區域史 地導覽,無疑是本論文進行客庄聚落研究加值應用的最佳幫手。
圖 三-3 DocuSky 數位人文學術研究平台首頁 1.個人化需求
DocuSky 最符合本研究需求的項目,是該平台提供個人雲端儲存空間,使用 者可在上面建置個人資料庫。建庫的三個路徑分別是:DocuSky 首頁圖示、網站 導覽、及功能選項中的研究平台。步驟為:點選「建庫與重整」,然後找到「建 構或刪除資料庫」的工具,使用者從個人資料庫中點選所要操作的「資料庫文獻 集」,即可於線上展開該資料庫。當然,也可以在列表中刪除已經不要的文字庫。
線上展開資料庫之後,可操作的功能很多,包括:全文檢索、瀏覽、分析、
視覺化觀察……等。以檢索為例,在查詢欄位輸入檢索詞,譬如「客家」、「伯 公」……等,即可進行全文檢索,或可縮小範圍在一個特定查詢結果之後,在查
41
DocuSky 數 位人文學術 合工具(Geoport)。
2.DocuSky 地理資 訊工具(DocuGIS)。
1.展示在 DocuSky 上,可以
42
DocuSky 的核心價值,在於可以用一般人熟悉的 Excel 表格新增個人圖層,
建立屬性資料與詮釋資料表格。實際作法是在 DocuGIS 平台右側功能選單上先 登錄,然後點選「上傳csv」頁籤,在「貼上 CSV/TSV」的文字框內,貼上複製 的文本資訊,然後在新增圖層名稱後面點選「新增此圖層」,系統就會顯示已新 記顯示文本中提到「伯公」的地景,然後點選圖標就會出現Metadata(詮釋資料 或屬性資料)的詳細資訊;點擊Link img 則會出現地景影像等。
簡單講,使用DocuGIS 的人文研究者,必須先以 Excel 整理並填入具有座標 資訊的文本,然後開啟DocuGIS 個人圖層,貼上從 Excel 複製的資訊,就可以在 地圖上顯示出資訊內容。Excel 基本欄位包括:序號(id)、地名(place)、經度
(x)、緯度(y)、文本內容(text)、圖檔連結(img),研究者可依個人需求增加 自訂欄位,例如:超連結(url)、日期(date)、時間、地點……等。
DocuGIS 目前已被廣泛運用於各種開放資料的蒐集,以及空間資訊視覺化觀 察,大部分OpenData 都含有空間點位資訊的欄位,即使缺乏座標,也可以透過 諸如「內政部地名資訊服務網」、「法鼓文理學院地名規範資料庫」等系統平台找 到所需的地名座標。本論文以客庄史地調查研究之地理資訊系統應用為主題,顧 名思義,文本中的地名、地景多屬於非知名的景點,缺乏現成座標可供查詢。因 此,小區域史地調查研究的座標資訊,幾乎完全仰賴研究者實地前往定位。