• 沒有找到結果。

史料文本分析與數位人文之學術領域發展脈絡

四、 文獻探討

4.1 史料文本分析與數位人文之學術領域發展脈絡

有關於史料分本與數位技術合作的發展,可分為兩個脈胳,一為計量史學所進行的統計試驗,

其二則為數位典藏和資料庫的發展。歷史與數位技術的結合,可回溯至 60-70 年代,在歐美國家所 興起的計量史學(Cliometrics)熱潮,電腦的統計功能,讓史學研究者看到了新的未來。雖然計量史 學於 70 年代因受到質疑而遭到了很大的挫敗,但隨著網際網路與個人電腦的興起,各種資料庫的

出現,使得史學家不得不承認數位技術給史學研究帶來了新的生命[1]。

史料之無限性,讓向來的研究者即使皓首窮經,亦無法蒐羅到所有史料,但日新月異的科技發 展,不及改變了人們的生活模式,也牽動知識領域的創新處理[2]。電腦提供了保存資料更多的選 擇,再加上網際網絡的便利,使得學者們可以進行更多不同面向的研究。電腦對人文學者的最大用 處即為利用它對庋藏在圖書館、博物館等中的各類型資料,進行儲存與檢索,達成保存與研究之作 用為科技與人文合作的重大成果[3]。由各種形式產生的數位資源,可透過網際網路快速取得,讓 人文、科學等層面的文明遺產,能夠為全人類分享[4]。新世紀數位文獻的流通,不僅改變著人們 溝通和處理資料與知識的方式,乃至人類的生活環境、社會結構和文明的發展[5]。

電子文獻於史學研究的發展亦可產生畫龍點睛式的輔助作用,從中研院史語所建置之漢籍全文 資料庫來看,電腦為史料的解釋或意義的發掘找到了新的接榫點。[6]鑑於數位媒介在古籍長久保 存上的優勢,自 1980 年代中央研究院開始建置古籍全文資料庫,逐步將資料科技導向人文相關應 用,並陸續建置各項研究資料庫。[7]歷史資料在有了資訊科技的支援後,史學與社會有了更多的 結合,由〈數位化:史學與社會結合的一大契機〉一文,即可看到數位化在結合歷史學與社會方面 所發揮的作用。[8]

在古籍數位化和資料庫的建設上,中國也取得了相當的成就,《四庫全書》、《四部叢刊》、《歷 代石刻史料彙編》、《十通》、《國學寶典》、《中國基本古籍庫》、《古今圖書集成》、《龍語瀚堂典籍資 料庫》等已經廣為人知和使用。而網路上電子書的格式也非常多元,如 txt、doc、html、pdf、djvu 以及知網、超星、方正等。這為使用大數據和雲計算手段深度整合這些資料提供了重要的基礎。[9]

在大數據的時代,若無統合資料的數據庫,人們將會迷失在茫茫資料中,供後來者追憶想像的「歷 史」,將會褪色淡淺。在這層意義上,資料庫庫猶如原始社會的長老,是保留族群記憶的傳承之寶。

[10]

1998 年以來,各機構數位典藏計畫陸續推動下,建立相關數位技術規範,並累積大量數位資 料,尤其文史檔案陸續轉置為數位影像與全文資料庫,使得歷史研究可資運用的數位資源大幅增加。

[7]國史館數位典藏計畫的啟動與發展,正是期望能夠利用資訊科技的發展技術,將史料轉化為數 位資源,開拓歷史研究的新思維、新方法面向。[2]國史館的數位典藏工作希望能夠在歷史研究的 網路與趨勢中,扮演積極貢獻與不可或缺的角色,讓數位資源對歷史學界所能貢獻的價值提升到更 高的境界。[4]以大量史料的儲存、使用角度來看,數位資源對歷史研究提供了極大的便利性:史 料經過位技術處理,成為數位資源,建置於時間與空間高度集中的資料庫,利用網路及雲端技術,

同時提供給眾多研究者接收充裕的數位資源,增進廣蒐博採之效率[2]。

數位科技為歷史人文學研究帶了許多的新的研究工具,可進行有些過往被認為難以進行的研究,

如巨量資料的量化分析、地理空間分析及多節點研究等,改變了研究者與材料之料的關係。[11]數

位人文研究也提供了不同領域學者合作研究的可能,不同區域的學者也可以共同研究同樣的研究對 象。大數據和雲端計算的出現正在或即將改變我們的思維方式,對於我們重新認識世界提供了更為 科學的方式,也為研究者利用資料分析方式探索人文學提供了一個更好的機會。[9]

有關大數據對人文社會科學研究的影響,孫建軍提出 I. 大數據與人文社會科學研究新思維:

(1) 人文社會學開放與全過程研究思維,以往人文社會科學研究成果的表現形式為最終成果,再 利用主要以文獻引用、轉述和評論等為主。而數位人文研究可記錄人文社會科學研究的完整 過程,資源化的原始資料、中間成果得以立體化應用,再利用水準顯著提升。目前,國外以 線上實驗室、專案網站、開放資料集、專案論壇、專案社會網路為特徵的立體開放研究思維 普遍確立,可參與性大大增強。

(2) 人文社會科學碎片化重組研究思維,大數據環境下,人文社會科學研究更加注重片段資料、

海量資料、非結構化資料的採集、清洗與分析,通過碎片化重組,深度揭示難以處理或無法 預知的科學問題。比如通過海量自然語言表達效果觀測公眾的政治參與意識、通過科學家的 在線時間與資源下載時間分佈研究科學家的作息時間與工作強度等。

(3) 人文社會科學計算分析研究思維。以往人文社會科學研究定性研究居多,定量研究也主張採 用是非論斷,採納或拒絕某一特定假設,是採用確定性、因果關係的研究思維。在大數據環 境下,人文社會科學研究可採用計算分析思維,對相關命題進行趨勢分析。

II. 人文社會科學的大數據研究具有之基本特徵:

(1) 所涉及資料均大大超過一般的閱讀、分析和理解所能處理的範疇,是以往“不可研究”或

“難以研究”的,大資料分析方法的出現提供了人文社會科學研究新的研究空間,提供了新 的研究可能。

(2) 一般引入計算分析方法,其結論並非觀察、思索、領悟等傳統方法獲得,而是通過大量資料 的彙集而“自動湧現”,其理論的獲得不同於傳統人文社會科學研究。

(3) 均構建了可持續完善和豐富的資料集和分析工具,其可用性、共用性、重用性、協作性大大 增強,提供了人文社會科學學者大規模協作的可能。

(4) 均具有跨學科特徵。數位人文研究需要彙集專業領域技能、資料管理技能、資料分析技能和 專案協作技能,因而這類專案往往由跨度較大的不同學科的專業學者共同完成。

(5) 決定研究品質的主要是資料集的品質、數量和利用方式,而研究假設相對容易。在某種程度 上,數據科學家將成為人文社會科學大數據研究中的主角。