網站典藏庫徵集任務之實務與發展現況
Web Archiving Strategies in Collections and Recent Developments 阮紹薇 Shao-Wei Juan
國立臺灣大學圖書館採訪組編審兼採錄股股長 Librarian, Acquisitions Department, National Taiwan University Library
E-mail: [email protected]
【摘 要】
本文主要由網站典藏的重要性,介紹世界各國一些重點網站典藏計畫,在實 務及學術討論方面的最新發展。其中,網站典藏計畫的策略可分為機構典藏和事 件典藏二項重點。其中各計畫針對重大事件的網站典藏,更能彰顯網站典藏的重 要性,其徵集內容不但是歷史的一手資料,亦成為典藏單位的館藏特色。超越傳統 圖書館的徵集任務與館藏管理,網站典藏庫可提供為文化資產的長久的保存及可即 性,提供未來世代研究網站發展、學術議題及歷史進程等重要的研究資源。
【
Abstract】This paper reviews the significance and recent development of web archiving projects and includes a summary of the current state of web archiving in many countries.
This paper focuses on NTUWAS as an example of an archive which combines approaches for acquiring information collections, and establishs institutional repository and eventsoriented web sites for future studies.
關 鍵 詞: 網站典藏庫;網路資源備份;開放性網路資源;機構典藏;機構網站 典藏系統;數位資源寄存法;原生數位資源
Keywords: Web archiving system; Web resource preservation; Open access resources;
Institutional repository, IWAS (Institutional Web Archiving System);
Digital Collection Deposit Act; Born digital
技日新月異,數位資料的產出、傳播 和使用也更加便捷,Tim O'Reilly於 2004年首次提出Web 2.0的概念,網路 內容的提供者或分享平台早已漸漸取 代傳統的資訊載體。(Crook, 2009)
然而,這些網路空間(website)中,
由學術社群間知識分享與學術交流,
注重的已不再是內容(content),而 是在互動情境(context)激盪的重要 意涵,亦有別於傳統圖書館所提供的 資訊內容及保存形式。
據World Wide Web(http://www.
worldwidewebsize.com)的統計,至 2010年1月4日,網路中可被搜索引擎 索引的網頁數量達到21.24億個所謂 表層或淺層的網頁(surface web),
然而深藏在網頁背後,必須與網站互 動或使用帳號才能檢索到的深度或深 層的網頁(deep web),其資訊量更 為淺層網頁的500倍之多。在2001年 對網路的相關研究,提供一個網頁的 平均壽命(lifespan of a web page)約 75-100天(Brown, 2006, p.3),在許 多文獻中,都引用網站平均生命週期 約為44天(項潔、洪筱盈,2006),
鼓勵建構學術網路社群及數位產出,
越 來 越 多 具 有 學 術 價 值 及 歷 史 意 義 的網路「開放性資源」(open access resources),及只以數位型式產出的
「原生數位資料」(born digital)充 斥著網路虛擬世界中。如何有效地掌 握並有系統的保存、保障這些資源的 永久可存取性,以滿足未來可能的研 究需求及保存當代的文化與學術資產
(洪淑芬,2006),著實考驗著傳統 圖書館館藏發展的觀念。
本 文 將 概 述 網 站 資 源 典 藏 的 任 務及重要性,並依不同的徵集模式,
介紹目前幾個重要的網站典藏計畫。
由 於 大 學 圖 書 館 肩 負 著 保 存 知 識 文 化、配合教學研究和推廣學術三大使 命,宜建立更完善的網站保存機制,
以 滿 足 數 位 學 術 產 出 的 管 理 和 保 存 需 求 ( 項 潔 、 洪 筱 盈 ,2005),以 臺 大 圖 書 館 於2006年起即開始計劃 並 執 行 近 四 年 的 「 臺 灣 網 站 典 藏 」
(NTUWAS)做為經驗分享,本文更 實際地探討建構網站典藏計畫的價值 及重要性。
貳、 網站典藏計畫概述
網 站 典 藏 (Web Archiving或 Web Preservation)的概念,最早應 回溯至網站資料(web)創立之初。
Brown(2006)舉World Wide Web Consortium為例,該網站仍保留著 1991年的網站型式及內容,將18年前 網站的原貌完整保留著(圖 1)。若 想回顧更多已消失或更新的網站,使 用者亦可進入Wayback Machine(網 路時光機),為該網站所收1996年10 月間的Yahoo!網站(圖 2),現在看 來與18年前的陽春網站並未有太多變 化。
網 站 流 量 統 計 公 司A l e x a 創 始 人Brewster Kahle於1996年創立了非 營利性的Internet Archive(archive.
org,以下簡稱IA),將定期收錄及 保存網路中各種文字、音訊、視訊、
軟體系統和Web網站資料提供公眾檢 閱(圖 3)。也是全球第一個由民間 成 立 的 網 站 典 藏 計 畫 , 使 用 可 透 過 Wayback Machine鍵入網址,按“take me back”,即可看到IA所保存1996以 後網站。IA所典藏的大量網站資料,
為學術界留下了網站發展歷史的珍貴 記錄,提供了分析網站發展的過程,
與 網 站 內 容 建 構 的 歷 史 (Brugger, 2009)。
IA的開創性作法,引起了世界 各 國 圖 書 館 、 檔 案 館 等 資 料 單 位 的 重視。美國國會圖書館(Library of Congress,以下簡稱LC)在美國政 府 的 強 力 支 援 下 , 即 與IA共同開發 以 「 智 慧 女 神 」Minerva命名(全
圖 1 World Wide Web Consortium
http://www.w3.org/圖 2 1996年10月17日Internet Archive第一筆典藏Yahoo!首頁
http://web.archive.org/web/19961017235908/http://www2.yahoo.com/
名Mapping the Internet Electronic Resources Virtual Archive)的網站 典 藏 計 畫 , 以 為 將 來 的 世 代 保 存 當 下 的 國 家 文 化 和 智 慧 產 出 為 已 任 。
(Arms, 2000)Minerva的成功開發,
主 要 是 獲 得 「 國 家 數 位 資 訊 基 礎 建 設與保存計畫」(National Digital Information Infrastructure Perservation Program,簡稱NDIIPP)撥出500萬美 金做為啟動經費,由此可知美國政府 有鑑於保存網際網路中的「原生數位 資料」(born digital)的急迫性。
NDIIPP計畫為美國國會圖書館 主導,結合聯邦政府及非聯邦政府機 構,如美國商務部(US Department of Commerce)、白宮科技政策辦公 室(OSTP)、美國國家航空暨太空 總署(NASA),美國國家醫學圖書 館(NLM)及美國國際圖書館電腦中 心(OCLC Online Computer Library Center)等單位,以保存數位資源的 完 整 性 與 統 整 性 為 目 標 , 可 見 國 家
級的網路資源的典藏,有賴於相關單 位 的 群 策 群 力 、 分 工 合 作 才 足 以 達 成任務。如NDIIPP除了LCWA計畫 外,亦支援加州數位圖書館及紐約大 學圖書館等圖書資訊學術單位針對學 術網路資源流失進行的Web-At-Risk Project,建立Web Archiving Service
(WAS)系統。(Seneca, 2009)
M i n e r v a 於 2 0 0 8 年 改 名 為 LCWA(Library of Congress Web Archives),但以所開放公眾瀏覽的 網站典藏來看,雖然外型上沒有太多 改變(如圖 4),然而其典藏工作仍 持續進行中。其工作團隊為美國的網 站典藏制定相關的技術標準和規範,
訂定長期保存的措施,也帶動美國圖 書館界重視網站典藏,列入數位館藏 徵集的重點開發項目,國際級的圖書 館合作組織如IFLA及OCLC等會員團 體,也因此而開始合作研擬相關網站 建置及典藏格式(如matadata)等國 際標準。
圖 3 Internet Archive首頁呈現其所收錄的各類型的網站資料
http://www.archive.org/由LCWA看來,國家圖書館素 以典藏國家文化遺產為己任,主導該 國的網站典藏計畫當然是無可取代。
(Shiozaki & Eisenschitz, 2009)為 了 有 效 收 集 保 存 網 站 資 料 , 自1996 年起,如澳洲、奧地利、加拿大、丹 麥 、 芬 蘭 及 日 本 等 國 家 , 相 繼 開 發 國 家 型 的 網 站 典 藏 系 統 。 其 中 澳 洲 國 家 圖 書 館 自1996年起研發網站典 藏系統,並將其成功建置的網站典藏 系統PANDORA,推向歐盟各國和英 國,知名度和規模甚至遠超過美國的 LCWA。
2003年7月,歐美12個國家的國 家 圖 書 館 , 共 同 組 成 「 國 際 網 站 典 藏合作組織」(International Internet Preservation Consoritum, 以下簡稱 IIPC),以netpreserve.org為網站名 稱,訂定四大目標如下:
1. 收集、保存和徵集全球各機構豐富 的網站資源;
2. 開發網站典藏應用程式,研擬國際
共通的網站典藏技術及標準;
3. 成為強而有力的諮詢及遊說團體,
向各國政府推廣網站典藏相關立法 及政策的制定;
4. 鼓勵及支援各國圖書館、檔案館、
博物館及文化遺產等機構網站內容 的收集及保存。
IIPC的成果包括開放原始碼(open source)軟體的開發及修正;提出網站 典藏標準、詮釋資料(metadata)與內 容管理的發展計劃;分享成員組織處 理數位內容的經驗;並提供網站典藏 的最新動態與未來發展。
自2005年起,IA也開始為個別機 構推出年費制的Archive-It(圖 5),為 110多個合作夥伴提供網站典藏規劃、
下載與檢索平台的服務。Archive-It 的會員來自於國家圖書館、檔案館、
大學圖書館、聯邦機構、非政府非營 利 機 構 、 博 物 館 , 及 學 者 專 家 等 。 Archive-It視成員需求,依網址、主 題及機構選擇典藏目標,設定徵集範
圖 4 美國國會圖書館網站典藏系統LCWA首頁
http://lcweb2.loc.gov/diglib/lcwa/html/lcwa-home.html
圍 , 並 運 用 不 同 時 段 的 排 程 下 載 機 制,為會員們定期抓取及保存網站,
並提供如matadata的編目資料、全文 檢索、網站典藏相關報表及網路內容 分析等全面性的服務。
在 學 術 及 實 務 的 研 討 方 面 , 2 0 0 1 年 「 國 際 網 站 典 藏 工 作 坊 」
(I n t e r n a t i o n a l We b A r c h i v i n g Workshop,以下簡稱IWAW)也應運 而生,自2001至今,每年召開會議,
聚集來自世界各地的相關學者及實務 工作者,討論網站典藏的最新發展,
分享網站徵集、維護與保存的實務經 驗,期能結合學術研究和實務,推動 網 站 典 藏 工 作 , 以 利 相 關 計 畫 之 永 續經營。2008年IWAW在丹麥召開會 議,臺灣方面由時任臺灣大學圖書館 系統資訊組主任的陳光華教授派員與 會,現場發表學術論文並與來自各國 的學術及實務專家們分享「臺灣網站 典藏庫」(NTUWAS)的成果,獲得 熱烈的回響。
IWAW於2009年9月30日及10 月1 日 在 希 臘 召 開 會 議 , 會 議 所 討 論的議題(http://www.dlib.org/dlib/
november09/rauber/11rauber.html)包 含網站典藏技術研發及典藏內容的最 新 發 展 , 本 屆 會 議 多 篇 論 文 針 對 網 站典藏源自於機構網站典藏(IWAS, Institutional Web Archiving System)
概 念 , 討 論 機 構 典 藏 在 制 定 收 錄 政 策、取得授權、及內容完整性等非技 術層面的典藏問題。如日本University of Tsukuba即提出機構典藏中必須對 網站內容提供者,事先規劃嚴謹的網 站典藏政策,以確保公開資料的永久 合法性及可用性。
參、 網站典藏徵集模式
傳統上,不同類型及規模的圖書 館,針對其特殊任務與服務對象,定 有不同的館藏發展或館藏選擇政策;
在面對如此龐大及來源廣泛的網站資
圖 5 Archive-It網站首頁
http://www.archive-it.org/
料,重覆率高、格式不一、內容質量 多半未受管控的網路資源,圖書館也 必須考量運用有限的資源,制定適合 的 徵 集 策 略 及 選 擇 原 則 。 以 下 就 澳 洲的網站典藏計畫PADI(Preserving Access to Digital Information)歸納出 的四大典藏徵集模式:全面性、選擇 性、專題性、出版寄存式典藏模式,
及採取彈性處理方式的綜合性典藏模 式,介紹若干國際知名的網站典藏計 畫。
一、 全面性(Comprehensive Approach)或全域式典藏
( Whole Domain)
世界最大,也是唯一企圖全面性
(comprehensive approach)典藏全球 網站的世界級網站典藏計畫當然首推 Internet Archive,使用HTTrack(網站 抓取程式web crawler),以自動、批 次、全面性的搜尋方式來抓取網站,
但因缺乏品質控制、未經篩選即進行 儲存,雖有豐富網站資料,但重覆性 高,充斥著無計其數失效或不完整的 典藏,為其美中不足之處。
此 外 , 國 家 級 的 網 站 典 藏 計 畫 以 國 家 或 區 域 性 的 網 站 為 徵 集 目 標,屬全面網域式典藏模式。瑞典的 Kulturarw3和芬蘭的EVA project即為 採取這種典藏模式的代表國家。
瑞 典 皇 家 圖 書 館 ( R o y a l L i b r a r y ) 於 1 9 9 6 年 開 始 執 行 Kulturarw3 Project,修定原有的瑞典
寄存法(Swedish Deposit Law),確 保網站典藏的合法性,並利用程式自 動抓取屬於瑞典的所有網站資料。可 惜的是Kulturarw3在1998年開始建構 時,由教育部(The Swedish Ministry of Education)提出立法建議,區隔保 存(preserving)和公眾取用(giving access)服務(Mannerheim, 2000),
因 此 至 今 只 限 於 瑞 典 皇 家 圖 書 館 內 提 供 學 術 研 究 者 申 請 檢 閱 使 用 , Kulturarw3並未向網路大眾開放。
二、 選擇性典藏(Selective)
選 擇 性 的 網 站 典 藏 , 意 指 典 藏 機構設定特定的網站典藏目標,依主 題、重要性及典藏品質等,規劃網站 收錄的原則。1996年澳洲國家圖書館 建立亞洲第一個網站典藏系統:「潘 朵拉」(Preserving and Accessing Networked Documentary Resources of Australia,以下簡稱Pandora),公認 為研究並開發國家級網站典藏計畫的 先驅,Pandora採用的是選擇性的網 站 典 藏 模 式 , 針 對 澳 洲 地 區 的 網 路 出 版 品 和 重 要 網 站 資 源 , 重 點 式 地 典 藏 具 有 長 期 研 究 價 值 的 網 站 資 源
(如圖 6)。
Pandora對其所典藏的網站,比 照 國 家 圖 書 館 的 館 藏 , 利 用 圖 書 館 分類編目工具,如AACR2、LCSH及 DDC等,以半人工方式製作MARC 格式,將網站典藏匯入國家圖書館目 錄及全國書目中心提供讀者檢索。將
六個州立合作館的網站典藏視為分館 的館藏,使用者可從合作館代碼清楚 分辨網站典藏的原儲存館,如State Library of Victoria典藏的網站,即在 MARC856後加上分段“$zArchived by ANL for VSL”。(Phillips, 2004)
P a n d o r a 建 立 一 個 由 國 家 圖 書 館 主 導 , 協 調 國 內 重 要 圖 書 館 , 訂 定 網 站 典 藏 的 選 擇 原 則 (selection guidelines),再將各館所收錄的網 站 典 藏Pandora自行研發的Pandas
(Pandora Digital Archiving System)
整合成為一個資料庫系統,並結合國 家書目系統提供服務,建構一個收錄 完 整 並 管 理 完 善 的 「 國 家 圖 書 館 」 網站典藏模式,為各國相關計畫的表 率,英國網站典藏庫即應用Pandora系 統建置而成。
三、 專題式典藏(Thematic)
設 定 特 定 主 題 或 事 件 議 題 來 收
集網站的徵集策略,該計畫組織通常 具有特殊的服務對象或任務,並能提 供 機 動 性 的 網 站 下 載 功 能 。 美 國 國 會圖書館的LCWA即為專題式典藏的 典 範 , 設 定 特 定 主 題 , 收 藏 美 國 政 府及人民所關注的網站資料,如911 事件網站(如圖 7)、2002年冬季奧 林 匹 克 運 動 會 , 伊 拉 克 戰 爭 及 非 洲 蘇丹的達佛(Darfur)事件等。專題 下 再 依 網 站 主 題 (subject)、題名
(title)、人物或組織名稱(name)
提供瀏覽清單。
事件(events)是最能發揮專題 式網站典藏計畫的重要性,「911事 件」於2001年9月11日發生,為美國 歷史上最慘痛的恐怖組織攻擊事件,
LCWA自2001年9月11日至2001年12 月2日,共收錄2,313個網站(number of sites),同時也將LCWA的合作單 位IA中所收錄約3萬個相關網站列入 相 關 資 源 。 此 外 ,2003年非洲蘇丹 西部區域發生的種族滅絕事件,世稱
圖 6 澳洲PANDORA系統選擇收錄澳洲區域性網站的各類主題
http://pandora.nla.gov.au/
「達佛危機」(Crisis in Darfur),
2005年MINERVA將為「達佛危機」
請求國際人道救援的網站或部落格,
並抓取(crawl)有關種族滅絕、人道 主義干預、維持和平部隊及蘇丹國的 相關網站,提供完整的歷史證據及學 術研究的資源。(阮紹薇,2009)直 至今日,蘇丹達佛地區的人道危機,
仍然持續是美國民眾憂心及聲援的焦 點。
四、 出版寄存式典藏(Deposit)
國家級的網站典藏計畫,多半都 必須透過政府立法,明確規定網站所 有者將網站自動呈繳至國家的網站典 藏庫中。歐洲國家網站典藏計畫最早 於1996年開始,即為將網站典藏制定 法定寄存法(Legal Deposit Act)或呈 繳制度,以有效典藏網路資源,如丹 麥、芬蘭、荷蘭、瑞士等。
其中,2008年「國際網站典藏研 討會」(IWAW)的召集國家丹麥,
即於2004年12月開始依出版品寄存法
(Act on Legal Deposit of Published Material no. 1439 of 22)開始收集所 有 丹 麥 國 家 網 域 內 所 出 版 的 國 家 的 或國際的「丹麥資料」(.dk下的所 有資料Danish Material),計劃四年 為 期 將 全 部 網 站 至 少 典 藏 一 遍 , 但 重 要 或 事 件 性 的 重 態 網 站 則 視 需 要 不定期的選擇性(selective)典藏。
(Jacobsen, 2008)
而2009年改版令人耳目一新的 英國網站典藏庫(UK Web Archive)
( 如 圖 8),即在2003年制定「英 國法定送存圖書館法」(The Legal Deposit Libraries Act,簡稱LDAP)
將網站典藏庫比照出版品寄存原則,
由British Library, the National Library of Scotland, the National Library of Wales, the Bodleian Library, Oxford, Cambridge University Library and Trinity College Dublin等六所國家及大 學圖書館合作網站典藏的寄存任務。
至2009年底,總收錄將近1.28億網
圖 7 美國國家圖書館LCWA的911事件之網站典藏
頁,企圖完整收藏英國的所有網站。
由於收錄網站內容可能會衝擊到文化 事業、運動或媒體等有經濟價值的版 權資料,因此部份內容只限六家寄存 圖書館的閱覽室開放檢閱。(Tuck, 2009)
美 洲 地 區 的 加 拿 大 於2004年開 始進行Library and Archives(以下簡 稱LAC)的網站典藏計畫,由加拿大 圖家圖書館和國家檔案館依「加拿大 圖書館與檔案法」(The Library and Archives of Canada Act, the Legislative Act)的規定,收錄加拿大境內政府
(*.gov)及私人網站。該計畫從為 網站典藏的特性,研擬編目和描述網 站存取層次(access level)的原則,
並 設 定 數 位 典 藏 發 展 政 策 (digital collection development policy)、網 站 選 擇 與 徵 集 指 導 原 則 (selection
and acquisition guidelines for Canadian web sites),及數位出版品的記述 原則(description policy for digital publications),將網站典藏視為傳 統 的 紙 本 出 版 品 , 建 立 書 目 記 錄 並 進行後續典藏徵集作業。(Lilleniit, 2007)由於寄存制度的法源及支持,
LAC執行二大計畫:E-Collection和 Government of Canada Web Archive,將 政府網站及網路出版資源完整保存下 來,為所有典藏建立專業編目紀錄,並 開放公眾檢索取用。
五、 綜合性典藏策略(Combined Approaches)
由於各種網站典藏模式均有利有 弊,部份國家採取綜合性的策略,選 定特殊事件或議題做全域式的收集,
圖 8 2009年最新改版的英國網站典藏庫(UK Web Archive)
http://www.webarchive.org.uk/ukwa/
對其他的網站採取較為嚴謹的選擇性 典藏原則。如前述丹麥和英國網站典 藏計畫(UK Web Archive)的作法。
在亞洲方面,2001年起中國大陸、日 本及韓國亦採取這種綜合性典藏策略 進行網站典藏。
中 國 國 家 圖 書 館 於2001年成立
「 網 絡 信 息 資 源 釆 集 與 保 存 實 驗 項 目」(Web Information Collection and Preservation,以下簡稱WICP),初 期由北京大學開發「中國Web信息博 物館」(以下稱Web InfoMall)的網 站典藏系統。WICP計畫於2003年開 始啟動,以長期追蹤並保存政府官方 網站及電子報為首要典藏目標,再配 合「專題存檔」為典藏策略,如「奧 運專題」全面收錄2008年北京奧運共 60個子專題的相關網站,完整記錄運 動場地建設、運動項目,和奧運吉祥 物等。但由於中國國家圖書館未對外 開放其網站典藏的成果,目前也只能 從Web InfoMall輸入正確的網址檢索 其網站典藏的情況。
同 樣 身 處 於 亞 洲 地 區 的 國 家 級 網 站 典 藏 計 畫 , 還 有 日 本 國 會 圖 書 館 執 行 的WARP(Web ARchiving Project)計畫及韓國國家圖書館的 OASIS(Online Archiving & Searching Internet Sources)。韓國的網站典藏 計畫則較近似於將數位典藏的網站透 過 網 站 典 藏 計 畫 加 以 保 存 , 重 視 國 內 的 數 位 出 版 內 容 的 網 站 典 藏 。 日 本國會圖書館的WARP主要特色為遵 照「公眾送信權」(Rights of Public
Transmission,引自日本國著作權法 23條),所有典藏均有詳細的審核和 授權機制。WARP收錄中央及地方政 府網站資料外,亦保存網路上免費公 開的電子期刊與圖書,此外,WARP 也接受推薦,避免遺漏重要典藏。如 圖 9,WARP將日本新潟越後妻地區 都會每年舉辦的『大地藝術祭』相關 網站保存下來,提供背景分析及描述 網站的「書誌情報」。
在 臺 灣 方 面 , 洪 淑 芬 (2006)
發表國內第一篇完整介紹網站典藏概 念的論文,即主張基於完整性與經濟 效率,宜考慮混合式之模式,除了批 次選擇收集特定類別網站(如.edu、
.gov、.org等),亦個別選擇已知的重 要網站作深入的蒐集。而國家圖書館 身為國家級圖書館,除致力實體文獻 的數位化及資訊服務,也注意到網路 資源逐步取代實體文獻之趨勢,在進 行國家文獻典藏時,網路資源的典藏 也是不能忽略的重要職責,基於資源 保存與學術研究的立場,國家圖書館 於2007年著手建置「國家圖書館網站 典藏先導系統」,目前已開放公眾檢 索使用。該網站提供多元化的檢索查 詢方式,如典藏查詢、主題瀏覽、機 構瀏覽、地區瀏覽及重大議題瀏覽,
亦歡迎讀者上網推薦。
以下筆者就臺灣大學圖書館建置 之「臺灣網站典藏庫」(NTUWAS),
簡述該系統所收錄之館藏特色,就實務 分享網站典藏的重要意義及價值所在。
肆、 臺灣大學網站典藏庫的 館藏特色
2006年臺灣大學圖書館承教育 部委託,建置「臺灣機構典藏」以存 取並長久保存機構知識的產出,提出 加強收集與管理機構內產生的各種數 位資源及灰色文獻,提高機構學術成 果 的 能 見 度 與 影 響 力 。 ( 項 潔 、 洪 筱盈,2005)2006年7月,臺大圖書 館 結 合 系 統 資 訊 組 及 「 臺 灣 機 構 典 藏 」 計 畫 的 工 作 團 隊 , 將 原 生 數 位 型態(born digital)的「網站典藏」
(Web archives)列入「臺灣機構典 藏 」 的 計 畫 項 目 , 將 長 期 關 注 相 關 計 畫 的 研 發 成 果 , 成 功 建 置 臺 灣 第 一個網站典藏系統NTU Web Archive
System(以下簡稱為NTUWAS)(如 圖10)。
NTUWAS的系統管理介面主要 有「後端管理系統」及「前端讀者介 面」二部份。後端設定網站下載及取 存機制,不同時期的網站典藏能有效 對 應 讀 者 查 詢 介 面 , 管 理 者 亦 能 清 楚的分辨尋找網站典藏,增進管理的 效 能 。 而 「 前 端 讀 者 介 面 」 除 提 供 網 站 檢 索 及 全 文 檢 索 , 讀 者 可 提 供 本 系 統 未 收 錄 之 網 站 逕 行 推 薦 , 讓 網站內容更加完備。NTUWAS系統 建置及架構的詳細介紹,可參考陳光 華 教 授 領 導 的 團 體 於2008年發表於 第八屆“International Web Archiving Wo r k s h o p ” 的 論 文 “ D e v e l o p i n g National Taiwan University Web Archiving System”。(陳光華、陳彥
圖 9 WARP中日本『大地藝術祭』相關網站的典藏
良、丁培峰,2008)
NTUWAS的內容建立,如同實 體館藏之徵集,由圖書館採訪組規劃 館藏發展方向,並實際執行網站之選 擇與下載。經考量如Internet Archive 系統自動下載造成大量無效網站的缺 點,NTUWAS主要採用人工篩選,再 輔以系統排程功能的收錄原則,最後 再經由網站檢測確保收錄品質,才提 供讀者瀏覽與檢索。
NTUWAS前後台系統功能經過 二年的測試,於2008年4月正式上線 供眾使用,同時利用圖書館快訊並登 刊 於 臺 大 校 訓 , 歡 迎 全 校 師 生 共 同 投 入 這 項 重 要 的 網 站 典 藏 工 作 。 目 前NTUWAS已收錄近5,000種網站資 料,使用12T的硬碟空間,提供更多 元化及有趣的各樣瀏覽典藏的介面,
如觀察網站更迭的「時光迴廊」、依
事件發生時間瀏覽典藏的『時光拉霸 機』和將地域性網站以Google地圖呈 現的『地理瀏覽』等。(如圖11)
NTUWAS為臺灣第一個網站典藏 系統,鎖定選擇、蒐集、保存原始性 網頁資料目標,善盡保存臺灣網站數 位資產之責任,並提供綜存網站新舊 版本的展示平台及檢索機制,以滿足 當代與未來世代研究發展之需求。然 而,網站資料豐富且瞬息萬變的的網 路世界中,NTUWAS如同全世界各國 的網站典藏計畫一般,都不可能做到 一網打盡式的目標。因此在NTUWAS 的典藏方面,工作小組即參考各國網 站典藏系統的作法,設定計畫目標如 下:
1. 提供網站典藏(Web archive)機 制;
2. 記錄網站發展的歷程;
圖 10 2006年12月建置初期的NTUWAS
3. 收藏網路記憶中的臺灣紀錄,提供 未來學術研究的參考。
然 而 , 網 路 資 料 超 越 時 間 及 空 間的限制的特性,在網站的典藏方面 也必須考量全球性學術、政治、經濟 貿易上互相依存、不斷增強的脈動關 係,因此除了保存臺灣這片土地上人 民和國家的網站典藏外,也應對應、
觀 照 同 時 期 國 際 社 會 的 變 化 脈 絡 , NTUWAS也運用有限的資源,盡可能 將臺灣所關注的重大國際事件及學術 網站等列入典藏目標。
綜合以上,NTUWAS網站典藏 以臺灣大學圖書館機構典藏目標為優 先,並規劃富有地方性及時代價值的 特色網站達到保存臺灣記錄的計畫目 標。藉此設定了NTUWAS三大典藏發 展目標:典藏機構、典藏臺灣和典藏 時代,並以內而外的館藏發展策略,
逐步規劃收錄內容及典藏範圍。
以下就NTUWAS的三大典藏發展 目標,以實際的網站典藏舉例說明如 下:
一、 典藏機構
NTUWAS的計畫主目標在於將臺 灣大學所有及相關機構的網站資料,
完整保存;並以臺大身為教育部所屬 國立大學的機構性質,擴大收錄公部 門網站及教育學術相關網站,期能至 少完整收錄一遍,並儘可能典藏重要 的網站更迭紀錄。
(一) 臺大相關網站
完 整 收 藏 臺 灣 大 學 首 頁 、 行 政 及學術單位、合作網站、計畫網站,
亦收錄重要的個人網站。典藏特色如
圖 11 至2009年多次更新改版後的NTUWAS
http://webarchive.lib.ntu.edu.tw/default.asp
下:
1. 臺灣大學首頁的網站典藏回溯至 1997年7月15日,至2010年1月6 日止,典藏數量為147個,並持續 記 錄 臺 灣 大 學 所 屬 單 位 的 更 新 網 站 , 或 重 大 異 動 事 件 。 如 圖12,
NTUWAS保存了「臺灣大學進修推 廣部」學分班停招前的網站。
2. 收錄臺灣大學2008年11月17日80週 年校慶『八十臺大、前進百大』的 相關網站,典藏「邁向頂尖大學計 畫」補助的新增計畫或單位之相關 網站。並擴大收錄其他獲得補助的 大學相關計畫網站,及接受繁星計 畫的重點高中網站,作為未來教育 政策研究的參考。
(二) 政府機構網站
中央各部會、各級地方政府所屬 單位之合作網站及個別網站。原則上 中央及各部會網站因為過於龐大,因
此主要收錄總統府、五院首頁及行政 院下重要二級單位網站,重要的館藏 特色如下:
1. 2007年初臺灣興起一股臺灣正名 風潮,部份政府事業單位更名而進 行的網站改版:如中華郵政股份有 限公司於2007/02/12更名為臺灣郵 政股份有限公司,又於2008/08/01 回 復 名 稱 為 中 華 郵 政 股 份 有 限 公 司 ( 圖13),又如中正紀念堂管 理2007/05/15更名為國立臺灣民主 紀念館,又於2008/08/21回復名稱 為國立中正紀念堂管理處,一波三 折的過程;亦有更名後維持新名稱 的,有中國石油股份有限公司改為 臺灣中油股份有限公司,中國造船 改名為臺灣造船等。NTUWAS典藏 並保存與這些因單位名稱改變而更 迭的網站,也無形中成為見證臺灣 歷史的一手資料。
2. 臺灣在2008年進行的立法委員與總
圖 12 臺灣大學進修推廣部學分班停招前的網站
http://webarchive.lib.ntu.edu.tw/switch.asp?IDX_SITE=1197&LOADDTE=2008-05-01
統大選,從候選人網站或部落格的 網站典藏,可說是在網路時代出現 新 形 態 的 選 舉 策 略 。 由NTUWAS 典藏的競選相關網站來看,約有三 分之一個網站已大幅變更或不再運 作,因此必須掌握時機保存新聞性或 時效性之網站。中央及地方選舉後的 各級政府人事或網站異動的記錄。重 要如『阿扁電子報』全部內容(圖 14)及其活動紀錄(圖15)。
又如2008年5月21日總統大選前後 總統府網站的異動,如圖16為馬英 九總統上任後新架的總統府網站,
經由NTUWAS所設計由人工操作的
「即時下載」功能,才能留下如此 珍貴的網站歷史記錄。
3. 中華民國臺灣省319鄉鎮及55臺灣 原住民鄉鎮的地方網站,保留豐富 的 地 方 文 史 資 料 及 地 方 產 業 特 色 等,這部份亦可視為達成第二個典 藏目標「典藏臺灣」的重要典藏特 色。如高雄縣三民鄉於2008年1月1 日改名為那瑪夏鄉,及2009年8月8
日的八八水災,及2010年3月4日甲 仙百年大地震受災地區,留住重要 關鍵歷史紀錄的地方政府網站。
4. 臺北市政府社會局廣慈博愛院於民 國96年9月11日正式被裁撤,但舊 網站仍存在NTUWAS中。
(三) 教育學術網站
主要收集重點國立或私立大專院 校及學術單位之網站、合作網站(結 盟網站)、計畫網站及個人網站等。
典藏特色主要為:
1. 前述「邁向頂尖大學計畫」相關學 校網站;
2. NTUWAS也致力肩負學術機關的任 務,配合臺灣大學正在進行的邁向 頂尖大學計畫為基礎,兼收藏校外 其他相關主題網站,典藏相關的學 術成果,關於這方面,其特色可分 為:地區性研究主題如亞太研究、
南島文化,及臺灣即將邁入高齡化 社會衍生之公共保險研究等;將文 化資產加值利用的數位典藏計畫;
高科技的奈米科技、光電與半導體 http://webarchive.lib.ntu.edu.tw/switch.asp?IDX_SITE=1046&LOADDTE=2007-02-13
等;探索人類生命奧秘的基因體與 分子生物等;及全球性環境保育及 生物多樣性等主題。
3. 重要異動機構:原國立體育學院於 2008/02/01更名為國立臺灣體育大 學(桃園),並於2009/08/01更名 為 國 立 體 育 大 學 的 網 站 紀 錄 。 在 NTUWAS「時光迴廊」中點選右方 的「教育學術」類目,即可一探該
校更名前後的網站變化(圖17)。
二、 典藏臺灣
(一) 相關網站
文學、美術、古物、民間風俗、
民間藝術等及相關典藏單位(如博物 館、美術館)網站。各教學資源及史
圖 14 中華民國總統府網站『阿扁電子報』
http://webarchive.lib.ntu.edu.tw/switch.asp?IDX_SITE=96&LOADDTE=2006-08-11
圖 15 中華民國總統府網站陳水扁總統的活動紀錄
http://webarchive.lib.ntu.edu.tw/switch.asp?IDX_SITE=96&LOADDTE=2008-05-20
料檔案等相關網站入此。NTUWAS 保 存 臺 灣 重 要 藝 術 文 化 網 站 共3 4 5 種,其中藝術與文化資產部份265種 網 站 及 華 文 及 臺 灣 文 學 網 站98種,
NTUWAS保存臺灣藝術文化資源的重 要典藏特色。
(二) 族群相關網站
原住民、客家、臺灣各宗親會網 站;婦女團體、少數民族、弱勢族群 入此。這部份的重要典藏如:
1. 保存臺灣原住民族相關網站及部落 格 , 保 存2007年來許多消失或停 止運作中的臺灣原住民族網站,如 蕃薯藤網站中的「蘭嶼曙光」(圖 18)。
2. 華僑及臺灣新移民等相關網站,如 圖19「外籍及大陸配偶家庭關懷服
務網」,為階段性任務並已結束的 政府網站。
(三) 非政府組織
職 業 公 會 及 工 會 、 慈 善 團 體 、 宗教團體(含臺灣傳統民間信仰及民 俗 團 體 ) 、 其 他 非 營 利 社 團 等 。 這 部份呈現臺灣社會的良善及公益的一 面,也是最能反映臺灣大學的社會關 懷 。 由 於 非 政 府 組 織 的 種 類 繁 多 , NTUWAS針對自然資源保護、婦女 與 性 別 相 關 及 人 道 救 援 三 項 , 與 學 術 研 究 或 時 事 議 題 較 相 關 的 重 要 議 題 組 織 , 設 立 獨 立 類 目 , 以 觀 察 相 關 議 題 及 網 路 資 源 之 發 展 。 如 圖20
「臺灣國際醫衛行動團隊」(Taiwan International Health Action,簡稱 TaiwanIHA)
圖 16 中華民國總統府網站首頁馬英九就任第12任總統的相關活動
http://webarchive.lib.ntu.edu.tw/switch.asp?IDX_SITE=96&LOADDTE=2008-05-21性」的重要資訊,在這些重要的歷史 資 訊 中 , 部 份 重 大 的 事 件 和 重 要 人 物,若以獨立或特別的類目來呈現,
一則以呈現其時代意義,一則不會埋 沒在龐大的分類目錄中,被人遺忘。
這部份可能會因為事件或人物本身後 續衍生更多的討論或產生更多網路資 源,因此可隨時將後分類進行彈性調 整。
(一) 事件網站
做 為 美 國 國 會 幕 僚 機 關 的 美 國 國 會 圖 書 館 , 典 藏 了 甚 多 重 要 的 事 件 網 站 , 記 錄 重 大 歷 史 事 件 發 展 過 程 , 如 收 錄 聯 合 國 和 美 國 國 會 所 關 切的『達佛危機』,及2001年「911 事 件 」 等 相 關 網 站 ; 澳 洲 國 家 圖 書 館的Pandora收錄2004年發生的「南 亞海嘯」(Asia Tsunami Disaster)
相關區域或國家的網站;英國的UK Web Archiving典藏「倫敦恐怖攻擊」
圖 17 NTUWAS「時光迴廊」中,國 立體育學院二度更名的網站紀錄
http://webarchive.lib.ntu.edu.tw/machine.asp?selvalue=008001000
圖 18 已消失的「蘭嶼曙光」
http://webarchive.lib.ntu.edu.tw/switch.asp?I DX_SITE=1916&LOADDTE=2007-03-05
圖 19 已消失的「外籍及大陸配偶 家庭關懷服務網」
http://webarchive.lib.ntu.edu.tw/switch.asp?I DX_SITE=820&LOADDTE=2007-01-10
三、 典藏時代
如 前 言 所 述 , 吾 可 以 從 圖 書 館 豐富典藏中,找到人類發展過程中,
所謂「關鍵」、「轉捩點」或「決定
(Terrorist Attact-London, 7th July 2005)等。
從 各 國 網 站 典 藏 計 畫 中 的 均 將 事件(events)仍為重要典藏類目,
並 以 不 受 時 空 及 一 般 類 目 的 網 站 典 藏 的 處 理 辦 法 , 所 以 「 事 件 導 向 」
(events oriented)的網站典藏,更能 讓網站典藏顯出它的重大意義。
中 國 國 家 圖 書 館W I C P 的 We b InfoMall,收錄熱門事件如「抗擊非 典 的 日 子 」 和 「2008北京奧運」等 相關新聞及活動網站,並「歷史的回 放 」 來 呈 現 這 些 具 有 時 代 意 義 的 事 件;日本國會圖書館將不復存在的行 政區域舊網站保存在WARP中,則提 供了地方性的文史檔案紀錄。(阮紹 薇,2009)
NTUWAS為重要專門討論歷史事 件或時事議題的網站,如228事件、
傳染病(SARS)、軍購案、921大 地震等,列入「重大事件」中,再依
(圖21)。
「時光拉霸機」以時間概念讓使 用者可以依時間的記憶,就該事件在 NTUWAS中典藏的相關網站查詢當時 的網站資訊,亦為NTUWAS的一項創 舉,如查詢莫拉克颱風(八八水災)
當時地方政府利用網站傳遞的受災情 形及政府公告(圖22)、總統府網站 的總統勘災現場及時消息,及後續發 展的重要紀錄:如監察院於2009年8 月21日發布88水災召開專案調查研議 小組會議的監察院網站公告等。
除 了 時 間 的 記 憶 外 , 許 多 議 題 或事件,因其區域性或別具意義的地 理 位 置 , 若 以 地 圖 概 念 來 呈 現 , 將 更有助提示使用者瀏覽網站典藏,因 此NTUWAS利用google地圖的免費資 源,提供依「地理瀏覽」網站典藏的 服務,如以世界地圖呈現的臺灣邦交 國的位置,呈現海島邦交國密集的畫 面,而由臺灣地圖呈現臺灣原住民鄉 鎮(圖23),亦有助於臺灣原住民分 佈區域的辨識。
由「地理瀏覽」展示網站典藏中 地區性的歷史軌跡,亦是NTUWAS的 一項創舉。如比較NTUWAS中921地
圖 20 TaiwanIHA網站首頁
http://webarchive.lib.ntu.edu.tw/switch.asp?I DX_SITE=4525&LOADDTE=2008-02-23
震(圖24)及88水災的災區地標(圖 25),會發現很大的重疊性,想見 1999年921震災過後,2008年10月30 日「財團法人921震災重建基金會」
因 任 務 告 一 段 落 才 走 入 歷 史 ,2009 年8月8日部份受災區又遭受風災的侵 襲,而這些地區又幾乎都落在我們原 住民的鄉鎮。
(二) 人物網站
人 物 網 站 是 在 事 件 網 站 之 外 , 另 一 種 書 寫 歷 史 的 重 要 一 手 資 料 。 NTUWAS中在各類型網站中都收錄一 些人物資料,一些已過世的臺灣重要 人物,如李國鼎先生的紀念網站、陳 定南先生生前的部落格,各行各業如 文學家、藝術家和教師的個人網站,
保 存 重 要 的 傳 記 資 料 和 學 術 研 究 資 源。
在NTUWAS保留的人物網站中,
圖 21 NTUWAS的時光拉霸機
http://webarchive.lib.ntu.edu.tw/history.asp
圖 22 NTUWAS時光拉霸機中 八八水災專題呈現災區地方政府網 站的重要資訊
http://webarchive.lib.ntu.edu.tw/tevent.
asp?eventValue=33
最熱鬧的要屬臺灣社會中因公職人員 選舉活動頻繁,而大量產生的競選人 物網站。各種候選人的部落格、個人 網站和政黨後援的個人網站,尤其是 選舉過後,幾家歡樂幾家愁,許多落選 人從此就關閉網站,資料永遠消失,則 是這部份人物網站的最大特色。
然而這些網站保留著許多政治人 物因為選舉宣傳而留下平常難得一見 的個人資料,及因為爭取選票而提出 的政見,甚至是利多大放送等,這些 快速被建立、在活動期間不斷更新的 網站(如最新選戰消息),短期內又 很可能快速消失的人物網站,也是許 多國家在網站典藏中不可缺乏的一個 徵集重點。
這部份因為涉及Web 2.0的網路
圖 25 NTUWAS依88水災地理位 置的網站典藏瀏覽
http://webarchive.lib.ntu.edu.tw/gevent.
asp?eventValue=7
圖 23 NTUWAS依臺灣原住民鄉 鎮地理位置的網站典藏瀏覽
http://webarchive.lib.ntu.edu.tw/gevent.
asp?eventValue=1
圖 24 NTUWAS依921大地震地理 位置的網站典藏瀏覽
http://webarchive.lib.ntu.edu.tw/gevent.
asp?eventValue=8
應用和社群經營模式,目前網站保存 工具如HTTRACT無法成功抓取社群 網站如部落格及影音分享網站等,也 成為許多網站典藏計畫的一大挑戰。
(Crook, 2009)
2008年韓國、美國及中華民國 都舉行總統大選,NTUWAS均保留 當時相關人物及政黨的競選網站。除 現任美國總統歐巴馬的個人競選網站 外 ( 圖26),也保留了當時和歐巴 馬同時角逐民主黨的美國總統候選人 的希拉蕊個人網站,及美國民主黨網 站;而共和黨代表角逐總統大位的馬 侃(John McCain)因其夫人抄襲網 站食譜而釀成負面新聞話題的網路事 件,也正好被NTUWAS保留下來(圖 27)。2008年中華民國亦舉行影響政黨 輪替的總統大選,選情激烈,而各候 選人的個人及政黨的競選網站,也相
當精釆。當時民進黨總統候選人謝長 廷在網站中提供成長歷程中的個人資 料呈現感性訴求(圖28)。而在後來 順利當選馬英九總統,其www.ma19.
net的部落格由來已久,NTUWAS自 2006年9月19日開始保存MA19網站,
其中2006年11月14日的典藏也以懷念 親人為主題(圖29),由此可見政治 人物個人官網為提供重要傳記資料和 政治經歷的重要來源。
在2 0 0 8 總 統 大 選 激 情 過 後 , NTUWAS被推薦為馬蕭總統大選的網 站存檔處,為NTUWAS導入大量的網 站點選數量,讓許多使用者認識臺灣 網站典藏庫,在NTUWAS的線上推 薦網頁中提供許多值得典藏的網站。
(圖31)
伍、 結語
在NTUWAS的「時光迴廊」中,
回 顧 不 同 時 間 網 站 的 重 要 改 變 , 如
「更名」、「改版」及「關站」等,
從臺灣網站典藏庫的館藏來看,網站的 變遷反映了臺灣社會和政治的變化,
這些變化均被NTUWAS忠實地保存下 來。當國立中正紀念堂管理處於民國96 年5月15日更名為國立臺灣民主紀念館
(如圖30,在改名初期「大中至正」與 臺灣民主記念館並存的首頁)。
保存當下的重要事件,以免事後 遺憾,一直都是網站典藏工作的一大 挑戰。NTUWAS能掌握到這些重要的 網站更迭時機,是靠著「即時下載」
後台系統功能;此外,為應付政府機 構更名、更換首長或組織重整時,有 大幅度的變動,由於這部份的異動網 站 量 大 , 無 法 用 人 工 一 一 控 制 , 因 此,NTUWAS也為此特別設計「預約 排程」應付大量網站同時更新的下載 排程。此為NTUWAS從2006年起不斷 在進行平台測試和內容規劃上不斷改 進的成果。
當然,由人工進行網站選擇及下 載網站品質測試及篩選,NTUWAS 會過濾掉那些明顯為娛樂、入口、商 業 性 質 , 或 內 容 不 宜 的 網 站 。 而 因 為網站本身使用Flash程式寫作的網 頁、Javascript動態網頁連結資料、深 層網站(deep web)時,或在網站下 載後的測試階段出現dead link、亂碼、
file not found(錯誤代碼404)等問
圖 26 NTUWAS中2008年美國總
統候選人 Obama最初的競選網站
http://webarchive.lib.ntu.edu.tw/switch.asp?IDX_SITE=4322&LOADDTE=200 8-01-24
圖 30 臺灣民主紀念館「大中至 正」共存的網站
http://webarchive.lib.ntu.edu.tw/switch.
asp?idx_site=3544&loaddte=2007-05-24
圖 27 NTUWAS中2008年美國總
統候選人 McCain競選網站中被控抄 襲的家庭食譜
http://webarchive.lib.ntu.edu.tw/switch.
asp?IDX_SITE=4334&LOADDTE=200 8-01-22
圖 28 NTUWAS中民進黨總統候 選人謝長廷競選網站呈現感性訴求
http://webarchive.lib.ntu.edu.tw/switch.asp?IDX_SITE=177&LOADDTE=200 7-10-26
圖 29 NTUWAS自2006年起保留 的馬英九官方網站
http://webarchive.lib.ntu.edu.tw/switch.
asp?IDX_SITE=176&LOADDTE=200 6-11-14
題,部份重要網站仍會繼續測試直到 下載到內容較為完整的網站。
至於網站典藏的類目方面,由於 NTUWAS採取依典藏來進行「後分 類」,配合收錄網站的性質與數量,
以及日後典藏的重點項目,來進行適 度的更新或調整。因此除了主要大類 不變外,子類目隨時會作變動,也是 網站典藏的一項較圖書資料編目較為 彈性的作法。
NTUWAS自2008年4月初開放典 藏和系統的成果至今,期盼全校師生 和各界使用者在典藏內容及主題範圍 方面提供意見,讓NTUWAS持續收錄 更多值得珍藏、具學術性或有時代價 值的網站。使用者除可利用「讀者推 薦」功能協助我們新增典藏內容外,
亦可點選「聯絡我們」利用電子郵件
來信批評指教。期待NTUWAS未來 能比照臺大機構典藏計畫,結合相關 教育學術團體,擴充網站資料收錄範 圍,規劃蒐集臺灣地區以外各類網路 資源,達成提供世界級學術資源的終 極目錄。讓臺灣的網站典藏計畫邁向 世界級Web Archiving計畫的目標。
本計畫系統建置及維護有賴「臺 灣大學機構典藏」主持人項潔教授、
陳雪華館長,及圖書館系統資訊組陳 光華教授的指導,帶領系統資訊組丁 培 峰 、 陳 彥 良 , 及 陳 建 智 等 同 仁 , 先後參與NTUWAS前後台的系統規 劃及程式設計,開發期間不斷發揮程 式專才及創意,設計出別具特色的檢 索平台和瀏覽介面,倍受國際相關計 畫組織的重視,被國際網站典藏工作 坊(IWAW)推薦為重要網站典藏計
圖 31 馬蕭總統大選的網站存檔聲明
http://webarchive.lib.ntu.edu.tw/switch.asp?IDX_SITE=176&LOADDTE=2008-04-03
WARP)。上網日期:2010年1月10日,網址:http://warp.ndl.go.jp/
中國北京大學「中國Web信息博物館」(簡稱Web Infomall)。上網日期:2010 年1月10日,網址:http://www.infomall.cn/
英國國家圖書館“UK Web archiving consortium”(簡稱UKWAC)。上網日期:
2010年1月10日,網址:http://www.webarchive.org.uk/ukwa/
美國國會圖書館“Library of Congress Web Archives”(簡稱LCWA)。上網日期:
2010年1月10日,網址:http://lcweb2.loc.gov/diglib/lcwa/html/lcwa-home.html
<http://lcweb2.loc.gov/diglib/lcwa/html/lcwa-home.html>
國家圖書館「臺灣網站典藏先導系統」。上網日期:2010年1月10日,網址:
http://webarchive.ncl.edu.tw/nclwaFrontNew/<http://webarchive.ncl.edu.tw/
nclwaFrontNew/>
臺灣大學「臺灣網站典藏庫」(簡稱NTUWAS)。上網日期:2010年1月10日,
網址:http://webarchive.lib.ntu.edu.tw/<http://webarchive.lib.ntu.edu.tw/>
澳洲國家圖書館“Pandora Digital Archiving System”(簡稱Pandora)。上網日期:
2010年1月10日,網址:http://pandora.nla.gov.au/
IFLA/IPA Steering Group. Preserving the Memory of the World in Perpetuity: a joint statement on the archiving and preserving of digital information。上網日期:
2010年1月10日,網址:http://archive.ifla.org/V/press/ifla-ipa02.htm
更多網站典藏計畫相關網站請見圖 30二。上網日期:2010年1月10日,網址:
http://webarchive.lib.ntu.edu.tw/webs.asp <http://webarchive.lib.ntu.edu.tw/
webs.asp>
參考文獻
洪淑芬(2006)。網路資源備份保存技術與應用探析。國家圖書館館刊,95
(2),75-121。
項潔、洪筱盈(2005)。臺灣機構典藏發展芻議。教育資料與圖書館學,43
(2),173-190。
項潔、洪筱盈(2006)。大學圖書館數位保存與館藏發展策略:以臺大圖書館為 例。大學圖書館,10(2),2-18。
陳光華、丁培峰(2007)。臺灣大學網站典藏系統之研發。大學圖書館,11
(2),1-18。
阮紹薇(2008)。從網站典藏臺灣—「臺灣網站典藏庫」。臺灣大學圖書館館 訊,新96期。
阮紹薇(2009)。回溯時光 典藏記憶—談網站典藏庫的事件記錄。臺灣大學圖書 館館訊,新113期。
圖 32 NTUWAS中各國網站典藏系統的簡介及連結
http://webarchive.lib.ntu.edu.tw/webs.asplibrary web archive perspective. In World Library and Information Congress:
74the IFLA General Conference and Council. Retrieved May 27, 2008, from http://www.ifla.org.iv/ifla74/index.htm.
Chen, K. H., Chen, Y. L. & Ting, P. F. (2008). Developing National Taiwan University Web Archiving System. In Proceedings of the 8th International Web Archiving Workshop, Aarhus, Denmark: University of Aarhus.
Crook, Edgar (2009). Web archiving in a Web 2.0 world. Electronic Library, 27(5), 831-836.
Jacobsen, G. (2008). Web Archiving: Issues and Problems in Collection Building and Access. Liber Quarterly: The Journal of European Research Libraries, 18(3/4), 366-376.
Linneniit, R. (2007). Archiving the Canadian web: experiences at Library and Archives Canada. The Serials Librarian, 53(1/2), 139-149.
Mannerheim, J. (2000), Preserving the Digital Heritage of the World. Retrieved December 29, 2009, from http://etjanst.hb.se/bhs/ith/1-00/jm2.htm
Masanès, J., & Rauber, A. IWAW’ 06 proceeding [sic] of the 6th International Web Archiving Workshop, September 21-22, 2006, Alicante, Spain Available from http://www.iwaw.net/06/PDF/iwaw06-proceedings.pdf.
Paynter, G., Joe, S., Lala, V., & Lee, G. (2008). A Year of Selective Web Archiving with the Web Curator at the National Library of New Zealand. D-Lib Magazine, 14(5/6), 2-2.
Phillips, M. E., & Koerbin, P. (2004). PANDORA, Australia’s Web Archive: How Much Metadata Is Enough? Journal of Internet Cataloging, 7(2), 19-33.
Rauber, A., & JulienMasanes. (2008). Report on the 8th International Workshop on Web Archiving - IWAW 2008. [Proceeding]. D-Lib Magazine, 14(11), 14-14.
Seneca, T (2009). The web-at-risk at three: overview of an NDIIPP Web Archiving Initiative. Library Trends, 57(3), 427-441.
Shiozaki, R. Y. O., & Eisenschitz, T. (2009). Role and Justification of Web Archiving by National Libraries: A Questionnaire Survey. Journal of Librarianship &
Information Science, 41(2), 90-107.
Tuck, J. (2008). Web Archiving in the UK: Cooperation, Legislation and Regulation.
Liber Quarterly: The Journal of European Research Libraries, 18(3/4), 357-365.