• 沒有找到結果。

北平「世界日報」:民初歷史性新聞報紙數位化之研究

N/A
N/A
Protected

Academic year: 2021

Share "北平「世界日報」:民初歷史性新聞報紙數位化之研究"

Copied!
12
0
0

加載中.... (立即查看全文)

全文

(1)

圖書與資訊學刊 第 54 期

北平「世界日報」

:民初歷史性新聞報紙數位化之研究

Digitization of the Early Republic Newspapers:

A Case Study of Peiping’s “Shih Chieh Jih Pao”

余 顯 強

Shien-Chiang Yu

世新大學資訊傳播學系副教授

Associate Professor, Department of Information and Communications Shih-Hsin University E-mail:ysc@cc.shu.edu.tw

【摘要 Abstract】

民初新聞報紙具有相當豐富的歷史研究價值,是瞭解當時政治、社會、經濟、生活型態等情形的絕 佳工具,但是歷史性報紙體積龐大、紙張脆弱,不僅不易保存,也不易檢索,因此數位化便是使歷史性 報紙重獲新生命的唯一途徑。 本文以世新大學北平「世界日報」數位化計畫為例,擬藉由實體原件品質、Metadata制訂與著錄、 搜尋結果呈現等特質,探討民初新聞報紙數位化與現代報紙數位化不同之處。並針對民初新聞報紙數位 化潛在的議題加以分析與建議。

The Early Republic newspapers are materials replete with valuable literature for historical study, since they may serve as useful resources for understanding the backgrounds of politics, society, economy, and lifestyle of the Early Republic. However, the Early Republic historical newspapers are usually large in page size and fragile in paper quality, which causes difficulties both in preservation and in information retrieval. To overcome the difficulties, digitization is a significant medium to refresh the values of historical newspapers.

This paper takes as an example the digitization project of Peiping’s “Shih Chieh Jih Pao” processed by Shih-Hsin University. Through an analysis of the quality of original physical materials, definition and formulation of metadata, and display modes of search results, this study attempts to reveal the different conditions of digitization between historical newspapers and modern newspapers. This paper also offers suggestions about potential issues and problems of the digitization of historical newspapers.

關鍵詞 Keyword

民初新聞報紙 歷史性報紙 數位典藏 北平世界日報

Newspaper in the early republic;Historical newspaper;Digital archives;Peiping Shih Chieh Jih Pao 圖書與資訊學刊

54(Aug ’05)84-95 ISSN 1025-2125

(2)

北平「世界日報」:民初新聞報紙數位化之研究

壹、前言

報紙為每日發刊之連續性出版傳播媒體,其所 記載的新聞訊息兼具內容豐富、論點深入等優點, 因此歷經幾個世紀的發展與考驗,不僅在電子媒體 與網路媒體的挑戰中,仍佔有傳播媒體之重要地 位,此外報紙更扮演了為電子媒體設定議題的規範 性角色。(鄭植榮,2004年,3月) 報紙除了提供新聞訊息的功能之外,對歷史文 化的保存也有相當貢獻,其特點不僅是第一手文 獻、內容豐富、包含全社會的檔案,且具備了有序 性與可近性的特點,甚至有許多內容為報紙獨有。 (張琪玉,1999年,頁7) (李學軍、鄧小川,2001年, 頁69)歷史性報紙中不僅可以看出對當時新聞事件 的報導,也可以從社論或新聞事件的發展之中,窺 知當時的政治、經濟及文化局勢,傳遞當時社會普 遍的價值觀;而報紙中附帶的副刊、廣告、新聞圖 片,更富有歷史價值,能夠顯示出當時人民休閒、 民生之概況。 雖然報紙資料內容包含豐富多元的資訊,但報 紙出版的考量以一次性(Ephemeral)為主(Deegan, King, Men, & Steinvel, 2001, July),著重在快速印 刷以立即傳遞當天新聞資訊,因此採用的印刷技術 與紙張品質必然不利於保存。經過長久時間的流 轉,眾多讀者的翻閱使用,光線照射、保存環境的 溫濕度不佳等因素(林淑芬、宋美珍,2002年6月, 頁198)造成報紙紙張的酸化、脆化,而不利於長久 保存。 由於網路科技的發展,現代報紙媒體已有兼營 網路電子報的趨勢。以全世界來看,西元1994年開 始有報紙媒體在網際網路上建立網站,發佈網路電 子報。到了1994年底,共有78家報紙發行網路電子 報。西元1997年,網路電子報已發展到1900多家。 1998年10月初,全世界的網路電子報已增長至4295 家,1998年底增至4925家(姚雪痕,2003年,5月), 近幾年更有驚人的成長。這樣的趨勢奠基於現代報 紙編輯流程的電子化,平面報紙編輯完成之後,新 聞資訊很容易便能轉進數位資料庫,在網路上進行 第二次的利用。因此現代報紙的數位化過程並無太 多困難度。相對而言,早期發行的報紙,因長時間 累積不僅數量極為龐大,並且由於儲存保管上的困 難,可能造成很嚴重的損害情形,若有缺期、破損 情形,亦不容易補齊實體。 除了保存文化資產之外,數位化還能夠賦予歷 史性報紙新生的價值。透過資訊系統的輔助,不僅 歷史性報紙的新聞內容能夠容易地被查找,更能達 成許多超乎報紙原有功能的應用。例如聯合報的 「聯合知識庫」計畫,將聯合報系50年來的歷史性 報紙數位化,並開放給一般民眾使用,特別是除了 學術研究者、其他媒體從業人員、圖書館加入會員 之外,尚有許多警察局等警政單位亦上網利用聯合 知識庫,從歷史性報紙中找尋早期類似作案手法案 情或未破案的線索,協助刑案的偵辦。(何銘傑, 2001年5月,頁11)不只是現代報紙數位化可以方便 讀者使用資訊,歷史性報紙的數位化也能夠帶來相 當大的貢獻。

貳、北平「世界日報」數位化計畫簡述

北平「世界日報」(以下簡稱「世界日報」)數 位化計畫包括兩個計畫,分別是隸屬於「數位典藏 國家型科技計劃-內容分項發展計畫」的「北平世 界日報內容數位化開發計畫」與「技術研發分項計 畫」的「後設資料動態管理系統研發計畫」。為紀 念世新大學創辦人成舍我先生,在1998年開始著手 將成先生創辦的北平「世界日報」、「上海立報」和 「香港立報」進行報紙數位化典藏計畫。希望能將 民國初年的歷史性報紙新聞資料,透過數位化的方 式再現,另外也希望能透過數位化的工作,延長世 界日報的保存年限,增進其使用的便利性與時效 性,並發揚成舍我先生辦報的理念。

(3)

圖書與資訊學刊 第 54 期 「北平世界日報內容數位化開發計畫」於1998 年進行作業測試,1999-2000年進行初步全文數位 化測試。於2002年被列入數位典藏「內容發展分項 計畫」,隸屬新聞主題小組(數位典藏國家型科技計 劃:新聞主題小組簡介),並於2004年申請「後設 資料動態管理系統研發計畫」研擬設計與建置民初 新聞後設資料(Metadata)儲存、檢索與管理系統。 (余顯強,2004年,7月) 以下分別針對「世界日報」的史料價值、計畫 實施方式、成果與應用三個部分,對「世界日報」 數位化相關計畫做一概括性的介紹。 一、「世界日報」的史料價值 「世界日報」於1925年2月10日創刊,1937年 對日抗戰開始,於是被迫停刊。直到1945年8月抗 戰勝利才復刊,復刊3年半後,1949年2月「世界日 報」被共產黨查封,成舍我先生也跟隨國民政府撤 退來台為止,總共發行16年,其間歷經軍閥割據、 國民革命軍北伐、對日抗戰、國共戰爭,涵蓋軍政、 訓政與憲政三個時期。(馬之驌,1986年,10月, 頁166) 成舍我先生辦報堅持「不受津貼」、「不畏強 暴」,「不懼軍閥」的暴行恐嚇,甚至曾經因此得罪 軍閥,差點惹來殺身之禍。如此立場堅定、言論公 正的辦報理念深獲北京人民認同,發行數字甚至高 達3萬份,超越當時北京城其他各大報的紀錄。(馬 之驌,1986年,10月,頁189)「世界日報」新聞內 容除了具有公正客觀反應民初當時真切的社會狀 況外,也有幾項鮮明的特色足以為新聞史學研究者 注意: (一)由於當時教育界正熱烈討論教育制度的改 革,加上老師罷教、學生罷課等學潮運動 活躍,因此「世界日報」特別重視教育新 聞,還特別闢立「教育界」專欄。(馬之驌, 1986年,10月,頁178) (二)特別規劃「婦女界」專欄,旨在積極推動 婦女運動,此為「世界日報」的特有版面。 (金秉英,1998年,8月,頁248) (三)副刊名為「明珠」,主編張恨水先生自撰「金 粉世家」、「啼笑姻緣」等,均獲得廣大迴 響,是「世界日報」特色之一。 「世界日報」在動盪的政治環境中,仍堅持一 貫公正客觀的理想,報導許多其他報社不敢揭露的 新聞事實,頗具歷史研究價值。而該報特別重視教 育新聞、婦女新聞及副刊,深具時代意義。 二、計畫實施方式 由於必須回溯收集完整發行的世界日報,礙於 人力與時程的急迫性,計畫執行的程序主要分成如 圖一所示5個工作階段,包括:由國內外各圖書館 蒐集微縮捲片資料,然後轉製成紙本的新聞內文, 利用人工進行新聞資料輸入,並且經過資料校對, 最後設置網站呈現數位化成果。 圖一:典藏數位化工作流程圖

(4)

圖書與資訊學刊 第 54 期

由於民初用字與今日習慣的差異、排版與印刷 技術的限制,再加上保存本身的損害,以及報紙內 容缺字、漏字、難字、不常用字等問題,經過廠商 使用光學字元辨識(Optical character recognition, OCR) (Allen & Schalow, n.d.) 正 確 辨 識 率 低 於 50%(世新大學北平世界日報內容數位化開發計畫 工作流程簡介),因此並不適用OCR自動辨識文 字,而必需採用人工打字輸入。 計畫初期,由於微縮資料閱讀不易,因此將一 版的微縮捲片分割成9份,以A4紙張列印出來,然 後再將九張A4紙拼成一個完整的版面。當時工作 不僅費時(完成5個版面的時間約1小時),而且印刷 品質也不盡理想。後來放棄這種耗時費力的方式, 直接將微縮捲片資料掃瞄成整版的數位圖檔,一個 圖檔就是一個版面的新聞,再將整版新聞圖檔切割 成單則新聞圖檔,並且以流水號為圖檔命名。打字 員直接依據單則新聞數位圖檔進行文字輸入,省略 紙本的製作時間,而且報紙影像的清晰度也隨之提 升。 由於人力與時程的限制,計劃初期並無先分析 資料著錄的描述範圍,而未定義符合「世界日報」 的Metadata。因此其計畫後期則將上述編製的全文 資料,配合轉換成符合自訂的Metadata與新聞小組 聯合目錄所定義之Metadata規範的資料。 三、成果與應用 「北平世界日報內容數位化開發計畫」目前僅 處理「世界日報」的新聞版面的內容,包括:國內 要聞、世界要聞、各省新聞、經濟界、教育界、世 界瑣聞、地方新聞;其他版面因經費及人力問題暫 不收錄。由於民初報紙廣告、副刊、周刊的研究價 值和趣味性很高,因此未來將陸續處理這些版面, 以呈現「世界日報」的完整風貌。 為達到資源存取與利用的目的,「後設資料動 態管理系統研發計畫」負責導入相關的技術與應 用,並規劃試用後設資料與開發適當的管理系統。 初期已完成規劃的工作包括:符合歷史性新聞報紙 特性Metadata的定義、動態資料庫管理架構、商務 平台與經營模式的設計等。 但實際執行上仍舊缺乏適當的軟體開發人 力。因此,現僅完成將全文資料匯入資料庫並依據 參數定義轉換成指定Metadata之XML格式資料。目 前可供檢索的資料為已完成建檔之1926至1929年 的新聞內容,共計48547筆全文資料,包括文字模 式與符合聯合目錄新聞主題後設資料的XML格 式。

參、民初歷史性報紙執行之狀況

以「北平世界日報內容數位化開發計畫」為 例,分別就「實體原件品質」、「Metadata制訂」與 「Metadata著錄」三方面,探討民初歷史性報紙的 特殊性對數位化過程造成的影響。 一、實體原件品質 本計畫是將「世界日報」微縮捲片直接掃瞄成 TIFF格式的數位圖檔,然後再以人工輸入成文字 檔。數位影像的處理所遭遇的狀況包括歷史性報紙 固有的問題和微縮捲片轉換數位圖檔,茲分述如 下: (一)歷史性報紙固有的問題 除了紙本原件印刷本身清晰度之外,報紙的邏 輯結構(Logical structure)和實體輸出樣式(Physical layout)相當多樣且複雜,並不適合OCR處理報紙的 文字自動辨識。此外「世界日報」還具有許多特殊 的版面與內容結構問題。首先,歷史性報紙排版方 式與今日不同。舉例來說,現代新聞報紙編輯電腦 化,傾向於塊狀排版,也就是將每則新聞加上標 題,排列成方形,然後像堆積木一般,在整個報紙 版面上排滿新聞及圖片,如此一來版面整整齊齊、 北平「世界日報」:民初新聞報紙數位化之研究

(5)

圖書與資訊學刊 第 54 期 乾淨俐落,方便讀者分辨新聞編排的範圍,容易閱 讀。在正式進行OCR時,可以方便切割(Zoning)每 則新聞的區域,提高辨識精確率。而歷史性報紙則 是採用手工排版、鉛字印刷。有些重要新聞,「世 界日報」採用圖二所示的「集合式」報導方式,將 多個相關類型的新聞事件共用同一主標題,再以摘 要形式的副標題個別予以區隔。排版的方式常有非 塊狀的方式,一則新聞有可能被分列成多邊形,影 像切割時容易造成OCR辨識引擎的誤判。此外可 能因為當時排版技術不成熟,或新聞內容篇幅控制 不當,因此常常會有「文轉幾版」的情形產生必須 倚賴人工判斷。 此外當時報紙印刷採用鉛字排版,可能因為鉛 字不敷使用,亦有可能是以摘要方式將內文重點如 圖三所示,以較大字體印刷。造成同一篇新聞稿中 可能會發現某幾個字字級特別大或特別小,字與字 之間的間距又不固定,此種類型資料多見於軍事與 政治相關之新聞,且越後期出刊的報紙,出現比率 越低。 (二) 微縮捲片轉換數位圖檔的問題 報紙經過長時間存放,以及使用者日積月累的 翻閱,紙張勢必會變黃、變脆,因此容易產生折痕、 破損、髒污,而不如原先新發行時的清晰。因此轉 製成微縮捲片的過程中,會產生第一次影像品質的 降低,再將微縮捲片掃瞄成TIFF數位圖片格式, 由於技術上的限制,會造成第二次對影像解析度的 損害。所以,經過實體報紙轉製成微縮捲片、微縮 捲片掃瞄成數位圖檔兩次轉製的過程之後,實際得 到的數位圖檔會有許多雜點,也會有整片的髒污、 破損,甚至是影像扭曲的情形,影響數位化影像呈 現的效果。 圖二:集合式的相關新聞報導模式 資料來源:世界日報,1924 年 9 月 3 日,3 版

(6)

北平「世界日報」:民初新聞報紙數位化之研究 綜合上述歷史性報紙原本排版上的特殊性,以 及數位化過程中無可避免影像品質低落的原因,導 致「世界日報」光學字元辨識的正確率非常低,因 此無法採用OCR自動辨識模式,而以人工打字方 式建立新聞內容全文。 二、Metadata制訂 Metadata是對數位物件的一組描述性資料,一 般而言其描述的資訊可以分成兩部分:管理資訊與 內容資訊,前者包含數位物件形式、版權宣告、傳 遞資訊、製造資訊……等,後者則是描述數位物件 的內容本身。Metadata不僅可用來處理資料的調 度、儲存和檢索(陳百齡,2002年),也能作為光學 字元辨識(OCR)、語言處理(Linguistic processing) 和資料找尋(Search)的指引。(世新大學北平世界日 報內容數位化開發計畫工作流程簡介)基於北平 「世界日報」的媒體類型與內容特性,必須選擇適 合用以描述新聞資料的標準,以利於完整的呈現北 平「世界日報」的內容,以及新聞事件之間的關聯 性。目前已發展與新聞描述有關的Metadata,包含 由 國 際 出 版 通 訊 協 會 (International Press Telecommunication Council, IPTC) 所 制 訂 之 NewsML、國際新聞通訊會議制定的新聞業文字規 格(News Industry Text Format, NITF)、專門描述運 動 新 聞 的SportsML 、 國 際 數 位 企 業 聯 盟 (International Digital Enterprise Alliance, IDEAlliance)制訂之產業出版需求標準 (Publishing Requirements for Industry Standard Metadata, PRISM),以及XMLNews組織所制訂之XMLNews 等。

圖三:內容報導模式

(7)

圖書與資訊學刊 第 54 期 圖四:中央社南京電文全文 資料來源:世界日報,1931年2月15日,3版 圖五:法庭旁聽記 資料來源:世界日報,1931年2月14日,7版 上述各Metadata都有一個共同的現象,就是比 較偏重描述數位物件的管理資料,但是對新聞內容 本身的描述相形之下較少,主要原因在於這些 Metadata主要是應用於現代新聞產業,滿足跨平台 間流通的問題,因此重點在於標記管理資料,例如 版權、資料格式、傳遞方式、出版時間等,而沒有 迫切需要去描述內容本身。(Cabo & Llavori, 1997, September, pp.645-661) 新聞報導的主題涵蓋範圍 廣,內容的呈現並無特定結構,很難明確界定新聞 稿所記敘的內容,因此與各類學術、檔案、公文比 較起來,設計涵蓋完整新聞應用領域的Metadata 時,有其一定的複雜度。 對新聞內容的描述,目前有兩個代表性的類 型。一種是「由上而下」,也就是先從新聞文體結 構的相關理論,取出一套描述架構,藉此發展 Metadata的設計;一種則是「由下而上」,也就是 不預設新聞文體的結構,直接從不同領域的新聞稿 中,去瞭解新聞元素。或許比較好的方式是選擇折 衷,混合「由上而下」及「由下而上」兩個觀點, 以分析這個非常基本、卻瞭解不足的領域。(陳百 齡,2002年) 「世界日報」屬於民初的新聞報紙,不論是在 版面的編排、標題的標示方法、新聞稿的類型、內 文,除了包含新聞事件的人事時地物之外,尚有以 不同字體呈現的摘要描述的撰寫格式等,與現代新 聞學的規範大異其趣,甚至對新聞的定義,均有異 於今日的報紙。茲舉例說明如下: (一)民初報紙有許多特殊的新聞文體 現代新聞稿要求專業的寫作方法,因此發展出 倒金字塔式的寫法,也就是將整個新聞事件的重點 寫在導言中,包括人、事、時、地、物等5W1H, 導言之後再分段詳細敘述。首先呈現出的導言最為 重要,之後各段重要性遞減的倒金字塔文體結構。 這樣的專業寫法其實已有一定的結構,但即使如 此,如上所述目前各Metadata標準對新聞內容結 構,仍然無法完全掌握。 民初報紙著重在資訊告知的功能,對新聞稿寫 作方式並無特別要求,「世界日報」的新聞稿格式 與類型更是五花八門,可以直接將政府單位、通訊 圖書與資訊學刊 第 54 期

(8)

北平「世界日報」:民初新聞報紙數位化之研究 社或駐外記者的電報如圖四全文刊載上報;也可以 將法庭上法官與被告的對話直接如圖五紀錄下來 變成一篇新聞;更有按照事件發生的先後順序敘 述,彷彿以小說故事的方式來寫作。因此現有的 Metadata對新聞稿類型的描述,除了基本的專欄、 社論等類型之外,實不足以完全描述「世界日報」。 (二)民初報紙新聞稿並不署名 現代報紙每則新聞的最前面,一定會標示記者 姓名與報導地點之類的署名,也是記者對新聞報導 負責的一種表現。但是民初報紙並無此傳統,以「世 界日報」為例,只有註明新聞來源、來稿地點及來 稿形式。但「世界日報」的副刊、周刊文章,還是 有作者署名,因此未來在處理副刊、周刊的資料 時,仍需要著錄「作者」一欄。 目前世界日報「後設資料動態管理系統研發計 畫」,參考國內外現行新聞Metadata標準,如NITF、 XML News、PRISM、RSS等,以Dublin Core及 NewsML定義之元素結構為主,並且考量「世界日 報」的專有特色,發展出一套適合描述歷史新聞的 Metadata,並依據發展之Metadata設計儲存、檢索 與管理新聞資料的資訊系統。 三、 Metadata著錄 Metadata制訂完成之後,接著執行Metadata著 錄。將相關資料填入Metadata欄位中,並連結相關 圖檔,封裝成為數位物件。「世界日報」的Metadata 著錄,除了提供一套著錄標準流程與規範之外,著 錄者還需具備歷史的知識背景與新聞的知識背景。 「世界日報」是民初的報紙,報導的新聞主題 以及使用的詞彙、語法、標點符號都和現代大不相 同,因此如果著錄者沒有相當的歷史知識背景,在 著錄資料時很難得心應手。例如,1931年2月12日 第3版有一則簡報內容為:「東北邊署參議員富占 魁、昨日由瀋陽來平、林家訓昨假擷英番菜館、為 富氏洗塵、林邀于學中等作陪云……」,如果著錄 者不熟悉電報的文法和當時的慣用詞彙,那麼很難 從這段文字擷取重點,著錄在適當的欄位中。 除了歷史知識背景之外,著錄者還需要對新聞 基礎知識有所瞭解。現代報紙標題形式清楚,很容 易分辨出何者為主題、何者為子題,但「世界日報」 當時的標題用法,很容易讓著錄者混淆。如圖六所 示的標題形式,依照一般人的邏輯,因為主題應該 是字級最大、最醒目的「財力如何?」。但是如果 著 錄 者 對 新 聞 編 輯 學 有 所 認 識 , 就 會 知 道 在 圖六:標題 資料來源:世界日報,1931年2月12日,3版

(9)

圖書與資訊學刊 第 54 期 主題之上還可以有眉題、肩題等如圖二所示的副標 題,用以輔助主題的語意。因此著錄者就應該瞭解 這個標題是:「肩題:財力如何?」、「主題:張學 良對晉軍改編變通辦法當以財力為準」、「子題:宋 哲元商震等已通電就職」,而將資訊著錄至適當的 欄位。 四、搜尋結果的呈現 「世界日報」具有相當豐富的史料價值,可提 供歷史研究者查找歷史資料的管道來源。然而在搜 尋結果的呈現上,如果僅依照現代大多數報紙資料 庫的方式,將無法滿足歷史研究者的需求。 舉例來說,現代報紙對標題最基本的要求就是 要清楚表明新聞重點,從標題當中,就能完整表達 該則新聞的內涵,所以資料庫在回傳搜尋結果時, 可以僅顯示主題、子題,就能讓使用者尋得需要的 資料。 但是「世界日報」的標題卻與現代報紙的標題 規範不同,當時並不要求標題表達整個新聞的重 點,雖然大部分的標題都能夠表達新聞重點,但仍 有某些標題可能與內文無關,或是無法讓讀者確實 瞭解新聞內容,例如:「西使即來平」(1931年2月 12日,3版)、「前日省府例會」(1931年2月12日,5 版)等,都讓讀者無法從標題直接判斷內容。 此外,由於「世界日報」會將電報內容直接刊 載,因此有些內文極短的電報,可能因為重要性並 不高,所以集中刊登於一個區塊,標題即為「簡報」 或「國府命令」,但其實是由許多簡短電報所組成。 所以,在查詢結果的呈現上,不能僅讓使用者 由標題去猜測新聞的內容,理想狀態必須同時以新 聞內容摘要的方式描述該則新聞,但由於摘要的撰 寫必須具備更高的歷史知識背景,本計畫現有人力 資源無法配合,有賴未來與歷史研究者的跨領域合 作。目前折衷的方式應是提供新聞的導言,讓使用 者從導言判斷內容是否符合其需求。

肆、相關議題探討與建議

民初歷史性報紙除了在數位化過程中,需特殊 處理的程序外,從數位化過程的實務經驗中,可歸 納出下列幾項議題: 一、全版影像的提供 Deegan 等 人 認 為 歷 史 性 報 紙 (Historical newspaper)數位化,必須提供使用者兩個主要的功 能:(Deegan, King, Men, & Steinvel, 2001, July)

(一)可讀性(Readability) 指讀者可以閱讀與掌握歷史本文。建議讓讀 者直接觀看到最真實的原件,也就是全版圖檔, 但考慮到全版圖檔篇幅太大、檔案容量也大,會 造成網路頻寬的負擔,因此僅提供切割後的單篇 新聞圖檔。 (二)可找性(Searchability) 指使用者能夠檢索新聞,並且瞭解新聞與新 聞之間的關連性,而這是圖檔無法達到的效果, 必須由圖檔轉成文字檔,並加以適當描述,甚至 配合權威控制,釐清數位物件之間的關係,以確 保使用者能夠找全與找準。 國際上一些大型的歷史性報紙數位化計畫,也 傾向提供原始報紙的數位影像檔,像紐西蘭的 NIUPEPA計畫(Apperley, Cunningham, Keegan & Witten, 2001, May, pp.86-87)、布魯克林公共圖書館 (Brooklyn Public Library)的Brooklyn Daily Eagle計 畫(Brooklyn Public Library, 2004)、猶他報紙數位化 計 畫 (Utah Digital Newspapers, UDN) (The University of Utah, 2003),也都為了維持原始報紙 的格式與完整性,將原始報紙的數位影像提供使用 者閱覽。

(10)

北平「世界日報」:民初新聞報紙數位化之研究 對歷史研究者而言,全版影像的提供也非常重 要。因為歷史研究必須追求第一手的史料,數位檔 案資料庫的查詢只能算是一種輔助,在數位化的過 程中,隨時有可能因為人為疏失,而產生資料錯 誤、資料遺漏等問題,如果歷史研究者僅搜尋數位 文字檔,那麼很有可能造成錯誤的引用,因此如果 能夠直接看到原始新聞事件的數位影像,將能夠增 加資料的可信度。 二、廣告、副刊、社論的數位化價值 每一份新聞報紙都是對當時社會的紀錄,「世 界日報」的貢獻即在於以客觀的角度反映普遍民 意。除此之外,「世界日報」除了陳述民初政經、 社會的新聞事件之外,還有由張恨水先生主編的副 刊。對所有的歷史研究者來說,廣告、副刊和社論 都極具研究價值。廣告表現當時的風土民情;副刊 展示藝文界的發展;社論則可窺知民意的意向,因 此除了新聞報導之外,報紙的廣告、副刊和社論也 是歷史新聞報紙數位化的重點。 三、數位化可能造成的資訊遺失 數位化能夠延續歷史性報紙的生命,讓讀者繼 續以數位形式瀏覽、閱讀、加值與應用。但目前的 數位典藏過程幾乎是「由上而下」的,也就是先由 計畫執行機構制定一套數位典藏的方針,再根據這 一套方針去設計數位化的方法與步驟。但是在這樣 的過程中,如果一開始的方向不夠縝密,後續的問 題將會接踵產生。 例如現代對開報紙兩個版面之間的中縫會夾 雜報社聯絡方式、廣告等資訊,「世界日報」亦有 中縫的設計,裡面印有許多廣告。計畫執行時,由 報紙的微縮捲片轉為單版圖檔,版面之間的中縫便 被裁切而遺漏掉,因此無法在數位化時加以處理與 描述。同樣的問題亦存在於Metadata的定義。由於 計劃執行初期對民初報紙版面、體裁、風格的認識 有限,造成制定的欄位屬性不敷所用。因此,進行 歷史性報紙的數位化之前,對該報的瞭解相當重 要,在未詳加考慮的情形下,即可能僅收納已知的 資訊類型,而排除許多有用資訊。

伍、結論

歷史性報紙隱含某個時代豐富的歷史資訊,對 歷史研究和新聞學研究有其重要性,而且因為實體 報紙品質損害嚴重、某些歷史性報紙發行報社已不 存在或沒有專職的單位負責進行管理,為確保社會 共同文化資產的延續,所以急需投入技術、經費、 人力,將歷史性報紙數位化,以數位形式延續其生 命、增加其利用價值。 其次,歷史性報紙在新聞文體、署名方式上都 與現代報紙不同,無法適用專為現代報紙描述工作 而設計的Metadata標準,因此必須考量「世界日報」 與現代報紙的諸多差異,制訂出專屬於中文歷史性 報紙描述的Metadata標準,描述的內涵不僅止於新 聞事件的分析,亦須包含內容相關之詮釋。標準制 訂後,「世界日報」新聞寫作含有許多與今日不同 的語法及背景知識,若沒有一定程度的瞭解,即使 有一套統一的著錄規則,著錄人員也無從下手,因 此對著錄的規範與訓練有賴與歷史學門、新聞學門 的跨領域合作。許多數位典藏機構在執行數位化的 過程,亦有相同的需求,必須倚賴學者專家協助資 料的辨識與著錄方能完成,此與圖書館編目作業遵 循編目規則即能著錄書目的模式有所不同。因此如 何加速與強化歷史性新聞資料的著錄工作,仍有待 與歷史學者及新聞專家的共同合作努力,方能對新 聞資訊做正確與完整的詮釋。 (收稿日期:94年3月8日)

(11)

圖書與資訊學刊 第 54 期 (本研究係數位典藏國家型科技計畫-技術研發分項公開徵選計畫「後設資料動態管理系統研發計畫」, 計畫編號:NSC 94-2422-H-128 -001 之摘錄,承蒙國科會提供補助經費與相關研究所需之協助。計劃執 行過程中並獲得內容發展分項計畫「北平世界日報內容數位化開發計畫」相關之資源與數位化經驗之指 導協助,謹致謝忱。)

參考書目:

世新大學北平世界日報內容數位化開發計畫工作流程簡介。上網日期:2005年2月15日。網址:http://content.ndap. org.tw/main/doc_detail.php?doc_id=242&class_vision=16 李學軍、鄧小川(2001年)。報紙文獻的數字化建設。四川圖書館學報,119,69。 何銘傑(2001年,5月)。一網看盡五十年─聯合知識庫的建置與應用。全國新書資訊月刊,2001年5月,11。 余顯強(2004年,7月)。後設資料動態管理系統研發計畫簡介。電子通訊,3(7),上網日期:2005年2月14日。網 址:http://www.ndap.org.tw/1_newsletter/content.php?uid=1028 林淑芬、宋美珍(2002年,6月)。期刊報紙數位化問題淺探。國家圖書館館刊,91年(1),198。 金秉英(1998年,8月)。當代論才子,如公復幾人─憶成舍我先生。在報海生涯:成舍我百年誕辰紀念文集(頁248 )。 北京。 姚雪痕(2003年,5月)。網絡報紙是否會取代傳統報紙。上網日期:2005年2月20日。網址:http://www.cgan.net/ science/discussion/htm/epaper.htm 馬之驌(1986年,10月)。新聞界三老兵。台北市:經世書局,頁166, 178, 189。 陳百齡(2002年)。讓電腦也能辨識新聞:新聞內容標記問題初探。中華傳播學會2002年會。上網日期:2005年2月15 日。網址:http://ccs.nccu.edu.tw/oldccs/con2002/conworks/11B-1.doc 張琪玉(1999年)。報紙文獻是一種極為豐富而未被充分開發的信息源。圖書館雜誌,2,7。 鄭植榮(2004年,3月)。報紙:數位時代的永恆太陽。在數位媒體的發展與再造研討會論文集。上網日期:2005年2 月21日。網址:http://mol.mcu.edu.tw/~ebook/research/pdf/paper/01.pdf 數位典藏國家型科技計劃:新聞主題小組簡介。上網日期:2005年2月14日。網址:http://content.ndap.org.tw/main/ vision_ brief.php?class_vision=16

Allen, Robert B. & Schalow, John. Metadata and data structures for the historical newspaper digital library. In Proceedings of the Eighth International Conference on Information and Knowledge Management. Retrieved February 15, 2005, from: http://portal.acm.org/citation.cfm?id=319971&dl=ACM&coll=GUIDE

Apperley, Mark, Cunningham, Sally Jo, Keegan, Te Taka & Witten, Ian H. (2001, May). NIUPEPA: a historical newspaper collection. Communications of the ACM Archive, 44(5), 86-87.

Brooklyn Public Library (2004). Historic newspaper: Brooklyn Daily Eagle online (1841-1902). Retrieved February 18, 2005, from http://www.brooklynpubliclibrary.org/eagle/

(12)

北平「世界日報」:民初新聞報紙數位化之研究 Cabo, María José Aramburu & Llavori, Rafael Berlanga (1997, September). An approach to a digital library of newspapers.

Information Processing and Management, 33(5),. 645-661.

Deegan, Marilyn, King, Edmund, Men, Alon & Steinvel, Emil (2001, July). The British Library newspaper pilot. Digitization and Preservation Online Resource Center. Retrieved February 23, 2005, from: http://digitalcooperative.oclc.org/ hdigitize/BritishLibrary Newspaper.html

The University of Utah (2003). Utah Digital Newspapers. Retrieved March 1, 2005, from: http://www.lib.utah.edu/digital/ unews/ about.html

參考文獻

相關文件

Buttermilk, curdled milk and cream, Yogurt, kephir and other fermented or acidified milk and cream, whether or not concentrated or containing added sugar or other sweetening matter

Milk and cream, in powder, granule or other solid form, of a fat content, by weight, exceeding 1.5%, not containing added sugar or other sweetening matter.

臺灣史 經濟與文化的多樣性 經濟活動 臺灣歷史上的商貿活動 世界史 文化的交會與多元世界.. 的發展

以下為《三立新聞網》 《自由時報電子報》 《蘋果日報電子報》三家網路新聞媒體 於 2014 年 11 月 19 日先後於其網站上所報導之新聞。新聞內容為講述 103

1998 年西班牙一家報紙報導了一位律師的房產被拍 賣償債的新聞。事後這位律師還清 債務,可是這篇報導 卻被轉到 Google 上,任何人以律師的姓名上 Google

For 5 to be the precise limit of f(x) as x approaches 3, we must not only be able to bring the difference between f(x) and 5 below each of these three numbers; we must be able

[This function is named after the electrical engineer Oliver Heaviside (1850–1925) and can be used to describe an electric current that is switched on at time t = 0.] Its graph

Lemma 3 An American call or a European call on a non-dividend-paying stock is never worth less than its intrinsic value.. • An American call cannot be worth less than its