• 沒有找到結果。

建置著作書目資料

第三章 研究設計與實施

第三節 研究步驟

三、 建置著作書目資料

本研究於 2011 年 5 月時下載臺灣歷史學者的著作 PDF 共 358 筆。國科會規 定須附上近五年的著作書目。學者在 PDF 中附上的著作書目年代不一,有的學 者附上研究生涯中所有的著作書目,有的附上 2011 年至 2005 年間,有的則附上 2001 年到 2005 年間的著作。

本研究只取 2001 年到 2010 年間的研究成果。如果學者的著作書目只附上 5 年內的研究,筆者會至該學者任職的研究機構中找出書目補齊年代不足。並且雖 然例子不多,但比對後官方網站的著作資料與國科會的著作 PDF,也有官方網站 刊載的研究成果比國科會資料更老舊的情形。只能盡量補齊不足的部份取較新的 研究,再去除掉不計入統計的書目,最後以手動建置臺灣歷史學者著作共 3466 筆書目。

37

四、 建置引用書目資料

為了獲得這臺灣歷史學者的引用書目資料,用 262 位學者的名字至 THCI 書 目資料庫進行檢索。筆者將收錄書目的 excel 檔案下載下來,剔除 2001 年以前的 期刊論文、沒有引用書目的期刊論文、與主題分類並不是歷史的期刊論文最後共 得出 1015 篇文章。

38

圖 3-2 國科會 THCI 資料庫檢索畫面

39

五、 設計書目欄位與清理資料

(一) 臺灣歷史學者著作書目欄位設計著作表欄位設計

國科會的著作目錄 PDF 檔案前常付上述這段說明:

圖 3 3 國科會學者著作 PDF 說明

其實國科會要求許多學者的著作書目並未按照上述規定計載或分類。

許多學者的著作書目並未按照上述規定計載或分類,大多概略的列出期刊、

專書、專書論文、研討會論文、書評、研究計畫以及其他類。而本研究中主要取 期刊論文、專書與專書論文、以書籍形式著作的出版品、書評等,去除屬灰色文 獻的研討會論文、技術報告,其他類的著作。取捨與分類的標準之後會再詳述。

而在其他類的著作中,大部分的學者並未明確分類著作類別,本研究一樣取出版 資料明確的編輯、史料編纂、工具書等著作。研討會論文,國科會報告等灰色文

40

獻,和報章雜誌刊登的科普性文章則不計入書目。

其後國科會的 PDF 中刊登之著作書目使用 EXCEL 建檔。欄位格式命名為 ID、作者、年代、標題、期刊,非期刊資料則記錄出版地,並且另外增加「資料 類型」與「語言」欄位。以人工判別的方式標示分類。

圖 3-4 臺灣歷史學者著作書目資料表欄位設計

(二) 引用書目資料表欄位設計

引用書目資料表的基礎是 THCI 資料庫下載的引用書目資料表,將 THCI 書 目資料表增加欄位,排序後成可以供 CATAR 文字剖析的格式後,就是本研究使 用的引用書目資料表。

41 圖 3-5 THCI 下載引用書目畫面

在引用書目資料表中,最大的問題相同書目但其中某個欄位標示不統一。例 如有些作者姓名有標示羅馬拼音的劃一題名,有些則沒有,英文姓名縮寫方式不 同但同一作者等。再一個問題是欄位資料的缺少,例如同一本書,有的有作者,

有的有標年代,有的則無。等等。這些書目資料的問題都需要經過人工與軟體的 資料處理功能去做資料的正規化,盡可能達到同一筆書目格式都相同。否則以 CATAR 進行書目對分析時,會被軟體判別做不同筆書目,影響分析的精確度。

(Tseng, 2010)

在將書目資料除錯、進行正規化的同時,筆者也一併將引用書目做資料類型 跟語言的分類。

42

圖 3-6 臺灣歷史學者引用書目分析 ACCESS 資料庫欄位設計

圖 3-7 臺灣歷史學者引用書目分析引用書目欄位設計

43

六、 資料分類準則

(一) 著作書目資料類型分類

如上述說明過,研究所使用的書目先取出版資料明確的期刊論文、專書及專 書論文、書評,編輯圖書、編纂的史料、工具書等著作。研討會論文,國科會報 告等灰色文獻,和報章雜誌刊登的科普性文章則不計入書目。分類的標準如下述:

(1) 期刊論文

指刊登在學術性期刊上的學術論文。

例: 『于志嘉〈明代江西衛所屯田與漕運的關係〉,《中央研究院歷史語言研究 所集刊》72.2 (2001):301-338。』

『王正華,2002 年 12 月,〈女人、物品與感官慾望:陳洪綬晚期人物畫中江南 文化的呈現〉,《近代中國婦女史研究》,第 10 期,頁 1-57。』

(2) 專書論文

收錄在討論特一主題的圖書中的單篇學術文章,而該書為多篇文學術文章的 合輯,作者為數人以上。

44

例:

『李文良,〈晚清臺灣的地方政府與社會——廣泰成墾號事件的觀察〉,收錄於 曹永和先生八十壽慶論文集編輯委員會(編),《曹永和先生八十壽慶論文集》 (臺 北:樂學書局),頁 101-120。』

『唐啟華,〈中國外交史的重要分水嶺—九一八事變之真相與回顧〉,收入中華 民國團結自強協會編,《歷史的傷痛》,台北:中華民國團結自強協會,2001。』

(3) 專書

為單一著者著作,或與其他幾位作者合著的整本圖書。

例:

『朱德蘭。2005.11,《台灣總督府と慰安婦》,東京:明石書店,頁 1-270,約 20 萬字。』

『李貞德,2008,《公主之死--你所不知道的中國法律史》,北京:三聯書店。』

(4) 書評

書評是給予書籍介紹和評論的文章。洪隆肇在選書指南中,將書評分做六大 類:介紹型書評、論述型書評、摘要型書評、源考型書評、比較型書評、感想型書 評。本研究中剔除刊登在報章雜誌等為介紹大眾讀物的介紹型書評,專取刊登在 期刊或專書等學術性質高的書評。

45

例:

『王成勉,2003.4,〈評吳燕娜編著《中國婦女與文學論文集—第一輯》、《中國 婦女與文學論文集—第二輯》〉,《文訊》,第 210 期,頁 18-19。 』

『柳立言,〈評 Brian E. McKnight and James T. C. Liu trans., The Enlightened Judgements, Ch'ing-ming Chi: The Sung Dynasty Collection〉,《法制史研究》2 (2001):

271-296。』

(5) 主編

指學者向其他學者擔任徵集學術文章、審核,並且最後出版成專書的編輯工作。

例:

『柳立言(主編),2008,《中國史新論‧法律史分冊──中國傳統法律文化之 形成與轉變》,臺北:中央研究院‧聯經出版事業公司。』

『呂紹理、唐啟華、沈志華主編,2010 年 7 月,《冷戰與台海危機》,台北:

國立政治大學歷史系。』

(6) 史料編纂

本研究將學者對基礎文獻的整理、著述、編纂等工作皆歸類為史料編纂。基 礎文獻對歷史學研究有原始文獻的性質,是學者主要查閱的對象。史料的種類繁 多,基本上可以歸類為:叢書、總集、地方志、政府檔案、資料彙編、宗教文獻、

46

書信、日記、文集等。

例:

『曾品滄,《李景暘藏臺灣古文書》(與林正慧合編)(臺北:國史館,2008 年) 』

『吳文星,2001.07,《臺灣總督田健治郎日記(上)》,臺灣史料叢刊,(與廣 瀨順皓、黃紹恆、鍾淑敏、邱純惠合編),頁 1-614。』

(7) 工具書

工具書通常指匯集某一方面知識、資料,按特定的方法加以編排,為讀者提 供查考問題的答案或資料線索的圖書。工具書是提供準確的、濃縮的知識信息,

內容廣泛而敘述簡明扼要,採用特定的編排方法提供考察之用。本分類中指學者 著作、編輯工具書,或參與纂寫。有辭書、類書、百科學書、書目、索引、表譜 圖

錄、年鑑、手冊。(赵国璋, 王长恭, & 江庆柏, 2006)

例:

『羅久蓉,2004. 歷史名詞二則──1.〈處理漢奸案件條例(懲治漢奸條例)〉; 2.〈戰爭罪犯審判條例〉,許雪姬總策劃,《台灣歷史辭典》(台北:遠流出版公司,

2004)』

『鄭政誠,2003,《台灣歷史年表》,台北:龍騰文化事業公司。』

47

(8) 圖錄說明

圖錄說明指主要匯集圖片、照片等形象姓資料。圖錄說明是指學者為古文物 或藝術品圖片旁添加解說。

例:

『《文藝紹興:南宋藝術文化大展.圖書卷》圖錄,2010,展件說明約 5,000 字。

許雅惠,《殷墟甲骨文》,台北:國立故宮博物院,2001。』

(9) 電子資源

指學者將史料內容或著作刊登到網站上,以數位形式呈現的著作。

例:

『邢義田,〈湖南龍山里耶 J1(8)157 和 J1(9)1-12 號秦牘的文書構成、筆跡和 原 檔 存 放 形 式 〉( 連 載 二 ), 武 漢 大 學 簡 帛 研 究 中 心 “ 簡 帛 ” 網 站 , http://www.bsm.org.cn/show_article.php?id=78,2005.11.14。(搜尋,2007.07.19)』

48

(二) 引用書目類型分類

本研究中所使用的引用書目是從 THCI 資料庫中下載 xls 格式的書目資料檔 案。檔案格式請見圖 3-3-4。

研究用的引用書目資料經過下載取得後,先以人工判定的方式,將引用書目 如下述項目分類,並標示語言種類,最後再整理成能使 CATAR 程式進行分析的 形式。

引用書目分類如下:

(1) 史料

史料就是指進行歷史研究時作為研究素材的基礎文獻。資料類型繁多,凡記 錄過人類活動的媒體都可做為研究素材。基本上可以歸類為:叢書、總集、地方 志、政府檔案、資料彙編、宗教文獻、書信、日記、文集等。本研究中藉由判讀 書目,將常作為史料使用的引用書目歸為一類。

(2) 專書

為單一著者著作,或與其他幾位作者合著的整本圖書。

(3) 期刊論文

指刊登在學術性期刊上的學術論文。

49

(4) 專書論文

收錄在討論特一主題的圖書中的單篇學術文章,而該書為多篇文學術文章的 合輯,作者為數人以上。如經正式出版的研討會論文集文章也算做專書。

(5) 工具書

工具書通常指匯集某一方面知識、資料,按特定的方法加以編排,為讀者提 供查考問題的答案或資料線索的圖書。工具書是提供準確的、濃縮的知識信息,

內容廣泛而敘述簡明扼要,採用特定的編排方法提供考察之用。有辭書、類書、

百科學書、書目、索引、表譜圖錄、年鑑、手冊。(赵国璋 et al., 2006)

(6) 電子資源

資料出處註明是從網站、資料庫、光碟等數位形式的引用書目。

七、 清理並正規化書目資料

為了配合第三階段使用 CATAR 軟體做書目對分析,CATAR 軟體在剖析資 料時,需要對應 ACCESS 資料庫的固定欄位。圖 3-4 是 CATAR 的 ACCESS 欄 位設計,將對應的資料放入欄位後,再由電腦計算歸類。欄位 DP 是主鍵、AU 是

50

作者、AF 是英文拼音、TI 是標題、SO 是機構、DE 是關鍵字、AB 是摘要、C1 是國家、CR 是引用書目、PY 是出版年度、IN 是機構。詳細說明請參見( )一文。

圖 3 -8 軟體導入 ACCESS 欄位表

本研究中只使用了 AU、TI、C1、CR 欄位,並且把 SO 改為統計期刊名稱 使用。

本資料表為了配合 CATAR 的文字剖析處理,將西文人名的分隔符號 Sinclair.

Keith 修改成 Sinclair~Keith。再匯入 SQL,將同一篇文章的引用書目合併為一串 合乎 CATAR 軟體要求的 CR 純文字,之後再使用 CATAR 軟體進行文字剖析。

Keith 修改成 Sinclair~Keith。再匯入 SQL,將同一篇文章的引用書目合併為一串 合乎 CATAR 軟體要求的 CR 純文字,之後再使用 CATAR 軟體進行文字剖析。

相關文件