從使用情形與學術評鑑功能探討「臺灣人文及社會科 學引文索引資料庫」整合發展之效益
Evaluation of the Development Strategy of the TCI-HSS Database System Based on Usage Statistics and Academic
Assessment Perspectives
曾淑賢 Shu-Hsien Tseng 國家圖書館館長
Director-General, National Central Library Email: [email protected]
洪淑芬 Shu-Fen Hung 國家圖書館編輯
Editor, National Central Library Email: [email protected]
【摘要 Abstract】
「臺灣人文及社會科學引文索引資料庫」(Taiwan Citation Index - Humanities and Social Sciences,簡稱為TCI-HSS資料庫,也常被簡稱為TCI資料庫)最初是於 民國101 年透過彙整當時國科會的「臺灣社會科學引文索引」(簡稱為TSSCI)、
「臺灣人文學引文索引」(簡稱為THCI)與「臺灣人文學引文索引核心期刊」(簡 稱為THCI Core)而建置,除了匯入原已建置的TSSCI、THCI資料庫之外,也匯入 國家圖書館所建置的「臺灣期刊論文索引系統」、「臺灣博碩士論文知識加值系統」
等之資料,提供建置引文時,可進行比對確認引文資料的正確性、或直接擷取資料 利用,以提升建檔效率。TCI-HSS資料庫建置之初,主要功能是在於輔助支援國內 的人文與社會科學領域的期刊之評比;至本文撰寫時的105 年,已經持續建檔 4 年,
擴增建檔資料的類型與範圍,並增進優化系統功能,故可發揮更多種輔助學術評鑑 之效益。本文首先回顧TCI-HSS資料庫建置之目的與背景,列舉此資料庫系統的發 展過程相關統計、以及現今的使用情形,並說明此資料庫系統可支援輔助不同的學
術評鑑之功能,進而論述此TCI-HSS資料庫發展過程中整合多個資料庫、以及擴增 建檔引文資料範圍之效益。作者於結論中,綜整此資料庫整合發展的具體效益,包 括支援期刊評比得以轉型加入多元配分權重、可作為多種評鑑的依據、以及可以發 揮作為入口平台之重要功能而裨益學術傳播等。最後並提出關係到TCI-HSS資料庫 之引文建檔發展、以及與國家學術知識財典藏保存暨未來推廣發展的相關建議;希 望國家的資訊建設,能夠周全兼顧永續的使用推廣與典藏保存。
The initiation of the Taiwan Citation Index - Humanities and Social Sciences (TCI-HSS) was due to the need for a more complete citation index database to support the journal assessments for the humanities and social sciences domain in Taiwan. The Taiwan Social Science Citation Index (TSSCI) and Taiwan Humanities Citation Index (THCI) were developed long before 2012, the year that scholars and the National Science Council (NSC, reformed into Ministry of Science and Technology in 2014) decided to merge these databases to enable an economic, efficient, and sustainable way for the long-term management and development of a citation index for these fields. The National Central Library (NCL) was entrusted to undertake the integration project, and in a collaboration with the NSC and the Advisory Committee for the TCI-HSS, the TCI-HSS database system was created, and the content development and system functionalities enhancement has shown steady progress. The TCI-HSS is a great improvement over its predecessor, and can support more kinds of evaluation and assessments. This paper first explains the current state of the TCI-HSS database system through the following sections:
introduction to the background and purpose of the construction of this TCI-HSS database system; explanation of research methodology, statistics about metadata records of ‘source records’ and ‘cited references’ to illustrate an overall picture about the content of the database system; overview of statistics about the percentage distribution of material types found in all of the ‘cited references’; discussion of the usefulness of the TCI-HSS database system through the statistics of webpage usage;
discussion of the benefits of utilizing the continuously growing databases owned by the NCL in constructing both ‘source records’ and ‘cited references’ for the TCI-HSS database. Then in the conclusion, the authors summarize the advantages of integrating several databases into one TCI-HSS. This includes enabling the
planning of journal assessment to reconsider the proportion of different indicators.
The database can thus be developed rapidly to support various kinds of evaluation and assessments, serving as a portal for researchers. In addition, the authors give some suggestions to improve both the metadata construction for this database as well as the preservation and promotion of valuable scholarly materials. Finally, for future consideration, the authors have offered recommendations for improving classifications and for more accurately and efficiently linking authors. It is hoped that this TCI-HSS database system will continue to be developed into a useful tool to serve the scholarly community.
【關鍵詞 Keywords】
臺灣人文及社會科學引文索引資料庫、TCI-HSS 資料庫、TCI 資料庫、期刊影響係 數、期刊評比、學術評鑑
Taiwan Citation Index - Humanities and Social Sciences; TCI-HSS Database System;
Journal Impact Factor; Journal Assessment; Academic Assessment
一、前 言
「臺灣人文及社會科學引文索引資料庫」(Taiwan Citation Index - Humanities and Social Sciences,簡稱為TCI-HSS資料庫,也常被簡稱為TCI資料庫)是於民國 101 年透過彙整當時國科會(現名科技部)的「臺灣社會科學引文索引資料庫」
(Taiwan Social Science Citation Index,簡稱TSSCI)、「臺灣人文學引文索引資 料庫」(Taiwan Humanities Citation Index,簡稱THCI)、與「臺灣人文學引文索 引核心期刊資料庫」(Taiwan Humanities Citation Index, Core Journal,簡稱THCI Core)而初創建置。國內所以思考建置引文索引資料庫,主要考量是為了建置臺灣 在地的期刊評比用資料庫;因為只有國內自己擁有自建的、以國內學術著作為主的 引文索引資料庫系統,才可能真實反映國內人文與社會科學領域學者的研究力,否
則諸如SSCI、A&HCI1、Scopus2、等資料庫,所收錄的資料係以西文為主;而中國 大陸的CSSCI3 資料庫雖然是華文的引文索引資料庫,然因中國著作數量龐大,高 度稀釋了臺灣學者的著作。故透過該等資料庫,臺灣學者著作完全不可能被凸顯,
也不可能精確地呈現臺灣學者著作與相關期刊的優質性。因此早在彙整創建 TCI-HSS資料庫的 10 年之前,現在科技部的前身行政院國家科學委員會即已推動 TSSCI與THCI等之建置。有鑑於中國大陸已快速發展人文及社會科學之引文索引資 料庫,挾其數量龐大之優勢,快速向國際學術界擴展影響力,臺灣亟思透過結合港、
澳等地之優質華文期刊,構建華人的另一人文與社會科學之社群,並發揮推廣臺灣 學者研究成果之功能,故有整合TSSCI與THCI、以及其他相關資料庫的TCI-HSS 資料庫之建置(曾淑賢、鄭秀梅、羅金梅,2013)。
TCI-HSS資料庫建置初始階段,主要考量的功能是在於輔助支援國內的人文與 社會科學領域的期刊之評比。該資料庫整合TSSCI與THCI之後,又匯入國家圖書館 所建置的「臺灣期刊論文索引系統」、「臺灣博碩士論文知識加值系統」等資料庫,
提供建置引文時,可進行比對確認引文資料的正確性、或直接擷取資料利用,以提 升建檔效率;初創後至本文撰寫時的105 年,已經持續建檔 4 年,擴增建檔資料的 類型與範圍,並增益系統功能。故相較於早期階段,已有長足的進步。本文首先回 顧TCI-HSS資料庫建置的目的與背景,列舉資料庫的發展過程相關統計、以及現今 的使用情形,並說明此資料庫可支援輔助不同的學術評鑑之功能,進而論述此 TCI-HSS資料庫發展過程中整合多個資料庫之效益。本文最後於結論中,提出關係 到TCI-HSS資料庫之引文建檔發展、以及與國家學術知識財典藏保存暨推廣相關的 建議;希望提示學界,在發展學術文化財著錄與檢索服務相關的資料庫之同時,亦
1 由 Institute of Scientific Information 公司所建置,此公司是 Eugene Garfield 於 1958 年創立 的資訊公司,簡稱ISI,後來於 1992 年為 Thomson Corporation 的子公司 Thomson Business Information 所併購。SSCI 是 Social Science Citation Index 的簡稱,為社會領域之資料庫;
A&HCI 是 Arts & Humanities Citation Index 的簡稱,為藝術與人文領域之資料庫;此二資 料庫與科學領域的Science Citation Index(簡稱為 SCI)是該公司對文獻資訊檢索影響至深的 三大資料庫產品,尤其以引文檢索、期刊影響係數(Impact Factor)排名,影響學界至深。
2 是 Elsevier 於 2004 年 11 月推出的系統,收錄逾萬種出版品,包括學術期刊、會議論文及書 評等之摘要與引文,為跨人文與藝術領域、社會科學、以及生命科學等多領域之整合型資料 庫。
3 全名為 Chinese Social Sciences Citation Index,由南京大學中國社會科學研究院評價中心所建 置。
必要呼籲個人作者與出版社響應授權,以裨益國家的資訊建設,能夠周全兼顧文獻 內涵的永續使用推廣與典藏保存。
二、「臺灣人文及社會科學引文索引資料庫」之發展
引文索引資料庫系統除了資訊檢索利用之外,其有別於一般資料庫系統的獨特 效用是可以提供學術評鑑參考之用的客觀統計數據。臺灣國內自建置TSSCI、THCI 等資料庫時,原僅收錄期刊文獻及其參考引用文獻(簡稱「引文」)。至發展TCI-HSS 資料庫,學者開始從多面向考量,而逐漸拓展收錄文獻類型,加入博士論文、專書 與專書論文等類型資料的引文建檔,期使此TCI-HSS資料庫可以輔助學術評鑑的項 目類別更多。此外也擴增建置引文資料的文獻來源,亦即期刊文獻類資料自105 年 起增加優選的香港、澳門與中國大陸人文社會科學類期刊文獻之引文建檔。未來資 料量增加達一定程度之後,將可看出更大範圍的人文社會學者之間的學術脈絡關 係。
所謂學術評鑑包含針對作者、大學及研究機構、以及期刊等的優質度評鑑與影 響力評比。作為輔助學術評鑑參考之用的引文索引資料庫,必須能夠公正、客觀、
正確地呈現各種評鑑參考用的統計數據,因為學術評鑑上的作者著作之量與質的評 鑑與評比,關係到研究者的升等與獲得的研究獎助。關於大學與研究機構的學術競 爭力與影響力之評鑑,關係到大學與研究機構的聲望、以及政府補助金之分配。而 關於期刊的評比,對出版社而言,關係到其是否容易獲得作者投稿、以及被訂購多 寡的銷售營利。因此,支援多種學術評鑑的引文索引資料庫,貴在資料的正確、涵 蓋年份長、以及須收錄特定學門領域在研究上較受重視與引用的重要文獻類型。
TCI-HSS資料庫整合既有的TSSCI、THCI等資料庫,逐年以來又拓展收錄範圍,不 斷擴增資料規模以及增進系統功能,乃是源於以下的因素與理念。
(一)國家圖書館掌握豐富學術資源之優勢而受委託進行整合
臺灣早期既有期刊文獻類的資料庫資源分散;當時國科會人文處TSSCI、THCI 二資料庫已建置約十年,資源分散,不易有效發揮期刊索引資料庫的最佳功能。基 於「整併既有資源、不重複建置」之考量,又國家圖書館長期以來建置「臺灣期刊 論文索引系統」,已累積深厚的建檔專業能力以及豐富的資料量,故國科會希望與 國家圖書館合作,以便在整併TSSCI、THCI等資料庫時,亦得以結合原來發展成熟
且內容完整豐富的「臺灣期刊論文索引系統」;期透過此資料庫之建置,為國內人 文與社會科學領域,提供可比擬國外學術評鑑利器的SSCI、A&HCI、Scopus、CSSCI 等之國內在地化的期刊評比工具資料庫。此資料庫由規劃整併至TCI-HSS資料庫開 發完成,係成立跨組織工作小組,聘請學者專家成立諮詢委員會指導,集專家學者 之智慧,在國家經費支持下完成且持續運作(曾淑賢、鄭秀梅、羅金梅,2013)。
因國家圖書館為國內出版品法定送存圖書館,不僅館藏豐富,且已建置多種重要資 料庫系統,故早期既有「臺灣期刊論文索引系統」為之奠基,後續復有「臺灣博碩 士論文知識加值系統」、「漢學中心典藏大陸期刊篇目索引資料庫」等資料庫作為 後續內容多元發展的堅實後盾,高度翼輔本資料庫的效率化發展。
(二)期刊評比與學界對於「評比」之期許
期刊評比在學術評鑑上,具有舉足輕重的地位。在假定無人為操作之前提下,
理論上,被引用愈多的期刊,表示該期刊在其所屬領域中,得到愈多的肯定與重視,
故此類期刊的「能見度」也愈高。而「能見度」影響所致,使得愈多作者,更願意 投稿到此種期刊,使得此種期刊的稿源愈豐富,最後在主編與專家評審之下脫穎而 出獲刊登的文章,也相對優質性高。
透過學術評鑑,可以評比作者、大學、研究機構、出版社等,對其具有關鍵性 的利害關係,因此,所謂「評鑑」,必須建立客觀公正的評鑑準據,以昭公信,泯 除爭議。早期的評鑑以發表數量為重,卻忽略了在收錄於SSCI資料庫的期刊中,其 品質亦有優劣差異,此種以發表數量為主要的學術評估標準,缺乏公正性(陳世哲,
2010)。故學者呼籲,應建立學術多元化的審查機制,以公正、客觀、尊重多元學 術價值的立場進行評審,而且衡量研究成果不僅以形式為單一標準,且應重視內涵;
同樣是刊登於期刊,各期刊影響力卻有高低;而同一份期刊中的不同論文,對學界 的貢獻也有差別,因此評鑑除了參考客觀指標,更重要的是評估著述的實質內容、
學術創見及貢獻(傅仰止,2009)。基於此一理念,科技部前身的國科會人文處自 99 年開始規劃推動「人文及社會科學學術期刊評比制度化」工作,漸使評鑑程序與 評鑑結果的公信力具有高度說服力,且希望能協助國內人文社會科學研究者逐漸在 國際學術界占有一席地位(吳淑真,2011)。於 2011 年推動的人文及社會科學學 術期刊評比制度化的過程中,期刊評鑑指標兼納入客觀的評鑑指標(包含形式指標、
引用指標)與主觀的品質評鑑指標(包含專家評審、問卷調查),而且品質評鑑指 標權重為70%,客觀評鑑指標權重為 30%(吳淑真,2011;陳弱水,2011),可說
充分回應了學者對於評鑑應重實質內容與貢獻的籲求。TCI-HSS資料庫在人文及社 會科學學術期刊評比制度中,即為客觀評鑑指標的權重部分,提供可據以評比的客 觀數據。
(三)重視專書寫作的學者呼籲
TCI-HSS資料庫在整合初期,主要是以期刊文獻作為「來源文獻」,為各篇期 刊文獻建置其引用的參考引用文獻。然學術研究成果的展現,除了期刊文獻形式之 外,學位論文中的博士論文、專書、以及專書論文等,亦屬比較系統化的研究成果。
因此,科技部前身的國科會人文處,早已開始邀請國內研究機構暨出版社訂定專書 出版補助辦法,冀能透過出版品公平、公開、公正之評鑑程序,同時建立優良研究 指標,以提升學術專書的水準,增加學術的流通與普及(戴浩一,2004)。有關人 文與社會科學領域專書著作的重要性,學者紛紛從不同的角度加以論述,包括人文 社會領域的專書被引用的活躍年限較期刊長,而且經典之作的專書,其被引用甚至 可能與時俱進,故專書對學術界的影響力較期刊長久(魏念怡、陳東升,2006)。
也有學者從本國重要議題的研究與具有研究內涵傳承重要意義的專書特質,呼籲所 謂「評鑑」應審視學術與社會之間的種種關係,促成重新開啟人文學與社會科學研 究的視野,重視研究對社會的實質貢獻,而不應過度重視在國際期刊中的刊登而忽 視了學術專書的重要性,因為此種國際期刊導向的評鑑方式,可能造成年輕學者因 此僅以寫作合乎學術規格的論文為奮鬥目標,未來深具傳承創新與人文內涵的學術 專書或將減少,且可能導致臺灣社會的新情勢與新問題反而未能獲得學界足夠的關 注與深入的研究(鄧育仁,2014)。還有學者則是從促成臺灣學術環境發展多元化 及正常化,以及「專書經典值」(Book Legendary Scores, BLS)之角度,論述在「長 期引用指數」指標的觀點考量下,專書引文資料逐漸納入索引資料庫後,專書將會 更顯著地展現其獨特的意義和價值,而確信專書具有較期刊文獻更為長久之重要地 位與影響力(楊志堅,2013,2014)。
國科會人文處(現在的科技部人文司)有鑑於令人憂心的專書式微,曾推動人 文及社會科學領域的專書寫作計畫,鼓勵學界同仁將多年研究計畫所累積的成果,
或是重要學術課題,撰述為學術專書,以更完整、系統性地闡述見解。此外,也規 劃由期刊編輯委員會代審專書的配套制度,以確保專書的學術品質。102 年更推動 專書寫作的「行遠計畫」(陳東升,2014)。
由前述三點可知,基於國家圖書館已累積相關經驗並擁有重要資料庫資源、學 界對於所謂期刊「評比」期許納入多元指標、呼籲重視內容較為完整豐富的專書,
並促使由政策面倡導鼓勵,故可於整併原有的TSSCI、THCI兩大資料庫時,同時醞 釀規劃納入博士論文、專書、以及專書論文,以期有朝一日此資料庫可以協助落實 多元評比指標之目標。
三、探討議題與方法
(一)探討議題
本文主要的探討議題包含下列項目。
1. 測試並介紹 TCI-HSS 資料庫的學術評鑑功能,以幫助各界了解與利用該等相 關功能。
TCI-HSS 資料庫可以統計分析的學術評鑑面向多元;希望透過本文的介 紹,讓更多學者、研究者、出版機構以及設計評鑑指標之學者專家與評鑑相關 機構了解各種評鑑參考數據的統計分析功能。讓學者、研究者與出版機構瞭解,
希望可以提升其授權公開分享著作的意願;讓設計評鑑指標之學者專家與評鑑 相關機構了解,則是提供其從 TCI-HSS 資料庫的功能現況,思考是否再度調 整評比制度中的「客觀評量指標」之權重。
2. 檢視介紹 TCI-HSS 資料庫輔助各不同評鑑面向之統計操作方法。
評鑑的客觀參考數據指標,貴在資料的正確性、以及是否可以便捷地提供 評鑑相關數據,儘量降低必須再人為進行統計資料的整理與分析之功夫勞力。
透過作者對於各項統計功能的測試,可以發覺歸納哪些統計分析可以直接產出 相關統計的排序、哪些需要再經過人為整理排序的功夫。後者需要研究者透過 軟體應用的技術操作輔助,往往也是比較不為人知的功能。透過本文在操作上 的展示介紹,可以推廣周知本資料庫各種評鑑面向的統計操作方法。對於尚需 人為整理操作的統計分析功能,可以列為未來優化努力的項目。
3. 由檢視 TCI-HSS 資料庫功能,思考未來的發展方向並提出建議。
TCI-HSS 資料庫的發展規劃,必須兼顧資料建置面與查詢使用服務面,
本文從評鑑指標中的「客觀評量指標」包含「形式指標」與「引用指標」二者,
以及探討此資料庫至今的建檔進程與功能現況,思考未來如何能夠經濟有效地 發展此資料庫,而提出相關建議。
(二)討論方法
1. 介紹 TCI-HSS 資料庫中各類資料數量暨使用統計,以供判斷評鑑上的效度。
在科技部研擬的期刊評鑑指標權重分配中,「客觀評量」指標的「引用指 標」是根據 TCI-HSS 資料庫進行評量。此種客觀的書目計量指標,需要資料 庫包含的資料有一定規模的資料數量與涵蓋年代範圍、以及相當數量的被使用 度,才能使引用暨文獻利用相關的統計結果,有效地呈現出真正的學術著作影 響力,而具有參考價值。因此,本文列記TCI-HSS 資料庫自初始建置至撰寫 本文的105 年 8 月為止的各類資料數量,以及相關的使用統計,以供各界研判 相關的評鑑統計之效度。
2. 以不同統計方式檢視資料庫使用統計之信效度。
資料庫的使用情形,可以統計分析的項目不一而足,但往往受限於資料庫 原本的統計項目設定、或者特殊統計軟體本身的功能之限制。如前所述,資料 庫的被使用情形,也關係到評鑑相關統計的效度,可以作為效度判斷的依據。
TCI-HSS 資料庫由系統本身的統計功能產出的各月使用統計,每月均公布於 此資料庫網站的「最新消息」。惟為進行更多元的統計,也外掛網頁流量統計 軟體PIWIK4。作者試以撰寫本文的前二個月為例,利用 PIWIK 產出使用統 計,除了可以呈現較多面向的統計如造訪者來自的國家,亦可與 TCI-HSS 資 料庫由系統本身的統計互相對照,由趨勢是否具有一致性,初步研判統計的信 度。
3. 以讀者端的介面實際操作測試各類學術評鑑相關功能。
本文的目的之一,是介紹並幫助各界了解與利用 TCI-HSS 資料庫的學術 評鑑相關功能。基於促進了解與推廣利用的目的,相關的功能應以各界均可公 平、自由利用為理想。本資料庫的設計,即將所有評鑑相關功能,建構於使用 者端的介面。因此,本文對於學術評鑑的相關統計分析功能之介紹與相關論述,
4 PIWIK 是公司名稱,也是該網站流量統計軟體的名稱(https://cloud.piwik.pro/)。
均僅利用讀者端的介面功能,根據該公開使用的介面之功能,進行直接的、與 間接的5 評鑑相關統計分析。
四、相關統計
「臺灣人文及社會科學引文索引資料庫」自整併TSSCI、THCI、以及THCI Core 等資料庫之後,有關發展方向如期刊選擇收錄的原則、收錄資料的類型、建立專書 引文索引的基本規則、資料建置的時間順序、遴選專書著作的名單、學術查詢的方 便性、學術資料的公共近用等議題,均由專業學術社群共同參與討論;以後任何原 則之調整改變,也仍將由學術社群參與規劃和推動(陳東升,2013)。實際上該 TCI-HSS資料庫乃是逐步拓展收錄資料的範圍,從以臺灣的人文及社會科學期刊文 獻與期刊引文為主,經由科技部人文司整合學者專家共同參與,拓展範圍至收錄優 選的港澳學術期刊論文,也增加收錄臺灣的博士學位論文、優選的學術專書等及其 引文,並再進一步擴大收錄範圍,也納入經學門召集人率領域專家學者優選出的中 國大陸期刊,使本TCI-HSS資料庫得以成為華文學界重要的引文索引資料庫。
(一)收錄資料種類與建檔規劃
TCI-HSS 資料庫一共收錄 18 學門的期刊,包含文學、語言學、歷史學、哲學/
宗教研究、人類學、教育學、心理學、法律學、政治學、經濟學、社會學、傳播 學、區域研究及地理、藝術學、管理學、體育學、圖書資訊學、綜合等18 學門的 期刊篇目,作為TCI-HSS 資料庫系統內的「來源文獻」,並為之建「引文資料」。
此外,自102 年起定期匯入國家圖書館原有系統內之博士論文書目及摘要資料後,
首先就 100 學年度約 190 冊博士論文建置引文,建立先導經驗及作法。另自 103 年12 月至 104 年 6 月,因了解科技部人文司對於人文社會學領域專書之重視與將 專書納入本引文資料庫之希望,本館乃提出「103 年國家圖書館學術性引用文獻資 料擴增建置計畫」之申請,獲得科技部補助建置人文社會學領域的優選學術專書 之建檔,總計完成專書2,300 多冊、5,300 多篇專書論文、引用文獻 85 萬筆之建檔。
5 例如後述六之(二)之 2 有關專書被各類型文獻引用的情形,需要透過下載統計表之後,進 行不同的排序。
國家圖書館於執行 TCI-HSS 資料庫的建檔作業時,對於期刊類資料乃是為新 刊期刊建檔與回溯為舊期刊建檔二者並進,101 至 104 年的第一個中程計畫期間,
主要的工作包含訂定引文資料的欄位格式、修訂來源文獻篇目資料的錯誤、配合 科技部人文司各年規劃所將進行期刊評比的學門,以及將進行評比時間而安排建 檔的優先順序及補缺建檔等,使此一資料庫,得以發揮及時支援評比之效用。101 至104 年期刊文獻與引文建檔完成的數量如表 1。
表1
TCI-HSS資料庫101-104年彙整資料與建檔規劃 (萬筆)
項目
年度 來源文獻建檔a
引用文獻建檔
回溯建檔 新增建檔
THCI 與 TSSCI 匯入 19.5 50
101 年新增 1.4 40 28
102 年新增 1.4 40 28
103 年新增 1.4 53 28
104 年新增 1.4 52 28
科技部補助「103 年國家圖書館學
術性引用文獻資料擴增建置計畫」 --- 85
匯入與新增建檔
總 計 25.1 432
a期刊約1,075 種(其中還持續出刊發行之期刊約 900 種)。
由表1 可知,101 至 104 年的 4 年期間,完成期刊來源文獻約 5 萬 6 千筆、引 用文獻297 萬筆之建檔。若與匯入的「THCI 與 TSSCI」資料合計,截至 104 年年 底,TCI-HSS 資料庫已經收錄人文及社會學期刊 1,075 種(其中還持續出刊發行之 期刊約900 種),來源文獻逾 25 萬筆,引文資料逾 430 萬筆。至 104 年年底,回 溯建檔已回溯至88 至 89 年,如果 105 至 108 年受補助經費穩定,預計至 108 年第
二個中程計畫執行完成後,期刊文獻引文之建檔將可望回溯至 79 年;達成回溯 30 年的資料建檔。6
表2 是 105 年度的建檔數量規劃。較諸 101 至 104 年,規劃將於 105 年建檔的 數量倍於以前任何一年度的建檔量。
表2
TCI-HSS資料庫105年度建檔進度及數量規劃
項目
年度 資料類型 資料出版年 建檔冊數/篇數 引用文獻數
105
臺港澳期刊 1990-2016 5,462 / 58,798 1,763,940 大陸期刊a 1990- 468 / 4,680 140,400 博士論文 2000- 4,250 / 0 850,000
專書 360 / 3,600 180,000
合計 2,940,000b 註:執行期間:105 年 1 月至 12 月。
a. 中國大陸期刊以經由學門學者專家挑選推薦為主,相關的來源文獻部分係自國家圖書館所建置之
「漢學中心典藏大陸期刊篇目索引資料庫」(選錄文章以文史哲、社會科學等學術性論文為主,總 計近2,000 種,收錄的現刊約 500 種)匯入 TCI 資料庫。b. 各類資料的引用文獻數為估算值,但全 年建檔數量達到294 萬筆。
(二)資料量統計
TCI-HSS 資料庫之資料建檔新增,是由建檔者直接於資料庫後台進行資料建置,
但所建檔之資料,先存置於暫存區,俟校對通過,進行「提交」7,本館此專案團隊 之工作人員再就已經「提交」之資料進行審核,審核通過後再進行「上架」,提供 查詢利用。至本(105)年 8 月初為止,此資料庫所包含的各類型資料與所占百分 比統計如表3。
6 曾淑賢計畫主持,「105-108 年國家圖書館學術性引用文獻資料擴增建置計畫(1/4):綱要計畫 書」(綱要計畫書審議編號:105-1201-07-11-03)。
7 建檔、校對與「提交」為委外廠商必須進行的工作。
表3
TCI-HSS資料庫現有收錄資料統計
資料類型 人社領域各類文獻數量 百分比%
來源文獻
期刊論文a 287,701 6.02
學位論文 15,575 0.33
專書 6,053 0.13
專書論文 15,213 0.32
小計 324,542 6.80
引用文獻 4,451,436 93.20
總計 4,775,978 100.00
權威資料
人名權威b 21,788 ---
機構權威 21 ---
小計 21,809 ---
註:統計至 105 年 8 月 6 日止。
a. 至 105 年 8 月 6 日為止共收錄不分領域期刊計 1,090 種。b. 人名權威資料為彙整教育部的教 師資料與建檔過程為作者建置之資料,但並非所有作者均有建置權威資料。
本資料庫至105 年 8 月統計所得的引文資料總計 445 萬 1,436 筆,占全資料庫 總數量的 93.2%。此四百餘萬筆引文資料,來自於期刊、博士論文、專書、專書論 文等多類「來源文獻」之參考引文建檔。而此四百餘萬筆引用文獻若以文獻類型分,
則各種引文類型數量統計如表4。被引用數領先的是期刊論文占 36.87%,其次是圖 書占33.14%;圖書的被引用,幾乎可以與期刊文獻的被引用相抗衡。另因為圖書論 文的被引用占11.16%,如果將圖書與圖書論文合計,則此二類型的引文占 44.3%,
已經多於期刊文獻的被引用。
各類資料數量基本上都是隨著時間與不斷建檔而增加,惟引文總數在104 年 12 月之統計為494 萬 8,895 筆(106 年綱要計畫書),至 105 年 8 月 6 日之統計卻降 低為445 萬 1,436 筆。此乃是因為過去四年進行引文建檔過程中,同一筆著作可能 被多位作者引用,不同的作者對於引用文獻的記述方式或有完整度上的差異,故原 則上建檔時是先進行「查重」:「臺灣期刊論文索引系統」以及「臺灣博碩士論文 知識加值系統」除於該資料庫建置之初批次轉入所有資料備用之外,亦持續將新增 資料轉入該TCI-HSS 系統中的「中繼資料儲存區」。建置引文資料時,建檔者先於
此「中繼資料儲存區」以及現有的「引文資料」中,查找同一筆資料。找到同一筆 資料後,進行比對判斷,而選用原來既有的較完整的一筆書目資料,進行「套用」。
然此過程中,往往遺留被「放棄」的最初已經「新增」之不全的引文,經久累積下 來,該系統中即包含龐大數量的無效資料,造成日後選取將「套用」的引文過程中,
需要自愈來愈多的無效資料中篩選,建檔速度減低之外,系統運作速度亦受到影響。
因此,本館於105 年 6 月透過程式比對出無法對應到任何「來源文獻」的無效引文 資料,將之全數刪除;一共刪除192 餘萬筆無效的引文資料;故引文數量略減,但 使資料庫內容更精確。
建置TCI-HSS 資料庫之前,TSSCI、THCI 等資料庫的資料尚少,「來源文獻」
與「引文」合計僅共約70 萬筆(表 1);而 TCI-HSS 資料庫自整合此二資料庫後 持續建置,至105 年 8 月 6 日總資料量達到 445 萬筆時,已具體呈現出專書、專書 論文被引用的合計,比期刊文獻的被引用多 7.43%。未來資料庫的「來源文獻」與
「引用文獻」建置更多之後,因為根據進行比較用的文獻數量增加,相當於樣本數 提高,因此圖書類資料的被引用與期刊文獻的被引用之比較,將具有更高的正確性,
而能更客觀確實地呈現人文與社會科學領域引用特質。故隨著建檔量的增加,更明 朗的人文社會科學領域之圖書類與期刊文獻之引用實態呈現,值得期待與持續觀察 研究。
表4
各種引文類型數量統計
資料類型 資料數量 百分比%
期刊論文 1,549,231 36.87
圖書 1,392,555 33.14
圖書論文 469,043 11.16
學位論文 201,216 4.79
會議論文集 47,834 1.14
會議單篇論文 69,328 1.65
研究計畫(併入研究報告) 2,531 0.06
研究計畫/研究報告 53,383 1.27
政府公報/統計 2,887 0.07
檔案 9,576 0.23
(續下頁)
表4(續)
資料類型 資料數量 百分比%
手稿 1,451 0.03
未刊稿 1,122 0.03
專利 340 0.01
標準 476 0.01
單篇論文 5,990 0.14
資料庫 1,836 0.04
網路資源 112,243 2.67
其他非書資料 251,473 5.98
報紙/電子報/網路新聞 25,938 0.62
座談會/會議紀錄 1,165 0.03
單篇文學作品 1,689 0.04
書評 227 0.01
摘要 899 0.02
包含「文獻類型分類」總筆數 4,202,433 100.00
不含「文獻類型分類」總筆數a 249,003
總計 4,451,436
註:統計至105 年 8 月 6 日止。
a. 不含「文獻類型分類」的引文資料總筆數為 24 萬 9,003 筆,此將近 25 萬筆是引文資料本身未建置
「資料類型」的欄位,一部分是原屬於TSSCI 與 THCI 的資料,另一部分是 102 年上半年先以離線 方式建檔的資料。該部分有待未來補建資料類型的資訊,俾使統計更趨精確化。作者撰寫本文的105 年8 月為止,「各種引文類型數量統計」僅能就書目資料中包含資料類型分類的引文進行統計。
五、使用統計
(一)檢索使用數量統計
臺灣人文及社會科學引文索引資料庫自102 年 9 月啟用,至 105 年 7 月 31 日 止累計使用統計如表5。
表5
TCI-HSS資料庫使用統計
統計項目 105 年 1-7 月 102 年 9 月啟用
至105 年 7 月 1 月 2 月 3 月 4 月 5 月 6 月 7 月 累計
連線使用次數 (引文瀏覽人次)
586,132 568,857 589,667 570,691 390,852 838,018 589,411 38,136,692
檢索次數 (引文查詢)
336,589 537,862 488,316 500,409 265,212 535,729 239,436 30,873,043
引文書目點閱 次數
301,003 500,905 443,352 462,195 237,493 496,047 214,770 28,389,443
資料來源:「臺灣人文及社會科學引文索引資料庫」。檢自
http://tci.ncl.edu.tw/cgi-bin/gs32/gsweb.cgi/ccd=f0CvKK/newsresult_format0?r1=1&searchall=1
為針對使用情形進行詳細分析了解,本研究利用 PIWIK 網頁流量統計軟體,
擷取TCI-HSS 資料庫 105 年 6 月與 7 月的造訪使用相關統計(圖 1、圖 2)。該網 頁統計數字與TCI-HSS 資料庫網站本身的統計,有一定程度的差異。此應該是因為 統計上的定義與統計機制不同所造成。但就此二個月份造訪人數與檢索次數數量的 比較而言,6 月均大於 7 月,與 TCI-HSS 資料庫本身所統計出的數據趨勢一致,因 此,雖因統計機制不同而造成差異,但二者統計六、七月份的使用,統計分析數據 均呈現一致的增減,可提供判斷統計上的信度。
圖1 TCI-HSS 資料庫網頁 105 年 6 月使用發展趨勢報表
圖2 TCI-HSS 資料庫網頁 105 年 7 月使用發展趨勢報表
由PIWIK 針對 TCI-HSS 資料庫網頁使用發展趨勢所產出的 6 月份與 7 月份報 表觀察,在近50 萬人次(6 月份)與近 40 萬人次(7 月份)的造訪者中,平均停
留時間均在2 分 30 秒以上,僅瀏覽一頁便離站者(跳出率)分別占 19%與 21%,
平均是20%。相對於僅瀏覽一頁便跳出離站之情形,此統計顯示有 5 分之 4 的造訪 並未一連入隨即離開,而且每位造訪者進入本資料庫系統之後均進行一定的查詢瀏 覽活動:6 月份與 7 月份平均活動數為 7.2 與 8.9 個查詢活動,總檢索次數分別約為 5 萬 1 千次與 4 萬次,而總瀏覽頁數則分別為 25.4 萬頁與 27.6 萬頁。另外,PIWIK 統計也提供「由單一次造訪所產生的最大活動數」之統計,6 月份與 7 月份分別是 1,738 次與 3,229 次。此程度的「活動數」與活動內容,均未被 TCI-HSS 資料庫針 對不當下載所設定的資料庫安全保護機制所阻擋,故可推知此應屬使用者檢索與下 載書目以供研究利用之類的正常使用,並非不當的大量擷取之行為。另外,值得一 提的是,各月份使用者檢索上的系統平均反應時間,即回應任何檢索與瀏覽的使用 者動作之時間(average generation time)均小於 1 秒,故 PIWIK 統計上呈現為 0 秒,顯示此資料庫系統在使用者端的利用上,能夠迅速回應任何使用者的檢索與點 閱瀏覽之需求。
(二)造訪者來自的國家
該網頁流量統計顯示,在此二個月中,造訪者來自105 個國家,臺灣的使用者 占66-70%,中國的使用者占 8%,加上香港的使用者占 3-4%,可知來自華語世界的 使用者合計大約占75%。而造訪所占百分比在 1%以上的國家,6 月份與 7 月份分別 有8 國與 12 國,分別占總造訪人次的 95%與 96%(圖 3)。TCI-HSS 資料庫的造 訪統計顯示,主要的使用者是臺灣與華語世界的使用者,此說明該資料庫確實符合 建置當時之理念,即提供在地化的人文社會科學領域期刊評比與引文檢索利用之資 料庫,以服務國人之需求。
圖 3 TCI-HSS 資料庫造訪者來自的國家
六、TCI-HSS 資料庫與學術評鑑相關的系統功能
本節首先檢視本TCI-HSS資料庫在期刊評比中的定位,其次探討其在各種學術 評鑑上的功能,以確認本資料庫在現階段是否已經足以達成支援提供客觀的評鑑依 據之任務。
(一) 在期刊評比中的定位
期刊評比在 2011 年「期刊評比新制」推動後,評鑑指標兼納入客觀的評鑑指 標與主觀的品質評鑑指標,而且品質評鑑指標權重為70%,客觀評鑑指標權重為 30%,
如圖4 所示。
圖4 2011 年期刊評鑑指標權重分配。資料來源:整合自吳淑真(2011)、
陳弱水(2011)相關文章之繪圖。
陳弱水(2011)、吳淑真(2011)先後撰寫期刊評比相關文章均闡述期刊評比 新制對於「引用指標」中的權重分配,其中「客觀評量指標」主要是透過TCI-HSS 資料庫統計各受評期刊被引用的情形(占總分的24%),稱為「引用指標」。該部 分基於研究生學位論文往往對新成果敏感,故於「引用指標」中,區分為「期刊論 文影響係數」(被期刊引用的情形,在所占的24%中,配予80%的比重)與「博士 論文影響係數」(即5年內被博士論文引用的情形,在所占的24%中,配予20%的比 重);凸顯正視本土的、以華文為主要語文的學術期刊重要理念(陳弱水,2011)。
105年科技部再度調整評鑑指標的權重,科技部人文社會科學研究中心提供的
「期刊評比收錄新制簡介」顯示,客觀指標從30%降為20%,如表6。由TCI-HSS資 料庫支援進行的「引用指標」,在期刊評比中所占的權重,隨之從過去的24%降低 為15%。此調整顯示質化的審查更被重視,而且專家評審也更具重要性。
表6
期刊評比新舊制度比較
資料來源:科技部人文社會科學研究中心
(二)與學術評鑑相關的系統功能
引文索引資料庫的建置目的,除了可提供資訊檢索與學術研究之用,也可以產 出被引用次數、影響係數、引用和被引用的半衰期、以及立即引用率等。此等書目 計量之數據,可以提供瞭解學科領域的發展現況、學科領域內的文獻使用特性、研 究者著作之間的關聯性、以及各學科領域的研究發展趨勢等(曾淑賢、鄭秀梅、羅 金梅,2013),而作為學術評鑑中的客觀評鑑指標之依據。
有關TCI-HSS 資料庫在資訊檢索方面的功能,可以詳見「臺灣連結世界‧世界 認識臺灣:『臺灣人文及社會科學引文索引資料庫』建置經驗」(曾淑賢、鄭秀梅、
羅金梅,2013)與「建立臺灣人文及社會科學領域之引文索引資料庫」(曾淑賢、
鄭秀梅,2013)等文,本文不再贅述。在此僅針對本資料庫與評鑑相關的功能,以 實例說明之。該等與評鑑相關的功能,雖然早在此資料庫建置之初即已規劃,但隨 著納入的資料類型增加(增加收錄博士論文與專書、專書論文),以及資料量的逐 步增加,包括為新刊資料建檔、以及為舊的期刊卷期回溯建置參考引文資料,現在
的TCI-HSS 資料庫所能展現的文獻引用情形,已較過去更能顯示引用上豐富而具有 意義的諸多現象。
1.
有關期刊的評鑑(1)影響係數指標
此引文資料庫最重要的評鑑功能是支援期刊評鑑,而期刊評鑑主要的 參考指標之一是「影響係數」(Impact Factor)。「影響係數」的計算主 要是根據一個期刊在某期間(例如 5 年為期)的刊載總篇數與被引用總次 數計算而得。TCI-HSS 資料庫在功能方面,已經達成可提供臺灣人文與社 會科學各學門的各種期刊之「影響係數」,但因為不同學科對於必要參考 的文獻之需要不同,造成所撰寫的學術論文之引用習慣不同。以政治學門 與語言學門的 103 年之統計的比較為例,政治學門被引用數排名第一名的
「選舉研究」至103 年累計被引用次數為 159 次,99 年至 103 年總刊登篇 數為47 篇,平均每篇被引用 3.382 次,其 103 年的「影響係數」為 0.653
(圖5)。語言學門被引用數排名第一名的「語言暨語言學」至 103 年累計 被引用次數為69 次,99 年至 103 年總刊登篇數為 152 篇,平均每篇被引 用0.453 次,其 103 年的「影響係數」為 0.108(圖 6)。同為學門中被引 用次數最高的期刊,政治學門與語言學門之間,每篇期刊平均被引用次數 與期刊本身的「影響係數」,政治學門均高於語言學門,而且差異顯著;
顯見不同學門的期刊,國內期刊被引用的機率,差異性極大,而使統計上 的「影響係數」差異也極大。但是,就一些學門如語言學門以及文學學門 中的外語學科而言,不論是英語系國家或非英語系國家,研究者撰寫研究 文章時,主要的引用資料來源可能都是西文資料,故在英語系的國家,一 種期刊依據其特定期間之內的總篇數與總被引用數計算出「影響係數」而 依該數據判斷期刊的「影響力」是合宜的;但以臺灣非英語系國家的語言 學期刊而言,依同樣公式計算所得的影響係數必然偏低,卻不代表期刊的
「影響力」與重要性低。故應依學科領域之不同,進行不同的評比設計,
而不宜一概以「影響係數」為評比論斷期刊的「影響力」之依據。
圖5 政治學門期刊 103 年總被引用數排名、「影響係數」、與總篇數
圖6 語言學門期刊 103 年總被引用數排名、「影響係數」、與總篇數
(2)被引用數指標
本TCI-HSS 資料庫與期刊評鑑相關的另一功能是依照期刊被不同類型 資料引用數排序,如圖7 所示,本資料庫「使用統計」提供有關期刊的「被 引用數」之統計,此期刊被引用數統計可以選擇 2009 至-2015 年之間的任 一年度、或者 5 年歷年來的全部統計。研究者並可以點選學門而篩選出特 定學門的所有期刊。該資料庫系統經點選年份與學門後,首先依期刊刊名 順序排序,使用者可點選依期刊/學位論文/專書/專書論文,進行不同 的排序。
圖7 是 105 年 8 月 6 日以所有學門的 2009 至 2015 年的總統計表進行 排序的結果;各類引用排名順序如下:2009 至 2015 年歷年來最常被期刊
歷年被引用數累計
歷年被引用數累計
引用的期刊是《社區發展》,最常被學位論文引用的期刊是《教育研究月 刊》,最常被專書與專書論文引用的期刊均為《中央研究院歷史語言研究 所集刊》。然純以被引用數進行排名或影響力的比較,也正如同利用「影 響係數」一般,不同領域可能因為學科內涵特質之故,研究者慣常引用的 取向有相當大的差異性,故使用的同時,有必要思考對每一個別學科的適 用性。
圖7 期刊被各類文獻引用統計
2.
有關專書的評鑑如圖8 所示,TCI-HSS 資料庫至 105 年 8 月 6 日為止,一共收錄專書 6,053 冊8,而透過引文建檔鍵入的專書引用文獻共計139 萬 2,555 筆(表 4),如圖 8 所示,該龐大的專書被引用的總數量,分散於期刊、學位論文、專書、以及 專書論文引用(該等資料類型是現在 TCI-HSS 資料庫收錄與建置引文的「來 源文獻」)。本系統對於專書,可選擇產出2009 至 2015 年間單一年份的專書 被各類文獻引用的統計表,也可以產出歷年5 年以來被各類型資料的總引用數。
惟至105 年 8 月為止,本系統尚未提供依學門篩選出同領域的所有專書之功能,
因此,如要評比某些特定專書的被引用情形,需要透過下載該統計表之後,進 行不同的排序,並以人工搜尋出欲進行評比與評鑑的專書,如圖 9 至圖 12。
不同的排序顯示,過去5 年間被引用最多的是《教育研究法》,被不同類型文 獻引用的總次數為933 次。被期刊引用最多的是《行政法之理論與實用》,其 總被引用數為689 次,在總被引用數的排名為第 4。而總被引用數排名第 1 的
《教育研究法》,其被學位論文引用數也排名第1。另外,被專書引用最多的 專書為《中國藝術精神》,總次數為72 次。被專書論文引用最多的專書為《語 言,社會與族群意識 : 臺灣語言社會學的研究》,總次數為 42 次。整體而言,
因為專書的產出本來就需要長時間的專注研撰,才可能結構完整、充分且深入 地表述概念、思想、以及研究創見,故專書的總產出少於單篇的期刊論文,能 被專書引用,甚為可貴,因此,被專書引用的價值權重,或更甚於被期刊文獻 引用;值得人文與社會科學領域進行學術生產力評比與學術競爭力評鑑機制之 設計的學者加以思考。
8 在 TCI-HSS 資料庫中,直接於網頁上利用「使用統計」而進行「專書/被引用數」的統計報 表產出,得到被期刊、學位論文、專書、專書論文的任何一種形式之著作引用過的專書總數,
至105 年 8 月 12 日止計 5,248 種。與 105 年 8 月 6 日自資料庫管理者端下載之專書總冊數 6,053 冊(表3)有 805 冊之差異,該差異應是因為國家圖書館接受科技部人文司之建議書單,陸續 將新收到建議書單的專書納入此資料庫中,然有的專書較新,尚未獲得引用,故在專書被引用 統計表中,因尚無被引用數而未出現於使用者端的統計表中。
圖9 被期刊引用最多的專書 圖 10 被學位論文引用最多的專書 圖8 專書被各類文獻引用統計表
圖11 被專書引用最多的專書 圖 12 被專書論文引用最多的專書
(三)與大學評鑑之關係
大學研究力的評比,也是評鑑中重要的一環。TCI-HSS 資料庫提供有關大學研 究力評比的參考依據之一,即學位論文被各類著作的引用數統計。該資料庫「使用 統計」項目下,提供2009 至 2015 年期間的單一年度與該期間的整體統計,在「學 位論文」項目下的「被引用數」點選「學校」,系統首先即依校名筆劃順序列表,
使用者可選擇將所有大學整體排序,或點選「公立、私立」與「技專、綜合型大學」
分別統計,再選擇所要統計的年份之後,即可開始點選不同的資料類型,進行學位 論文被不同類型著作引用數之排序。圖13 是將所有學校全部表列,並選擇「歷年」
之後的統計排序,顯示各大學的學位論文中,歷年來學位論文最常被期刊論文引用 的是國立政治大學,學位論文最常被學位論文引用的是國立成功大學,學位論文最 常被專書引用的是國立政治大學,學位論文最常被專書論文引用的是國立臺灣師範 大學。國立政治大學的學位論文在被期刊論文、專書等二種類型的著作引用數均居 冠,顯示其在人文與社會科學領域有一定的學術影響力。
圖13 學位論文被各類著作的引用數統計
(四)有關研究者個人的評鑑
要進行有關個人研究力與影響力之評比,需要能夠確實掌握著作的作者。
TCI-HSS 資料庫提供的統計排序資料中,學位論文、專書、專書論文均能於經過進 一步的作者查詢後,確認作者。但如果要確認個人的特定著作在整體中的排名,需 點選「學位論文」類別之下的「被引用數」項下的「論文名稱」,或「專書」/「專 書論文」之下的「被引用數」,然後進行「下載資料」(如圖14),將完整資料下 載為Excel 資料表之後,先進行如前述圖 9 至圖 12 依不同的資料類型排序,然後以 搜尋功能搜尋特定著作,即可看出該著作在被引用數方面的排名。
圖14 可提供評鑑個人的資料類型
七、整合資料庫與擴增引文資料範圍之效益分析
國家圖書館依據「圖書館法」規定,為國內出版品之法定送存圖書館;為完整 保存國家圖書之獻,而積極徵集,故典藏較其他圖書館機構完整的圖書、期刊等各 類出版品文獻9,,因此得以根據館藏,建置「臺灣期刊論文索引系統」以及「臺灣 博碩士論文知識加值系統」。如前所述,科技部前身的國科會基於資料整合以提升 效益之考量,邀請國家圖書館負責進行資源整合與TCI-HSS資料庫之建置。整合「臺 灣期刊論文索引系統」與「臺灣博碩士論文知識加值系統」於TCI-HSS資料庫的效 益如下。
(一)提升新刊資料查詢服務的即時性
在將TSSCI 與 THCI 等資料庫整合為 TCI-HSS 資料庫之前,TSSCI 在應用上,
因為查核程序繁複,且資料庫並非以使用者需求為主要考量,故資料的公開,往往 落後二、三年,學界同仁甚感不便(陳東升,2013)。此一情況,在 TCI-HSS 資
9 國家圖書館納入出版者送存之出版品,唯因為時有出版者遺漏送存之情形,且期刊類資料時常 發生更改出版頻率、脫刊等情形,本館相關業務部門雖努力催繳,但仍難達到完整俱足之典 藏;故在此呼籲學術機構與各界出版者主動送存,以裨益國家學術文化資產之保存流傳。
料庫系統建置完成後,即有明顯的改善,因為該資料庫透過結合「臺灣期刊論文索 引」,即隨著期刊的收刊,儘快將新收的期刊文獻篇目鍵入「臺灣期刊論文索引」
中,再以該「臺灣期刊論文索引」資料庫支援TCI-HSS 資料庫,使新刊資料之收錄 與公開的即時性,有大幅的改善。
(二)提高引文建檔的資料正確性
不論是期刊文獻、學位論文、專書、專書論文、甚或是研討會論文等各類型著 作,可能因為不同學科領域引用書目格式不同、包含腳註的敘述文字間而附加來源 說明、或因為作者對於揭載參考文獻的嚴謹度不一,造成同一筆資料為不同作者引 用時,引用文獻的格式與資訊有所差異。
一般人對於TCI 資料庫整合過程的理解是,其基礎來源主要是來自於 TSSCI、
THCI、THCI Core 等,但其同時匯入當時「臺灣期刊論文索引系統」與「臺灣博 碩士論文知識加值系統」之文獻資料至「中繼資料儲存區」,並且不斷即時納入新 增資料,以備支援引文建檔過程中,作為提供在建檔者經關鍵欄位比對而查獲所將 建置為引文資料的同一筆期刊文獻/學位論文資料時,可以直接採用來自「臺灣期 刊論文索引」以及「臺灣博碩士論文知識加值系統」,相當於是當筆文獻的「權威 書目紀錄」,此有助於提高引文建檔的資料正確性。唯建置引文資料時,因為引文 資料的資料類型多元,包含期刊文獻、學位論文、專書、專書論文、會議論文、報 告、政府資訊、網路資源等,未必能自TCI-HSS 資料庫中的支援用之「中繼資料儲 存區」查得,故建檔者仍必須根據實際館藏進行建檔工作。且國家圖書館基於資料 正確性的考量,嚴謹督責建檔作業過程必須根據實際資料進行校對,以確保資料的 正確性。
(三)「查重」、「整併」提高資料庫內資料的精簡度
正規的學術研究著作,大多會引用其他作者之先行研究。而同一著作,如果被 後來的多位作者共同引用,則引文資料庫之內,即不斷出現同一筆文獻的重複建檔。
此種重複建檔,如前所述,可能同一筆資料,因不同引用者著錄的詳簡不一、或各 有所疏漏,以至於造成書目的不一致性。本資料庫設計「查重」與「整併」的功能,
在新增一筆資料時,即進行「查重」,匯集所有應是同一筆資料的多筆書目資料,
包括自「來源文獻」搜尋所得的相當於是「權威資料」的原始書目、以及「引文」
中的各筆先後建置之書目資料,經判斷之後,遴選最完整正確的一筆,進行套用。
而其他各筆不完整之資料,則透過「整併」的系統功能,選正確完整者留存,而消 除其餘不完整之書目資料(Chiang, 2014; Tseng, Chiu & Chiang, 2015)。如此,可 以達到去蕪存菁的效果,提高資料庫內資料的精簡度。
(四)確保支援期刊評鑑的有效性
因為在TCI-HSS 資料庫中,被引用數的計量分析統計乃是透過程式進行機械化 的比對,同一筆文獻在不同的著作中被引用時,各作者著錄的正確性與完整度往往 有所差異,但重要的是引文建檔上必須使之一致化,機械化的比對才不至於遺漏未 計數。因為利用「中繼資料儲存區」的期刊文獻與學位論文書目資料於引文建檔中,
可確保引文建檔的正確性與完整度,最顯見的效益即確保系統進行被引數量的統計 時,可確實比對到每一筆被引用的資料,而可提供較正確的引用、共同引用的統計 數字,從而確保本TCI-HSS 資料庫支援期刊評鑑的有效性。
(五)及早產出比較完整的專書、期刊文獻、學位論文等各類文獻被學位論文引用 之統計數據
本TCI-HSS資料庫對於學位論文的引文建檔,雖然僅就人文及社會科學領域的 博士論文進行引文建檔,但是,匯入本資料庫的學位論文則不限博士論文,是悉數 予以匯入。因此,在針對「來源文獻」進行比對其被引用數時,資料庫程式除了比 對已經建檔完成的結構化引文資料之外,也利用匯入的各篇學位論文的「參考文獻
」文字檔一節,透過作者與篇名關鍵詞的交集比對,而得以及早產出比較完整的被 學位論文引用之統計;而高度裨益統計專書、專書論文、博士論文與期刊文獻等被 學位論文引用的即時性與完整度。
八、結論與建議
本TCI-HSS資料庫是臺灣人文社會科學領域的學者,基於打造可充分呈現臺灣 人文社會科學領域學者的研究力、適宜作為臺灣學者與各類學術評鑑依據的資料庫 之理念,集合多位學者的智慧,共商共議而整合既有分散的小規模引文資料庫而創 始建置。自規劃彙整、至擴增建置引文來源資料之類型,發展歷程中均定期召開諮 詢委員會,以針對發展上的重要議題,討論研訂妥善的策略。由本文的介紹可知,
本資料庫的內容數量已逾四百餘萬筆;資料量的增加,對於學術資源的查詢、評鑑
面向與評鑑指標項目的規劃、以及評鑑參考統計數據的效度,均有正面的效益,歸 納如下。
(一)TCI-HSS 資料庫整合與擴增建檔的效益 1. 支援期刊評比得以轉型加入多元配分權重
本TCI-HSS 資料庫在期刊評鑑中,作為輔助評鑑的「引用指標」配分從 24%調整為 15%(前述表 6);在期刊評比的定位中,由前述各種統計分析排 序功能評估,可知本資料庫確可提供客觀計量的評鑑參考,而一定程度地達成 輔助客觀評量評鑑之功能任務。在 100 年規劃「期刊評比新制」時,將期刊 被期刊引用、以及期刊被學位論文引用,分別配予80%、20%的權重,但尚未 加入被專書與專書論文引用的配分權重。人文與社會科學領域的專書與專書論 文,透過本TCI-HSS 資料庫內容的持續建檔擴增,以及 TCI-HSS 資料庫設計 上,於期刊被引用的統計表中,揭載被期刊、學位論文、專書、以及專書論文 等不同類的著作引用的次數(圖7);專書與專書論文在人文與社會學領域中 的研究參考價值,已經充分明確地被彰顯。因此,未來在期刊評比的引文客觀 指標中,建議可以正式加入期刊被專書與專書論文引用情形的配分權重。
2. 可作為多種評鑑的依據
本TCI-HSS 資料庫之整合與持續建檔,原始目的是作為期刊評比之依據,
但實際上如本文前述有關期刊評鑑、專書評鑑、大學評鑑、研究者個人的評鑑 等之介紹,本資料庫實際上可輔助的評鑑,遠多於原本設定的期刊評比一項,
而且多種被引用之統計表,提供下載利用,政府機構與研究者可以利用此系統 的多種統計表,進行創新應用與新的研究,例如,自所查得的書目所顯示的「被 引用次數」,可以點入參閱是哪些文獻曾引用該著作。而點入後的介面,提供 該等文獻的年代分布,由此可以了解該特定著作自發表之後的被引用高峰期,
如圖15。
圖 15 TCI-HSS 資料庫提供被引用高峰期的分析統計
理論上,無論是一位研究者之著作、一種期刊、或是一種專書,其被不同類 型的文獻,例如被學位論文、專書、專書論文、或期刊文獻等引用之情形,評比 上亦可分別配予不同的權重;因為TCI-HSS 資料庫在技術面上已能提供被不同類 型文獻引用之次數,故可支援此種更細緻的客觀評分。但是,因為本資料庫以專 書與博士論文作為「來源文獻」的引文建檔數量遠少於期刊,且人文與社會科學 類文獻的被引用高峰期往往是在出版的幾年之後,故對於近期內新出版著作的學 者或研究者之評鑑,如要憑藉本資料庫提供的專書被引用數據,理論上本資料庫 所提供之被引用數,未必能十分反映出著作的品質與影響力。有鑒於 TCI-HSS 資料庫的此一反映著作實際品質與影響力之時效性與功能上的侷限,不論是針對 期刊或研究者之評比與評鑑,需要在主觀的品質評量指標方面配予更高的權重,
實為合理之規劃。換言之,著作文獻要透過本資料庫而發揮影響力,或者透過本 資料庫而呈現出實質上的品質與影響力,需要有一段醞釀時間,故短時間之內的 評比,需要以其他指標輔助;亦即不可以忽視同儕專家評審的重要意義與效度。
3. 裨益學術傳播
資料庫的價值,充分反映在被使用的情形;高造訪人次,顯示資料庫能夠 吸引使用者,具有研究利用之價值。從本文介紹的使用情形之相關統計可知,
TCI-HSS 資料庫是高度被使用的資料庫。因為引文索引資料庫也是研究資源 檢索的主要資料庫;納入此資料庫中的文獻,均可能因為使用者以文章關鍵詞、
題名關鍵詞、以及作者姓名等之查詢而被查得,從而提高期刊、學位論文、專 書與專書論文等各類文獻的被查獲率。加上TCI-HSS 資料庫可以自文獻書目 關聯至原本的文獻類型所屬資料庫,包括「臺灣期刊論文索引系統」、「臺灣 博碩士論文知識加值系統」等提供免費使用已獲授權的文獻之資料庫平台,此 等平台的開放性與便利性等,將高度促進資料的利用率,使國家過去與現在長 期持續投注經費完成的資料庫系統,因被充分利用而發揮其真正的價值;自 TCI-HSS 資料庫為起始,導引使用者探索利用關聯的其他重要學術研究資源 的資料庫系統,亦即本資料庫可以發揮作為入口平台之重要功能,這是本資料 庫系統對學術傳播的重要貢獻。
(二)建議
本資料庫自101 年整併 TSSCI 與 THCI 資料庫以來,致力於增加資料庫內容建 檔、擴充系統功能、提升引文品質、以及提升對學術社群的服務等。101 至 104 年 已經完成第一個為期4 年的中程計畫,105 年起進行第二個 4 年期計畫的第一年計 畫。茲從執行面的實務經驗與保存暨推廣學術智慧資產的立場,提出建議如下。
1. 形式指標應包含參考文獻的格式
不同的學門,對於參考文獻的引文格式要求不一,有的學門要求所有曾引 用的文獻,必須於文末以專章列載,並且必須採用特定的書目資料格式。但是,
有的學門則未必進行嚴格的規定,以至於有的文獻資料僅有頁尾腳註,而無文 末的參考文獻專章。在此情形下,引文資料的建檔十分困難,建檔者必須自說 明文字的字裡行間,尋找出引用文獻的資訊,為之建檔。但以腳註揭載引用資 料,其書目資料內容往往不夠齊全,造成建檔上的困難,且資訊不足的情形,
將間接影響未來引用文獻的統計。因此,建議學門召集人領導學門所屬期刊的 參考文獻格式統一化,規範於文末必須以「參考文獻」專章,清楚列記所引用 之所有文獻資料,以收一目瞭然之效,並可裨益引文建檔。
2. 鼓勵作者與出版社授權
學位論文的重要特點是研究題目必須具有尚未有前人研究之獨特性,或者 前人所未及的新突破創新,因此學位論文在知性的學術研創中,具有相當的重 要性。但過去在期刊評比制度化的設計規劃中,被學位論文引用相對於被期刊 論文引用占80%的權重,僅占 20%,而被專書引用則尚未被作權重配分(圖 4),
此現象可能是因為過去不易掌握被學位論文與專書引用的統計數據所致。但自 101 年彙整 TSSCI、THCI 資料庫後,至作者撰寫本文的 105 年為止,引文建 檔量的累積,如本文的統計分析,實際上專書在人文社會科學類的研究文獻中,
被引用情形不遜於期刊文獻。數位全文的流通,勢必影響引用與被引用的情形,
有助於個人、機構、以及特定出版品的學術影響力與能見度之提升。因此,建 議並鼓勵個人作者與出版機構授權公開分享研究著作成果,以使著作得以受到 保存流傳之保障,成為可供眾近用的國家智慧財之一部分;既可促進知識的流 通傳播,也可裨益學術評鑑的有效性。
3. 專書遴選參考利用本資料庫的統計
本資料庫規劃每年度新增專書與專書論文的書目資料及引文建檔,專書的 遴選,主要是由科技部委由各學門召集人率領域專家擬定建議清單。因為本 TCI-HSS 資料庫的引文建檔,不論是針對期刊文獻、學位論文、專書、或專 書論文的引文建檔,都涵蓋專書的參考文獻;透過此廣範圍的引文建檔,至 105 年 8 月 12 日為止,可知已有 5,248 種專書曾被本資料庫已建檔之資料引用
(前述註8),而且專書被引用數可以依學門篩選,也可以依被不同類別的文 獻引用數排序,具有一定的專書品質與學術影響力之判斷參考價值,故未來科 技部人文司提供各學門的建議收錄專書清單、或各學門遴選建議納入本資料庫 優先建檔之清單時,建議參考本資料庫之統計分析表,以免有遺珠之憾。
4. 有關學位論文與專書在學術傳播上的影響力值得持續觀察研究
研究者引用文獻,可能引用的文獻多元,不同學門,最常被引用的文獻類 別亦有差異。由本文實際測試 TCI-HSS 資料庫的評鑑相關統計,發現專書與 專書論文被引用的合計,已經多於期刊論文。未來持續建檔增加資料量,值得 持續觀察研究學位論文與專書被引用的情形,以進一步確認其在學術傳播上的 影響力;此可作為科技部未來調整「客觀評量指標」的評量項目權重配分之參 考。