• 沒有找到結果。

圖書館期刊使用統計之系統設計與實作:以博碩士論文之參考文獻為例

N/A
N/A
Protected

Academic year: 2021

Share "圖書館期刊使用統計之系統設計與實作:以博碩士論文之參考文獻為例"

Copied!
98
0
0

加載中.... (立即查看全文)

全文

(1)

資訊學院 數位圖書資訊學程

圖書館期刊使用統計之系統設計與實作:

以博碩士論文之參考文獻為例

Design and Implementation for Statistical Citation

Analysis of Journal Papers: A Study of References

of Dissertations and Theses

研 究 生:王冬祥

指導教授:黃明居 教授

(2)

圖書館期刊使用統計之系統設計與實作:

以博碩士論文之參考文獻為例

Design and Implementation for Statistical Citation Analysis of

Journal Papers: A Study of References of Dissertations and Theses

研 究 生:王冬祥 Student:Tung-hsiang Wang

指導教授:黃明居 Advisor:Ming-jiu Hwang

國 立 交 通 大 學

資訊學院 數位圖書資訊學程

碩 士 論 文

A Thesis

Submitted to College of Computer Science

National Chiao Tung University

in partial Fulfillment of the Requirements

for the Degree of Master of Science

in

Digital Library

January 2011

Hsinchu, Taiwan, Republic of China

(3)

ii

圖書館期刊使用統計之系統設計與實作:

以博碩士論文之參考文獻為例

學生:王冬祥

指導教授

黃明居博士

國 立 交 通 大 學 資 訊 學 院 數 位 圖 書 資 訊 學 程 碩 士 班

探討期刊資源被使用的情況,一直以來都是圖書資訊學領域的一項重要研究, 圖書館也利用各種方式想瞭解期刊資源的使用情況。針對校內的研究產出,利用 論文的參考文獻來進行統計分析,是一種以使用者為導向,反應實際研究及使用 需求有效的方法。但進行相關的分析研究必須仰賴大量的人工方式,蒐集、整理、 過濾出相關的資訊,是此類研究中很大的負擔。 本研究以參考文獻計量為基礎,設計建置一套期刊使用統計系統(System for

Citation Analysis of Journal Papers,SCAJ)。系統區分為六大模組:系統模組、刊 名資料庫模組、引文模組、統計期刊清單模組、共享模組、以及統計作業模組。 使用者可將參考文獻資料匯入,以進行分析作業,系統即可產出文獻類型,以及 西文期刊的引用次數統計結果。此外,使用者亦可匯入期刊清單,與參考文獻統 計結果進行進一步的統計,利用自訂的權重進行統計,最後產出可供參考的統計 數據,協助圖書館做為評估期刊使用情況的參考。 SCAJ 可廣泛應用於參考文獻資料的統計工作,協助解決參考文獻著錄凌亂 問題,並減少人工作業時間。用於圖書館的期刊資源使用狀況時,可利用使用者 的論文產出,統計論文的期刊引用,回推圖書館期刊資源的使用狀況,協助研究 圖書館期刊使用率的問題。 關鍵詞:期刊使用統計系統、文獻計量、期刊使用率

(4)

Design and Implementation for Statistical Citation

Analysis of Journal Papers: A Study of References

of Dissertations and Theses

Student:Tung-hsiang Wang Advisors:Dr. Ming-jiu Hwang

Degree Program of Computer Science

National Chiao Tung University

ABSTRACT

The analysis of journal usage has always been an important research topic in Library and Information Science. Various methods have been used by the libraries to understand the usage of journal papers. Citation analysis of references of research publications is a user-oriented method which may efficiently show the actual demand of journal resource. However, it used to require a lot of time and effort to collect, organize, and analyze the information, which resulted in a heavy burden on this kind of research.

Based on the metrological analysis of the references of dissertations and theses, a System of Citation Analysis of Journal Papers (SCAJ) is proposed. The system is divided into 6 modules: system module, module of journal titles, citation module, module of statistic inventories of journals, partaking module, and statistic module. Through SCAJ, users can get the information about the categories of literatures and citation times of English journal papers. Furthermore, users can enter journal lists and self-set weighting index to do extending citation analysis. The final outcome is statistics that are worth referring to and can be used to evaluate the usage of journals by the libraries.

SCAJ solves the problem caused by confusing and disordered references and reduces the cost of labor and time. The utility rate and citation frequency of journal papers and can be precisely estimated by using SCAJ to analyze the references of dissertations and these.

Key Word:System for Citation Analysis of Journal papers (SCAJ), Bibliometrics, Utility rate of Journal papers

(5)

iv

終於完成論文了,在進研究所的這些日子以來,總是工作、學業蠟燭二頭燒, 但總算完成學業了,當學生的日子也告一段落。 論文能順利完成,首先要感謝我的指導教授 黃明居老師,感謝您在這段時 間的悉心指導,以及包容我有時候因為工作而無法將心力用在學業上,讓我在論 文研究的過程中,學習到該領域相關的知識,最重要的是整個研究過程中的自我 挑戰。還有口試時柯皓仁教授及張東淼教授的指導及寶貴意見,讓我的論文能更 完善。 感謝對一路走來幫助以及關心過我的人,心裡真的懷著無限的感激。最後感 謝我最重要的家人,我的父母親,以及在求學的這段時間跟我一起步入紅毯的老 婆詩婉,感謝你們一直在背後支持我、鼓勵我,謝謝。

(6)

目 錄

第一章 緒論... 1 1.1 研究背景及動機... 1 1.2 研究目的... 2 1.3 研究範圍與限制... 3 1.4 研究流程... 4 第二章 文獻回顧... 5 2.1 期刊使用分析... 5 2.1.1 期刊分析方式... 6 2.1.2 期刊分析系統... 9 2.2 學術論文引文格式... 13 2.3 相關資訊技術... 15 2.3.1 近似字串比對... 15 2.3.2 Web 服務 ... 15 2.3.3 ASP.NET ... 17 第三章 系統分析與設計... 19 3.1 系統需求分析... 19 3.2 設計概念... 22 3.3 系統設計... 23 3.3.1 系統實體架構... 24 3.3.2 系統作業流程... 26 3.3.3 系統模組及功能... 34 3.3.4 參考文獻分析功能... 38 3.3.5 WOS Web 服務 ... 43 第四章 系統實作與展示... 49 4.1 系統環境建置... 49 4.2 系統展示與功能介紹... 51 4.2.1 系統模組... 51 4.2.2 刊名資料庫模組... 52 4.2.3 引文模組... 55 4.2.4 統計期刊清單模組... 61 4.2.5 共享模組... 63 4.2.6 統計作業模組... 63 第五章 系統評估... 72 5.1 需求完成度評估... 72 5.2 資料分析評估... 73 5.2.1 系統評估資料... 73

(7)

vi 5.2.2 西文期刊分析評估... 74 5.2.3 WOS 分析評估 ... 80 第六章 結論與建議... 83 6.1 研究結論... 83 6.2 研究建議... 84 6.2.1 研究結果建議... 84 6.2.2 未來研究建議... 85 參考書目... 86

(8)

表目錄

表目錄

表目錄

表目錄

表 3-1 系統模組使用權限 ... 37

表 3-2 WOS Web 服務 searchRetrieve 參數說明 ... 45

表 3-3 WOS Web 服務回傳 XML 內容 ... 46 表 4-1 上傳引文資料儲存比較 ... 55 表 5-1 需求完成度評估 ... 72 表 5-2 系統評估資料 ... 74 表 5-3 西文期刊分析正確率 ... 75 表 5-4 西文期刊分析比率 ... 77 表 5-5 西文期刊未成功分析的分佈 ... 79 表 5-6 系統利用 WOS 分析期刊的評估 ... 81

(9)

viii

圖目錄

圖目錄

圖目錄

圖目錄

圖 1-1 研究流程 ... 4 圖 2-1 研究文獻關係 ... 5 圖 2-2 Web Services 架構 ... 17 圖 3-1 系統需求面向 ... 19 圖 3-2 系統設計概念 ... 23 圖 3-3 系統架構 ... 24 圖 3-4 系統實體架構 ... 25 圖 3-5 系統作業流程 ... 26 圖 3-6 刊名資料庫作業示意 ... 27 圖 3-7 刊名資料庫作業流程 ... 28 圖 3-8 引文資料作業流程 ... 29 圖 3-9 引文資料校正作業流程 ... 30 圖 3-10 期刊清單作業流程 ... 31 圖 3-11 排名比較統計作業流程 ... 33 圖 3-12 系統模組 ... 35 圖 3-13 系統功能 ... 36 圖 3-14 參考文獻分析處理流程 ... 42

圖 3-15 存取 WOS Web Service 網路架構 ... 44

圖 4-1 系統環境建置架構 ... 50 圖 4-2 系統權限管理 ... 51 圖 4-3 刊名清單上傳功能 ... 52 圖 4-4 刊名資料庫管理功能 ... 53 圖 4-5 新增刊名驗證功能 ... 54 圖 4-6 引文資料上傳功能 ... 58 圖 4-7 引文資料校正 ... 59 圖 4-8 引文資料校正作業 ... 60 圖 4-9 統計期刊清單功能 ... 62 圖 4-10 共享模組功能 ... 63 圖 4-11 引文統計報表選擇 ... 64 圖 4-12 引用次數統計結果 ... 65 圖 4-13 分類統計結果 ... 66 圖 4-14 合併統計選擇 ... 67 圖 4-15 合併統計共享資料選擇 ... 68 圖 4-16 合併統計報表結果 ... 69 圖 4-17 排名比較功能 ... 70 圖 4-18 排名比較結果 ... 71

(10)

圖 5-1 西文期刊分析比率 ... 78

圖 5-2 西文期刊未成功分析的類型比率 ... 80

圖 5-3 WOS 刊名程序比對結果 ... 82

(11)

1

1

第一章

第一章 緒論

第一章

第一章

緒論

緒論

緒論

本研究期能利用資訊技術,設計出一套期刊使用統計系統(System for

Citation Analysis of Journal Papers, SCAJ),以幫助研究人員以及圖書館在論文的 參考文獻計量作業時能減少人工作業,以較節省人力、時間的方式進行相關統計 及應用。本章就以研究的動機及背景、目的、以及流程,分述如下。

1.1 研究

研究

研究背景及

研究

背景及

背景及動機

背景及

動機

動機

動機

圖書館購置之學術期刊在各類學術資源中,常是研究時的重要參考來源,它 提供了最新的研究發展、研究成果及未來發展等等的新知、新理論,讓學者在研 究時借鑒參考文獻來獲取新知,對所研究加以印證,並從中啟發靈感,產生新的 理論,也是學者在發表研究成果及學術表現的重要平台,由此可知,期刊在學術 領域的重要程度。然而圖書館在資料的採購經費,期刊占了相當大的比例,以美 國大學圖書館為例,每年採購資料預算的 30%至 45%用於購買期刊,有些學術 性的專門圖書館之期刊費,甚至高達 80%至 90%。由於價格昂貴,佔用了圖書 館書刊經費的極大比例,圖書館在決定購買與否時通常需要了解其使用狀況,並 考量其成本效益,以便把經費用在購置讀者最需要、最常用的資料上,使有限的 資源能得到最有效的運用(詹麗萍,民 95)。 探討期刊資源被使用的情況,一直以來都是圖書資訊學領域的一項重要研究。 研究的結果除了可以讓圖書館做為删訂期刊以及管理期刊的參考依據,還可以讓 學生、教師以及研究人員做為研究以及投稿時的參考。然而,期刊也並非一成不 變,學術的研究會隨著時間改變,產生新的研究重點、新的研究領域,甚至一門 新興的學科,連帶影響期刊的停刊、創刊、合併、分輯、改名等現象不時出現, 同時期刊在出版的質量與水準也會隨時產生變化,所以,圖書館研究期刊資源的 使用,是必須不斷持續下去,才能因應期刊的變化。

(12)

就大學圖書館而言,研究期刊使用的方法不外乎為問卷調查、使用調查等使 用分析方法。期刊使用分析雖然可以反映期刊使用情形,但是其中多數方法多半 容易受到圖書館管理方式、調查過程使用者的配合度、調查時間的長短及時間點 等因素的影響,使得分析結果不易分析與解釋,反而容易失去公正性與可靠性。 意見調查法的優點在調查問題可以不只侷限於目前既有的館藏,並可得知讀者的 直接回饋。但是此法必需配合設計相當完善的問卷內容,而且只能調查出受訪者 的期望和意見,及其所能想起之問題,造成統計結論與真實情況可能因此有所差 距 (石美玉,民 92)。 然而,針對校內的研究產出,例如教師的研究論文及博碩士學位論文等,利 用論文的參考文獻來進行統計分析,是一種以使用者為導向,反映實際研究及使 用需求有效的方法。雖然目前國內各大學圖書館大都已建置機構典藏系統或者是 博碩士論文數位典藏系統,但在論文的參考文獻部份,仍僅止於將論文的所有參 考文獻資料當成一筆文字資料,存在一個資料庫欄位內,也就是對系統來說,參 考文獻就是一筆字串,並無任何的統計價值,加上部份的作者並未依規定或常見 的學術論文引文格式進行著錄,造成參考文獻的資料極為凌亂。雖然圖書館擁有 典藏系統的參考文獻資料,但要利用它來進行相關的分析研究卻困難重重,無法 利用電腦處理凌亂的著錄格式,必須仰賴大量的人工方式,蒐集、整理、過濾出 相關的資訊,是此類研究中很大的負擔,要透過館員或研究人員持續的建立及更 新研究更屬不易。因此,如何設計與開發一個實用性高的系統,輔助館員或研究 者瞭解圖書館期刊使用之情形,並解決上述問題,為本研究最重要的動機。

1.2 研究

研究

研究目的

研究

目的

目的

目的

基於上節研究背景及動機的探討,本研究將利用參考文獻計量為基礎,設計 出一套可協助研究人員或圖書館,進行論文參考文獻研究時較易於分析的系統, 得以改善因沒有適用的系統或工具協助,導致需使用人工的方式做資料的分析、

(13)

3 比對、以及統計的困擾,甚至因需要耗費大量人力的狀況下,就不得不縮小研究 規模,以達到人力可進行的範圍。 總結上述說明,本研究之具體目標如下: 一、設計與實作,參考文獻計量為基礎的期刊使用統計系統(SCAJ),讓研究人 員或圖書館人員可以自由應用。 二、透過系統輔助,針對校內的研究產出,回推瞭解圖書館期刊使用率問題。 三、利用系統做為參考文獻計量的輔助工具,並且解決文獻著錄凌亂的問題。 四、透過系統做為輔助工具,來達到減少人力、時間,以及擴大研究範圍。 五、透過系統產出的數據,做為期刊評估或後續研究的參考。

1.3 研究範圍與限制

研究範圍與限制

研究範圍與限制

研究範圍與限制

本研究主要是以設計與實作期刊使用統計系統(SCAJ)為目的,故其範圍 及限制如下: 一、以引文資料為分析內容 主要是以匯入的引文資料來分析其來源期刊,並計算期刊的引用次數,以做 為分析期刊的量化指標。所以,本系統僅處理參考文獻的引文資料。 二、匯入分析資料格式 匯入上傳的引文資料檔案,僅以單純引文資料之 Text 檔格式或者 XML 格式 儲存的博碩士學位論文引文資料二種格式為主。 三、引文資料類型分類 本研究所指之被引用文獻資料類型的項目分為,西文期刊、會議論文、網路 資源、中文期刊、圖書、博碩士論文、研究報告、以及其它。 四、以西文期刊為分析內容 由於西文期刊價格非常昂貴,分析西文期刊的使用情況為各研究單位的重要 需求,故此研究之範圍,還是以分析文獻參考來源中的西文期刊為主。

(14)

1.4 研究流程

研究流程

研究流程

研究流程

本研究目標在設計 SCAJ 系統,並實作建置完之後進行系統的測試評估,最

後針對系統設計與實作過程,以及最後測試評估結果提出結論以及建議。詳細之 研究流程如圖 1-1 研究流程。

(15)

5 2

第二章

第二章 文獻回顧

第二章

第二章

文獻回顧

文獻回顧

文獻回顧

依據研究背景、動機、以及研究目的,進行期刊分析系統及相關資訊技術、 引文分析、期刊分析、以及引文格式分析,四個面向的相關文獻進行探討。如圖 2-1 研究文獻關係所示,針對系統設計實作的相關知識,以及資訊技術,期刊的 分析方式、常見用於分析期刊的系統,學術論文的引文格式以及系統相關的資訊 技術進行回顧介紹。 圖 2-1 研究文獻關係

2.1 期刊

期刊

期刊使用分析

期刊

使用分析

使用分析

使用分析

期刊使用分析的目的不外乎是為了瞭解期刊的品質、使用狀況、是否符合使 用者需求等。本節針對期刊使用分析進行回顧目前國內外常使用的分析方式,以 及常用來輔助期刊分析的資訊系統,並介紹資訊系統所提供的分析指標。

(16)

2.1.1 期刊

期刊

期刊分析

期刊

分析

分析

分析方式

方式

方式

方式

期刊為定期而繼續出版的刊物,根據英美編目第二版(Anglo-American

Cataloguing Rules, 2nd Edition, AACRII)的定義:「是指有編號或年月編次標示, 意欲無限期發行者,包括期刊、報紙、年刊(報告、年鑑等)、學會會報、紀要、 議事錄等、以及有編號的出版品」。(胡述兆、王梅玲,民 92)。期刊是研究時事、 科技新知、最發展與未來趨勢的最重要資源,凡在專書上網法找到或尚未論及的 新理論、新發明、新概念與新趨勢,常仰賴期刊論文提供資料。而期刊的發行量 雖然大,但根據研究,有 35%的期刊論文從來沒有被引用過,而 49%的期刊論 文只被引用過一次,只有 16%的期刊論文被多次引用 (石美玉,民 92)。可見 慎選切合使用者需要以及有用的期刊是極為重要。 國內外對於期刊分析評選的方式並無特定的規範,在許多文獻也指出,沒有 一種單獨的標準可以做為期刊的價值或重要性的指標,因此需因應環境以及條件 不同來選擇適當的期刊分析評選方式。分析評選方式大致可分為主觀及客觀二種, 綜合目前國內外常用的主觀期刊分析評選方式如下: 一、意見調查法 意見調查法的優點在調查問題可以不只侷限於目前既有的館藏,並可得知讀 者的直接回饋。 二、專家諮詢法 此法為根據專家意見來選擇核心期刊。具體方式為條列出某一學科的專業期 刊或相關期刊清單,提供教師及研究人員評估,請他們圈選出在教學及研究 活動中,利用率最高的幾種期刊,再綜合它們的意見。此法之優點為納入最 了解在其學術領域中那些期刊為必需之專家學者的意見,可切合核心使用者 群之真正需要。 客觀的期刊分析方式則有下列方式: 一、引文分析法

(17)

7 引文分析法是以期刊文獻所列之參考書目為研究對象,以統計各種期刊上發 表的一次文獻被其他文獻引用的多寡。 二、載文法 可分為載文量法與載文率法兩種。 (一) 載文量法利用布萊德福定律,將某一主題下之所有期刊,依其所含相關 論文篇數的多寡可以找出某一學科的核心期刊,或是決定要獲得某一比 例的文章需要多少種的期刊,並且可以成為期刊淘汰的依據。但此一方 法對載文量多,或刊期較頻繁的大型期刊,將佔有較大的優勢。相對的, 對載文量少,但內容符合需要之小型期刊,便極有可能被排除在核心期 刊之外。為補強這個缺點,必需同時使用所謂載文率法配合分析。 (二) 載文率法係計算期刊刊載某一學科或專業的相關文獻數,佔該期刊全部 載文量的百分比,國外研究文獻曾提出若相關主題的論文篇數在 50% 以上者,即顯示此份期刊對此一主題的研究貢獻大。 三、索引摘要法 有別於載文量法及載文率法需要大量的期刊作為分析樣本群,索引摘要法僅 取一種或數種在某一學科或專業領域中權威性較強,收錄較齊全的索引摘要 刊物作為分析統計之依據。 四、使用分析法 直接分析現有館藏的使用狀況,是各種期刊評鑑方法中相當實用及重要的一 種,可以直接反應使用者的使用狀況,但會因使用者的配合程度以及人為因 素而造成分析的誤差。一般的期刊使用分析採行之方法大致上有: (一) 出納記錄 直接計算期刊被使用次數,但對於期刊不外借之單位,此法恐受到限 制。 (二) 調查單

(18)

於期刊上黏貼調查單,請讀者於使用資料後,於調查單上作記號。 (三) 讀者問卷調查 在讀者離開圖書館之際,請讀者勾選曾經使用過的期刊。 (四) 重新歸架計算 要求讀者於取出期刊閱覽完畢後,將期刊置於閱覽桌上或指定之地方, 館方於一定時間內,將讀者留下之期刊加以記錄分析。 (五) 複印記錄 由讀者申請複印之記錄單,統計使用次數。 (六) 館際合作申請記錄 利用館際合作申請記錄,可了解讀者需要的,但目前館內沒有的期刊的 狀況,但對館藏期刊之使用情形則無法提供資訊。 (七) 電子期刊使用統計 近年電子期刊之發展,多數之電子期刊系統已可提供電子期刊之使用統 計,直接採用亦是相當重要的參考。 五、使用費率法 本法是考慮期刊被使用的經濟效益,藉由統計各期刊的使用次數,將期刊價 格除以使用次數,可以得知平均使用一次期刊所需付出的成本用。 六、標準期刊清單法 以權威性之團體所推薦之期刊為標準,例如以 Index Medicus 評估生物醫學 期刊,以科學引文索引(Science Citation Index, SCI)評估科學技術各類期 刊,或如其他著名圖書館之館藏期刊清單,其他組織或圖書館已完成評鑑之 核心期刊清單等均可作為參考。中外有許多圖書館直接採用期刊引用報告 (Journal Citation Reports, JCR)為衡量工具,JCR 將 SCI 及社會科學引文 索引(Social Sciences Citation Index, SSCI)兩大引文索引資料庫所收錄超過 三年以上之期刊,依其被引用次數(Total Cites)、影響係數 (Impact Factor)、

(19)

9 立即索引 (Immediacy Index)等分別列出名次,為期刊的選擇提供了重要 的參考依據。 七、多要素分析法 為避免使用單一評鑑方法造成偏頗之結果,而將多種評鑑方法綜合使用。有 逐法篩選者,亦有數法同時使用,並賦與不同權重以統計排序者。具代表性 者如 Dhawan, Phull, & Jain(1980)出之綜合模式,該模式在確認學科領域 期刊之質與量之際,也同時結合實際利用情況與讀者意見來確認核心期刊的 正確性。 綜觀國內外相關研究採用的期刊評鑑模式,石美玉(民 92)針對近年來的 國內外較著名或有特色的研究實例進行分析,在國內的六篇相關研究針對其評鑑 方法統計,多要素分析法為所有個案都採用,顯見絕大多數國內個案皆認同單一 期刊分析評鑑方法容易造成結果之偏頗,引文分析法則僅有一案採用,標準期刊 清單則有 80%的案例採用。針對國外的六篇相關研究法頗為分散,僅有引文分析 是共同採用之方法。就目前所蒐集到的文獻可以看出只要是在小範圍或單一主題、 單一圖書館之核心期刊研究,引文分析法便經常被使用,在資料量不大之狀況下, 同時搭配其他期刊分析評鑑方法以補足引文分析法可能之缺失,如此所得之結果 是可以較不引起爭議的。

2.1.2 期刊

期刊

期刊分析

期刊

分析

分析

分析系統

系統

系統

系統

儘管國內外對於期刊分析的方式有許多,所涵蓋的深度以及廣度也不盡相同, 但對於沒有充裕時間或人力的研究人員及圖書館館員而言,較廣較深的期刊分析 範圍及方式就產生較大的問題。當可以用於協助期刊分析評鑑的系統出現之後, 理當成為最直接便捷的參考來源,甚至於直接當成評鑑期刊的主要依據,以下就 幾個可用於期刊分析評鑑的系統進行簡單介紹:

(20)

由 Institute for Scientific Information(ISI)發行,其引用資料來自 Web of Science(WOS)資料庫中 8,000 多種期刊,包含 200 多個學科全球 3,300 多 家出版商,利用自然科學、社會科學領域的所有專業的期刊積累和列出引用 數和文章計數,對期刊進行評價和比較。它是提供期刊數據以評估期刊的工 具,做為期刊的品質評估及作者生產力與影響力的參考。針對 JCR 提供的 期刊評鑑指數概述如下:

(一) 影響係數(Impact Factor, IF)

Impact Factor 為目前最多使用者參考的期刊評鑑指數,主要計算方式為 該期刊前二年出版的文章在此今年平均被引用的頻率。例如:2010 年 的影響係數,即為該刊 2008 年與 2009 年出版的文獻在 2010 年被引用 的總數,除以該刊 2008 年及 2009 年出版的文章總數。其計算公式如下。 ܫܨ =該期刊近二年出版之文章在當年的被引用次數 該期刊近二年出版之文章數

(二) 五年影響係數(Five-Year Impact Factor)

其概念跟影響係數相同,只是將用於計算的引用時間由二年拉長至五年, 其原因為有些領域需要較長的時間才能達到引用的高峰。

(三) Eigenfactor Metrics

Eigenfactor Metrics 為 2009 年新版 JCR 所提供的新功能,包括

Eigenfactor Score 和 Article Influence Score。由華盛頓大學(University of

Washington)發展出來的指標,其計算原理類似 Google Page Rank 的概

念,Page Rank 是計算連結的網頁,而 Eigenfactor 則是計算引文,但不 只計算引文的數量,更重要的是計算引文的來源。其特色為於計算的引 用時間範圍為五年,忽略期刊的自我引用,將社會科學以及自然科學期 刊一起計算,也加入了博士論文、新聞、以及一般期刊來更客觀的評估 期刊的重要性,透過期刊引用網路社群反映期刊的權威性和引文的影響

(21)

11

力,打破原先影響指數引用次數權重均等的概念。

(四) 即時引用指數(Journal Immediacy Index)

用於計算某期刊在該年度多快被引用的方法。也就是說 2010 年的即時 引用指數,就是以 2010 年該期刊的文獻被引用數除以該刊 2010 年出版 的論文總數。此指數與影響係數最大的差別,在於計算的時間分界,此 指數直接顯示期刊當下的影響力,較適合觀察更新快速的學科。 二、Scopus 由全球超過 500 位使用者以及圖書管理人員所共同設計發展而成,包含來 自全球 5,000 個出版公司,涵蓋超過 18,000 種期刊之摘要及參考書目,以確 保其廣泛的跨領域性。它提供美國地區以外的資料,涵蓋範圍廣,大量收錄 從 1996 年以後的期刊與論文。Scopus 提供的期刊評鑑指數概述如下: (一) h-index

h-index 是在 2005 年由加州大學聖地牙哥分校(University of California

in San Diego)的凝態物理學教授 Jorge Hirsch 所提出 SJR 指標,主要

目的是藉由 h-index 來描述科學家的研究產出之影響與質量。其計算方 式為一個科學家所發表的文章中,有 h 篇文章被引用次數大於等於 h, 而其他文章被引次數皆小於等於 h,則其 h-index 指數為 h。在 Scopus 也提供計算一群文獻或期刊之 h-index。

(二) SCImago Journal Rank(SJR)

SJR 為西班牙的組織機構評鑑公司 SCImago 所提出,用於衡量學術來

源的科學聲望,即每篇論文的加權引用價值。SJR 在 2008 年得到了

Nature 的報導被認為是對 ISI 的期刊影響係數強有力的挑戰,其演算法

也是類似 Google Page Rank 的概念,在賦予分值的時候考慮被引期刊的 級別,某一期刊在被另一期刊引用時將賦予該期刊其自身的聲望或地位, 也就是說引用具較高 SJR 的來源比引用具較低 SJR 的來源更有價值。

(22)

(三) Source Normalized Impact per Paper(SNIP)

SNIP 為萊登大學(Leiden University)技術研究中心的 Henk F. Moed 教

授所提出。其特色為衡量期刊的上下文引用影響,它可依據作者引用其 他論文的次數、引文影響成熟度,用於評估的資料庫對學科領域所有文 獻的覆蓋程度。三年引文期中某一來源出版物中的每篇論文,平均被引 用次數與該學科領域的引文潛力(Citation potential)之間的比值。引文 潛力係指一篇文章估計在指定的學科領域中,達到的平均被引用次數。 三、Journal-ranking Journal-ranking.com 是一個免費註冊使用線上的期刊評鑑服務,目前收錄超

過 7,000 種期刊。由香港科技大學的林良材教授所建立,Center for Journal

Ranking(CJR)運作該網路服務。它也提供了期刊的評比指標,期刊影響

指數(Journal Influence Index)來供使用者參考,跟 JCR 的 Eigenfactor 以及

Scopus SJR 一樣,其概念都來自於 Google Page Rank,引文網路結構決定該

引用的品質權重,使文獻的品質不單只由引用的數量決定。 上述的三個期刊分析評鑑系統,都是以引文文獻分析為基礎,較新的分析評 鑑指標則再配合上,引文網路結構決定該引用的品質權重。引用文獻分析即使有 許多的參考價值但還是存在著有諸多爭議,在眾多的批評中,以自我引用、引用 錯誤、引用均等以及二次引用為多。引文分析雖然存在著不少干擾變數,卻仍在 資訊計量學甚至資訊科學學域中,昂首佇立,自成一家,各方研究欣欣向榮。究 其原因,不外是:沒有一種既簡單、直接又實際的技術可以掌握所有文獻的使用 情形;價值的判斷早在文獻被引用時即已完成;可以容易且精確的選擇引用的數 據;引文分析是唯一對作者使用文獻最容易觀察到的指標(蔡明月,民 94)。 總之,引用文獻資料庫提供豐富的各項的量化數據以及評比指標,但該數據 應視為參考之用,而不應視為評估期刊品質的唯一指標,應用時搭配其它的分析 評鑑方式,才能分析評鑑出真正有高品質及有用的期刊。

(23)

13

2.2 學術論文引文格式

學術論文引文格式

學術論文引文格式

學術論文引文格式

在學術論文的寫作當中,通常會引用前人的研究成果或觀念來提高論文的信 服力,藉由引用文獻表明對前人研究成果的承認、借鑿、繼承、修正、反駁、批 判或是向讀者提供更進一步研究的參考線索等,於是著文與引文之間建立起一種 引證關係(孟連生,民 85)。而讀者則可以藉由引用文獻來延伸對該文章閱讀, 由文章之間建立起來的引證關係來探索相關的知識網路,讓研究範圍可以延伸的 更深更廣。因此引文格式的正確使用是很重要的一環,其重要性不亞於文章本身, 故在引用資料的過程中,如未按照一定的格式規範撰寫,或者是沒有記載出處, 日後讀者想要利用引文來延伸閱讀就會發生困難,甚至產生錯誤引用的狀況,對 作者而言甚至會被冠上抄襲的惡名。 而在每一學門領域中,對於論文的撰寫引用資料或者是編製參考文獻時,都 有其學術規範存在,研究人員在從事學術論文寫人作或投稿至學術期刊時也希望 能從所屬學門的規範。從各學門的期刊投稿格式規定中,雖然皆有其專屬文獻引 用格式,但其實絕大部份也都是以國際知名的寫作規範所變化而來。在 1991 年 被著名的 booklist 雜誌選為三大格式手冊分別為,Chicago Style、American

Psychological Association Style(APA)以及 Modern Language Association Style

(MLA),國內外對於引文規範的討論多以此三種格式為對象,以下就這三種格 式進行說明:

一、Chicago/Turabian Style

Chicago Style 包含 Kate L. Turabian 主編的 A Manual for Writers of Term

Papers, These, and Dissertations,而不是單指 The Chicago Manual of Style,二

者都是由芝加哥大學出版,Kate L. Turabian 以 The Chicago Manual of Style 為架構編制,提供大學生及研究生的正式論文、報告的寫作格式手冊 A

Manual for Writers of Term Papers, These, and Dissertations,至今已經過六十

(24)

of Term Papers, These, and Dissertations 在學術界的地位頗為重要,但在探討

學術格式規範時,其重要性還是不及 The Chicago Manual of Style。The

Chicago Manual of Style 最新版為 2003 年出版的第 15 版,而目前 A Manual

for Writers of Term Papers, These, and Dissertations 最新版為 2007 年以 The

Chicago Manual of Style 第 15 版為藍本的第 7 版,但此版本與上一版相隔 11

年之久。其使用範圍極廣,包含了文史、哲學及科學等。 二、American Psychological Association Style

APA 格式是指美國心理協會(American Psychological Association)所出版的

出版手冊中,有關投稿該協會旗下所屬二十九種期刊時必須遵守的規定。該 手冊詳細規定文稿的架構、文字、圖表、數字、符號等的格式通稱為 APA 格式(APA style),相關領域的期刊、大學報告、學位論文也常參考其格式, 做為要求投稿者及研究生之依據。APA 出版手冊自 1944 年出版以來,經過 1974 年的二版,1983 年的三版,1994 年的第四版,於 2001 年 7 月發行第 五版,在 2007 年六月為了符合網路新科技以電子參考資源出版 APA Style

Guide to Electronic References,以補足現今的需求。APA 格式為心理、教育

及社會科學領域學術期刊經常採用的書目格式。 三、Modern Language Association Style

MLA 格式為由美國現代語言學會所制定,最初出現在 1951 年語言學會期刊

PMLA 上的 MLA Style Sheet,此規範立即受到學術出版界及學會會員的歡

迎,接著經過多年的增補修定,1977 年正式發行成為 MLA Handbook for

Writers of Research Papers。接著在 1984 年發行第二版,在 1988、1995 及

1999 發行三、四、五版,目前為 2003 年出版的第六版。MAL 格式根據使

用者的不同,分為給高中以及大學生使用的 MLA Handbook for Writers of

Research Papers;給研究生與專家學者使用的則是 MAL Style Manual and

(25)

15

Publishing 在 1998 年出版第二版來因應電子文獻的使用需求。MLA 格式被

人文學領域廣泛採用,特別是文學及語言等。

2.3 相關

相關

相關資訊技

相關

資訊技

資訊技術

資訊技

該節將針對系統所使用到的資訊技術,包含用於系統在期刊刊名比對用到的

近似字串比對、跟 WOS 溝通的 Web Service、以及系統的開發平台 ASP.Net 進行 介紹。

2.3.1 近似

近似

近似字串比對

近似

字串比對

字串比對

字串比對

近似字串比對(Approximate String Matching)為字串比對(String Matching)

所衍生出來的問題。近似字串比對主要是研究字串 P(Pattern)的近似子字串 (substring),是否在較長的字串 T(Text)出現的的方法。近似字串比對的問題 一直以來就不斷的被研究,用以改進其準確率以及效率,也不斷的有新的演算法 被提出來,在目前常見的近似字串比對演算法可分為單一樣式演算法(Single

Pattern Algorithm),以及多樣式演算法(Multi Pattern Algorithm)也就是一次比 對多個 P 的演算法。目前常見的 Boyer-Moore Algorithm 以及 Knuth-Morris-Pratt

Algorithm 就是單一樣式演算法,Boyer-Moore Algorithm 被認為在實際應用中,

最有效的單一樣式演算法。而 Wu-Manber Algorithm 以及 Aho-Corasick Algorithm 則是常見的多樣式字串比對演算法。

2.3.2 Web 服務

服務

服務

服務

隨著資訊技術的發展,依照需求而發展出不同的資訊系統,系統之間的差異

性也越來越大,為了讓系統之間能互相交流,必須要有共同的協定,Microsoft 、

(26)

Wide Web Consortium, W3C)提出以 XML 為基礎的標準協定,做為網際服務的

溝通語言及工具,Web 服務(Web Services)就是因應這樣的需求而產生。Web 服務是一種服務導向架構(Service-oriented architecture)技術,主要是透過 Web 協議給不同平台的應用程式提供服務,讓平台之間能動過服務相互溝通。Web 服務是以 Web 的開放標準為基礎它包含:

一、eXtensible Markup Language(XML)

用來描述資料的一種標記語言,主要是說明資料是什麼,以及攜帶資料資訊。

XML 被廣泛用來作為跨平台之間互動資料的形式,主要針對資料的內容,

通過不同的格式化描述方式 XSLT,CSS 等,可以完成最終的展現格式,例 如產生對應的 HTML,PDF 或者其他的檔案格式。

二、Simple Object Access Protocol(SOAP)

是一個以 XML 為基礎的編碼技術製作出來的通訊協定,SOAP 的出現是為 了簡化網頁伺服器在從 XML 資料庫中提取資料時,無需花時間去格式化頁 面,並能夠讓不同應用程式之間透過 HTTP 通訊協定,以 XML 格式互相交 換彼此的資料,所以應用程式之間不需要知道彼此的作業平台是那一種,或 是各自如何實作等細節資訊,就可以透過 SOAP 來相互溝通。其作業方式為 將溝通用的內容封裝成 SOAP 訊息,當 Client 端發出 SOPA 請求給 Server 端的 Web 服務時,Server 在收到請求後會依據請求將處理完的資料回應一 份 SOAP 給 Client 端。

三、Web Services Description Language(WSDL)

WSDL 是由 Microsoft 及 IBM 共同訂定的標準。主要是描述 Web 服務的細

節,也是使用 XML 格式之語言,讓 Web 服務應用程式能以一種標準方法來 描述自己擁有的介面及能力,以便讓互動更容易進行。

四、Universal Description, Discovery and Integration(UDDI)

(27)
(28)

Hypertext Preprocessor(PHP)或 JavaServer Pages(JSP)這樣的簡化程式設計流

程與提供強大資料處理能力的模組,應用在 Web 伺服器的外掛模組(plug-in

module)。在 ASP 平台紅極一時的時候,微軟也因為 ASP 的諸多限制,例如程

式語言只支援 VBScript、Jscript,只能存取支援 COM 的元件,直譯式語言的效 能問題等,因而著手重新設計 ASP 的架構,導入基礎類別庫(Base Class Library) 的支援,強化了程式模型以及平台的支援,在 2002 年推出包含於

Microsoft .NET Framework 1.0 的 ASP.NET 1.0 版,宣告新一代的 ASP.NET 時

代的開端,目前最新的版本為 ASP.NET 4.0,內含於 Microsoft .NET Framework

4。

ASP.NET 的許多控制來簡化繁瑣的開發工作,讓程式設計人員可以有效的

提昇開發效率,大幅的增加生產力,另外也內建 ASP.NET Asynchronous JavaScript

and XML(AJAX)的技術、Master Page、Profile 使用者設定檔、Web Part Framework、 網站管理工具、以及帳號權限管理系統等等的解決方案或技術,讓程式設計人員 在程式設計上直接應用,減少重複造輪子的工作,這也是本系統選擇以 ASP.NET 平台來開發的主要原因。

(29)

19 3

第三章

第三章

第三章

第三章 系統

系統

系統分析與

系統

分析與

分析與設計

分析與

設計

設計

設計

本章將以參考文獻計量為基礎,朝向設計出期刊使用統計系統(SCAJ)目 標進行,3.1 依據對圖書館員進行的需求訪談,將所提出的需求進行分析說明, 3.2 說明系統的是以何種概念做為設計的方向,3.3 則進入系統的設計部份,將規 劃出系統的架構以及模組功能的設計。

3.1 系統

系統

系統需求分析

系統

需求分析

需求分析

需求分析

系統需求是依據圖書館所面臨的期刊使用統計問題,以設計期刊使用統計系 統(SCAJ)目標進行,針對大學圖書館館員進行需求訪談。依據訪談結果整理 及分析出系統需求,將需求分為資料需求、功能需求、介面需求、以及報表需求 四個面向,如圖 3-1 系統需求面向所示。系統主要是以資料需求的輸入(Input) 以及報表需求輸出(Output)為主,以下針對這四個面向的需求進行詳細說明。 圖 3-1 系統需求面向

(30)

一、 資料需求: (一)匯入參考文獻資料 使用者上傳所要分析的引文資料文字檔,系統將上傳文字檔分析,分析出 引文類型及期刊名稱,並依分析的結果儲存於資料庫內。引文類型分類如 下: 1. 西文期刊:以英文為主的期刊論文。 2. 會議論文:不分語言的會議論文。 3. 網路資源:來自於網路上的文獻。 4. 圖書:不分語言的圖書文獻。 5. 中文期刊:以中文為主的期刊論文。 6. 博碩士論文:不分語言的博碩士論文。 7. 研究報告:不分語言研究報告文獻。 8. 其它:無法分類於上列分類範圍的文獻。 (二)統計用期刊清單 用於統計作業,除了引文資料外,額外的參考指標,讓使用者自行上傳統 計用期刊清單包含所要分配的分數,經由系統分析後儲存於資料庫,於統 計作業時給予自訂權重,產出計算後的分數,可配合引文資料一起計算或 單獨計算。 (三)統計結果儲存 統計作業時,使用者自訂給予不同的引文資料、統計用期刊清單,以及不 同的權重,進行比較每次的結果變化,必需先做統計結果的儲存再取出比 較。 二、 功能需求: (一)期刊權威控制

(31)

21 需設置期刊刊名資料庫做為系統的核心資料,參考文獻資料的分析及統計 用期刊清單,皆需跟期刊刊名資料庫比對,來產生比對後結果,但可能產 生同一期刊但期刊名稱不一樣的狀況,故需要設置刊名的權威控制來解決 同一期刊但期刊名稱不一的問題。 (二)多使用者 需要讓多個使用者同時使用系統而互相不衝突,每個使用者有獨立的作業 空間,不因其他使用者的變動而造成資料錯誤。 (三)資料共用 在資料共用主要希望讓使用者之間,相互參考文獻的資料,以及統計期刊 清單的共用,讓使用者間也可以將對方的所建立的資料加入,當成一個參 考指標來產出統計的結果。 (四)資料匯出 Excel 系統所產出的結果需建立匯出功能,提供匯出 Excel 格式讓使用者可以利 用既有的工具程式,做後續的資料處理或建立圖表。 三、 介面需求: (一)瀏覽器方式展現 不需安裝用戶端軟體就可以使用系統的所有功能。 (二)簡潔及功能兼具的作業介面 在作業畫面中,盡量將所需的功能加入,需要的訊息顯示,不需要的訊息 隱藏,並可以依需求顯示隱藏訊息及功能,不要讓使用者在引文作業或其 它的作業時,因為訊息太多而眼花瞭亂或資料量太大而傳輸太久造成作業 緩慢。 (三)自訂顯示及處理資料數量 可由使用者自訂顯示的資料數量,可以一次處理更多的引文資料,來加快 引文資料的處理速度。

(32)

(四)顯示資料篩選 對顯示的資料做篩選,來更快找到所需的資料,並進行相關作業。 四、 報表需求: (一)引用次數統計 統計所分析資料的各期刊引用次數,包含權威控制及排除權威控制,以及 同時顯示每筆資料的單獨引用次數跟合計次數。 (二)文獻類型統計 所分析的參考文獻資料類型統計。 (三)統計自訂權重 引文資料及期刊清單資料,可透過自訂權重的方式,產出統計報表,並讓 使用者單獨或合併統計。 (四)排名比較統計 將自訂不同權重的統計報表儲存,再利用排名比較統計來產生報表,以便 使用者觀查各儲存記錄的期刊排名變化。

3.2 設計概念

設計概念

設計概念

設計概念

WEB2.0 網路運用新時代的當下,共建共享是其主要精神,系統將依據這個 的精神去設計,並建置一個以使用者為導向的期刊使用統計系統(SCAJ),其設 計概念如下: 一、簡易使用 建構在一個透過網際網路就能使用,來降低使用門檻,讓有需求的研究人員 或圖書館館員都能使用的開放式系統,不必自行建立及開發,不必安裝用戶 端軟體就能使用系統。 二、個人化作業環境 透過網路進入系統就能有獨立的作業環境,不會因操作而影響他人的作業或

(33)

23 他人的作業影響自己。 三、自訂權重報表 讓使用者自己上傳參考清單,來自由的訂定各項權重,做各項權重調整後的 比較,可透過系統產出的數據,做為研究及評估的參考。 四、使用者回饋 透過更多使用者的使用,來回饋系統豐富資料庫內的資料,進而提高系統的 準確度及其效率,並且能互相參考其它使用者所建立的資料或當成評估的條 件。 圖 3-2 系統設計概念

3.3 系統設計

系統設計

系統設計

系統設計

本節主要是依據 3.1 節的系統需求分析結果來設計系統,完成如圖 3-3 系統 架構所示的完整系統架構,並規劃設計系統的各模組及功能。3.3.1 為系統實體

(34)

架構的說明;3.3.2 針對主要的系統作業流程的設計進行說明;3.3.3 系統模組及 功能是以圖 3-3 系統架構

圖 3-3 系統架構為參考,將系統以功能區分設計成六個模組,最後在系統中較 為重要的參考文獻分析設計,於 3.3.4 參考文獻分析功能及 3.3.5 WOS Web 服務 (WOS Web Services)二節中詳述其設計方法。

圖 3-3 系統架構

3.3.1 系統

系統

系統實體

系統

實體

實體

實體架構

架構

架構

架構

系統採用三層式架構(3-tier architecture)來建置本系統,其架構如圖 3-4 系

統實體架構所示,在實體的架構中,基於資安考量會將商業邏輯層建置於防火牆 的非軍事區(Demilitarized Zone, DMZ)內,資料存取層(Data Access Layer, DAL) 層置於防火牆內的Intranet Zone。

一、展示層(Presentation Layer)

(35)

25

跟系統(Web Server)做為二者間的溝通協定。 二、商業邏輯層(Business Logic Layer, BLL)

負責在 Web Server 上執行處理邏輯運算,此層接受來自使用者端的請求 (Request)服務,並且將程式處理結果傳回到使用者端,它的目的是用來 作為使用者與資料庫之間的溝通橋樑,系統在該層是以 Internet Information

Services(IIS) 6.0 建置。

三、資料存取層(Data Access Layer, DAL)

DAL 主要提供資料給 BLL 來處理,系統建置 Microsoft SQL 2005 做為資料

庫,Client 端無法直接對資料庫進行存取動作,必須經由 BLL 透過 ADO.NET 與 DAL 的連結對資料進行存取。

(36)

3.3.2 系統

系統

系統作業

系統

作業

作業

作業流程

流程

流程

流程

依據系統需求分析,規劃設計主要的系統作業流程。在系統中,每項功能都 有其相互關係,如圖 3-5 系統作業流程;先從管理者建立使用者帳號及權限開 始,再由管理者及進階使用者匯入蒐集的期刊名,增加刊名資料庫內的資料量, 如果刊名資料庫內的資料量不足時,會造成引文作業的系統分析結果準確率低, 接著進行引文資料作業或統計用期刊清單作業。進行完前述二項作業後,可能產 生相同期刊卻有不同刊名的狀況,在統計作業前必需完成刊名權威控制作業,將 相同的期刊合併,以解決在統計時系統將其視為不同期刊的錯誤。最後再進行統 計報表作業才能產生正確的結果,接下來依據作業流程部分做詳細的說明。 圖 3-5 系統作業流程

(37)

27 一、刊名資料庫管理 刊名資料庫為本系統之核心資料,存放所有的期刊名稱,目的為用來讓引文 資料及統計用期刊清單做為期刊比對用,所以刊名資料庫內的資料愈多,相 對的系統的準確程度也愈高。刊名資料庫內的資料蒐集如圖 3-6 刊名資料 庫作業示意,可由管理者或進階使用者匯入蒐集的期刊清單,也可由使用者 在引文資料作業及統計用期刊清單作業時增加未收錄的期刊名資料,其作業 流程如圖 3-7 刊名資料庫作業流程;期刊名資料上傳作業及統計用期刊清 單上傳作業,都是將上傳的資料一筆筆的分析,如果不存在內就新增至資料 庫內,而引文作業則是由使用者在作業時所設定的期刊名來判斷是否新增。 圖 3-6 刊名資料庫作業示意

(38)

圖 3-7 刊名資料庫作業流程

二、引文資料作業

該作業為系統最主要的作業,其統程如圖 3-8 引文資料作業流程,讓使用 者將要分析的引文資料檔案上傳,再經由系統做分析,將每一筆資料加以分 類,並判別出西文期刊的刊名,完成分析作業之後,可由使用者修改成方便

(39)

29 識別的檔名,再選擇要分析的檔案,由使用者針對每一筆資料加以確認,確 認類別的正確性以及類別為西文期刊的刊名是否正確。 圖 3-8 引文資料作業流程 資料校正的詳細流程,如圖 3-9 引文資料校正作業流程,校正作業是以一 次多筆的方式進行校正以加快作業速度;首先檢查資料是否完整,不完整的 資料可以做刪除動作;再檢查分類是否正確,不正確可修改為正確的分頪, 再來檢查類別是否為西文期刊,如是是西文期刊就檢查是系統分析出的刊名

(40)

是否正確,不正確的話需自行修改成正確的期刊名稱,重覆比對完整個頁面 的資料後再進行做儲存。 圖 3-9 引文資料校正作業流程 三、統計用期刊清單作業 讓使用者自行上傳期刊清單,目的是在統計作業時可以加入上傳的期刊清單 並給予不同的權重,提供使用者引文外的另一種評估指標,例如可上傳 JCR 的清單或國科會核心期刊清單等。如圖 3-10 期刊清單作業流程說明,使用

(41)

31 者先將要上傳的期刊清單,自訂加入 1 至 100 的分數,統計後期刊所得到的 分數為自訂分數*權重%,整理後上傳儲存在資料庫內,最後系統會自動分 析出是否有重覆的期刊名,由篩選出來的重覆期刊中刪除重覆的資料就完成 該項作業,重覆的期刊名會造成統計時重覆計算導致結果錯誤。 圖 3-10 期刊清單作業流程 四、刊名權威控制 目的為控制刊名資料庫內的期刊名的正確性,如有同一期刊但期刊名稱不一 樣的狀況,則可設置刊名的權威控制來連結這些刊名,以解決此問題。如果 未設置好權威控制會造成引用次數的分散,統計出來的結果就會有錯誤。系 統會自動合併相同的國際標準期刊代碼(International Standard Serial Number,

ISSN)期刊刊名,也可利用系統的篩選功能找出一樣的期刊,再選權威控

制功能來合併期刊,在引文資料的引用次數統計,以及統計自訂權重統計都 必需考量刊名權威控制的正確性。

(42)

五、統計報表作業 (一) 引文資料的引用次數部份,選擇一個或數個先前作業所完成的引文資料 檔,送出統計後統計出各檔及合計的引用次數,並可另存為 Excel 格式 檔,供使用者後續利用。 (二) 引文資料分類統計,選擇一個或數個先前作業所完成的引文資料檔,送 出統計後系統會合併所選的檔案,並且統計出各分類的數量,並可另存 為 Excel 格式檔。 (三) 合併統計報表,可讓使用者自訂統計權重,選擇一個或數個先前作業所 完成的引文資料檔,給予權重百分比,或者是選擇一個或數個先前上傳 的統計用期刊清單,再給予權重後送出執行統計,系統會依照所選擇的 檔案及權重計算出各期刊所得到的分數。結果可儲存在系統內,供排名 比較統計做排名比較,也可另存為 Excel 格式檔。系統所使用之正規化 評分方式舉例如:若被引用次數最高之期刊為 IEEE Transactions on

Pattern Analysis and Machine Intelligence,其被引用數為 200 次,而被引

用數第二高期刊為 IEEE Transactions on Computers,其被引用數為 198 次,則將給予 IEEE Transactions on Pattern Analysis and Machine

Intelligence 之評分為 100 分,而 IEEE Transactions on Computers 之評分

則為 (f − min/max-min) ×100,即 (198-0/200-0)×100=99 分,以 此類推。 (四) 排名比較統計,選擇合併統計報表所儲存的二筆以上資料,送出執行統 計後,系統將依據合併儲存記錄的排名,產生排名比較報表,可方便使 用者觀查各儲存記錄的期刊排名變化,其作業流程如圖 3-11 排名比較 統計作業流程,結果可另存為 Excel 格式檔,供使用者後續利用。

(43)

33

(44)

3.3.3 系統

系統

系統模組及功能

系統

模組及功能

模組及功能

模組及功能

依據圖 3-3 系統架構設計,將系統以功能區分設計成六個模組,分別為系 統模組、刊名資料庫模組、引文模組、統計期刊清單模組、共享模組、以及統計 作業模組。每一個模組又分為幾個子功能,為做到簡潔的系統,盡可能將不同的 子功能做在同一作業介面上;以資料庫為中心,各模組都跟資料庫做連結溝通, 將所有的資料都存於資料庫內,以便系統運算分析利用或提供其它模組使用。如 圖 3-12 系統模組所示,各模組功能簡介如下: 一、系統模組 主要功能為管理系統帳號及使用權限,讓管理者透過管理模組進行帳號管理, 以及設定適當的權限。 二、刊名資料庫模組 主要功能為管理系統核心的期刊名資料,提供上傳整批期刊名資料,以及期 刊名權威控制。 三、引文模組 該模組為使用者在引文作業時最主要的工作環境,提供引文資料的整批上傳, 上傳之後的分析、修改、校正及確認的作業。 四、統計期刊清單模組 主要讓使用者上傳在統計時要用到的期刊清單,並包含所要分配的分數,以 及重覆期刊的刪除作業,由系統自動分析是否有期刊重覆的狀況,重覆的期 刊資料會於報表作業時產生不正確的輸出結果。 五、共享模組 讓使用者分享所建立的資料,其他使用者可以利用別人分享出來的資料進行 統計參考。 六、統計作業模組 主要功能為各項統計報表的輸出,包含引文資料的引用次數,引文資料分類

(45)

35 統計,統計自訂權重,讓使用者單獨或合併統計,排名比較統計,讓使用者 觀查各儲存記錄的期刊排名變化;並且各統計報表都提供 Excel 格式輸出。 系統資料庫 帳號管理 權限管理 刊名清單上傳 刊名資料庫編輯 管理 刊名權威控制 新增刊名驗證 統計用期刊清單 上傳 統計用期刊檔案 管理 清單編輯管理及 重覆清單檢查 設料共享設定 引文統計報表 合併統計報表 排名比較統計 引文資料上傳 引文檔案管理 引文確認、修改 及校正管理作業 圖 3-12 系統模組 依據上述六個模組規劃設計出如圖 3-13 系統功能。系統實做就以該架構為 藍圖進行設計,首先完成刊名資料庫模組的設計,讓刊名資料庫可以進行上傳及 整理功能,接著進行引文模組的設計,最後再完成其它的模組。

(46)
(47)

37 系統模組在使用者權限部份,因考慮到系統中有某些部份會影響到其他使用 者所產出報表的結果,以及系統重要的刊名資料庫內容正確性,故將權限劃分為 三種如下: 一、管理者 具有所有系統功能。 二、進階使用者 具有除系統模組外的所有功能,可管理刊名資料庫內的資料及設定刊名的權 威控制,賦予系統核心刊名資料庫的管理任務。 三、一般使用者 具有引文模組、統計作業模組、以及統計期刊清單模組的系統一般性功能, 停用刊名資料庫模組,是為了防止使用者更改刊名資料庫的內容,而造成其 他使用者的統計結果產生誤差。 表 3-1 系統模組使用權限 權限劃分 權限劃分 權限劃分 權限劃分 模組名稱 模組名稱 模組名稱 模組名稱 管理者 管理者 管理者 管理者 進階使用者進階使用者進階使用者進階使用者 一般使用者一般使用者一般使用者一般使用者 系統模組 系統模組 系統模組 系統模組 V 刊名資料庫模組 刊名資料庫模組 刊名資料庫模組 刊名資料庫模組 V V 引文模組 引文模組 引文模組 引文模組 V V V 統計作業模組 統計作業模組 統計作業模組 統計作業模組 V V V 統計期刊清單模組 統計期刊清單模組 統計期刊清單模組 統計期刊清單模組 V V V

(48)

3.3.4 參考文獻

參考文獻

參考文獻分析功能

參考文獻

分析功能

分析功能

分析功能

目前常見的參考文獻著錄方式有 American Psychological Association(APA)

Style、Modern Language Association(MLA)Style、American Medical Association

(AMA) Style、以及 Chicago Style。在這幾個常見的著錄方式中,如要利用程 式透過各種書目格式的標準,以及近似字串比對演算法,來分析判斷出期刊名或 是文獻類型是難以達到需求的,其原因說明如下: 一、無特定關鍵字、標示及特定的格式,足以讓程式能正確判斷文獻類型。 二、常用的書目格式在標示期刊名稱部份無明顯的區隔符號,程式難以分析出正 確的期刊名稱。 三、文字檔無法展現書目格式的特定著錄方式,例如 APA、Chicago 及 AMA 會 以斜體或 MAL 以底線的方式來著錄期刊名稱,轉換成文字檔再進入系統, 這些特定的標示都會隨著消失。 四、著錄方式混亂,例如作者並未按照規定著錄。 系統在設計參考文獻分析處理時為因應上述狀況,故另外再設計參考文獻分 析功能,其主要功能的為分析判定引文的類型,以及類型為西文期刊的文獻分析 出其刊名。系統利用如圖 3-14 參考文獻分析處理流程所示,將參考文獻分析分 為四個處理程序,來達到分析出文獻的類型及期刊名之目的,其程序之功能及處 理方式依照順序如下,而關於 WOS Web 服務的設計將於下一節進行詳細說明: 一、資料前置處理程序 將每筆引文資料做下列轉換,讓資料比對時的錯誤減少。 (一) 轉換所有文字成為大寫。 (二) 全形字元轉換成半形字元。 (三) 去除無法轉換成半形的全形字元。 (四) 去除前後及連續的空白字元。

例如:

(49)

39

轉換前

66

R. Mohan, “Video Sequence Matching,” IEEE

International Conference on Acoustics, Speech and Signal Processing, Vol. 6, pp. 3697

3700, May 1998.

轉換後

[66] R. MOHAN, "VIDEO SEQUENCE MATCHING," IEEE

INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOL. 6, PP. 3697-3700, MAY 1998.

二、西文期刊分析程序 該模組主要功能為分析判斷出是否為西文期刊及其刊名。首先分析取得可能 的期刊名稱,再與刊名資料庫比對來確定是否為西文期刊及其刊名,如未比 對到則進行可能期刊名比對 WOS 程序,如還是未比對到刊名,再進行篇名 比對 WOS 程序。下列程序二、程序三及程序五只要有一程序產生比對結果, 就不再往下進行其它程序,並將分析的引文資料判定類型為西文期刊,且判 定分析出的期刊名為該引文資料的正確刊名,其詳細說明如下: (一) 分析引文資料的期刊名子程序:利用下列三種方法來分析出可能的期刊 名稱 1. 尋找引文資料內是否有 VOL.,如有則取 VOL.前的雙引號跟逗號 之間的字為可能期刊名。

例如:

F. AURENHAMMER, "VORONOI DIAGRAMS - A SURVEY OF

A FUNDAMENTAL GEOMETRIC DATA STRUCTURE," ACM COMPUTING SURVEYS, VOL. 23, NO. 3, PP. 345-405, 1991

2. 引文資料無雙引號,則找倒數第二個逗號到往前句號號中間為可能 期刊名。

例如:

P. J. BURT AND E. H. ADELSON. A MULTIRESOLUTION

SPLINE WITH APPLICATION TO IMAGE MOSAICS. ACM

(50)

3. 引文資料以逗號、句號及雙引號當成分割點,取第二長的字串當成 可能的期刊名。

例如:

F. AURENHAMMER, "VORONOI DIAGRAMS - A SURVEY OF

A FUNDAMENTAL GEOMETRIC DATA STRUCTURE," ACM COMPUTING SURVEYS, VOL. 23, NO. 3, PP. 345-405, 1991

(二) 刊名資料庫的比對子程序:將分析出來的可能期刊名跟刊名資料庫進行 比對,比對結果符合刊名資料庫內的期刊名才算正確,並將引文資料類 型設定為西文期刊。在比對之前需做字串整理,如去除標點符號、特殊 字元及一些停用字(Stop Word),目的在增加比對的正確率。

例如:

字串整理前

ACM TRANSACTIONS ON GRAPHICS,

字串整理後

ACM TRANSACTIONS GRAPHICS

(三) WOS 刊名比對子程序:在上個程序未比對到確定的期刊名時執行,將 上個程序分析出來的可能期刊名送至 WOS 查詢,查詢該期刊的文章一 筆,來判定是否有該期刊存在。 (四) 分析引文資料的期刊篇名子程序:西文期刊分析程序及 WOS 刊名比對 程序都未比對出期刊名時,才執行本程序及下個程序 WOS 篇名比對程 序,利用下列二種方法來分析出可能的期刊篇名 1. 引文資料有雙引號時,利用雙引號當成分割點,取最長的字串當成 可能的篇名。

例如:

F. AURENHAMMER, "VORONOI DIAGRAMS - A SURVEY OF

A FUNDAMENTAL GEOMETRIC DATA STRUCTURE," ACM COMPUTING SURVEYS, VOL. 23, NO. 3, PP. 345-405, 1991

2. 引文資料無雙引號時,利用逗號及句號當成分割點,取最長的字串 當成可能的篇名。

(51)

41

例如:

P. J. BURT AND E. H. ADELSON. A MULTIRESOLUTION

SPLINE WITH APPLICATION TO IMAGE MOSAICS. ACM

TRANSACTIONS ON GRAPHICS, 2

4

:217-236, 1983 (五) WOS 篇名比對子程序:方法為利用上個程序分析出的可能期刊篇名送 至 WOS 查詢,查詢是否有該篇名的文章,如有回傳資料則取得該文章 的所屬期刊名稱。 三、引文類型分析程序 該模組主要功能在於分析判別引文類型,可判別的類型有網路資源、會議論 文集以及可能為西文期刊或會議論文集,已判定為西文期刊的引文資料不執 行該模組。 (

) 網路資源分析判別子程序:檢查引文資料是否有 HTTP:或 HTTPS:字串, 如包含有該字串即判定類型為網路資源。

例如:

SONY ONLINE ENTERTAINMENT. "EVERQUEST". AVAILABLE

FROM : HTTP://EVERQUEST.STATION.SONY.COM

(二) 會議論文集分析判別子程序:檢查引文資料是否有字串 CONFERENCE、

CONF.、PROCEEDINGS、PROC.、 SYMPOSIUM 及 SYMP.,如包含

其中的字串即判定類型為會議論文。

例如:

M. PAN, C. CHU. FASTROUTE 2.0: A HIGH-QUALITY AND

EFFICIENT GLOBAL ROUTER. IN ASIA AND SOUTH-PACIFIC DESIGN AUTOMATION CONFERENCE, PP.250-255, 2007

(三) 可能為西文期刊或會議論文集分析判別子程序:檢查引文資料是否有字 串 PP.,如包含該字串即判定類型為西文期刊或會議論文集。

例如:

M. PAN, C. CHU. FASTROUTE 2.0: A HIGH-QUALITY AND

EFFICIENT GLOBAL ROUTER. IN ASIA AND SOUTH-PACIFIC DESIGN AUTOMATION CONFERENCE, PP.250-255, 2007

(52)

四、刊名資料庫比對引文資料程序

該模組利用刊名資料庫來反向比對引文資料,如刊名資料庫內的期刊名字串 包含在引文資料內,即判定可能為西文期刊,以便利使用者校正。

(53)

43

3.3.5 WOS Web 服務

服務

服務

服務

WOS 為美國 Thomson Reuters 於 1997 年間建置之網際網路版引用文獻索

引資料庫系統,提供使用者理、工、醫、農、人文、及社會科學等各學科領域之 文獻書目、作者摘要、及引用文獻等資料。該系統收錄期刊超過 10,000 種,每 週更新其內容,每年提供超過 110 萬筆書目及 2300 萬筆引用文獻資料。WOS 共涵蓋下列三大資料庫:

一、Science Citation Index Expanded(SCIE)

收錄科學技術類期刊計 7,000 餘種,涵蓋主題約 150 餘種。收錄年限於

2005 年,並已回溯自 1900 年,另外 1991 年起之資料包含作者摘要。

二、Social Sciences Citation Index(SSCI)

收錄社會科學類期刊計 2,200 餘種,亦從近 3,300 種科技類期刊中挑選相 關資料收錄,涵蓋主題約 50 餘種。收錄年限自 1956 年,另外 1992 年起 之資料包含作者摘要。

三、Arts and Humanities Citation Index(A&HCI)

收錄藝術人文類期刊計 1,200 餘種,亦從近 7,000 種科學和社會科學類期 刊中挑選相關資料收錄,主題包括藝展評論、戲劇音樂及舞蹈表演、電視廣 播等。收錄年限自 1975 年起,另外 1999 年起之資料包含作者摘要。 系統在設計參考文獻分析功能時,因應在刊名資料庫內未收錄的未知刊名, 需要一個提供正確的書目資料以及期刊名稱的參考資料庫,於是收錄大量的引用 文獻索引資料庫 WOS 就設計為系統參考的主要來源。本系統在執行分析階段, 利用 WOS 所提供的 Web 服務進行資料查詢及校對,以輔系統的分析,故系統的 架構會如圖 3-15 存取 WOS Web Service 網路架構所示。期刊評選系統因授權限 制無法直接存取 WOS Web 服務,所以在分析階段會先連至交通大學的代理伺服 器,經過帳號認證,通過之後再由代理伺服器的授權 Internet Protocol Address(IP

(54)

進行書目資料查詢,查詢結果再經由代理伺服器回傳至系統。

圖 3-15 存取 WOS Web Service 網路架構

WOS Web 服務提供 10 種作業(Operations),讓使用者自行撰寫程式利用

SOAP 簡單物件存取協定跟 WOS Web 服務進行資料查詢,本系統只使用

searchRetrieve 交易做為篇名及期刊名的查詢及比對,如表 3-2 WOS Web 服務

searchRetrieve 參數說明,使用 query 參數來查詢的範例如下: 一、查詢篇名,searchRetrieve("WOS", TI=((((“篇名篇名篇名篇名”)))), "", "", "", 1, 1, ""),因查 詢只要包含所查詢的篇名就會回傳結果,回傳的結果必需要再跟原本查詢的 篇名再比對字串是否完全一樣,以防止回傳的結果錯誤。 二、查詢期刊名,searchRetrieve("WOS", SO=((“期刊名( 期刊名期刊名期刊名”)))), "", "", "", 1, 1, ""), 跟查詢篇名一樣是包含來運算,故回傳結果也需再做一次的字串比對。

(55)

45

表 3-2 WOS Web 服務 searchRetrieve 參數說明

Parameter Description

databaseID Identifies the WOK resource that this request will search. The "Codes and Descriptions" document for this resource provides more

detailed descriptions of the other parameters in this document.

query The search expression in WOK advanced search format. Please see the "Query Expressions" section below for more information.

depth The time span that this search will cover such as 1week, or 2000-2002.

editions The editions that this search will cover.

sort The sort order for record retrieval.

firstRec The index of the first record this request will retrieve. The index of the initial record in the search result is 1.

numRecs The number of records this request will retrieve. If the number of records in the search result is less than this value, then this request

will return a smaller number of records. This value must not be

greater than 100.

fields The fields that will be retrieved for each record.

SOAP 簡單物件存取協定是基於 XML 的協定,故查詢結果回傳的 XML 資料更

利於程式的後續處理,其回傳的 XML 資料範例重點說明如表 3-3 WOS Web 服 務回傳 XML 內容。

數據

圖  1-1  研究流程
圖  3-3  系統架構為參考,將系統以功能區分設計成六個模組,最後在系統中較 為重要的參考文獻分析設計,於 3.3.4 參考文獻分析功能及 3.3.5 WOS Web 服務
圖  3-4  系統實體架構
圖  3-7  刊名資料庫作業流程
+7

參考文獻

相關文件

Wang, Solving pseudomonotone variational inequalities and pseudocon- vex optimization problems using the projection neural network, IEEE Transactions on Neural Networks 17

In this paper, we build a new class of neural networks based on the smoothing method for NCP introduced by Haddou and Maheux [18] using some family F of smoothing functions.

Define instead the imaginary.. potential, magnetic field, lattice…) Dirac-BdG Hamiltonian:. with small, and matrix

Programming languages can be used to create programs that control the behavior of a. machine and/or to express algorithms precisely.” -

• Since the term structure has been upward sloping about 80% of the time, the theory would imply that investors have expected interest rates to rise 80% of the time.. • Riskless

Microphone and 600 ohm line conduits shall be mechanically and electrically connected to receptacle boxes and electrically grounded to the audio system ground point.. Lines in

– evolve the algorithm into an end-to-end system for ball detection and tracking of broadcast tennis video g. – analyze the tactics of players and winning-patterns, and hence

Then using location quotient(L.Q.)to analyze of the basic industries in the metropolitan area, and population and employment multiplier of Hsinchu Area and Miaoli Area are analyzed