• 沒有找到結果。

第四章 期刊評選決策支援系統

4.2 引文統計模組

4.2.1 參考文獻整理

將上述1,005 篇博碩士論文之參考文獻,92 學年度 4,814 筆、93 學年度 6,426 筆、94 學年度 7,163 筆、95 學年度 4,543 筆、96 學年度 4,070 筆,合 計27,016 筆,除去不正常之斷行,整理成整齊之純文字檔案,如圖 4-4。

圖 4- 4 參考資料純文字檔

46

其次,將整理完成之檔案匯入系統,進行資料比對及統計作業。可由「引文 作業」中,選取「引文資料上傳」以上傳欲分析之參考資料(圖 4-5);然後,至

「引文資料校正」下選取欲分析之參考資料學年度(圖 4-6),本研究採分學年度 方式進行校正及分析,以利分學年度統計。

圖 4 -5 參考資料上傳畫面

圖 4- 6 參考資料上傳後分學年選取畫面

參考資料匯入系統後,系統將依下列原則,對匯入之參考資料進行初步 判定(結果如圖 4-7),判定原則及步驟如下:

引文資料上傳及校正

47

一、 西文期刊分析:首先分析取得可能的期刊名稱,再與刊名資料庫比對來 確定是否為西文期刊及確定其刊名,如未比對到則進行可能期刊名比對 WOS 程序,如還是未比對到刊名,再進行篇名比對 WOS 程序。

(一) 分析引文資料的期刊名程序,利用下列三種方法來分析出可能的期 刊名稱:

1. 尋找引文資料內是否有 VOL.,如有則取 VOL.前的雙引號跟逗 號之間的字為可能期刊名。

2. 引文資料無雙引號,則找倒數第二個逗號到往前句號中間為可 能期刊名。

3. 引文資料以逗號、句號及雙引號當成分割點,取第二長的字串 當成可能的期刊名。

(二) 刊名資料庫的比對程序,將分析出來的可能為期刊名的字串跟刊名 資料庫比對,比對結果存在刊名資料庫的可能期刊名才算正確分 析出期刊名,並將引文資料類型設定為西文期刊。在比對之前需 做字串整理,如去除標點符號、特殊字元及一些停用字(Stop Word),目的在增加比對的正確率。

(三) Web of Science(WOS) 刊名比對程序,上個程序未比對到確定的期刊 名時執行正程序,將上個程序分析出來的可能期刊名送至WOS 查 詢,查詢該期刊的文章一筆,來判定是否有該期刊存在。

(四) 分析引文資料的期刊篇名程序,西文期刊分析程序及 WOS 刊名比 對程序都未比對出期刊名時,才執行本程序及下個程序WOS 篇名 比對程序,利用下列二種方法來分析出可能的期刊篇名:

48

1. 引文資料有雙引號時,利用雙引號當成分割點,取最長的字串當 成可能的篇名。

2. 引文資料無雙引號時,利用逗號及句號當成分割點,取最長的字 串當成可能的篇名。

(五) Web of Science(WOS) 篇名比對程序,方法為利用上個程序分析出的 可能期刊篇名送至WOS 查詢,查詢是否有該篇名的文章,如有回 傳資料則取得該文章的所屬期刊名稱。

二、 引文類型分析:主要功能在於分析判別引文類型,可判別的類型有網路 資源、會議論文集以及可能為西文期刊或會議論文集,已判定為西文期 刊的引文資料不執行該模組。

(一) 網路資源分析判別程序,檢查引文資料是否有 HTTP:或 HTTPS:字 串,如包含有該字串即判定類型為網路資源。

(二) 會議論文集分析判別程序,檢查引文資料是否有字串

CONFERENCE、CONF.、PROCEEDINGS、PROC.、 SYMPOSIUM 及SYMP.,如包含其中的字串即判定類型為會議論文。

(三) 可能為西文期刊或會議論文集分析判別程序,檢查引文資料是否有 字串PP.,如包含該字串即判定類型為西文期刊或會議論文集。

三、 刊名資料庫比對引文資料:利用刊名資料庫來反向比對引文資料,如刊 名資料庫內的期刊名字串包含在引文資料內,即判定為西文期刊(由期刊 清單比對參考文獻)。

49

分析狀態 全部筆數 已確認筆數 未確認 已確認

分析不出待判定* 591 0 確認 修改

期刊(自動對到 TITLE) 647 40 確認 修改 期刊(未比對到 TITLE)* 254 0 確認 修改 期刊(由期刊清單比對參考文獻)* 597 0 確認 修改

期刊(由刊名比對 WOS)* 9 0 確認 修改

期刊(由篇名比對 WOS)* 252 0 確認 修改

會議論文集(自動) 1246 0 確認 修改

可能為會議論文或期刊(自動)* 68 0 確認 修改

網路資源(自動) 406 0 確認 修改

圖 4 - 7 未修改前系統自動分析之類別畫面