• 沒有找到結果。

商業資料庫收錄資源之分析與比較

第五章 檢索結果之分析與比較

第一節 商業資料庫收錄資源之分析與比較

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

72

承上述,因不同的資料庫與系統所收錄的相同題名文章的來源題名可能會有 所不同,故本研究在進行資料庫與系統的收錄資源重複性交叉比較時,比較的項 目只有作者、文章題名與年代三個欄位,依據此三項資訊判斷是否為重複資源。

相反的,在進行資料庫內部自我重複性分析時,本研究作為重複資源的判斷依據 項目有作者、文章題名、來源題名、資料類型與年代五項資訊。而系統的自我重 複性判斷依據則為作者、文章題名、來源題名與年代四項。茲針對資料庫與系統 的收錄資源,詳述如下。

第一節 商業資料庫收錄資源之分析與比較

本研究篩選出兩個商業資料庫(SCIE 與 Scopus)中 30 位杜林獎得主,從 1990 到 2012 年 10 月間出版的所有著作之後,分別計算兩個資料庫所收錄的資源,進 一步刪除兩個資料庫自我重複的資源;並以刪除自我重複資源後留下的資源,作 為最後比較評估之用。在分析兩個資料庫重複來源,本研究採用之比較項目為作 者、年代與資源題名三項。本節主要分析兩個資料庫個別資源收錄情形與其自我 重複性,再進行兩個資料收錄資源之交叉比對與分析。因各資料庫與系統的資料 來源非常多元,本研究及分析及列出資料來源筆數最多的前五名,詳細來源列表 皆於附錄 1 至 3 中呈現。此外,五個資料庫與系統各自所收錄的資料來源前五名 以及交叉比對中重複性最高的資料來源前五名的來源題名、來源類型、來源國家 及單位細項,皆於附錄 16 中呈現。

一、 個別商業資料庫之分析

本研究先分別針對 SCIE 與 Scopus 各自的收錄資源,分析其收錄筆數、自我 重複性與資料來源總數排名前五名。本研究資料庫收錄資源自我重複性的判斷依 據為作者、文章題名、來源題名、資源類型與年代五項。以下將分別針對 SCIE 與 Scopus 逐一說明。

(一) Science Citation Index Expanded (SCIE)

如表 5-1-1 所示,經過逐筆過濾並剔除著錄資訊不完整資源後,SCIE 所篩選 表 5-1-2 所示,來源最多者為 Lecture Notes in Computer Science,共有 40 筆資料;

第二名為 Communications Of The ACM,共有 35 筆資料;第三名為 Theoretical

Computer Science,共有 30 筆資料;第四名及第五名分別為 Information and Computation 及 Formal Methods in System Design,各有 29 筆及 25 筆。第一名和

第二名資料來源所占的比率分別為 3.5%及 3.0%;第三名至第五名所占的比率則

3 Theoretical Computer Science 30 2.6

4 Information and Computation 29 2.5

5 Formal Methods in System Design 25 2.2

(二) Scopus

由表 5-1-3 可知,從 Scopus 所過濾出完整及正確的資源筆數為 1,003 筆,經 過逐筆比對後,得到 Scopus 內部自我重複筆數為 15 筆,其中有一筆重複收錄 4 次,一筆重複收錄 3 次,扣除重複資源 15 筆後,Scopus 最後所得資源筆數為 988

Computation 及 Theoretical Computer Science,各共有 29 筆及 28 筆;第四名及第

五名分別為 Formal Methods in System Design 及 Electronic Notes in Theoretical

Computer Science,各共有 24 與 20 筆。第一名資料來源的比率高達 20%,而第

四名至第五名的資料來源所占比率分別為 2.9%、2.8%、2.4%及 2.0%。Lecture

Notes in Computer Science 為最多資料來源的主要原因應為,在 Scopus 所收錄的

來源中,大部來自專題叢書 LNCS 的資源,Scopus 都以 LNCS 著錄,而並非以

1 Lecture Notes in Computer Science 202 20.4

2 Information and Computation 29 2.9

3 Theoretical Computer Science 28 2.8

4 Formal Methods in System Design 24 2.4

5 Electronic Notes in Theoretical Computer Science 20 2.0

二、 交叉分析與比較

經過對個別商業資料庫(SCIE、Scopus)收錄資源的分析,本研究將進一步比 較其收錄資源分析結果,以探討兩者的差異性所在。本研究資料庫交叉比較來源 重複性的依據項目作者、文章題名與年代三項,而資料來源的重複性則僅以來源

的獨特性比 Scopus 高 8.1%。從資源可獲得性來看,Scopus 收錄的資源在 SCIE 的可獲得性為 57.3%,而 SCIE 所收錄的資源於 Scopus 的可獲得性則為 49.2%。 (詳見附錄 3)。如圖 5-1-6 所示,第一名為 Lecture Notes in Computer Science,共 有 40 筆,其所占比率為 8.1%;第二名為 Information and Computation,共有 29 筆,所占比率為 5.9%;第三名為 Theoretical Computer Science,共有 26 筆,所占 比率為 5.7%;第四名為 Formal Method in System Design, 共有 24 筆資料,所占 比率為 4.8%;最後一名為 Communications of the ACM,共有 19 筆資料,所的占 比率為 3.8%。其中,第二名和第三名的筆數只差一筆,即第二名比第三名多一 筆,其比率也非常接近。以來源類型來看,除了第一名的來源為專題叢書外,其 餘四名都為期刊。由此可見,在 SCIE 和 Scopus 所收錄的資料來源中,大部份的 重複資料來源類型都為期刊。SCIE - Scopus 的全部重複來源列表,詳見附錄 3。

2 Information and Computation 29 5.9

3 Theoretical Computer Science 28 5.7

4 Formal Methods in System Design 24 4.8

5 Communications of the ACM 19 3.8