• 沒有找到結果。

開放取用系統收錄資源之分析與比較

第五章 檢索結果之分析與比較

第二節 開放取用系統收錄資源之分析與比較

2 Information and Computation 29 5.9

3 Theoretical Computer Science 28 5.7

4 Formal Methods in System Design 24 4.8

5 Communications of the ACM 19 3.8

第二節 開放取用系統收錄資源之分析與比較

本研究三個開放取用系統(GS、MAS 與 CiteSeerX)收錄資源的自我重複性分 析與交叉比較重複性分析的進行方法,都與第一節商業資料庫(SCIE 與 Scopus) 收錄資源分析與比較的方法相同。本節主要亦為分析三個系統的收錄資源與其自

(一) Google Scholar (GS)

如表 5-2-1 所示,GS 篩選出的正確資料筆數為 1,307 筆,經過比對後,得到 GS 內部自我資源重複筆數為 57 筆。其中,重複三次的資源有 5 筆,扣除合重複 筆數 57 筆後,所得最後資料筆數為 1,250 筆,自我重複性為 4.4%。

筆;第三名為 Computer Aided Verification,共有 28 筆;第四名為 Communications

of the ACM,共有 27 筆;第五名為 Theoretical Computer Science,共有 24 筆。第

一名與第五名資料來源所占的比率分別為 2.7%、2.6%、2.2%、2.2%和 1.9%。以 來源類型來看,網路資源可能包含的資源類型非常多元,有期刊、書籍、會議論

3 Computer Aided Verification, proceedings 28 2.2

4 Communications of the ACM 27 2.2

5 Theoretical Computer Science 24 1.9

(二) Microsoft Academic Search (MAS)

由表 5-2-3 可知,MAS 篩選出的正確資料筆數為 972 筆。經過逐筆過濾比對

來源中,收錄最多資源的來源題名為 Computing Research Repository,共有 56 筆,

所占比率為 6.5%;第二名為 Communications of the ACM,共有 41 筆,所占比率 為 4.8%;第三名為 ALGOL Bulletin,共 31 筆,所占百分比為 3.6%;第四名為

Theoretical Computer Science,共有 27 筆,所比率為 3.1%;第五為 Information and Computation,共有 24 筆,所占比率為 2.8%。分析其來源類型,第一名為由 ACM、

arXiv.org e-print archive (originally at Los Alamos, now based at Cornell) 與 Networked Computer Science Technical Reference Library (NCSTRL)等機構所成立 的開放取用網站,主要提供電腦科學相關的資料,第二名至第五名的四個來源都 為期刊。MAS 全部的資料來源列表,詳見附錄 5。

表 5-2-4 MAS 資料來源

n=860

序號 來源題名 筆數 比率%

1 Computing Research Repository 56 6.5

2 Communications of the ACM 41 4.8

3 ALGOL Bulletin 31 3.6

4 Theoretical Computer Science 27 3.1

5 Information and Computation 24 2.8

(三) CiteSeerX

如表 5-2-5 所示,本研究在逐筆過濾後,所得 CiteSeerX篩選出的正確資源筆

Computer Aided Verification,所占比率為 4.0%;第三名為 Tools and Algorithms for the Construction and Analysis of Systems,所占比率為 3.2%;第四名及第五名分別

為 Information and Computation 與 Advances in Cryptology – CRYPTO,其所比率分 別為為 1.8%及 1.6%。此外,CiteSeerX收錄資料來源中,最多的網路資源,第二 名第三名及第五名的來源類型為會議論文,第四名則為期刊。CiteSeerX全部的資 料來源列表,詳見附錄 6。

表 5-2-6 CiteSeerX資料來源

n=500

序號 來源題名 筆數 比率%

1 網路資源 33 6.6

4 Computer Aided Verification 20 4.0

3 Tools and Algorithms for the Construction and Analysis of Systems 16 3.2

4 Information and Computation 9 1.8

茲針對 GS-MAS、GS-CiteSeerX與 MAS-CiteSeerX詳細說明如下:

(一) GS – MAS

in System Design 與 Topics in Cryptology - CT-RSA 的重複筆數相同,故一共列出 6

種資料來源。其中,第一名至第三名的重複筆數分別為 27 筆、19 筆及 15 筆,

2 Information and Computation 19 4.5

3 Electronic Notes in Theoretical Computer Science 15 3.6

4 Journal of the ACM 14 3.3

資源的可獲得性為則 64.0%。兩者重複性與獨特性比率相差 38.2%,即 CiteSeerX 的資源重複性比 GS 高,獨特性則比 GS 低。

4 Programming Languages and Systems, Transactions 9 3.1

5 Advances in Cryptology - CRYPTO 8 2.8

性比率為 80.5%,重複性則為 19.5%,CiteSeerX的獨特性比率為 66.4%,重複 性則為 33.6%。兩個系統的重複性及獨特性比率相差 13.9%,即 MAS 的獨特性 比 CiteSeerX高,重複性則比 CiteSeerX低。從資源可獲得性來看,在 MAS 收錄 的資源中,CiteSeerX資源的可獲得性為 33.6%,而在 CiteSeerX所收錄的資源中,

MAS 資源的可獲得性則為 19.5%。

4 ACM Transactions on Computer Systems 6 5.4

5 Theoretical Computer Science 6 5.4

6 Communications of the ACM 5 4.5

7 Lecture Notes in Computer Science 5 4.5

8 SIAM Journal on Computing 5 4.5

Scopus-CiteSeerX、Scopus-GS、Scopus-MAS 及 Scopus-CiteSeerX六個組合的交叉 比較與分析,茲說明如下: 筆。以比率來看,第一至五所占比率分別為 5.3%、4.7%、3.7%、2.9%及 2.7%。

以資料類型來看,第一名為雜誌,第二名及第四名為會議論文,第三名及第五名 為期刊。由於 SCIE 與 GS 的資料來源都較為多元,故其重複的資料來源類型也 相對較多。SCIE 與 GS 全部的重複資料來源列表,詳見附錄 10。