第五章 檢索結果之分析與比較
第二節 開放取用系統收錄資源之分析與比較
2 Information and Computation 29 5.9
3 Theoretical Computer Science 28 5.7
4 Formal Methods in System Design 24 4.8
5 Communications of the ACM 19 3.8
第二節 開放取用系統收錄資源之分析與比較
本研究三個開放取用系統(GS、MAS 與 CiteSeerX)收錄資源的自我重複性分 析與交叉比較重複性分析的進行方法,都與第一節商業資料庫(SCIE 與 Scopus) 收錄資源分析與比較的方法相同。本節主要亦為分析三個系統的收錄資源與其自
(一) Google Scholar (GS)
如表 5-2-1 所示,GS 篩選出的正確資料筆數為 1,307 筆,經過比對後,得到 GS 內部自我資源重複筆數為 57 筆。其中,重複三次的資源有 5 筆,扣除合重複 筆數 57 筆後,所得最後資料筆數為 1,250 筆,自我重複性為 4.4%。
‧
筆;第三名為 Computer Aided Verification,共有 28 筆;第四名為 Communicationsof the ACM,共有 27 筆;第五名為 Theoretical Computer Science,共有 24 筆。第
一名與第五名資料來源所占的比率分別為 2.7%、2.6%、2.2%、2.2%和 1.9%。以 來源類型來看,網路資源可能包含的資源類型非常多元,有期刊、書籍、會議論3 Computer Aided Verification, proceedings 28 2.2
4 Communications of the ACM 27 2.2
5 Theoretical Computer Science 24 1.9
(二) Microsoft Academic Search (MAS)
由表 5-2-3 可知,MAS 篩選出的正確資料筆數為 972 筆。經過逐筆過濾比對
‧
來源中,收錄最多資源的來源題名為 Computing Research Repository,共有 56 筆,所占比率為 6.5%;第二名為 Communications of the ACM,共有 41 筆,所占比率 為 4.8%;第三名為 ALGOL Bulletin,共 31 筆,所占百分比為 3.6%;第四名為
Theoretical Computer Science,共有 27 筆,所比率為 3.1%;第五為 Information and Computation,共有 24 筆,所占比率為 2.8%。分析其來源類型,第一名為由 ACM、
arXiv.org e-print archive (originally at Los Alamos, now based at Cornell) 與 Networked Computer Science Technical Reference Library (NCSTRL)等機構所成立 的開放取用網站,主要提供電腦科學相關的資料,第二名至第五名的四個來源都 為期刊。MAS 全部的資料來源列表,詳見附錄 5。
表 5-2-4 MAS 資料來源
n=860
序號 來源題名 筆數 比率%
1 Computing Research Repository 56 6.5
2 Communications of the ACM 41 4.8
3 ALGOL Bulletin 31 3.6
4 Theoretical Computer Science 27 3.1
5 Information and Computation 24 2.8
(三) CiteSeerX
如表 5-2-5 所示,本研究在逐筆過濾後,所得 CiteSeerX篩選出的正確資源筆
‧ Computer Aided Verification,所占比率為 4.0%;第三名為 Tools and Algorithms for the Construction and Analysis of Systems,所占比率為 3.2%;第四名及第五名分別 為 Information and Computation 與 Advances in Cryptology – CRYPTO,其所比率分 別為為 1.8%及 1.6%。此外,CiteSeerX收錄資料來源中,最多的網路資源,第二 名第三名及第五名的來源類型為會議論文,第四名則為期刊。CiteSeerX全部的資 料來源列表,詳見附錄 6。
表 5-2-6 CiteSeerX資料來源
n=500
序號 來源題名 筆數 比率%
1 網路資源 33 6.6
4 Computer Aided Verification 20 4.0
3 Tools and Algorithms for the Construction and Analysis of Systems 16 3.2
4 Information and Computation 9 1.8
茲針對 GS-MAS、GS-CiteSeerX與 MAS-CiteSeerX詳細說明如下:
(一) GS – MAS
‧ in System Design 與 Topics in Cryptology - CT-RSA 的重複筆數相同,故一共列出 6 種資料來源。其中,第一名至第三名的重複筆數分別為 27 筆、19 筆及 15 筆,
2 Information and Computation 19 4.5
3 Electronic Notes in Theoretical Computer Science 15 3.6
4 Journal of the ACM 14 3.3
‧
資源的可獲得性為則 64.0%。兩者重複性與獨特性比率相差 38.2%,即 CiteSeerX 的資源重複性比 GS 高,獨特性則比 GS 低。4 Programming Languages and Systems, Transactions 9 3.1
5 Advances in Cryptology - CRYPTO 8 2.8
‧
性比率為 80.5%,重複性則為 19.5%,CiteSeerX的獨特性比率為 66.4%,重複 性則為 33.6%。兩個系統的重複性及獨特性比率相差 13.9%,即 MAS 的獨特性 比 CiteSeerX高,重複性則比 CiteSeerX低。從資源可獲得性來看,在 MAS 收錄 的資源中,CiteSeerX資源的可獲得性為 33.6%,而在 CiteSeerX所收錄的資源中,
MAS 資源的可獲得性則為 19.5%。
4 ACM Transactions on Computer Systems 6 5.4
5 Theoretical Computer Science 6 5.4
6 Communications of the ACM 5 4.5
7 Lecture Notes in Computer Science 5 4.5
8 SIAM Journal on Computing 5 4.5
‧
Scopus-CiteSeerX、Scopus-GS、Scopus-MAS 及 Scopus-CiteSeerX六個組合的交叉 比較與分析,茲說明如下: 筆。以比率來看,第一至五所占比率分別為 5.3%、4.7%、3.7%、2.9%及 2.7%。以資料類型來看,第一名為雜誌,第二名及第四名為會議論文,第三名及第五名 為期刊。由於 SCIE 與 GS 的資料來源都較為多元,故其重複的資料來源類型也 相對較多。SCIE 與 GS 全部的重複資料來源列表,詳見附錄 10。