• 沒有找到結果。

收錄資源與資料來源之綜合分析與比較

第五章 檢索結果之分析與比較

第四節 收錄資源與資料來源之綜合分析與比較

7 Uncertainty in Artificial Intelligence 6 3.4

8 Communications of the ACM 5 2.8

9 Embedded Software, Proceedings 5 2.8

10 Foundations of Computer Science 5 2.8

11 Logic in Computer Science, Symposium 5 2.8

12 SIAM Journal on Computing 5 2.8

亦為當中最少。歸納其原因為,CiteSeerX本身對資料檢索結果的顯示量有所限制 (最多 200 筆)、強調全文的取得、因學科領域的限制而影響收錄資料量以及收錄

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

91

1.5%。而開放取用系統的資源主要利用系統的搜尋器搜尋網頁資源而來,為系統 主動抓取資料,重複性會較高。而 CiteSeerX因所檢索到的資源筆數比較少,故 其自我重複性也比其他系統低。

由表 5-4-2 可知,在資料庫與系統兩兩交叉相比的比較中,重複性資源最高 的為 SCIE 與 Scopus,共 566 筆重複資源,即兩個資料庫有一半以上的資源為重 複資源。第二名為 SCIE 與 GS,共有 555 筆資源重複;第三名為 Scopus 與 GS,

共 553 筆;第四名為 GS 與 MAS,共 504 筆;第五名為 Scopus 與 MAS,共 407 筆;第六名為 SCIE 與 MAS,共 393 筆;第七名為 GS 與 CiteSeerX,共 292 筆;

第八名為 SCIE 與 CiteSeerX,共 292 筆;第九名為 Scopus 與 CiteSeerX,共 246;

第十名為 MAS 與 CiteSeerX,共 168 筆。從資料重複性的筆數量來看,第二名至 第七名都為 GS 與其他資料庫與系統的比較,第七名至第十名為 CiteSeerX與其他 資料庫與系統的比較。由此可見,收錄資源筆數越多,涵蓋其他資料庫與系統資 源的量就越大,故 GS 為涵蓋其他資料庫與系統資源量最多的系統。

表 5-4-1 資源自我重複性排名

序號 名稱 資源總數 重複資源數 重複性%

1 MAS 860 271 11.5

2 GS 1,250 52 4.4

3 CiteSeerX 500 13 2.5

4 SCIE 1,150 17 1.7

5 Scopus 988 12 1.5

SCIE 較 CiteSeerX高 33.0%;第三名為 Scopus 與 CiteSeerX,,Scopus 比 CiteSeerX 高出 24.3%;第四名為 GS 與 MAS,GS 比 MAS 高 18.3%;第五名為 MAS 與 CiteSeerX,MAS 較 CiteSeerX高 14.1%;第六名為 SCIE 與 MAS,SCIE 比 MAS 高 11.5%;第七名為 Scopus 與 GS,GS 比 Scopus 高出 11.8%;第八名為 SCIE 與 Scopus,SCIE 比 Scopus 高 8.1%;第九名為 Scopus 與 MAS,Scopus 比 MAS 高 6.1%;第十名為 SCIE 與 GS,GS 比 SCIE 高 3.9%。從資源獨特性來看,在所 有的交叉比較組合中,整體上 GS 的資源獨特性都比其他資料庫和系統高,而 SCIE 除了比 GS 低 3.9%之外,其資源獨特性較 Scopus、MAS 與 CiteSeerX為高。

Scopus 的資源獨特性則比 MAS 和 CiteSeerX高,MAS 的資源獨特性也比 CiteSeerX 高,故資源獨特性最低為 CiteSeerX。從資源獨特的排名也可看出,資料庫與系

種來源中,SCIE、Scopus、MAS、CiteSeerX,重複收錄的資料來源為:美國 Academic Press 所出版的 Information and Computation; SCIE、Scopus、GS、MAS 重複收 錄的來源為荷蘭 Elsevier BV 所出版的期刊 Theoretical Computer Science;SCIE、

GS、MAS 收錄的重複來源為美國 Association for Computing Machinery, Inc. (ACM) 所出版的期刊 Communication of the ACM。在資料來源前五名中,SCIE 與 Scopus 同時所收錄的來源還有,德國 Springer 所出版的專題叢書(series) Lecture Notes in

Computer Science, LNCS 與期刊 Formal Methods in System Design;GS 和 CiteSeer

X 同時收錄的來源除了網路資源外,還有收錄於德國 Springer 所出版的專題叢書 LNCS 之下的子叢書(subseries) Security and Cryptology 中的會議論文集 Computer

Aided Verification。

除了共同收錄的資料來源外,在前五名的 14 種來源中,只有 GS 有收錄的 來源有美國康乃爾大學(Cornell University)所建置的開放取用網站 “arXiv.org”;

僅有 Scopus 收錄的來源有荷蘭 Elsevier BV 所出版的期刊 Electronic Notes in

Theoretical Computer Science;MAS 還收錄了英國 International Federation for

Information Processing (IFIP)所出版的期刊 ALGOL Bulletin 與美國 ACM 所建置的 開放取用網站 Computing Research Repository。在 14 種來源中,只有 CiteSeerX, 收錄的資料來源則有同樣為收錄於德國 Springer 所出版的專題叢書 LNCS 之下的 子叢書中的會議論文,其分別為收錄於 Security and Cryptology 中的 Advances in

Cryptology - CRYPTO 和 Topics in Cryptology - CT-RSA 以及收錄於 Theoretical

Computer Science and General Issues 中的 Tools and Algorithms for the Construction

and Analysis of Systems。

1 Information and Computation 期刊 美 Academic Press SCIE、Scopus、

MAS、CiteSeerX 2 Theoretical Computer Science 期刊 荷 Elsevier BV SCIE、Scopus、GS、

MAS

3 Communications Of The ACM 雜誌 美 ACM SCIE、GS、MAS

4 Formal Methods in System Design 期刊 德 Springer SCIE、Scopus 5 Lecture Notes in Computer Science 叢書 德 Springer SCIE、Scopus 6 Computer Aided Verification 會議論文 德 Springer GS、CiteSeerX

7 網路資源 - - - GS、CiteSeerX

8 arXiv.org - 美 Cornell Uni. GS

9 ElectronicNotes in Theoretical

Computer Science 期刊 荷 Elsevier BV Scopus

10 ALGOL Bulletin 期刊 英 IFIP MAS

11 Computing Research Repository 網站 美 ACM MAS

12 Advances in Cryptology - CRYPTO 會議論文 德 Springer CiteSeerX 13 Tools and Algorithms for the

Construction and Analysis of Systems

會議論文 德 Springer CiteSeerX

14 Topics in Cryptology - CT-RSA 會議論文 德 Springer CiteSeerX

與陳薇竹 2006 年〈引用文獻索引資料庫之比較研究〉之研究結果比較,相 同之處有以下三點(1)以資源完整性的排名,本研究之研究結果同樣為 GS 最多,

SCIE 排名第二、Scopus 排名第三以及 CiteSeerX最少,GS 仍為涵蓋其他資料庫 與系統資源量最多的系統;(2) CiteSeerX,因收錄資源量較少,與其他資料庫與 系統資源重複性也相對較低,但如果以重複性百分比來看,則 CiteSeerX所收錄 的資源於其他資料庫與系統的可獲得性為 30%以上;(3) SCIE 為重複性最低的資 料庫,但本研究 SCIE 的自我重複率為 1.7%,比其研究之 3%少 2%。相異之處

Guerrero 和 Escalona 針對 IEL(IEEE/IET Electronic Library), INSPEC 及 PASCAL 進行三個資料庫有關工程領域內容的重複性和涵蓋性之比較研究,研究

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

96

精度不高:搜尋引擎的檢索結果包含很多相關度低、無效的連結、書目資料不全 的資料,其查準率低於資料庫。

分析與比較五個資料庫與系統收錄資源的完整性、重複性與獨特性,發現資 料涵蓋量最高的排名為 GS(1,250 筆)、SCIE(1,150 筆)、Scopus(988 筆)、MAS(860 筆)及 CiteSeerX (501 筆),故 GS 為涵蓋其他資料庫與系統收錄資源最多的系統。

以資料自我重複性來看,自我重複性百分比較高之排名則為 MAS(11.5%)、

GS(4.4%)、CiteSeerX (2.5%)、SCIE(1.7%)與 Scopus(1.5%)。SCIE 與 Scopus(566 筆)、SCIE 與 GS(555 筆)、Scopus 與 GS(553 筆)、GS 與 MAS(504 筆);Scopus 與 MAS(407 筆)、SCIE 與 MAS(393 筆)、GS 與 CiteSeerX (292 筆)、SCIE 與 CiteSeerX (292 筆)、Scopus 與 CiteSeerX (246 筆);重複筆數最少的組合為 MAS 與 CiteSeerX, 共 168 筆。GS 因資源涵蓋量最多,與其他資料庫與系統收錄資源的重複筆數會 較多;相反地,CiteSeerX則因資源涵蓋量最少,與其他資料庫與系統收錄資源的 重複筆數亦會較少。以資料來源得獨特性來看,SCIE 與 Scopus 收錄的資料來源 都為正式出版之期刊與叢書等。而 GS、MAS 與 CiteSeerX因沒有收錄標準,其 所涵蓋的資料來源種類比 SCIE 與 Scopus 多元,也較具有獨特性。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

97

註釋

註88、同註74。

註89、G. Antonio Guerreroand F. Escalón ‏, “Measurement of the Overlapping in Three Data Bases with Information on Engineering,” Anales de

Documentacion10, (2007): 335-344.

註90、W. H. William and W. I. Esther,”Bibliographic IndexCoverageof a Multidisciplinary Field,”Journal of theAmerican Society forInformation Scienceandtechnology54 (14) (2003):1305-1312.

註91、邱均平等,「網路計量學」(北京:科學,2010):126-129。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

98

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

99