• 沒有找到結果。

第二章 文獻探討

第四節 資料重複性與獨特性之探討

CiteSeerX文獻收錄的方式亦如同 CiteSeer,以網路搜尋引擎自動化搜尋網頁 方式,搜尋包含 ps 和 PDF 格式存在的學術文獻並加以儲存,以提供需求者使用。

(註 57)除此之外,CiteSeerX還搜尋研究者網頁或機構的技術報告檔案,提供多元 化的資源於使用者。使用搜尋引擎的優點為可結合多個網路搜尋引擎的資料,能 搜尋到的資料勝過單一搜尋引擎,且可直接過濾文獻以避免重複。與 CiteSeerX 合作的其他搜尋引擎包含 Google Scholar、Yahoo!、Ask、Bing、CSB 及 Libra,

可由結果顯示頁面的右邊,直接點選欲進一步搜尋的檢索系統,查詢同樣的資料。

所收錄的資源,除了搜尋引擎自動化搜尋網路資源外,CiteSeerX還提供研究者將 研究成果自由分享到平台的機制。

第四節 資料重複性與獨特性之探討

相同文章同時被二種或二種以上資料庫收錄之數目的比率;或相同期刊被二 種或二種以上資料庫同時收錄之數目的比率都可稱之為重複性(overlap)。

Bardford 為資訊科學領域最早從事重複性相關研究之學者,Martyn 則為 1960 年 代中期,為最早發展重複性理論與進行期刊涵蓋重複性研究的學者。雖然 Bardfor、

Glass 與 Orr&Crouse 等學者比 Martyn 更早從事重複性相關的研究,但這些研究 都未涵蓋很多主題領域及未曾提出理論性的架構。(註 58)

其後,有一些學者曾分析化學、物理、生物、心理等領域的收錄重複性,但 這些研究亦未提出任何較複雜的統計技術或方法。1997 年,Bearman 及 Kumberger 認為主要問題為資料的收集,因為當時的自動化書目系統及搜尋演算法還在發展 初期,大部份作品的摘要都非機讀格式,而從文獻出現於主要期刊到成為二次來 源,其時間延誤差距非常大;再者亦缺乏引文書目標準。(註 59)

了分析農業書目(Bibliography of Agriculture, BOfA)的相關重複性外,其比較 BOfA 和其他 15 個二次來源間的覆蓋範圍,並提出了在沒有標準書目記錄格式 下比較書目記錄的問題,其中包括不同資料庫的收錄文獻書目記錄的限制,例如:

字譯(transliteration)、詞彙拼法(variable spellings)、作者名稱的呈現方式、沒 有統一的資料結構和資料結構合併不一致。(註 60)

1970 年代,Flanagan 等研究者開始分析二次來源的重複性,針對 Biological Abstracts(BA)、Chemistry Abstracts(CA)和 Engineering Index(EI)三個資料庫,設 計了五個階段的研究,分別為:(1)列出每個資料庫收錄期刊中重複的期刊;(2)

1976 年,Larson 等人進行了第三階段的研究,發現因三個資料庫檔案結構 差異性太大,故造成紙本格式無法統一,最後並提出資料庫應加強資料互通性的 建議。(註 64)

Bearman 為 首 位 使 用 因 素 分 析 ( factor analysis ) 與 多 維 量 尺 分 析 (multidimensional scaling, MDS)兩種統計技術來分析重複資料的學者,他以包含 CA、BA 及 EI 在內的 14 個資料庫進行收錄重複性研究,主要之兩個研究結果為:

14 個資料庫所收錄之 26,000 種期刊中,只有 5,466(21%)有潛在的重複性,有

23.4%為相對文章重複性(two-way relative overlap),且可信度高達 95%以上。(註 65)

Poyer 對 Index Medicus、Science Citation Index、Biologicla Abstracts 及 Chemical Abstracts 進行期刊標題重複性研究,結果發現在 7,969 篇期刊文章中,

有 92% 被其中至少兩個資料索引; 591 篇文章被其中一個資料庫收錄以及 55 篇 文章沒有索引。(註 66)

Maryellen與Andrew探討「資訊科學摘要(Information Science Abstracts, ISA)」

索引的一致性滿研究,結果顯示有將近一半的索引是完全一致的。ISA的索引政

Hood以1965年至1993年間與模糊集合論(Fuzzy Set Theory)相關的主題文獻 為本調查個案研究的對象,調查線上書目資料庫的書目記錄分布情形。該研究透 (Library and Information Science Abstracts, LISA)」與「圖書資訊學文獻索引 (Library Literature and Information Science,又稱為Library Literature)」為對象,

研究三者在1999至2000年間索引摘要文獻的主題範圍、重複性與資料類型等收錄

Walters與Wilder調查「晚年遷徙」(later-life migration)跨領域學科的相關文獻,

以評鑑12個不同資料庫索引摘要該領域文獻的表現。研究結果顯示佔該領域文獻 出版量40%的5種期刊中,3種屬社會老人學(social gerontology)、1種屬鄉村社會 學(rural sociology)、1種為區域科學(regional science);出版最多晚年遷徙文獻的 學科不見得是索摘收錄得最完善的學科,且4個跨領域資料庫較其他單一學科資

Gavel 和 Lars 針對 Web of Science(WOS)和 Scopus 兩個資料庫進行了期刊重 複的比較研究。其期刊名單來源為資料庫建置者提供而非研究者自己檢索資料庫 而來,而且該名單也不含任何有關收錄範圍的深度及一致性。(註 75)因此,任 何有關名稱的錯誤都會反映在研究結果裡。該研究發現不僅提供了有關收錄範圍 的測量,還發現了其獨特的資源。此研究方法可以快速的比較兩個資料庫的內容,

是一個適合用來分析資料庫收錄範圍的方法。(註 76)

Guerrero 和 Escalona 針對 IEL(IEEE/IET Electronic Library), INSPEC 及

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

23

PASCAL 進行三個資料庫有關工程領域內容的重複性和涵蓋性之比較研究,研究 結果發現 INSPEC 的涵蓋性最高(近 50%的文獻和超過 50%的來源)以及與其 它資料庫的重複性為 30%以上。(註 77)

由此可見,資料重複性與獨特性的研究十分廣泛,其研究之資料來源包含出 版社、資料庫、搜尋引擎;而資源類型則具有期刊、會議論文、學位論文、網路 資料、專利資源等。前述資訊資源都是可研究重複性與獨性性的範疇。

註23、Robert C. Denicola, “Copeyright and Open Access: Reconsidering University Ownership of Faculty Research,”Nebraska Law Review85, 2(2010):353-354.

註24、同註20,9。

3期( 2009):69。68-81

註34、蘇諼,「網路資源的引文分析與學術傳播」,引文分析與學術評鑑研討會(台 北市:政大,2004),16。16-34

註40、ZhouChunlei,“Citation Recommendation Analysis: A New Citation Analysis Approach,” Journal of the China Society for Scientific and Technical

Information 29, no. 4 (2010): 671-678.

註41、同註33,70。

註44、方紅玲,「2012年SCIE收錄眼科學期刊及其文獻計量學指標統計分析」,中 國科技期刊研究23卷,5期(2012):771-775。

註45、邱均平、葉曉峰、熊尊妍「國外索引工具的發展趨勢__以Scopus為例」,

中國索引6卷,1期(2008):2-14。

註46、SciVerse, “What does Scopus cover,”

http://www.info.sciverse.com/scopus/scopus-in-detail/facts (accessed Dec 18, 2012)

註47、SciVerse, “Content Selection for Scopus,”

http://www.info.sciverse.com/scopus/scopus-in-detail/content-selection (accessed Dec 18, 2012)

註48、J. Péter, “Google Scholar: The pros and Cons”,Online Information Review 29, no. 2(2005): 208-214.

註49、M. William and P. Rita, Google Scholar and More: New Google Applications

and Tools for Libraries and Library Users (Routledge, 2009), 14.

註50、D. Naill O, Internet Research Skills: How to Do Your Literature Search and

Find Research Information Online (Los Angeles: Sage Publications,

2007)31-32.

註51、馬建玲、田曉陽,「Google Scholar引文檢索功能評析」,科技查新與文獻 檢索19卷,12期(2010):67-68。

註52、D. Lee, “Microsoft Academic Search:Next-Generation Scholarly

Discovery,” http://www.slideshare.net/leedirks/microsoft-academic-search-overview-at-nfais-2012-lee-dirks(accessed Dec 20, 2012)

註53、Microsoft Academic , “Search, Help

Center,”http://academic.research.microsoft.com/About/Help.htm#2(access ed Dec12,2012)

註54、同註53。

註55、馬雪,「CiteSeerx: 免費獲取計算機類外文科技文獻的搜索利器」,內蒙古 科技與經濟,21期(2009):131。

註56、CiteSeerX, “About CiteSeeX,” http://csxstatic.ist.psu.edu/about(accessed Dec 20, 2012)

註57、同註53。

註58、G. Myke,“ A Review of Journal Coverage Overlap with an Extension to the Definition of Overlap,”Journal of the American Society for Information

Sciecne41, no. 1(1990): 43.

註59、B. C. Toni and K. A. William,A Study of Coverage Overlap Among Fourteen

Major Science and Technology Abstracting and Indexing

Services,(Philadelphia: National Federation of Abstracting and Indexing

Service, 1977)

註60、B. P. Charles et al.,“Study and Comparison of Indexing of the Bibliography of Agriculture in Relation to the Indexing of Fifteen other Secondary

Source,”U.S. Government Research and Development Repot IGC-PA-69-40(1969)

註61、W. L. James, F. Carolyn and H.E. Kennedy, “Overlap in the List of Journals Monitored by BIOSIS, CAS, Ei,” Journal of the American Society for

Information Science23(1972): 36-38

註62、同註61,25-28。

註63、同註62。

註64、L. R. Julian et al., “Comparison of Printed of Bibliographic Descriptions Distributed by BIOSIS, CAS, and Ei,”Journal of the American Society for

Information Science 27(1976): 46-52.

註65、同59。

註66、P. K. Robert K., “Journal Article Overlap among Index Medicus, Science Citation Index, Biological Abstracts, and Chemical Abstracts,” Bulletin of the

Medical Library Association72, no. 4 (1984): 353-357.

註67、S. C. Maryellen and A. J. Mark,” Indexing Consistency in Information Science Abstracts,” Journal of the American Society for Information Science 42 (1991):1-6.

註68、同註67。

註69、H. W. William, “An Informetrics study of the distribution of bibliographic records in online database: A case study using the literature of Fuzzy Set Theory (1965-1993),” (Ph.D. diss., The University of New South Wales, 1998)

註70、同註69。

註71、R. Eleanor and S. Craig, “Searching for library and InformationScience Literature: aComparison of Coverage in Three Databases,”LibraryComputing 19 (2000):118-126.

註72、同註71。

註73、W. H. Williamand W. I. Esther,“Bibliographic IndexCoverageof a Multidisciplinary Field,”Journal of theAmerican Society forInformation

Scienceandtechnology54, no. 14 (2003):1305-1312.

註74、陳薇竹,「引用文獻索引資料庫之比較研究」(碩士論文,政治大學,2007) 註75、G. Ylva and I. Lars, “Web of Science and Scopus: a Journal Title Overlap

Study,”Online Information Review32, no. 1 (2008): 8-21.

註76、同註75。

註77、G. Antonio and E.Fernandez‏, “Measurement of the Overlapping in Three Databases with Information on Engineering,”Anales de Documentacion10, (2007): 335-344.

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

28

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

29