• 沒有找到結果。

二、開放取用系統概說

第三節 資料庫重複性與獨特性探討之相關研究

提出來做討論38。有些學者認為傳統重複性(Traditional Overlap, TO)39指的是文章在 兩個以上的資料庫中出現,而另外相反的分散(scatter)理論由 Yerkey 及 Glogowski

36劉金銘,「Highwire 出版社評介—一個最好的學術期刊線上出版平臺」,中國科技期刊研究 20(6)

(2009):頁 1012~1016。

37 “Highwire”:< http://highwire.stanford.edu/lists/>(檢索於 2013 年 6 月 23 日)。

38 Samuel C. Bradford,” The Extent to which scientific and technical literature is covered by present abstracting and indexing periodicals,” Chemistry and Industry, 23(1937):p947-951.

39 Myke Gluck,” A Review of Journal Coverage Overlop with an Extension to the Definition of Overlap,”,Journal of the American Society for Information Science,41(1) (1990):p43-60.

TO)。另外,Martyn 又使用被子植物分類法(angiosperm taxonomy)之中的 20 個主題 去分析其各來源間的多元重複性。作者提出索引與摘要資料庫間重複性的優點,並 用相關重複性的單向理論【overlap with BofA=(# in A intersect BofA)/ (# in BofA)】進 行統計計算。Bourne 發現 BofA 中有 54%的引用文獻是唯一的,但是有 24%的引用

Chemical Abstracts(CA)及 Engineering Index(EI)三個資料庫作研究。首先,於三個資 料庫中選出重複的期刊,並且分析其為何相同的理由。接著對於三個資料庫中資料 的收錄及著錄政策的不同及差異性做測量,測量其檔案經由電腦判讀的互通性如

40 Neil Yerkey & Maryruth Glogowski, “Scatter of library and information science topics among

bibliographic data bases,” Journal of American Society for Information Science 41(4) (1990):p245-253.

41 James Martyn, “Tests on abstracts journals: Coverage overlap and indexing,” Journal of Documentation, 23(1967):p45-70.

42 Charles P Bourne.,” Characteristics of Coverage by the Bibliography of agriculture of the literature relating to agricultural research and development,” in Clearinghouse for Federal Scientific and Technical Information, Springfield, Va.22151(1969).

Wood 針對 BIOSIS、CAS、EI 三個資料庫進行研究,其由三個資料庫中選出 14,592 種期刊並對其進行標題欄位的分析。結果顯示 1%的期刊同時被三資料庫收錄,而 Medicus(IM)、Science Citation Index(SCI)、Biological Abstrasts(BA)及 Chemical Abstracts(CA)四個資料庫進行資料重複性的研究。其收集了生物化學、免疫學、解 剖學、病理學、微生物學、生理學及藥理學之文獻,從中選出 652 種期刊中 7,969 篇期刊文章為樣本進行四資料庫的搜尋比對。結果是 SCI 的文章最完整,共有包含 94.8%的書目,而且有 91.9%的參考書目是重複的情況;Index Medicu 收錄的資料獨 特性最高。Poyer 歸納出資料庫間的重複性受資料庫更新的時間、期刊標題選擇及 資料庫收錄政策的影響47

1985 年,LaBorie 以 Informetrics 期刊當對象,針對四個資料庫 Information Science Abstracts(ISA)、Library Literature、LISA 及 Abstract Journal 間的重複性做研 究,結果發現 ISA 其收錄的資料最完整,Library Literature 收錄的標題最少,並且 發現 LISA 和 Library Literature 收錄之重複性最高約占 25.4%48。而 1989 年 Nicholls 對於圖書資訊領域(LIS)的四個資料庫:LISA、ERIC、Library literature 及 Information Science Abstracts(ISA)做了比較,檢索出涵蓋 1984 年當年的圖書及文獻資源共有 50

43 James L. Wood ,Carolyn Flanagan& H. E. Kennedy ,“Overlap in the List of Journals monitored by BIOSIS, CAS,Ei,” Journal of the American Society for Information Science,23(1972):p36-38.

44 James L. Wood, Carolyn Flanagan& H. E. Kennedy, “Overlap among the Journal articles selected for coverage by BIOSIS, CAS, EI,”Journal of the American Society for Information Science24(1973):p25-28.

45 Larson Julian R. etc..,“Comparison of printed bibliographic descriptions distributed by BIOSIS, CAS, EI,” Journal of the American Society for Information Science,27(1976):p46-52.

46 Tamas Doszkocs ,” Estimating citation overlap in a milti-file retrieval system,” in Information Management in the 1980’s: Proceedings of 40th ASIS Annual Meeting Chicago, vol.14(White Plains,N.

Y. :Knowledge Industry Publications for American Society for Information Science,x) (1977).

47 Robert K. Poyer,” Journal Article Overlap Among Index Medicus, Science Citation Index, Biological Abstracts, and Chemical Abstracts,”Bulletin of the Medical Library Association 72(4) (1984):p353-357.

48 Tim LaBorie etc., “Library and information science abstracting and index service: coverage, overlap, and context ,“Library and Information Science Research,7(1) (1985):p183-195.

性做了說明,其認為 INSPEC 和 SCISEARCH 兩資料庫相對重複性最高,有超過

49 Pauls T. Nicholls, “Bibliometrics of the laserdiscs applications literature,”,Laserdisk Professional, 2(1989):p106-109.

50 Alexander Y. Mychko-Megin,” A Comparison of biomedical databases,”Bulletin of the Medical Library Association,79(1991):p302-308.

51 Maryellen C. Sievert & Mark J. Andrew,” Indexing consistency in Information Science Abstracts,”

Journal of the American Society for Information Science,42(1991):p1-6.

52 Linda G.Slater, “ Mapping the literature of speech-language pathology,”Bulletin of the Medical Library Association85(1997):p297-302.

Information Science Abstracts(LISA)、Library Literature and Information Science 及 Information Science Abstracts(ISA)(有包含 CD-ROM)和線上資料庫的資料庫做重複 性研究。此研究利用 Dialog 模組,首先檢索三資料庫的標題欄位,選出在圖書資訊 學領域較廣泛應用的 20 個主題領域,之後針對此三資料庫兩兩進行比較,用以評估 三資料庫的重複性。其結果顯示 Library Literature and Information Science 所包含的 資料有 30542 筆最高,ISA 則只有 5,094 筆最低。而在重複性的比較上:LISA 和 ISA 的資料重複性為 12.2%;LISA 和 Library Literature and Information Science 的資料重 複性則為 10.3%;ISA 和 Library Literature and Information Science 的資料重複性卻為 5.8%。由此發現三個資料庫中同時存在的重複性資料只有低於 3%的比率。所以可 推測得知三資料庫的資料獨特性很高55

2003 年,Walters 和 Wilder 兩學者針對 7 個特殊學科資料庫及 5 個跨學科資料 庫進行比較內容的研究。其目的在於檢驗單一學科和跨學科資料庫,哪一種資料庫 的資料涵蓋範圍較完整?學科中的核心文獻是否也會被較多資料庫索引?文獻的重 複性是否能夠反映學科的相似性?兩位作者收集了 1990~2000 年間美加和 later-life migration 主題相關的資料,其收集到 500 筆相關文獻,經檢驗後選出 155 篇來做研

53 William W. Hood & Concepci S. Wilson,,”An informetrics study of the distribution of bibliographic records in online database: A case study using the literature of Fuzzy Set Theory(1965~1993),”(Sydney, Australia: Ph.D. dissertation, The University of New South Wales)(1998).

54 William W. Hood & Concepci S. Wilson,” The Relationship of Records in Multiple Database to Their Usage or Citeness,”,Journal of the American society for information science and technology,59(9) (2005):

p1004-1007.

55 Eleanor Read & Craig Smith,” Searching for library and information science literature: a comparison of coverage in three database,”Library Computing 19(2000):p118-126.

56 William H. Walters & Esther I. Wilder,” Bibliographic Index Coverage of a Multidisciplinary

Field,”Journal of the American society for information science and technology,54(14) (2003):p1305-1312.

數據分析和 Microsoft Excel 計算的頻率分佈,再使用百分比和平均數來繪製表格和 圖表。研究結果發現,在不同的搜索引擎中,Yahoo 與其他搜尋引擎之重複率最高,

約達40%“。而在其它的搜索引擎中, “CurryGuide”檢索物理學門資訊的回現率 (recall)有 77.1%。此外,該搜尋引擎與其他搜索引擎有約 43.7%的重複率。因此,

於物理學門上的重疊程度來說,“CurryGuide”在一般的搜尋引擎中算較好的專科搜 尋引擎58

2012 年 Wang 等人的研究認為目前網際網路發展迅速,而醫療健康知識的取得 也逐漸普及。此研究通過對 Google、Yahoo!、Bing 和 Ask.com 四個搜尋引擎的檢索 研究,以乳腺癌為檢索詞彙來進行搜尋。在研究中,作者還找來了醫學專家做了乳 腺癌的 6 個標準以及使用了 5 個乳腺癌在醫學臨床術語系統化命名(SNOMED CT)

最新發布的定義等資訊進行檢索。研究發現四大搜尋引擎對乳腺癌的 6 大標準的檢 索結果都有擠身前 30 名。而就有效性而言,Google 為最好的,其次為 Bing、Ask.com,

最差為 Yahoo!。此外,於搜尋引擎的重複性來說,其兩兩搜尋引擎的資料都約有 50%

57Rafiq Ahmad Rather,Fayaz Ahmad Lone & Gulam Jeelani Shah ,” overlap in Web Search Results: A Study of Five Search Engines,”Library Philosophy and Practice(2008)

58,Sedigheh Mohammad Esmaeil, Robabeh Mansour Kiaie & Faslname-Ye Ketab,”A Comparison between Search Engines and Meta-Search Engines in Retrieving Information Related to Physics and the Extent of Their Overlap,” Library and Information Studies,22(3) (2011) :p130-140.

59 LiupuWang, Juexin Wang, Li Michael, Liang Yong, Yanchun Wang & Dong Xu,” Using Internet Search Engines to Obtain Medical Information: A Comparative Study,”Journal of Medical Internet Research14(3) (2012 May).

60 K. P. Ismond & A. Shiri, “The medical digital library landscape,”Online Information Review31(6) (2007):p744-758.

61B SCHRIVER,.From print to electric. InformationTonday, 26(9) (2009):16. Rerrieved Feb 29, 2011, from Academic search complete.

62 D. Zimmerman & D. B. Paschal,“ An exploratory usability evaluation of Colorado State University Libraries digital collections and the Western Waters Digital Library Web sites,“The Journal of Academic Librarianship,35(3) (2009):p 227-240.

63賴施雯,「Medline 醫學資料庫之好用性評估」,(國立臺灣大學圖書資訊學研究所,碩士論文,民

100 年)。

64同 12。

65蔡明月,資訊計量學與文獻特性(臺北:國立編譯館主編,民 89 年),頁 3~7。