引文索引與引文分析之探討

(1)

引文索引與引文分析之探討

Citation Index and Citation Analysis

ችځ͡!

߆ڼ̂ጯဦ३ྤੈᄃᑫ९ጯࡁտٙି଱!

Ming- Yueh Tsay

Professor, Graduate Institute of Library, Information and Archival Studies,

National Chengchi University

E-mail: [email protected]

關鍵詞(Keywords)：

引文分析（Citation Analysis）；學術評鑑（Academic Evaluation）；科學引文

索引（Science Citation Index）；期刊引用報告（Journal Citation Reports）；影

響因素（Impact Factor）

；自我引用（Self-Citation）

；引用錯誤（Citation Error）

；

引用均等（Citation Equality）；二次引用（Indirect Citation）；引文分析效度

（Validity of Citation Analysis）

【摘要】

ώ͛ўд閳͔ࢗ͛৶͔ᄃ̶͔͛ژĄ׍វ̰

ट͹ࢋдଣ੅઼࡚ࡊጯྤੈࡁտੰ(Institute

of Scientific Information, ISI)Ăٙᄦү۞ࡊጯ

͔͛৶͔(Science Citation Index, SCI)ᄃഇΏ

͔ϡಡӘ(Journal Citation Reports, JCR)ྤ

फ़ऱ̝ᄦүăᑕϡᄃࢨטĂͽ̈́౅࿅͔͛৶

͔ĂซҖ۞ү۰ᄃ፟ၹ̝͔ϡෞᝥĄѩγĂಶ

͔ϡ̶ژ͔ٙ੓۞ۋᛉĂּтĈҋԧ͔ϡă͔

ϡ᏾ᄱă͔ϡӮඈ̈́˟Ѩ͔ϡĂϺஎˢΐͽ࣠

ژĂ֭ซ҃੫၆̶͔͛ژዎ࿃ז۞યᗟͽ̈́ᇆ

ᜩ͔ϡѨᇴᄃ͔ϡϒቁّ۞Я৵ඈග̟ტЪ

੅ኢĄ౵ޢĂᓁඕ̶͔͛ژ۞ϒࢬᆊࣃᄃ၁߉

ጯఙෞᝥ۞ᙯ໰Ą!

!

【Abstract】

The present paper describes the

production, application and limitation of

Science Citation Index (SCI) and Journal

Citation Reports (JCR), two major databases

of Institute of Scientific Information (ISI),

especially focuses on the usage of citation

data upon author and institution assessments.

Moreover, the critiques of citation analysis,

such as self-citation, citation error, citation

equality, indirect citation as well as problems

of citation data are discussed. In sum,

validity of citation analysis and its relationship

with academic evaluation are also

investigated.

前言

教育部於民國九十二年十月十六日左右，首度針對全國一百五十四所大學校院，採用具國際公認水準的 SCI--Science Citation Index(科學引文索引)、 SSCI--Social Sciences Citation Index(社會科學引文

(2)

索引)、以及 EI--Engineering Index(工程索引資料庫)，統計我國公私立大學及技職校院教師發表的學術論文篇數，作為學術評鑑之重要參考。調查結果在全國各大學校院引發巨大震撼。此外，中國時報民國九十年十二月十九日第十三版頭條新聞亦刊載：「為改善獲獎率偏高，造成得獎者不覺光榮，未得獎者抗議不公的情形，國科會決定大幅修訂實施多年的研究獎勵制度，廢除得獎率超過 50%的一般獎，僅保留獲獎率 3%到 5%之間的傑出獎。」研究成果評量制度遭到空前的質疑。衡諸事理，在於台灣地區學術空間狹窄，同行相競，彼此爭食，易流入黑箱或不公的主觀窠臼。尤其傑出獎是頒給「真正表現傑出者」。至於如何界定「真正」與「傑出」將是未來申請者與審查者面臨的更大挑戰。除了專家審評外，是否存在有較客觀具體的指標呢？大凡評量，首先脫離不了數字，生產量往往是第一根據。至於作品的品質或所謂的影響力，則又以刊載期刊的權威性與知名度作依據。有關期刊價值幾乎都以 SCI、SSCI 與 A&HCI 之影響因素(impact factor)加以認定。事實上，期刊雖然具影響力，被大量引用，並不意味作者的作品也被大量引用。因此，個人著作被引用的實際情況才是真正反應研究成果之「impact」的具體指標。遺憾的是，甚少有人涉及此方面的評量，甚至無從得知被引用的資訊。至於機構的學術評量，則是個人研究成果的累積。是以，本文試圖通過科學計量學(scientometrics)的常用工具--引文索引(citation index)與引文分析(citation analysis)，提出些許淺見供學界參考。一篇完整的學術論文，必由正文及之後所附的參考書目組成。正文本身為引用文獻，參考書目則是被引用文獻。通過對引用與被引用關係的研究，可獲知學科之間的關係與發展及學術傳播的歷程，進而了解研究近況與未來趨勢。引文分析是基於數理統計方法的應用，以揭示文獻之間存在的數量規律[1]。傳統上在引文分析的基礎上，對於「引用文獻」的解釋是：一篇文獻之所以被另一篇文獻引用是因為被引用文獻提供了相關資訊，例如：找出更寬廣的研究內涵、描述所採用的研究方法或提供支持的數據或討論。設若站在「所有引用都均等」的立場來看，一篇文獻被引用的次數，反應出其被後來研究使用的多少，被引用越多，表示貢獻的資訊越多，影響越大。反之，衰退的引用次數，顯示文獻被引用的趨動力減弱，內容逐漸老化而不被使用。引文分析乃科學計量學及資訊科學中重要之研究領域。自從美國科學資訊研究院 (ISI)，於 1963 年成功的利用電腦，系統化的製作了科學引文索引 (SCI)與期刊引用報告 (Journal Citation Reports-JCR) (以下行文以 JCR 稱之)之後，為作者的生產力與影響力以及期刊品質之評估樹立了一新標竿。一旦引用文獻資料轉換成機讀形式，並進而製作成引文索引之後，即可作為引文分析之用，產出作者被引用次數、被何人引用，引用在那一篇或那些文獻、自我引用、期刊被引用次數、期刊影響因素、期刊引用與被引用半衰期（citing and cited half-life）等資料。這些資料不啻為學術成就最直接、最便捷、最客觀的指標。

科學引文索引(Science Citation

Index, SCI)

SCI 乃 ISI 於 1961 年創刊，JCR 則於 1975 年出版。目前除了紙本式之外，另製作有線上資料庫，其名稱為 SciSearch，涵蓋年代自 1974 年至今，光碟資料庫涵蓋年代自 1986 年至今。此外，尚有網路版 Web of Science、Web of Knowledge 問世。除了 SCI 之外， ISI 尚出版《社會科學引文索引》(Social Sciences Citation Index -SSCI)及《藝術與人文學引文索引》(Arts & Humanities Citation Index-A & HCI)。

SCI 為一國際科際性索引，收錄科學、技術及生物醫學等方面學科共計 94 種，其中醫學有 40 種，生物有 16 種[1]，二者合計約佔 60%，足見其學科分佈偏重生物及醫學。

SCI 之編製

ISI 總裁迦菲爾德(Garfield) [2]曾聲明，引文索引製作的原理乃基於：引用與被引用文獻間必存在「有意義」的關係。因此，SCI 是將收錄之來源文獻(source item)，亦即引用文獻(citing work) 及其引用的文獻，亦即被引用文獻(cited work)完全輸入電腦而編製完成。SCI 之來源期刊約 4000 多種，SCI Expand 則增收至 6000 多種，其選錄之標準極為嚴格。根據 Garfield 於民國 79 年應國科會科學與技術資料中心之邀請來臺演講：＜ISI

(3)

如何選錄期刊＞的內容顯示，來源期刊必須符合下列條件始予以收錄[3]： 1.期刊被引用頻率的高低，可據此判斷其在某一研究領域中是屬核心抑或外圍期刊； 2.具權威性的編輯委員會及健全的論文審查制度； 3.具明確之「投稿須知」； 4.期刊刊名應能顯示該刊之主題內容； 5.具英文目次、篇名及摘要； 6.定期出刊且每年至少出版兩期以上； 7.國際知名專家的推薦； 8.完整的參考文獻書目資料及詳細的作者聯絡地址。臺灣地區為 SCI 收錄的期刊計有：(l)《中國化學會誌》(Journal of the Chinese Chemical Society)；(2) 《中國物理學刊》(Chinese Journal of Physics)；(3) 《中央研究院植物學彙刊》(Botanical Bulletin of Academia Sinica：An International Journal)；(4)《中央研究院動物研究學刊》(Zoological Studies)；(5)《材料化學與物理》(Materials Chemistry and Physics)及(6) 《臺灣醫學會雜誌》(Journal of the Formosan Medical Association)等。

SCI 加以索引之來源文獻的資料類型主要為期刊論文，此外尚有少數的圖書、專利文獻、技術報告及博碩士論文。期刊論文亦只收錄具原創性之研究論文(original research articles)、具評述性之綜論文章 (review articles)及技術簡訊(technical notes)。至於期刊內所刊載的其他資料，如：編輯專欄(editorials) 讀者來函(letters)、新聞通告(news notices)、會議摘要(《FASEB Journal》及《Clinical Research》兩期刊，因出版了大量的會議摘要，每年擁有相當數量的引用，故排除在外)及書評(刊於《Science》、《Nature》與《Scientist》三種期刊之書評除外)，因大都不被引用，故不給予索引[4]。

SCI 之特性與應用[5][6]

SCI 之特性及其應用如下： (1) SCI 乃唯一以引文分析作為評估科技資訊資源及學術研究成效之工具。 (2) 引文索引是以被引用文獻為標目，與引用文獻相連繫而達到將相同主題文獻聚集在一起的目的。 (3) 不論其學科屬性為何，凡被來源文獻引用過的文獻均收錄在 SCI。換言之，引用文獻都出自其收錄期刊一覽表中的期刊，但被引用文獻卻沒這層限制，只要作者引用，它可來自各種不同學科的文獻，例如：有一篇遺傳學方面的文獻，引用了生化、醫學、核子科學及儀器設施等方面的文獻，則這些被引用文獻完全自動收入 SCI 資料庫。由此可見 SCI 其多科際及交互參照之獨特性，是從事跨科際研究最好且唯一的工具。 (4) 引文索引最基本的功能在告知某一文獻在何處為何人引用？科學家透過 SCI 了解到其研究理論是否會被證實或批評？研究方法是否被修正或改進？建議事項是否被試驗過？研究結果是否被加以應用？使用者經由 SCI 亦可查知某化合物是否有新的合成方法？某藥物是否曾做過臨床檢測?某化學物質是否利用生物實驗測試過；儀器之潛在市場是什麼? (5) SCI 除了引文索引之外，亦具有一般主題索引之功能。從作者檢索，可知某作者為主要作者或次要作者時其作品各有那些?其作品新穎度如何?由作者之服務機構可知有那些作品是由某機構產生?該研究領域中相關的研究夥伴為誰?某學科領域是否有評述性之綜論文章?這些文章引證的原始參考資料在何處? (6) SCI 指引了使用者從以前的「被引用文獻」到後來的「引用文獻」。透過引文索引的組織可以了解文獻出版後被使用的程度及後來的發展。如此一來將早期文獻與現行文獻連接起來，可促進學術傳播之反饋機能；亦可了解某一主題歷年的研究成果並預測未來趨勢，對學術整理與提昇具莫大之貢獻。 (7) 引文索引法乃一種自動化索引法，不分析文獻主題內容，也不制訂索引用語，可免除因索引詞彙描述的不當所造成的檢索失敗。 (8) 利用共被引研究可探尋學科間之知識結構。 (9) 檢索簡易，毋須考慮檢索詞彙是否適當。例如：對想找尋有關後工業社會(post-industrial society) 這個主題的讀者而言，他根本不需考慮該用什麼索引用語來檢索，他只要知道貝爾(Bell)於 1973 年曾寫過的《後工業社會的來臨：社會預測的一項探索》 (The Coming of Post-Industrial Society：A Venture in Social Forecasting)代表作，就可從引文索引找到所有曾經引用它的相關文獻。

(4)

被引用的全部次數的交集結果，可得知作者自我引用的情況，以觀測作者主觀意識或自我中心的強弱。 (11) 利用引文索引檢索的結果相關度極高，在 1986 年所作的調查統計中，分析結果發現引用文獻中有 72%是與被引用文獻主題相當有關，22%是有點相關，只有 5%不相關[7]。 (12) 可以確認某學科之研究前鋒 (research front)。蘇俄資訊科學家們即曾利用引用數據成功的評估蘇俄之科學政策[8]。 (13) 非英語期刊收錄較少是 SCI 之一大缺失，因此有損其為國際性的稱譽。

期刊引用報告 (Journal Citation

Reports, JCR)

JCR 是唯一提供期刊引用數據以評估期刊之工具。以引用或被引用為指標的評鑑方法歷年來雖迭有爭議，然因其具無感式、定量化及客觀化的特質，故作為期刊與期刊之間的相對研究仍具有不可抹滅的正面價值。以下針對 JCR 之編制、內容及使用限制，加以探討。

JCR 之編制

JCR 每年所列之期刊引用數據，取自於當年 SCI， SSCI 及 A & HCI 三個資料庫對這些期刊的所有引用文獻，不管被引用文獻是那一學科或何時出版。故 JCR 報導全世界 60 多個國家，超過 3000 家出版者出版之近 6000 種期刊[10]。JCR 收錄期刊文獻的標準自然與 SCI 相同。若一期刊分成數個部份出版， JCR 並沒有將其加以合併而視為一種期刊計算。至於更改刊名的期刊，除非刊名的變更很小不致於影響期刊的排名次序，否則 JCR 是不做合併期刊計數，而只列出過去二年，刊名異動之期刊清單。然而，JCR 光碟版有自動計算刊名變更後統一的影響因素之功能。

JCR 之內容

JCR 提供的資料計有[11]： 1.某特定年期刊被引用的總次數；2.某期刊引用其他期刊的情況，亦即歷年來的引用次數分布，以及期刊為引用期刊時其自我引用 (self-citing) 率。3.某期刊歷年來被其他期刊引用的次數分布，以及當期刊為被引用期刊時，其自我被引用 (self-cited) 率。 4. 期刊某特定年共出版之文章篇數、合計總參考書目數，平均每篇文章附註參考書目數。 5. 影響因素； 6. 即時引用指數 (immediacy index)；7.引用半衰期(citing half-life)；8.被引用半衰期(cited half-life)。 JCR 除了可告知個別期刊的引用分析之特性外，其網路版因具有排序功能，可進一步揭示：(1)生產力最大的期刊為何(亦即某特定年出版文章篇數最多的期刊)?(2)某特定年被引用最多期刊為何?(3)最具影響力的期刊為何?(4)最熱門的期刊為何?(5)某期刊引用那些出版品，又被那些作品引用? (6)生命週期最長的期刊為何？透過引用與被引用期刊間的網絡連結，可描繪期刊間之主題關係，亦可作為評估學者專家研究成果的客觀憑據。

JCR 之應用

JCR 豐富且多樣化的內容，實可發揮無數之應用，茲分述如下[12]： 1. 就圖書館而言：歷年的引用數據分佈可作為期刊訂購及經費控制之參考，利於完成合乎經濟效益之期刊管理。此外，尚可協助圖書館決定過期期刊的典藏作業，包括決定裝訂保留或淘汰的期限。 2. 就個別科學家而言：可找出在其專業領域中新的或重要的期刊，定期閱讀，以增加新知或加以組織而成為個人的收藏。 3. 就作者而言：可得知最熱門、最具影響力、被使用最多、最具生產力或生命週期最長的期刊，作為投稿的參考，亦可作為評估學者專家研究成果的客觀憑據。 4. 就編輯者而言：在扣除期刊自我引用後，期刊的編輯們可以從期刊被引用的情形，得知自己期刊的整體表現如何?是否達到預期之經營目標?亦可與其他期刊加以比較。 5. 就出版者而言：可作為發行新期刊、擴充、合併或停止出版現有期刊的依據。 6. 就資訊分析家而言：利用書目計量學的研究方法，發展新的定量指標以評估期刊品質，進而開發各種科學傳播之模式。

JCR 之限制

JCR 是 ISI 有效應用電腦科技製作引文索引後的

(5)

附加產物，雖然其成果獲得不少喝采，但仍有其不足之處，造成使用時有所限制。茲略述如下[13]：

1. 引用次數固可顯示期刊被引用情形及其價值，然而，高度引用並不代表高度使用。例如：新知報導性質期刊，如：Scientific American 與 New Scientist 被閱讀機會很多，但被引用排名卻很低，這並不意謂它們較少被使用或較不重要。 2. JCR 使用者對引用模式必須有一通盤的了解與掌控，才能將 JCR 各式各樣的期刊引用數據加以巧妙的應用，存在有多種變數會影響引用次數、影響因素與即時引用指數。舉凡作者的聲望、學科特性、語言、刊期、期刊銷售量、圖書館館藏情況、期刊的可得性、被索引摘要工具收錄的情況、研究經費的優先次序等均包括在內。例如：在某些學科領域、以五年計算的影響因素可能比二年更適合，又如：非英語期刊因不易取得，自然被全世界引用的可能性降低。 3. 期刊刊登文章篇數突然增加或減少，會影響到影響因素。例如：當文章出版突然增加時，當年被引用次數未必相對地急速增加，此時只有一歲的文章多於二歲的文章。 4. ISI 以人工方式檢視收錄之來源文獻，然對於每年處理的上千萬個被引用書目則無法一一查檢，故對於讀者來函，研究論文或評述性綜論文章未加以區別。 5. 當期刊改名之後的第一年，新刊名將無影響因素，因其無前二年出版的文章篇數。一年之後 JCR 列出新舊刊名個別的影響因素，新期刊的影響因素可能會低於預期的值，因新期刊只包含最近一年被引用次數及刊登文章篇數。由於即時效應的影響，通常最近一年出版之期刊被引用次數較少，故影響因素降低；反之，舊期刊因包含第二年(出版後第二年被引用達到高峰)的被引用次數，故影響因素較高。第三年之後，舊刊名即不再列出。 6. 影響因素除了如上所述之客觀限制之外，其中尚隱含了許多不為人所透澈了解的錯誤認知，值得吾人深思。所謂影響因素，就 ISI 的定義是期刊前二年出版文章被引用的次數除以文章篇數。換言之，影響因素是指每一篇文章平均被引用的次數。然而，影響因素實際上受到許多因素的操縱，例如：期刊的主題、期刊的類型(letters journal、full paper

journal、review journal)、每篇文章的作者人數、期刊所含的文章篇數以及引用次數。經由研究顯示[14]基礎科學或較單一主題的期刊比應用科學或特定主題的期刊之影響因素較高，例如：物理學平均影響因素為 1.6 較材料科學的影響因素 0.7 高。此外，合作者多少亦會顯示影響因素的差異，當然合作者的多少亦受到學科性質的影響，例如：社會科學類每篇文章平均作者數為二人，至於生命科學則超過四人。即使在同一學科，期刊與文章的性質仍會左右影響因素。一般而言，刊期短出版快速的簡訊期刊(一般稱為 letters journal)通常有較高的即時引用指數以及較短的被引用半衰期，大約在二年之內。換言之，其老化較快。反之，刊載完整論文的期刊，其被引用高峰在文章出版後第三年，被引用半衰期較長，且老化趨向平緩。因此以二年為計算基礎的影響因素較出版較快、文章較短的簡訊期刊會來得少。至於評述期刊(review journal)，其即時引用指數相對地自然較低，通常在出版之後數年其被引用才達到高峰。被引用半衰期相對的加長，老化速度趨緩，雖然被引用，次數未必很多。但由於出版文章篇數的分母相對的較少，導致影響因素提高。因此，期刊性質不同或是期刊中刊載不同性質的文章均應注意此項差異。由於影響因素是一個平均值，因此期刊每年出版文章篇數或是計算的年數均會影響其數值。出版文章篇數越多的期刊其每年影響因素的改變較少(例如：150 篇以上的期刊大約在正負 15%，35 篇以下在正負 40%之間)。一個出版 140 篇文章的期刊其影響因素為 1.5 與另一出版相同文章篇數的期刊但其影響因素是 1.24，二者其實是沒有什麼不同的。計算時間的長度亦會影響影響因素，根據研究[15]顯示 JCR 以二年為計算基準的影響因素，各期刊每年的數值，起伏變動相當大。然而若改以五年為計算基準，則各期刊每年的數值較為平緩穩定。再就同一學科期刊影響因素的排列次序而言，若將二年改為五年，在 30 種化學期刊中有 24 種其排序會提前至 11 名。由是觀之，期刊影響因素受許多變數操縱。因此，即使是 ISI 所生產的依學科主題分類的期刊排序，亦應謹慎從事。大略估計，期刊之間的影響因素差異若少於 0.25 則應屬於同一等級。再且，在每一學科領域排名在前的期刊在另一學科則可能

(6)

排名至最後，處理上稍不妥當則可能完全失去意義。此外，應極力避免採用一影響因素的絕對值 (absolute value)去評量期刊品質，因為除了受前述的變數影響之外，不同學科領域長期發展情勢亦影響了影響因素。如果只因為第九年的影響因素低於其他年代，就判定第九年的研究做得不如其他年代，將是不合理的推斷。總之，引文分析因 ISI 豐富的引文索引而得以方便施行，進而觀察出學術研究成果及其傳播效益。影響因素是引用文獻測量的一種方式，有利於期刊影響力的建立。然而，它們絕對不是一種直接測量期刊品質的指標，且在使用時務必小心為要。此外，引用數據只是一種對傳統主觀且質化式的專家評估的一種補充，並非完全取代。因此，JCR 雖是主要且獨特的期刊指引，然而當比較或評估期刊時，卻不可以其作為唯一的根據。

引文分析之爭議

除了如前文所述 JCR 之限制外，以引用文獻作為評鑑工具，就引用本質所引起的爭議，最受到攻擊，原因無他：「沒有人可以真正知道作者為何引用」是也。Smith[16]很小心的下了：「作者的引用行為被知道的不多」，這樣的結論。在眾多引文分析研究之批評中，以自我引用、引用錯誤、引用均等及二次引用等為最。自我引用是引文分析研究中最為人詬病之處，作者藉由大量自我引用，膨脹其被引用次數並誇大其貢獻。自我引用的種類繁多，舉凡作者、機構、國家、期刊、學科等均有自我引用的現象。 Earle 與 Vickery [17]曾研究學科的自我引用，結果發現，社會科學文獻引用本學科的文獻達 58%。相對地，科學與技術的自我引用率則分別為 70% 與 80%。Dimitroff 與 Arlitsch[18]曾於 1995 年研究了圖書館學與資訊科學的自我引用率。他們總共調查了 1058 篇文獻，結果發現有 50%的文獻至少有一個自我引用。再且，文獻若是合作者、或研究報告、或由教師撰寫、或內容為理論導向者，其自我引用率較高。 Snyder 與 Bonzi[19]觀察了自然科學、社會科學、人文藝術學三大領域期刊自我引用情形。期刊樣本取自 ISI 製作的 JCR 資料庫排名前 25 名者。研究結果顯示：期刊自我引用率平均為 9%，其中自然科學為 15%、社會科學為 6%、人文藝術學為 3%。 Lawani [20]進行農藝學期刊自我引用的調查，其研究顯示，二種美國出版的期刊 Agronomy Journal 及 Crop Science 的自我引用率分別為 52%與 60%。至於法國期刊 L＇ Agronomie Tropicale 與 Annales Agronomiques 則為 100%與 83%。一般而言，最常見的自我引用研究，主要是作者自我引用分析。Tagliacozzo [21]分析了植物生理學與神經生物學的作者自我引用率分別為 16.6%及 17.5%。 Lawani [22]認為自我引用有二類。一為同時(synchronous)自我引用，另一為歷時(diachronous) 自我引用。就作者而言，所謂同時自我引用是指在一篇文章中，作者列於參考書目中有引用了自己的著作的篇數與全部參考文獻總數的比值。至於歷時自我引用，則是一篇文獻自發表以後歷年來被引用的總數中，作者自己引用自己文獻的次數所佔的比率。Lawani 從農業經濟學 1979 篇文獻中，取樣 237 篇文獻共 3469 個參考書目進行分析，其研究結果顯示一個高的同時自我引用率並不一定是自我中心主義者，因為作者除了引用自己的作品之外，尚引用了別人的作品。反之，一個高的歷時自我引用率則一定是自我中心主義者，因為歷年來他被引用的文獻中，大多是被自己引用的。高的同時自我引用率及低的歷時自我引用率只表示此作者是該特定研究領域的高生產力作者；相反的，低的同時自我引用率及有極高的歷時自我引用率則代表此作者的作品較不獲得他人的青睞，且其自我意識較高。引用錯誤是引文分析研究的第二大問題。即使有編輯依標準書目針對文章的引用書目加以修正，引用錯誤率，不論是引用格式或引用內容，仍然居高不下，以致無法証明引文分析的有效性。例如： Pandit[23]的研究顯示，在五種圖書館學核心期刊之 131 篇文章所包含的 1094 個引用書目中，就有 193 個（18%）是錯誤的。主要的錯誤類型為：遺漏頁碼或頁數錯誤(28%)；遺漏、不完整或不正確的作者或編者的名字（ 23%）；至於文章篇名的錯誤佔 (19%)。作者所造成的引用錯誤主要是遺漏作者、編者及卷期數，該類錯誤佔 53%；再經過編輯的查証補正之後，明顯降低至 18%。引文分析研究的第三大爭議是「引用均等」，亦即視所有的引用同等重要。一般而言，引文分析研究中的引用文計數，主要目的在從引用文被引用次數

(7)

的多少來確認其重要性，故其前提假設為所有的引用等值，且同一篇作品被多次引用亦只計算一次。此種認知，有所疏失，忽略了其他面向，因為一篇文獻包含許多部分，例如：導論、方法論、結果與結論等，引用文出現在那一部份，足以彰顯其不同的重要性。再且，被引用一次以上的引用文又如何處理呢? 這些都是值得思考的問題。只是單純計算引用次數來決定其重要性，會因「馬太效應」的影響偏袒「高被引用者」，許多作者只是因為他聲望高，名氣大而被引用，並非他的文章對引用文獻有實質的影響。因此，Small [24]建議採用「對數轉換」或「分數化」的方式來取代單純的引用計數以中和馬太效應。引文分析之另一重大疑慮是二次引用。Broadus [25]曾發現一篇國際知名的文章卻錯誤引用了一個早期的作品，批評家們據此推斷，作者並未真正參考原始文獻，其引用書目資料乃取自於別的出版品的參考書目。換言之，這種引用行為是一種蓄意的隱瞞與虛假。Moed 與 Vriens [26]亦根據原始文獻與被引用書目，加以比對作者名、出版年、卷期及起迄頁數。結果發現，某特定的引用錯誤居然會同樣出現在不同文章的參考書目。由此可見，許多引用書目是從別的參考書目複製而來。總之，引文分析缺乏統一的作業方式，對於結果亦無解釋的標準協議，其中尤以作者名字不一致的情況最常見，特別是較不為人熟知的名字及女性作者結婚後從夫姓，所引起的差異更大，例如：研究超導體的大學者朱經武先生 Paul Chu，其申請專利的名字則是 C. W. Chu[27]。 Stewart[28]總結引文分析的限制，計有：（一）引文分析只能以已出版的文獻加以計算；（二）引用文只能說明真正被使用的資料，至於那些即便是需要但未獲得的資料，則無法引用；（三）當研究興趣轉變時，某一特定主題在某特定時間內將造成文獻大量異常，致使引文分析即會被曲解。Smith[29]進一步歸納出影響引用次數與引用正確性的因素有：（一）期刊年紀；期刊出版越久，越可能被引用；（二）刊期；亦即期刊的出版頻率，週刊與月刊較季刊與年刊被引用的機率高；（三）期刊的大小；出版的文章數越多，被引用將越頻繁；（四）語言的性質；（五）主題的爭議性；（六）作者的聲望；（七）被索引與摘要工具收錄的情況；（八）抽印本的有無。引文分析遭遇的問題則有：（一）資料庫檢索者或數據的整理者所造成的技術性錯誤；（二）資料庫製作者輸入資料時的作業疏失；（三）資料庫收錄資料不完整；（四）大學或專門機構出版品因受合約限制，無法商業化發行出版，至資料取得困難，而未被引用；（五）早期資料庫只收錄第一作者，忽略了合作者的研究貢獻；（六）不具爭議性但有用的文章較少被引用，反之對立性強的文章被引用較多；（七）方法論文章被引用較多；（八）有些資料類型，如專利文獻，較少被引用；（九）、在以量取勝的謀略下，利用引用文數量或影響因素的多寡來評估個人成就，將造成連續出版小篇幅的文獻、自我引用或合作出版等手段來操弄引用文的評量。除了技術性的問題之外，引用文分析的最根本問題來自於引用行為的不確定性。 Kochen [30]觀察到：作者選擇參考書目的方法是非常武斷的，因此，許多應被引用的文獻被遺漏，亦有許多引用的文獻是不相關的。Martyn[31]認為引用文索引雖可以顯示一種書目關聯，但我們並不知道作者參考行為的引用動機，亦不知道被引用作品的那一部份是引用作者引用的實體。Broadus[32]及 Thorne[33]甚至指稱政治背景、個人動機或作者玩弄的遊戲，都可能是造成作者為了提昇他們個人或服務機構之地位而去選擇參考資料的原因。換言之，將引用文作為評估研究成果之一重要指標，仍有許多不為人了解之處，例如﹔引用文究竟在評量什麼？品質、重要性、影響力、可見性、抑或使用性？是上述的部分組合或是全部的綜合？引用文若真能是一種評量工具，其可靠性、效度又如何呢？又能評量的多好呢？由此可見，引用文的功能備受爭議，有關引用行為特質的有效性研究越來越多，然而諷刺的是 Cozzen[34] 卻感慨道：當我們越近看待引用行為，我們對它的了解就越少，因為我們無法了解作者為何引用這篇文章而不引用那篇文章的真正原因。

作者引用分析

除了評估期刊品質外，作者被引用的情形則更是直接且透明的評量作者成就的憑藉。ISI 公司 Web of Knowledge 系統的 SCI Expanded 資料庫可以檢索作

(8)

者的發表文獻總數、被引用的總次數、單篇文章的排名與合作者、單篇文章的被引用次數、被何人引用、被那篇文獻引用、以及自我引用等。例如：檢索國際知名的超導體研究專家朱經武與吳茂昆等五人於 1981 年發表於 Physical Review Letters，46 卷 25 期，1643-1647 頁的文章，共被引用七次，其中被 Aitken, R.G. 與 Daneshvar K. 引用在＂ High Pressure Study of the Magnetic…＂一文，發表於 Journal of Applied Physics，63 卷 8 期，4096-4098 頁，1988 年 4 月 15 日。此外，經由線上系統，例如：DIALOG 檢索 SCI 資料庫，可輕易得知作者的自我引用情況。僅得知被引用數據，仍是表相，進一步透過檢查引用文獻的「原文內容」 (citation content or context)更可以清清楚楚得知哪些理論、觀念、數據、實驗結果等被引用。換言之，唯有徹底檢視作者被引用的實質本體才能見證作者之國際影響力與其真正傑出之所在了。

結語

引文分析即便存在著不少干擾變數，卻仍在資訊計量學甚至資訊科學學域中，昂首佇立，自成一家，各方研究欣欣向榮。究其原因，不外是：（一）沒有一種既簡單、直接又實際的技術可以掌握所有文獻的使用情形；（二）價值的判斷早在文獻被引用時即已完成；（三）可以容易且精確的選擇引用的數據；（四）引文分析是唯一對作者使用文獻最容易觀察到的指標[35]。因此，雖然引文分析研究有諸多問題存在，仍有不少學者對其抱持正面樂觀的看法。 Hayes[36]以引文分析的方法評估圖書館與資訊科學教師的研究成果，卻證實了引文分析是一種「有效」的測量方法。Clark[37]採用了 15 種評量心理學家學術地位的指標，調查其與心理學上最常被引用之作者的關係，結果發現引用文是一種好的指標，亦即引用次數與學術地位呈正相關。Cole 與 Cole[38]指出排除引用錯誤、負面引用及視所有引用同等重要等問題，引文分析仍具有正面的評估價值。總之， Hall[39]認為大多數引用文研究的基本假設為（一）所有被使用過的文獻有真正被引用；（二）引用作者真的有使用被引用文獻且被引用文獻提供了有意義的資訊；（三）引用次數是評量引用文獻是否有意義的有效工具；（四）被引用文獻的內容與引用文獻內容具體相關；（五）所有引用的價值相等；（六）期刊引用報告（Journal Citation Reports-JCR）收錄的期刊能正確代表整個學科領域並支援其研究目標與目的。以上沒有一個假設是全然對的，儘管每一個假設在某一特定的情況下是對的。總之，引文分析因 ISI 豐富的引文索引而得以方便施行，進而觀察出學術研究成果及其傳播效益。 SCI 與 JCR 使用者對引用模式必須有一通盤的了解與掌控，才能將各式各樣的引用數據加以巧妙的應用。至於爭議所在之影響因素是引用文獻測量的一種方式，有利於期刊影響力的建立。然而，它們絕對不是一種直接測量期刊品質的指標，且在使用時務必小心為要。引用數據只是一種對傳統主觀且質化式的專家評估的一種補充，並非完全取代。因此， JCR 雖是主要且獨特的期刊指引，然而當比較或評估期刊時，卻不可以其作為唯一的根據。總結上述，引文分析涉及範圍廣、層面深，其產生來源或影響所及主要還是在於引用動機與引用行為，致使其長久以來仍為引用研究關注的焦點。

附註

[1]“Science Citation Index：A General Introduction＂, in Science Citation Index 1995, Guide and Lists of Source Publication, Philadelphia, PA ： Institute for Scientific Information, p.6, 1995.

[2]Garfield, Eugene. “Citation Analysis As a Tool in Journal Evaluation＂, Science, 178(4060)：471, 1972.

[3] Garfield, Eugene. “How ISI Select Journals for Coverage”, in Symposium on Criteria for Journal Selection by the World's Major Information Organization, held by Science and Technology Information Center, NSC, R. 0. C., March 21-22, pp.2-3, 1990.

[4] 同註 1。 [5] 同註 1，頁 6-8。

[6] Garfield, Eugene. “ How to Use the Science Citation Index (SCI) ＂ , Current Contents, 9 ： 5-14, February 28 1983.

(9)

市：文華圖書資訊管理，頁 54，民國 84 年。

[8] Price, Derek de Solla. “Networks of Scientific Papers＂, Science 149：510, 1965.

[9] 同註 1, 頁 7。

[10] SCI Journal Citation Reports, p.5, 1994.

[11] SCI JCR on CD-ROM, Quick Reference Guide, pp.1-16, 1995.

[12] 同註 10，頁 6。 [13] 同註 12。

[14] Amin, M. 演講講義 “Journal Publishers and Impact Factors＂, Proceedings of the 8th International Conference on Scientometrics and Informetrics , Sydney, 16-20 July, pp. 14-15, 2001.

[15] 同註 14。

[16] Smith, L. C. 〝Citation analysis〞. Library Trends,30 （1）:83-106,1981.

[17] Earle, P. and Vickery B., "Social science literature use in the UK as indicated by citations." Journal of Documentation, 25:123-141, 1969.

[18] Dimitroff, A. and Arlitsch, K., "Self-citation in the library and information science literature." Journal of Documentation, 51(1):44-56, 1995.

[19] Snyder, H.& Bonzi, S. “Patterns of self-citation cross disciplines (1980-1989).” Journal of Information Science,24(6):431-435,1998 .

[20] Lawani, S. M. "The professional literature used by American and French Agronomists and the implications for agronomic education." Journal of Agronomic Education, 6:41-46, 1977.

[21] Tagliacozzo,R. "Self-citation in scientific literature." Journal of Documentation, 33:251-265, 1977.

[22] Lawani,S. M. "On the heterogeneity and classification of author self citation." Journal of the American Society for Information Science, 33:281-282, 1982.

[23] Pandit,I., ＂Citation errors in library literature : A study of five library science journals＂. Library and Information Science Research, 15（2）:185-198,Spring 1993.

[24] Small, H.& Sweeney,E. ＂Clustering the Science Citation Index using co-citation, I：A comparison of

methods.＂ Scientometrics 7(3-6):391-409,1985. [25] Broadus,R.N., “An investigation of the validity of bibliographic citations＂ Journal of the American Society for Information Science,34（2）:132-135, 1983.

[26] Moed,H.F. and Vriens M., ＂Possible inaccuracies occurring in citation analysis＂, Journal of Information Science, 15（2）:95-107,1989.

[27] Smith, A., 〝The dangers of citation counting". Library Association Record,90（4）:220,April 1988.

[28] Stewart, J. L. 〝The literature of politics： A citation analysis.〞International Library Review, 2:329,1970.

[29] 同註 16。

[30] Kochen,M, Principles of Information Retrieval, Los Angeles：Melbille,1974,p.74.

[31] Martyn, J . 〝Bibliographic coupling〞, Journal of Documentation, 20(4)：236, 1964.

[32] Broadus, R. N., 〝The literature of the social sciences ： A survey of citational studies〞. International Social Science Journal, 23(2)：236-243,1971.

[33] Thorne, F.C., 〝The citation index：Another case of spurious validity? 〞 Journal of Clinical Psychology, 23(4)：1157-1161, 1977.

[34] Cozzen, S. E. 〝What do citation count? ： The rhetoric-first model〞. Scientometrics, 15：437-447, 1989.

[35] Orr, R.H. et al., 〝Development of methodologic tools for planning and managing library services, Ⅱ. Measuring a library ＇ s capability for providing documents〞. Bulletin of the Medical Library Association, 56：244,1969.

[36] Hayes, R. M. 〝Citation statistics as a measure of faculty research productivity〞. Journal of Education for Librarianship, 23(3):151-172,1983.

[37] Clark, K. E. American＇s Psychologists : A survey of a Growing Profession, Washington, D.C. : American Psychological Association,1957.

[38] Cole, J. and Cole, S. 〝Measuring the quality of sociological research : Problems in the use of the Science Citation Index〞. American Sociologist, 6(1):23-29,1971.

[39] Hall, B.H. Collection Assessment Manual for College and University Libraries, Phoenix, AZ： The Oryx Press, 1985, pp.57-58.

引文索引與引文分析之探討