文獻檢索技巧
林 時 暖
中國醫藥大學圖書館副館長
lisa@mail.cmu.edu.tw
大綱
• 資訊素養 • 資訊檢索之基本概念 • 檢索策略 • 檢索技巧 • EBSCOhost CINAHL實例說明 • 網路資源之檢索資訊素養技能
• A need for information;
• The resources available;
• How to find information;
• The need to evaluate results;
• How to work with or exploit results;
• Ethics and responsibility of use;
• How to communicate or share your findings;
• How to manage your findings.
學習目標
• 瞭解資訊素養之內容 • 瞭解資訊檢索之基本概念 • 瞭解資訊檢索之策略 • 瞭解資訊檢索之技巧 • 認識學術網路資源資訊檢索之基本概念
• 資訊尋求行為模式
• 自然語言 vs. 控制語言
資訊尋求行為模式
Source: Wilson, T.D. 2006. On user studies and information needs. Journal of Documentation 62(6):658-670.
自然語言
(1/2)
‧自然語言是以人類口語話的用詞作為檢索語,可能產生 語意不明確、語法不確定的問題。 ‧優點: -不需使用控制詞彙 -避免索引人員產生的人為錯誤 -索引成本較低 -不必應付索引典老化所帶來的問題 -字義的表達較為自由自然語言
(2/2)
• 缺點 -容易有遺漏 -檢索者負擔大 -文獻內涵易被遺漏 -回現率較低 -語意混淆,缺乏統一標準 -不易檢索有層次附屬關係的概念控制語言
(1/3)
• 功能: -控制同義字 -控制類同義字 -控制同型異義字 -控制語意上的相關詞彙 -控制階層附屬關係 • 工具: -分類表(Classification) -標題表(Subject Headings) -索引典(Thesaurus)控制語言
(2/3)
• 優點: -可解決同義字、類同義字與同形異義字的問題 -易從事有附屬關係的檢索 -用語明確一致 -可利用參互見,得知相關詞彙 -檢索者負擔輕控制語言檢索
(3/3)
• 缺點: -必須由專業人員編製索引,成本較高 -品質較難控制 -容易因為誤解而產生錯誤或不一致 -必須隨時更新 -索引人員必須具備學科背景與訓練,故製作較慢 -使用者必須經過訓練 -檢索詞受限於索引典,較無彈性回收率&精確率
• Recall(回收率/查全率) & Precision(精確率/查準率)
b+d a+c 總數 d c 未檢索到 b a 檢索到 不相關 相關 回收率= a+ca = 資料庫中所有相關文章筆數檢索所得之相關文章筆數 精確率= a a+b = 檢索所得之相關文章筆數檢索所得之所有書目筆數
檢索策略
• Hartley等人: 如何避免找到不相關文章的方法或是處理 找到過多或過少相關文章的可能對策 • Bates: 針對一檢索問題之通盤考量或全面性規劃 • 節省資源蒐尋的時間,且確保蒐集到的都是真正所需 的資源註:此步驟並不一定每項皆需要 選擇需求詞彙 選擇需求詞彙 選擇資源類型 及資料庫 選擇資源類型 及資料庫 決定檢索技巧 決定檢索技巧 開始檢索 開始檢索 審視結果 審視結果 結束 結束 (修正詞彙) (修正詞彙) (更換資料庫) (更換資料庫) (修正技巧) (修正技巧)
檢索策略圖
不符 符合檢索策略模式
• 常用的五種檢索模式
-分區組合檢索法(block building)
-引用文獻滾雪球法(citation pearl growing)
-檢易檢索法(brief search)
-主題層面連續檢索法(successive facet strategies)
分區組合檢索法
• 將檢索詞分解為幾個不同的主題進行檢索,再在運用布
引用文獻滾雪球法
• 事先掌握幾篇相關的文章, 利用這些相關文章找尋更多 相關的文章, 就像珍珠或雪球一樣越滾越大 • 在資訊檢索上的應用: 以相關文章的關鍵字或敘述語繼 續檢索 • 由精確率反向追求回收率 • 通常必須進行多次檢索, 才能找到足夠的相關文章簡易檢索
• 最常用的檢索策略 • 通常用簡單的幾個關鍵字, 加上布林邏輯的組合 • 檢索快速, 回收率低 • 適用情形: – 已知書目的檢索 – 只想閱讀“幾篇”相關文章 – 檢索概念相當具體時主題層面連續檢索
• 與分區組合檢索類似,但分區組合檢索通常會使用所有 的主題層面,而主題層面連續檢索則設法動用最少的主 題層面 • 先將檢索問題分成幾個主題層面, 再確認各主題層面的優 先順序 • 將最專指概念或是可能產生最少資料的概念輸入系統 • 若產生的資料筆數過多,則輸入其他次要概念與之結合 • 直到檢索者認為檢索筆數可以接受為止主題層面配對檢索
• 將主題層面兩兩配對並取其交集(AND) • 適用情形: – 當所有主題層面都同樣重要時 – 所有主題層面之專指性或模糊性相差不大 – 當將所有主題層面交集後,檢索結果為零筆資料時III. 檢索技巧
• 為完成特定目的所採取的行動 -布林邏輯(Boolean Logic) -運用切截(Truncation) -相近(鄰)運算元 -限制欄位 -限制檢索 -完整法布林邏輯
B A AND B A NOT B A B A A A A BBBB A B A OR B B運用切截
• 可分為下列幾種方式: • 右切截:如:輸入「behavi?」,則可檢索出behavior、 behaviour等字。 • 左切截:如:輸入「?gravine」,則可檢索出內含 landgravine、margravine等字。 • 左右切截(中間切):如:輸入「wom?n」,則可檢索出 內含woman、women等字。 • 常用切截符號包括?、#、*、$等,因系統不同有些差 異。相近(鄰)運算元
• 可限定兩個檢索詞彙出現的順序及位置。
• 檢索複合詞,運用相近(鄰)運算元,可降低不相關資料的筆
數
• 常用相近(鄰)運算元包括:NEAR、ADJ,例如:
限制欄位
• 檢索時可限制欄位條件,以避免檢索資料過多,如:年
限制檢索
• 可將檢索詞彙限定在某些特定欄位進行檢索,可以增加
檢索速度,並可提高精確率。
完整法
• 分別使用縮寫和全稱進行檢索,以確保查得完整的資
訊。
• 例如:使用作者的縮寫及全稱分別進行檢索
(Chen LiLi) or (Chen LL)
• 例如輸入機構全稱和縮寫:
如何修正檢索策略
• 檢索筆數過多(指誤引過多)
• 檢索筆數過少(包括零筆資料)
• 想增加資料回收率(即希望檢索到較多的相關資料)
檢索所得資料過多時
• 是否過份簡化問題? • 是否需要重新釐清檢索概念? • 是否使用了正確的布林邏輯運算元? • 是否使用過份含混或一般性之名詞? • 是否應考慮使用控制字彙? • 是否相近運算元限制過鬆? • 是否切截應用過鬆? • 是否注意到資料庫的「隱含性概念」?檢索所得資料過少時
• 是否使用符合檢索主題的資料庫進行檢索? • 是否將問題過於複雜化? • 是否真的沒有文獻探討該檢索主題? • 是否已使用足夠的檢索詞彙進行檢索? • 是否將相近運算元限制過緊? • 是否使用正確的布林邏輯(應使用OR而非AND)? • 是否拼字或語法有誤? • 是否考慮使用自然語言進行檢索? • 是否考慮使用切截?想增加資料回收率
(即希望檢索到較多的相關資料)
• 增加同義詞和類同義詞的數目 • 使用較廣義的檢索詞彙 • 以自然語言檢索代替控制詞彙 • 不使用布林邏輯的”AND”、”NOT” • 增加切截的範圍 • 使用較鬆的相近運算元 • 刪除一些非主題的欄位限制,例如:年代、資料型態等想增加資料精確率
(即希望檢索到正確的所需資料)
• 刪除部分類同義詞或是詞義含混的檢索詞彙 • 使用專指性較高的檢索詞彙 • 有適當的控制詞彙時,以控制詞彙代替自然語言進行檢索 • 使用布林邏輯的”NOT”刪除一些不相關的文章 • 限制切截的範圍大綱
• CINAHL 資料庫內容介紹 – 收錄資料 • EBSCOhost 常用功能介紹 • 基本檢索&檢索模式 – 檢索結果之篩選、整理&利用 – 進階檢索&限定條件– CINAHL Subject heading 主題表利用
– 查找期刊、email 警示功能
– 免費個人帳號功能
CINAHL介紹
(1/2)
• Cumulative Index to Nursing and Allied Health Literature
• 自1956年至今為護理學最具權威性的資料庫。 • 在所收錄的2,900多種醫護與健康領域的期刊中,逾2,000種是 MEDLINE所沒有收錄的。 • 超過10,000筆的記錄,回溯至1981年。 • 內容包括了護理、生物醫學、醫療健康圖書館學、非傳統醫學、 輔助醫學、消費者健康以及其他相關健康領域。 • 同時包含了書籍、護理學論文、精選會議紀錄、實務標準流程、 教學軟體與視聽器材、書籍章節的資源。 • 全文資源,囊括了有:+70種的期刊、法律案件、臨床創新、危 機處理、藥物資訊、研究指引、臨床實驗。
CINAHL介紹
(2/2)
• 加入EBSCO Publishing後,增加之功能、內容與版本
– Searchable Cited Reference(可查找之引用文獻)
– CINAHL Plus (CINAHL進階版)
– CINAHL with Full Text (CINAHL全文版)
如何進入
使用帳號與密碼
帳號: CN123 密碼: CN123
列出作者參考文獻之紀錄
基本檢索畫面
四種檢索模式
• 布林邏輯/片語 Boolean/Phrase
– 以and, or, not限定檢索策略之邏輯,and, or, not無大小寫之分,
置於and, or, not 之間字詞系統自動視為”片語”. Ex. 使用 [ ”heart attack” and treatment ]檢索結果與 [heart attack and treatment] 相同
• 尋找我的所有項目/Search all my terms
– 與 Google檢索方式相同(布林邏輯中自動加上and),片語需要
加上雙引號來區分。 Ex. 使用 [ ”heart attack” and treatment ]檢索 結果少於 [heart attack and treatment]
• 尋找我的任何項目/Search any of my terms
– 只要任何一個關鍵字相符,即顯示於檢索結果中
• SmartText檢索
– 以自然語言檢索相關結果,最多輸入5,000個單字,可”以文找
布林模式:and 分隔關鍵字條件
尋找我所有的項目
尋找我的任何項目
Smart Text 檢索
results: 307,406
可輸入至5,000個單字
檢索結果之
檢索結果清單 – 可繼續篩選
以[主題]篩選 限定文獻年份 Limiters [出版品類型]篩選 更多篩選條件 加入資料夾完整書目資料
可自行選擇需要之格式
【進階檢索】:關鍵字之常用欄位說明
• TX All Text :搜尋內文全文中與key word相符 之文獻
• AB Abstract:僅搜尋索摘部分與key word相符 之文獻
• AF Author Affiliation:查詢作者關係機構。Ex. Harvard University
• AG Age Group:限定年齡層。Ex. Age over 80
• AN Accession Number:可指定文獻之AN號碼
• AU Author:以作者姓名作為搜尋關鍵字。
• CA Corporate Author:搜尋機構以自身機構 名稱發表的文獻。Ex. National Hospital
• CH Cochrane AN:以Cochrane Accession Number查找文獻 • CT Gender:以性別限定文章。Ex. Male • DN Dissertation Number:以Dissertation Number查找文獻 • DT Publication Date:以出版日期查找 • EM Entry Date:以登入資料庫的日期查找 • IB ISBN:以書籍的ISBN查找。 • IS ISSN:以期刊的ISSN查找。
• JT Journal Title Abbreviation:以期刊名稱縮 寫查找
• LA Language:以文獻所使用之語言來限定查 找
• MW Word in subject heading:查找key word與 subject heading部分相符之文獻
• MH Exact subject heading:查找key word與 subject heading 完全相符之文獻
• MJ Word in Major subject heading:查找與 Major subject heading相符之文獻
• MM Exact Major subject heading:查找與Major subject heading完全相符之文獻
• PB Publisher:以出版者限定查找
• PG Numbers of Pages:以頁數來限定查找
• PM Medline PMID:以Medline的PubMed ID來 查找 • PY Year of Publication:以出版的年份限定查找 • SO Journal Title:以期刊的完整名稱查找 • TC Table of Contect:查找目錄中相符的文獻 • TI Title:以文獻的篇名作為查找依據 • VI Volume:以出版品的卷期作為查找依據
• Cas registry number: 化學物質登記號
• Gene symbol: 基因符號
• Gene symbol word: 基因符號字彙
• Grant number: 獎助代碼
• Molecular sequence: 分子序號
1. 選擇高解析度圖片
2. 引用圖片資料來源
CINAHL Subject Heading
CINAHL 標題之使用
找出 CINAHL Heading中與Cancer相關主題
樹狀顯示該標題中之副標題&限定子標題
副標題 相關標題
布林限定子標題
將找出CINAHL Heading分類中以 Neoplasms為主
要概念,且子標題為 Drug Therapy的紀錄
找出與[Midwifery]相關之期刊
支援RSS功能
期刊頁面
永久網址可加入我的最愛 可選取特定卷期,閱讀全文
建立[警示] 自動寄送發刊新訊
系統將會在新刊發行時
於兩頁文件中
列舉Reference 並以 Coding Matrix
揭露證據等級
Coding matrix/ 證據等級
• M:已發表的統合分析(Publishedmeta-analysis)
• SR: 已發表的系統性/整合性的文獻回顧 (Published systematic or integrative literature review )
• RCT:已發表的研究(隨機對照實
驗)[Published research (randomized controlled trial) ]
• R:已發表的研究(非隨機對照實
驗)[ Published research (not randomized controlled trial)
• G: 已發表的指引(Published guidelines)
• RV:已發表的文獻回顧( Published review of the literature)
• RU: 已發表的研究利用報告(Published research utilization report )
• QI:已發表的品質改善報告( Published quality improvement report)
• L : 有立法(Legislation) • PGR: 已發表的政府報告(Published government report) • PFR: 已發表的贊助報告(Published funded report) • PP: 政策,程序, 協議(Policies, procedures, protocols) • X: 實踐範例,故事,意見(Practice exemplars, stories, opinions)
• GI: 一般訊息及報告(General or
background information/texts/reports)
• U: 未發表的研究,文獻,壁報論文等
Unpublished research, reviews, poster presentations or other such materials
• CP: 會議論文簡介,文摘,簡報
(Conference proceedings, abstracts, presentations)
登入後,可將單篇或所有結果
加入個人帳號
將單篇記錄加入個人帳號
一次加入50篇紀錄
個人帳號中記錄可永久保留、無容量限制
依照研究專案,用資料夾分類整理
可將全文寄送至自己或他人信箱
可寄給多人,可使用免費信箱 附帶html或PDF
館藏目錄 全國西文期刊 Concert電子期刊 目錄 連結至學校有訂購之 電子期刊 EBSCO 電子期刊 查詢系統 EBSCO 全文資料庫
線上操作教學
中文線上語音教學
• EBSCOhost基本檢索 • http://support.ebscohost.com/training/lang/zh/zh-tw-t/tutorials/Basic_Search/Basic_Search.html • EBSCOhost進階引導式檢索 • http://support.ebscohost.com/training/lang/zh/zh-tw-t/tutorials/Advanced_Search/Advanced_Search.html • EBSCOhost設限值與擴增值設定 • http://support.ebscohost.com/training/lang/zh/zh-tw-t/tutorials/Limter_and_Expender/Limter_and_Expender.html中文線上語音教學
• EBSCOhost出版品檢索 • http://support.ebscohost.com/training/lang/zh/zh-tw-t/tutorials/Publication_Search/Publication_Search.html • My EBSCOhost個人文件夾之建立 • http://support.ebscohost.com/training/lang/zh/zh-tw-t/tutorials/MyEBSCOhost/MyEBSCOhost.html • Search與Journal Alert專題選粹自動通知服務 • http://support.ebscohost.com/training/lang/zh/zh-tw-t/tutorials/Search_Journal_Alert/Search_Journal_Alert.html • 線上簡易測驗 • http://support.ebscohost.com/training/lang/zh/zh-tw-t/tutorials/Quiz/Quiz.html網路資源的特性
• 大量 • 分散 • 多元 • 即時 • 易變 • 品質差 • 缺乏結構 • 大部分免費 • ……使用者行為
• 檢索詞彙短(Short query)
• 檢索結構單純(Simple structure)
• 檢索歷程少(Search session is few)
• 瀏覽少數網頁(View few result pages)
•
GoogleScholar
Google Scholar(學術文獻搜尋)
• 提供了使用者簡單而方便查詢介面 • 提供多元的資料類型,包括期刊論文、學位論文、圖書 等 • 可連結圖書館的全文資料 • 提供被引用次數及相關文獻供使用者參考Google Scholar(學術文獻搜尋)
SCIRUS
收錄內容包括: • 期刊論文 • 學位論文 • 會議論文 • 圖書 • 專利 • 預行本(Preprints) • 機構網頁 • 研究者網頁SCIRUS 進階搜尋
提供「布林邏輯」 提供「布林邏輯」
SCIRUS搜尋結果
(1/2)
SCIRUS搜尋結果
(2/2)
修正檢索詞
資源類型與 文件格式
資料取得途徑
Y N 我 要 找 資 料 圖 書 館 館 藏 ? 圖 書 期 刊 視 聽 資 料 館 際 合 作 文 獻 傳 遞 借 閱 或 影 印 遠距圖書 服務系統 館際圖書 互借 全國文獻傳 遞服務系統 取 得 文 獻 線 上 下 載圖書資訊資源 實體館藏: 圖書、期刊 視聽資料 服務系統 圖書資訊資源 電子資源: 資料庫、電子 書、電子期刊
WebPac MUSE ERMG
References
• Wilson, T. D. (2006). "On user studies and information needs." Journal of Documentation 62(6): 658-670.
• Crawford, J. C. (2006). The Culture of evaluation in library and information services. Oxford, Chandos Pub.
• 黃慕萱 (1996). "策略檢索與檢索技巧在資訊檢索上之應
用." 國家圖書館館館刊 85(2): 39-58.
• 黃慕萱 (民85). 資訊檢索. 台北市, 台灣學生.