第二章 文獻探討
第三節 PubMed 醫學資料庫與 MeSH
一、 PubMed 醫學資料庫
PubMed 是醫學期刊文獻索引摘要資料庫,它提供超過 2200 萬筆來自生命 科學期刊、Medline 資料庫及線上資源。其核心主題為醫學,但也能查閱生物醫 學相關資訊。PubMed 搜尋引擎隸屬於美國國家衛生研究院(National Institutes of Health; NIH)下的國家醫學圖書館, 而 PubMed 資料庫中不包含期刊論文的全 文,但可能提供超連結至免費或是付費的全文提供者。
PubMed 過 去 曾 被 許 多 學 者 進 行 相 關 研 究 , 如 楊 淑 華 (2009) 曾 與 EMBASE.com 檢索 Medline 資料庫的比較研究,成果 PubMed 在詞彙分類以及檢 出量均多過於 EMBASE.com;另外徐俊皓(2006)的研究中提出了一個 PubMed Smart 系統,希望找出基因本題論的隱含關鍵字,幫助使用者能提升查找的效率,
更希望能夠改善 PubMed。
11
而在 PubMed 中有提供一種識別資料(Identifier)提供檢索-PMID,它的功能 就像是數位物件識別號(Digital Object Identifier; DOI)的文獻編號。DOI 是一套在 數位環境下識別數位物件的機制,其動機在於補充統一資源標識符號(Uniform Resource Identifier;URI)指涉的統一資源定位器(Uniform Resource Locator; URL) 高變動性,且 URI 所表示的不是物件本身的資訊,只是資源所在地,而 DOI 能 克服這些問題。其用來代表知識產權對象(實體的、數位的或抽象的)的名稱(/或 英文、數字),如電子期刊、影音資料,電子書等。而隨著時間流逝,數位物件 內部的資訊、URL 可能會變化,但其 DOI 不會改變(賈東琴、董偉,2009)。而 PMID 的存在也是與 DOI 是非常相似的,只是本研究的數位環境侷限在 PubMed 資料庫中。
PMID 的使用方法就是在 PubMed 資料庫的搜尋框中輸入文章的 PMID(見圖 3),每一個 PMID 都唯一對應其中一份文獻,讀者可以免費查閱文獻的標題、作 者、摘要等。PMID 是一種流水號(serial number),從 1 開始編號,目前最多到 8 個位數,每年約有一百萬筆書目資料被加入至 PubMed 中,在 PubMed 中是個相 當實用的文獻編碼。
圖 4 以 PMID 查找 PubMed 資料庫之檢索結果
在 2012 年 2 月,PMID 亦對文獻做了版本控制,只要找到的文獻有被修訂 過,在檢索結果、摘要及文獻頁面都可看見(見圖 4)。而在文獻頁面中可點選
12
Other version 檢視之前的版本,版本控制優點是研究者不用因為少許的修改得另 外再填寫勘誤表,如作者的排序、新增或刪除作者等,都是版本控制的範圍。以 檢索 20029611 的文獻為例,PubMed 檢索出來的文獻版本都是最新的,若想找被 刪除的作者,必須檢查 PubMed 所提供的舊版本。
另外研究者可以透過新版的文獻頁面去檢視,例如輸入以下編碼:
20029611.1,即可找到第一版(見圖 5)。
圖 5 方框部分皆可點選其他版本瀏覽
圖 6 搜尋框中可輸入文獻初版的 PMID,即可找到初版的文獻
二、 MeSH
Medical Subject Headings 縮寫為 MeSH,是由 NLM 編彙的控制語彙表,中
13
文為醫學主題詞表。而標題表(subject headings)是屬於主題編目,編目人員會根 據圖書資訊主題的相關特性,解析其內容,使用一字、一詞或片語當作主題概念 的呈現,並且將概念標示進行首字順進行排列,接著以廣義詞(broader term; BT)、
狹義詞(narrower term; NT)、相關詞(related term; RT)等來表現詞彙間的關係(如圖 7)。藉著詞彙控制,可以使主題與概念間建立對應關係,而能夠達到依照主題來 集中文獻之目的,同時亦可作資料查詢。但是每本書所討論的主題範圍或標題可 能不只一個,所以標題表得將標題與其參照的關係要有順序地排列,如此才能夠 幫助讀者自圖書館目錄中查詢關於某一主題的各種類型的館藏,另外在設計之 初,就要將標題表用於分析文獻主題,這樣它就可作為資料庫系統控制詞彙的檢 索工具(陳和琴,2003)。
圖 7 簡易的 MeSH 架構圖
NLM 於 1954 年首次正式出版標題表 Subject Headings Authority List;1960 年由於 Index Medicus 的發行,全新的 MeSH 也隨之出版。MeSH 不斷地被各領 域專家一起新增、刪除與修改,每年都有不同版本的 MeSH,目前最新版本為 2013 版本,此版架構有 12 個階層,有 26853 個主標目(main headings)、214000 個補充概念文獻與 213000 個參照註協助使用者尋找最適當專有名詞。MeSH 的 功用除了用在館藏資料的主題編目外,亦可作為生物醫學方面之期刊文獻、圖 書、視聽資料、電子資源等資源的分析工具,MeSH 也應用在 NLM 出版之 Medline/PubMed 資料庫主題檢索的索引。
而 MeSH 的語彙有以下類型:
14
1.Descriptors:
也就是主標目(Main Headings),用來描述主題或內容特性的語彙,標示資 料涵蓋的內容主題為何。
2.Qualifiers:
與上者配合使用的副標目(subheadings),MeSH 中的副標目只有主題副標目 (topical qualifiers)。同一個主標目所連用的主題副標目基本上不超過三個。若超 過三個以上,則採用單獨的主標目或者參考 Topical Subheading Hierarchies 以減 少主題副標目的數量。
3.Geographics:
MeSH 的地理複分,樹狀結構表的 Z 類 Geographic Locations 中有把它詳細 的列出來。
4.Cross-References:
MeSH 有三種參照註(Cross-References),
a. See References (see 與 X)
從 MeSH 不採用的 Entry terms 指向 MeSH 採用的語彙,例如:
Cancer→Neoplasms(see) Neoplasms→Cancer(X)
b. See Related References (see related 與 XR)
用以指出主題概念上相關的其他 descriptor,例如:
Naval Medicine→Diving(see related) Diving→Naval Medicine(XR)
c. Consider Also References (consider also)
主要用於解剖的 descriptor,用以指出語言學上相關的其他 descriptor,且通 常是指出一組 descriptor 而非單一的 descriptor。例如:
Brain→ CEREBR- and ENCEPHAL-(consider also terms at)。
15
在 MeSH 目前有兩種呈現的方式(林敏雄,2007):字母順序標題表(Alphabetic List)、樹狀結構標題表(Tree Strucures),而樹狀結構在 NLM 的 MeSH 網站中有 提供 MeSH Browser 或者可以在 PubMed 直接查找 MeSH 詞彙,即可查看樹狀結 構標題表。此表是將 MeSH 所有標目分類呈現,用階層的架構表示詞彙間的上 下關係,並以英文及數字代表來表示對應的樹節點(如圖 8),甚至在 PubMed 中 還可檢索出 Entry term 有哪些(如圖 9)。經過這些處理,讓 MeSH 的架構更為清 晰並嚴謹,也是本研究導入此架構的主要原因。
圖 8 MeSH Tree 架構
16
圖 9 MeSH Tree 在 PubMed 的呈現樣貌