• 沒有找到結果。

第二章 相關研究探討

第一節 文獻探討

第二章 相關研究探討

第一節 文獻探討

本論文研究目的為自動從生醫文獻找出疾病與藥物之間的關係,在實驗的過 程中,研讀與探討許多人在此領域的實驗方法與技術,發現有一些研究使用MeSH (Medical Subject Headings) terms (https://www.ncbi.nlm.nih.gov/mesh/)尋找疾病與藥 物之間的關係,也有一些研究透過Clinical trials 的報告了解疾病與藥物之間的關 係,以下介紹這兩種不同尋找疾病或藥物關係的方法以及相關研究。

(一) MeSH terms

MeSH terms 是一套由美國國家醫學圖書館(NLM)所建立的生物醫學領域主 題詞表,每一個主題詞都代表特定的主題範疇。當使用者把欲查詢的關鍵字輸入 MeSH Database 中 (如圖 1 所示),將比對出最接近、最適當的 MeSH terms,點選 這些terms 的連結,它會告訴使用者 terms 的涵義,也可詳細以樹分層的方式呈現 上下層彼此的詞彙,再藉由這些terms 可以到 PubMed database 查詢相關醫學文獻 (https://www.ncbi.nlm.nih.gov/pubmed/)。

4

圖1:MeSH database 的輸入介面1

Jang et al.(2016)的研究主要是從兩個來源取得相關資料庫,一個是從 National Health and Nutrition Examination Survey(NHANES)取得電子病歷資訊,另一個則是 利 用 MeSH terms 取 得 目 前 出 版 相 關 藥 物 文 章 摘 要 和 從 Drug Bank (https://www.drugbank.ca/)取得的藥物資料庫,藉以建立兩類特徵向量。第一類是 臨床疾病特徵向量,是由clinical variables 資料集組成,代表在電子病歷上疾病與 健康之間的重要因素;第二類為藥物影響向量,是由 Drug Bank 的藥物列表和 PubMed 的藥物文章摘要所組成。透過統計的方法比較這兩類向量且求出疾病與 藥物對的分數,此分數代表著已存在的藥物對於特定疾病潛在治療的影響程度。

(二) Clinical trials

Clinical trials 是美國衛生研究院提供的線上醫學臨床試驗報告,該網站首頁 如圖2 所示。網站中包含已完成的、目前持續招募受試者、還有暫停招募受試者、

未來視情況決定是否繼續等研究狀態,此網站的優點是可以直接了解疾病名稱,

以及疾病所搭配的治療藥物與劑量,還有新功能是可以限定欲查詢的國家、受試 者的年齡與性別。

1 https://www.ncbi.nlm.nih.gov/mesh/

5

圖2:Clinical trials 的網站首頁2

Xu & Wang (2013)的研究顯示,他們從 Clinical trials 的疾病資料庫建立研究 所需之疾病字典,並從Drug Bank 的藥物資料庫再建立藥物字典。該研究的實驗 方法如下:首先透過已知的疾病與藥物對學習關係模型,例如原句為“Role of irinotecan in the treatment of small cell carcinoma ” (PMID: 11995707)擷取的關係 為“DRUG in the treatment of DISEASE ”,接著從 MEDLINE 擷取大量的文章摘要,

透過疾病字典和藥物字典自動對文章摘要進行標記,並且擷取同時具有藥物與疾 病的句子,找出出現頻率較高的關係,最後以 Precision、Recall、F1 值評估實驗 效能。本篇論文參考此研究的疾病與藥物資料庫取得方式,直接透過Clinical trials 裡已完成報告之部分疾病與藥物對進行分析,因為這樣可以減少搜尋疾病與藥物 配對的時間,而且也能確保找到的疾病與藥物是實務臨床使用的,再加上其他規 則學習和統計的方法,最後以Precision、Recall、F1 值呈現評估效能。

(三)PubMed 和 MEDLINE 的比較

MEDLINE 及 PubMed 都是由美國國家醫學圖書館 (National Library of

2 https://clinicaltrials.gov/

6

Medicine,簡稱 NLM)所建置,但兩者在本質上有所差異,MEDLINE 是資料庫,

PubMed 則是資料庫平台。PubMed 可以查找到 MEDLINE 資料庫所收錄之資料,

但不限於MEDLINE,還可以查詢 MeSH terms、Protein 等多種資料庫內的資料,

PubMed 除了可查找 MEDLINE 收錄的文章外,還可以查詢到下列資訊:

1. 處理中的文章,此類文章尚未由專業館員加上MeSH,亦尚未收錄於 MEDLINE。

2. 尚未正式發表的期刊文章,此類文章通常是出版社經由電子方式提交給 NLM。

3. 部分尚未更新為近代辭彙,或尚未收錄於MEDLINE 的 OLDMEDLINE 資

料。

本論文採用 PubMed 當作背景知識庫來源,因為它的資料庫種類除了包含 MEDLINE 的資料庫還有其它多種資料庫,這有助於增加查詢資料的廣度。

相關文件