近 年 來 神 經 網 路 的 研 究 有 許 多 突 破 性 的 發 展, 卷 積 神 經 網 路 (Convolutional Neural Network,CNN) 被廣泛的應用在影像辨識領域 [1],
有賴於圖形處理器的快速進步,利用深度學習來協助影像辨識已經是當今 的趨勢;腦部腫瘤研究則是當今學術領域中最熱門的研究主題之一,人體 需要依賴大腦調節中樞神經系統,大腦對於人類來說是十分重要的器官,
而目前在醫學研究與臨床中,腦腫瘤的主要診斷方式是透過醫學影像,腫 瘤的檢測透過核磁共振成像 (MRI) 或是電腦斷層掃描 (CT) 以及超聲波圖 像 [2]。
為了預防與治療腦部腫瘤病灶,檢測腫瘤是有用且必要的行為。醫 療人員與研究人員可以在觀察醫學影像,在不需要做侵入性手術之前便 可以先行評估病患的腦部狀況 [3];但常見的腦部腫瘤醫學影像,如 MRI 影像,需要一張張透過人力觀察而非常耗費人力與時間。所幸,過去幾年 來,深度學習方法已經廣泛運用於腦部 MRI 的分類 [4] [5] ,事實上,深 度學習的應用幾乎在每個領域都成倍的增加,特別是在生物信息學、醫學 圖像分析、醫學影像處理等等領域。
本文希望以大腦腫瘤分割 (Brain Tumor Segmentation) 為主題,找 出準確分類大腦 MRI 圖像的深度學習模型,並比較所使用的不同方法,
希望能夠找出有效、準確的模型設計,使相同領域的研究人員能夠有更多 參考資料,以及能夠將所設計的模型應用於臨床診斷。
2 研究背景介紹
2 研究背景介紹
2.1 腦部腫瘤與醫學影像辨識
人類腦部的腫瘤可區分為原發腫瘤 (primary tumor) 以及次發腫瘤 (secondary tumor),其中,原發腫瘤起源於腦細胞,而次發腫瘤則是其它 器官的腫瘤轉移至大腦之中,最常見的原發腫瘤是膠質瘤 (gliomas),其生 長於大腦的神經膠質細胞,並可以分為低級神經膠質瘤 (low-grade gliomas, LGG) 以及高級神經膠質瘤 (high-grade gliomas, HGG),低級神經膠質瘤 表現出良性傾向,而高級神經膠質瘤是一種惡性腫瘤,通常需要放射治 療、手術治療 [6]。
目 前 最 廣 泛 的 腦 腫 瘤 成 像 方 式 是 使 用 核 磁 共 振 造 影 (magnetic resonance imaging, MRI)。核磁共振造影是分析、監測腦部腫瘤以及進行 其手術的關鍵診斷工具;3D 腫瘤自動分割使用核磁共振造影圖像來找出 腦部腫瘤位置,可以大幅度的節省醫療從業人員的時間,並且進一步地為 了大腦腫瘤分析與監測提供一個準確且可重複使用的有效方案。其中,腦 部腫瘤成像通常使用不同權重的核磁共振造影圖像來呈現,例如 T1 加權、
對比增強 T1 加權 (T1ce)、T2 加權及液體衰減反轉恢復 (Fluid-Attenuated Inversion Recovery,FLAIR) 圖像。這些不同的權重為腦腫瘤的不同亞區提 供補充訊息 [7]。舉例來說:FLAIR 權重下更容易觀測到蜘蛛膜下腔的病 灶,尤其能夠判斷出腦組織與腦脊隨液交界處的病灶、T2 與 FLAIR 權重 下更能觀察腦組織水腫 (peritumoral edema) 下的病灶、反之 T1、T1ce 則 可以更明顯的看出沒有腦組織水腫的病灶區。
利用醫學影像來自動分割出腦腫瘤具有準確且可重複使用的潛力,
我們將因此能更有效率且更好地判斷病情、規劃手術、評估治療流程 [7], [8],然而腫瘤病灶區域與正常腦部組織的邊界通常不明確,另外,腦部腫
2.1 腦部腫瘤與醫學影像辨識 2 研究背景介紹
瘤的大小、形狀、區域都因患者而異 [9],使得腦部腫瘤的分割是一項具挑 戰性的任務。
近年來,卷積神經網路在多模態的腦部腫瘤分割取得了優良的成績 [10] ,[11];CNN 作為一種機器學習方法,它們需要一組標記後的訓練圖像 來進行訓練,可以自動地學習影像特徵。在 Havaei 的論文 [12] 中提出了 一種 CNN 同時利用局部與總體特徵來進行穩健地腦腫瘤分割,它將傳統 CNN 中所使用的全連結層改為卷積層,提高了 40 倍的速度,當然其美中 不足的地方在於其使用二維的腦部腫瘤切片,而不考慮三維腦部影像的上 下文訊息。
而使用三維 CNN 的 DeepMdeic [13] 利用 11 層的雙通路三維 CNN 進行多腦腫瘤分割,使用三維全連結條件隨機場 (Conditional Random Field,CRF),能夠有效降低誤報,性能上比起二維的 CNN 教好,但使 用局 部 的 圖 像 而 導致 其 計算 效 率相 對 較 低。三 維 卷積 神 經 網路 (Fully Convolutional Networks,FCN) [14] 與 U-net [15] 則可以減少單一 CNN 模 型對原始參數的依賴性,以及過度擬合 (over fitting) 至特定訓練集的問 題,而代價便是需要更多的計算資源來訓練和運行一組模型。