研究動機 - 資料擴增演算法與最佳傳輸理論於腦部腫瘤辨識的應用

　　近年來神經網路的研究有許多突破性的發展，卷積神經網路 (Convolutional Neural Network,CNN) 被廣泛的應用在影像辨識領域 [1]，

有賴於圖形處理器的快速進步，利用深度學習來協助影像辨識已經是當今的趨勢；腦部腫瘤研究則是當今學術領域中最熱門的研究主題之一，人體需要依賴大腦調節中樞神經系統，大腦對於人類來說是十分重要的器官，

而目前在醫學研究與臨床中，腦腫瘤的主要診斷方式是透過醫學影像，腫瘤的檢測透過核磁共振成像 (MRI) 或是電腦斷層掃描 (CT) 以及超聲波圖像 [2]。

　　為了預防與治療腦部腫瘤病灶，檢測腫瘤是有用且必要的行為。醫療人員與研究人員可以在觀察醫學影像，在不需要做侵入性手術之前便可以先行評估病患的腦部狀況 [3]；但常見的腦部腫瘤醫學影像，如 MRI 影像，需要一張張透過人力觀察而非常耗費人力與時間。所幸，過去幾年來，深度學習方法已經廣泛運用於腦部 MRI 的分類 [4] [5] ，事實上，深度學習的應用幾乎在每個領域都成倍的增加，特別是在生物信息學、醫學圖像分析、醫學影像處理等等領域。

　　本文希望以大腦腫瘤分割 (Brain Tumor Segmentation) 為主題，找出準確分類大腦 MRI 圖像的深度學習模型，並比較所使用的不同方法，

希望能夠找出有效、準確的模型設計，使相同領域的研究人員能夠有更多參考資料，以及能夠將所設計的模型應用於臨床診斷。

2 研究背景介紹

2.1 腦部腫瘤與醫學影像辨識

　　人類腦部的腫瘤可區分為原發腫瘤 (primary tumor) 以及次發腫瘤 (secondary tumor)，其中，原發腫瘤起源於腦細胞，而次發腫瘤則是其它器官的腫瘤轉移至大腦之中，最常見的原發腫瘤是膠質瘤 (gliomas)，其生長於大腦的神經膠質細胞，並可以分為低級神經膠質瘤 (low-grade gliomas, LGG) 以及高級神經膠質瘤 (high-grade gliomas, HGG)，低級神經膠質瘤表現出良性傾向，而高級神經膠質瘤是一種惡性腫瘤，通常需要放射治療、手術治療 [6]。

　　目前最廣泛的腦腫瘤成像方式是使用核磁共振造影 (magnetic resonance imaging, MRI)。核磁共振造影是分析、監測腦部腫瘤以及進行其手術的關鍵診斷工具；3D 腫瘤自動分割使用核磁共振造影圖像來找出腦部腫瘤位置，可以大幅度的節省醫療從業人員的時間，並且進一步地為了大腦腫瘤分析與監測提供一個準確且可重複使用的有效方案。其中，腦部腫瘤成像通常使用不同權重的核磁共振造影圖像來呈現，例如 T1 加權、

對比增強 T1 加權 (T1ce)、T2 加權及液體衰減反轉恢復 (Fluid-Attenuated Inversion Recovery,FLAIR) 圖像。這些不同的權重為腦腫瘤的不同亞區提供補充訊息 [7]。舉例來說：FLAIR 權重下更容易觀測到蜘蛛膜下腔的病灶，尤其能夠判斷出腦組織與腦脊隨液交界處的病灶、T2 與 FLAIR 權重下更能觀察腦組織水腫 (peritumoral edema) 下的病灶、反之 T1、T1ce 則可以更明顯的看出沒有腦組織水腫的病灶區。

　　利用醫學影像來自動分割出腦腫瘤具有準確且可重複使用的潛力，

我們將因此能更有效率且更好地判斷病情、規劃手術、評估治療流程 [7], [8]，然而腫瘤病灶區域與正常腦部組織的邊界通常不明確，另外，腦部腫

2.1 腦部腫瘤與醫學影像辨識 2 研究背景介紹

瘤的大小、形狀、區域都因患者而異 [9]，使得腦部腫瘤的分割是一項具挑戰性的任務。

　　近年來，卷積神經網路在多模態的腦部腫瘤分割取得了優良的成績 [10] ,[11]；CNN 作為一種機器學習方法，它們需要一組標記後的訓練圖像來進行訓練，可以自動地學習影像特徵。在 Havaei 的論文 [12] 中提出了一種 CNN 同時利用局部與總體特徵來進行穩健地腦腫瘤分割，它將傳統 CNN 中所使用的全連結層改為卷積層，提高了 40 倍的速度，當然其美中不足的地方在於其使用二維的腦部腫瘤切片，而不考慮三維腦部影像的上下文訊息。

　　而使用三維 CNN 的 DeepMdeic [13] 利用 11 層的雙通路三維 CNN 進行多腦腫瘤分割，使用三維全連結條件隨機場 (Conditional Random Field,CRF)，能夠有效降低誤報，性能上比起二維的 CNN 教好，但使用局部的圖像而導致其計算效率相對較低。三維卷積神經網路 (Fully Convolutional Networks,FCN) [14] 與 U-net [15] 則可以減少單一 CNN 模型對原始參數的依賴性，以及過度擬合 (over fitting) 至特定訓練集的問題，而代價便是需要更多的計算資源來訓練和運行一組模型。

在文檔中資料擴增演算法與最佳傳輸理論於腦部腫瘤辨識的應用 (頁 6-9)