• 沒有找到結果。

Taipei Medical University Institutional Repository:Item 987654321/22033

N/A
N/A
Protected

Academic year: 2021

Share "Taipei Medical University Institutional Repository:Item 987654321/22033"

Copied!
7
0
0

加載中.... (立即查看全文)

全文

(1)

以類神經網路架構實現腦部影像自動分割

Brain image segmentation by using artificial neural networks

曾柏蓉

a

Po-Jung Tseng

沈祖望

b

Tsu-Wang Shen

辛裕隆

c

Yue-Loong Hsin

服務單位 a學生,私立慈濟大學醫學資訊學系 b助理教授, 私立慈濟大學醫學資訊學系 c神經科主治醫師, 花蓮慈濟醫學中心

E-mail

a

[email protected]

b

[email protected]

c

[email protected]

摘要

醫學影像腦部分割(Brain Segmentation)通常為 電腦輔助診斷和醫學圖像分析治療過程中必 要 的步驟 。本 研究藉 由不 同的類 神經 網路 (Artificial Neural Network, ANN)演算法分割出 白質(White Matter, WM)、灰質(Gray Matter, GM)、腦液(Cerebrospinal fluid, CSF)。其主要 方 法 將 核 磁 共 振 攝 影 (Magnetic Resonance Imaging, MRI)去除非腦組織,再將圖讀入不同 的類神經演算法,包括 K-means 類聚演算法 (kNN)、模糊 C-Means 類聚演算法(FCM)、基 因改良式模糊 C-Means 類聚演算法(Improved Fuzzy C-means Clustering Algorithm- GA, IFCM-GA) 、 決 策 神 經 網 路 (Decision-Based Neural Networks, DBNN),以區分 WM,GM, CSF 三區。最後分析結果:CM、FCM、IFCM、 DBNN 的錯誤分區 ( Incorrect segmentation, InC ) 分 別 為 0.20915 、 0.30587 、 0.29899 、 0.15343。由數據可知決策式類神經網路演算 法對 MRI 腦部分割效果最好。此外,我們也 發現腦部影像分割配合影像融合,可以運用在 腦皮脂異常之偵測上,以提供醫師早期篩檢之 用。 關 鍵 字 : 腦 部 影 像 分 割 、 改 良 式 基 因 模 糊 C-Means 類聚演算法 (IFCM-GA)、決策神經 網路 (DBNN) Abstract

The brain segmentation is an important issue for computer-aided diagnosis in neurology. Several artificial neural network (ANN) structures were investigated for brain segmentation in the research, such as k-means clustering (kNN), fuzzy C-means clustering (FCM), improved fuzzy C-means (IFCM), and decision-based neural networks (DBNN). These methods were applied to segment a MRI brain image into gray matter, white matter, and cerebral spinal fluid (CSF). The accuracy of segmentation was also evaluated by 50 MRI images from 10 different individuals (5 images for each person). For brain image segmentation, our results showed incorrect segmentation (InC) rates are 0.15343, 0.20915, 0.29899, and 0.30587, for DBNN, CM, IFCM, and FCM methods respectively.

1、前言

(2)

癲癇、阿滋海默氏病、異位症、神經元遷移疾 病、腎腺腦白質退化症等等(table 1),都涉及 腦神經皮質細胞的問題。在診斷這類的疾病時 除了臨床上重要的疾病表現之外,腦部攝影有 時候也能提供重要的診斷依據。而腦部影像之 後分析,其中最重要也是最基本的技術,就是 腦部影像分割,像 Shen et al. [7]之前就利用改 良式模糊 C-Means 類聚演算法,做腦部影像分 割。 此外,這類腦皮質異常疾病,未必在生病的初 期就會呈現一般肉眼就可判定的變化,而我們 希望以腦核磁共振攝影的後分析可以幫助其 異常的狀況儘早發現。 Table 1 腦皮質與腦下皮質的疾病 疾病名稱 中文疾病名稱 Dysplasia 發育異常 Heterotopias 異位症 Disorders of Sulcation and Cellular Migration

神經元遷移疾病 Adrenoleukodystrophy 腎腺腦白質退化症. Disorders of Lipid Metabolism 脂質代謝疾病 Phenylketonuria and Amino Acid

Disorders

苯酮尿和胺基酸疾病 Mucopolysaccharidoses 黏多醣類疾病 Mucolipidoses and Fucosidosis 粘 (糖 )脂 和 果 藻 糖 過

多症 Multiple sclerosis 多發性硬化

Krabbe Disease Krabbe氏病;瀰漫性家 族性嬰兒腦硬化症 Canavan Disease 中樞神經海棉樣變性 2、腦部影像分割方法 腦部分割基本上主要分割出白質、灰質、腦液, 而圖一(figure 1)中概略說明此篇演算法分析 流程;首先將 MRI 去除非腦組織,再將圖中 的灰階度值 (intensity)讀入不同的類神經網 路(Artificial Neural Networks, ANN)演算法做 影像分割,進而分析哪一種演算法對 MRI 腦 部分割效果最好,我們測試了包括 K-means 類聚演算法(kNN)、模糊 C-Means 類聚演算法 (FCM)、改良式基因模糊 C-Means 類聚演算法 (Improved Fuzzy C-means Clustering Algorithm

-GA, IFCM-GA) 、 決 策 神 經 網 路 (Decision-Based Neural Networks, DBNN)等四 種方法。

Figure 1 演算法分析流程簡介

2.1、K-means 類聚演算法(K-means Clustering Algorithm) K-means 類聚演算法也可稱為 C-Means 類 聚演算法,它在所有的分割式分群法之中,是 最由一般人所熟知的。其主要目標是要在大量 高維的資料點中找出具有代表性 K 個資料 點 , 這 些 資 料 點 可 以 稱 為 是 群 中 心 (cluster centers,又稱 code words),然後再根據這些 群中心,可達到資料壓縮(以少數的資料點來 代表大量的資料)或資料分類(以少數代表點來 代表特定類別的資料)的目的。 其演算法的目標在於求取各輸入資料予其相 對應聚類中心點距離平均趨近穩定的狀態。公 式 1 就是目標函數。

∑∑

= = = K i N n n n id x wi x I N 1 1 )) ( , ( ) , ( 1 D

(公式 1) 權重的更新被表示為:

= = N n n n i x i x I N 1 ) , ( 1 w(i) (公式 2)

= = N n ni x I 1 i ( ,) N 此處w i 為權重,D 為總距離, 為特徵至 code word 的距離, , 表示分群函數, 表示 原圖 去除非腦組織後之圖 特徵 intensity x 四種類神經網路方法 結果

(3)

個數。

2.2、模糊 C-Means 類聚演算法(Fuzzy C-means Clustering Algorithm, FCM)

1973 年 Bezdek 首先提出 C-means 的改良式 演算法 Fuzzy C-Means 類聚演算法 [5],其目 標如同 K-means 演算法,但其分群函數 I 不 在是二位元矩陣,而是應用了模糊理論的概念, 使得每一輸入向量不再僅歸屬於某一特定的 群集,而以其歸屬程度來表現屬於各群集的程 度,其概念如 Figure2。 其演算法的目標在於求取各輸入資料予其相 對應聚類中心點距離平方越小越好。以下就是 目標函數。其中 m 為 indicator 指數,用來控 制模糊的程度,通常設定為 2。

∑∑

= = = K i N n n m n i d x wi x I 1 1 2 m ( ,) ( , ()) D (公式 3)

Fuzzy C-means 和 K-mean 最大的差別是分群 函數 I(xk,i),它的值再也不是絕對是 1 或 0, 根據點 n 對應到每一群中心 i 點的遠近,距離 越近 I 值越大,I 值介於 0 到 1 之間。 1 1 1 1 2 2 ) , ( − = − ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ =

k j m jn in n d d i x I (公式 4) 2 2 ) (i w x d n in = − , 會滿足以下是式子:

∑∑

= = = = ≤ ≤ = K i N n n K i n i n N I x i N x I 1 1 1 ) , ( , 1 , 1 ) , (

Figure 2 Fuzzy C-Means 概念圖 類神經網路 Fuzzy C-Means 分群步驟如下: 1.隨機選取 k 個資料點 , 1≦i≦k,並將 之分別視為各群聚初始的群中心。 2.以公式 4 更新分群函數 , 3.以公式 3 更新 Dm(Iter) 4.以公式 2 更新群中心 。 5.由式 <ε ) ( ) 1 ( 1 Iter D Iter D m m 判斷是否趨近穩定的狀 態。若小於ε(誤差值),代表分群結果已經穩 定不變,則可結束此迭代方法,否則 Iter=Iter+1 且返回步驟 2。 2.3、改良式模糊 C-Means 類聚演算法與基因 演 算 法 求 最 佳 的 ( λ 和 ξ ) 參 數 (Improved

Fuzzy C-means Clustering Algorithm - Genetic Algorithms, IFCM - GA)

2005 年 Shan Shen[7] 提 出 了 改 良 式 Fuzzy C-Means 演算法(IFCM)來解決腦部自動化分 割。其多加上了鄰居點數的觀念,將鄰居的分 群也列入判斷,分群函數 , 會因為鄰居的 特徵引力和距離引力受到影響。

IFCM 考慮鄰居引力(neighborhood attractions) 改變了

d

in2,將它附加一多項式使之更能符合 需求。 ) 1 ( ) ( 2 2 in in n in x w i H F d = − −λ −ξ (公式 5) 代表特徵引力(feature attraction)和 代表 距離引力(distance attraction) ,λ和ξ是控制 距離與特徵引力之權重,用來調節上面兩個鄰 居引力的程度,其值介於 0 和 1 之間。

= = = S k nk S k nk k in g g i x I H 1 1 ) , ( (公式 6) k n nk x x g = − 是 n 點和它的鄰居點 k 的灰階度 差(intensity difference)。S 是鄰居點的數目。

= = = S k nk S k nk k in i x I F 1 2 1 2 2 q q ) , ( (公式 7)

(4)

, 是鄰居點 k 對應到 i 點群中心的分群函 數。qnk是 n 點和它的鄰居 k 點的相對位置。 鄰居的結構是參照公式 8: Q} ) b -(b ) a -(a 0 | N {k Kj 2 k j 2 k j + ≤ < ∈ = (公式 8) 其中(aj,bj),(ak,bk)表示 j,k 點的座標,Q 是一個 常數,等於 2(L-1),L 是鄰居的階層。 q 可以被表示如公式 9: 2 k j 2 k j jk (a -a ) (b -b ) q = + (公式 9) 很遺憾的是,該演算法在求取最佳的(λ和ξ) 參數時,Shan Shen[7]提出的迭代運算十分費 時,主要是將最後一次 FCM 的資訊代入類神 經網路求最佳的參數(λ和ξ)。故我們以基因 演算法(Genetic Algorithms,簡稱 GA)方式加 以改良,以便迅速求解。 總結類神經網路 IFCM 分群步驟如下: 1.隨機選取 k 個資料點 w(i), 1≦i≦k,並將之 分別視為各群聚初始的群中心。 2.多次的執行 FCM(約 100 次) 。 3.我們用基因演算法找出相對較佳的λ和ξ 解,加以改良: 基因演算法,它適用於找尋最適化的技術, 利用『適者生存,不適者淘汰』的進化理論, 生物利用交配及突變來改變基因的組成,使 得子代和親代及子代之間產生差異性。其主 要 步 驟 有 四 : (1) 初 始 族 群 (Initital Population) (2)交配(Crossover) (3)適應函數 (Fitness Function) (4)突變(Mutation) 。 而我們運用 GA 求最佳的參數步驟如下: a. 訂定初始族群:隨機產生 4 組λ和ξ(介 於 0 和 1 之間)。紀錄此 4 組λ和ξ。 b. 交配:將紀錄中 4 組資料兩兩互相交換λ 和ξ。再紀錄此 4 組λ和ξ。 c. 適應函數:將紀錄中各組資料帶入 IFCM 計算正確率,選出最好的 4 組。清除紀錄, 再紀錄此最好 4 組λ和ξ。 d. 突變:紀錄中 4 組資料,小數點後每一個 位數有 1/5 的機率突變。再紀錄此 4 組λ和 ξ。 e. 當紀錄中最高正確率與前一次比較相差 小於 0.0001,λ和ξ即是紀錄中最高正確率 的那ㄧ組,否則,返回步驟 c。 4.再用最後一次 FCM 的資訊使 IFCM 得到初 始化的 , 。

5.用 , 更新群中心 w(i)(Iter)。(Iter 代 表迭代次數,Iter=1,2,3,…) 6.由公式 5 計算改良過的

d

in2。 7.用 2 in d 更新 , 。 8.如果 <ε ) ( ) 1 ( 1 Iter D Iter D m m 則停止程式,否則 Iter=Iter+1 且返回步驟 5。 2.4 、 決 策 神 經 網 路 (Decision-Based Neural Networks, DBNN) 決策神經網路的基本原理,以前已經有作者探 索並且建立,例如: Fu [6]、Kohonen [9]和 Rosenblatt [3]。它的架構也大致上決定,DBNN 是監督學習,結合像感知器(perceptron)一樣的 學習規則和分層(hierarchical)的非線性的網路 架構。它不僅有非線性的辨別功能而且可適應 多變化的非線性問題。DBNN 的階層結構概念 如 Figure 3。 Figure 3 DBNN 的階層結構 權重的更新差值如公式 10。

(5)

w) (x, w=η∇φ

(公式 10)

在應用上,我們需要選擇一個主要的準則函數 (Basis Function) , 辨 別 函 數 (discriminant function) ψ也會因此不同,選對準則函數,可 以使辨別函數分類資料更正確。常見的準則函 數(Basis Function)則分為: (1)線性準則函數 (Linear basis function, LBF); (2)放射準則函數 (Radial basis function, RBF); (3)橢圓準則函數 (Elliptic basis function, EBF)等。本研究採用的 是 RBF 的辨別函數(公式 13)。 2 ) w (x, 2 l l w x− − = φ (公式 13) DBNN 類神經網路訓練步驟如下[8]: 1.將訓練資料群 S={x(1),…, x(M)}讀入儲存,選 定分群數 L。 2. 讀入訓練資料 x(m)(已知它是屬於第 i 群) 3.如果 x w x wm l j l m m j m, )> ( , ), ( ( ) ( ) φ ( ) ( ) φ 此時,第 j 群勝過其他群,表示 x(m)透過神經 網路被分為第 j 群。 a)當 j=i,表示 x(m)被分群正確,權重不需更新, 維持原樣。 b)當 j≠i,表示 x(m)分群錯誤,更新權重如下: ⎪ ⎩ ⎪ ⎨ ⎧ ≠ ∀ = ∆ = ∆ + = + + + j i, k , w w : w -w w : learing) reinforced -(anti w w w : learing) d (reinforce (m) k 1) (m k (m) j 1) (m j (m) i 1) (m i 其他 處罰學習 鼓勵學習 4. 如果達到設定的迭代數目則停止程式,否 則 m=m+1 返回步驟 2。 3、結果 3.1、資料來源和評估準則 本 研 究 分 析 所 用 資 料 來 自 Internet Brain Segmentation Repository (IBSR)[4],資料有真 實腦部 MRI 和醫師手工腦部分割結果。本研 究將測試張數 50 片 256×256 pixels 的 MRI(共 10 人的資料,同一人取 5 張)分別放入這些類 神經方法之中,DBNN 放另外 50 片 MRI(不同 10 人的資料,也是同一人取 5 張)當訓練的資 料。 為了評估各個類神經網路分割執行上的優劣, 評估指數需要一些定義。Nfp是被分為此群但 實際上不屬於此群的點數。Nfn是不被分為此 群但實際上屬於此群的點數。Np是實際上屬 於此群的總點數。Nn實際上不屬於此群的總 點數。Ne是分錯群的總點數。N 是評估區域的 總點數。三個評估的參數被定義如下:

1) 錯誤分入 ( Under segmentation, UnS ) : UnS=Nfp/Nn,負向錯誤分區的比例。

2) 錯 誤 分 出 ( Over segmentation, OvS ) : OvS=Nfn/Np,正向錯誤分區的比例。

3) 錯誤分區 ( Incorrect segmentation, InC ) : InC=(Nfp+Nfn)/N,所有錯誤分區的比例。 4) 正 確 率 ( classification rate, CFR ) : CFR=Ne/N 3.2、評估結果與分析 在這個部份,我們以 MATLAB [1]實做了一個 雛 形系統 可提 供分析 、測 試資料 。此 系統 (Figure 4)可以提供選擇想使用類神經網路演 算法,可以選擇分析或是分割實際 MRI 影像。 Figure 4 腦部影像分割系統 我們決定分四群:背景、腦液、灰質、白質。 實 驗 結 果的則 是 呈 現是比 較 CM、 FCM、 IFCM-GA、和 DBNN 的腦部分割。 方法中停止條件ε設定為 0.00000001(CM、 FCM、IFCM-GA),控制模糊的程度 m 設定為 2 (FCM、IFCM),IFCM 的鄰居的階層 L 設定

(6)

為 2,IFCM 參數則是將基因演算法(Genetic Algorithms, GA)做了五次,得個最佳解,再取 其最佳值則λ=0.2810,ξ=0.6461。Table2 則 是分析數據結果,平均的 InC (CM、FCM、 IFCM 、 and DBNN ) 分 別 為 0.2091、 0.30587、 0.29899、 0.15343,DBNN 錯誤分區為最小 ,顯示出 DBNN 是較好的分 割方法。實際分割的結果顯示於 Figure 5,6。 Table2 各演算法腦部分割之分析結果 Figure 5 (a)原圖(b)用前處理將腦外殼去除(c) 二元化人工分割結果由左而右:分別是白質、 灰質、腦液(d) 人工腦分割結果 Figure 6 用類神經網路腦部分割結果 (a)K-means (b)FCM (c)IFCM-GA (d)DBNN 4、結論與討論 醫學圖像分割一直是複雜和極具挑戰的任務。 而大腦是一個特別錯綜複雜的架構,因此準確 的分割,在用於瘤、水腫和壞死的組織是非常 重要的,而我們在這裡採用類神經網路的方式 去處理腦部自動分割,以協助醫師診斷。在一 般的分群方式,大多使用 K-means、FCM 等 類聚演算法,而在這次分析中,我們特別使用 IFCM-GA 和 DBNN 來做分群,並跟以往的方 法作比較。依數據來看,DBNN 這個方法顯然 比較好,但缺點即是無法分割腦液(CSF)。 以下便是討論結果方面出現的異相、原因以及 嘗試解決的方法。 1)分析結果的異相 依照我們原先預測執行演算法結果,由優到劣 應是 IFCM、FCM、K-Means,因為這是演算 法不斷改進的結果,但結果卻是 K-Means > IFCM > FCM。探究其原因,由 Figure 7 縱切 面 可 以 清 楚 的 看 出 來 原 圖 片 灰 階 度 分 布 (distribution) 不 均 , 且 雜 訊 很 大 , 導 致 模 糊 (Fuzzy)結果不佳,我想這即是有加上模糊理論, 卻比不上原本演算法的原因,故灰階度正規化 是必須的。 Figure 7 堆疊 MRI 後的縱切面 2) DBNN 分割不出腦液(CSF)的異相 DBNN 分不出腦液(CSF),我們推測是因為腦 液佔整張影像量的部份佔最少,再加上訓練資 料有 50 片,腦液量在比例上更是少,DBNN 分 群 別 評估 參數 K-Mean s FCM IFCM DBNN 腦液 UnS 0.16864 0.23525 0.21720 0 OvS 0 0 0 0.82000 InC 0.16570 0.23056 0.21295 0.01884 灰質 UnS 0.10517 0.22349 0.22143 0.46858 OvS 0.43801 0.55124 0.53814 0.06537 InC 0.30424 0.41827 0.40951 0.22994 白質 UnS 0.18280 0.23209 0.24567 0.06343 OvS 0.11637 0.32405 0.31699 0.44565 InC 0.15749 0.26877 0.27451 0.21151 平均 UnS 0.15220 0.23027 0.22810 0.17734 OvS 0.18479 0.29176 0.28504 0.44367 InC 0.20915 0.30587 0.29899 0.15343 整 張 圖 CFR 0.96273 0.92864 0.93076 0.97249 不 含 背景 CFR 0.68807 0.53627 0.54758 0.76973

(7)

有個特性是每一群數量須差不多才會分割最 佳,所以腦液分割時因資料較少,形成該神經 元之弱化所致。之後我們將腦液部份之 pixels 複製,多加其量再訓練,但是進步有限。故再 次推測應是有很多非腦液部份之灰階度跟腦 液的差異不大所致。 腦部圖像分割的技術讓醫師在判斷病灶可以 更清楚,而後,我們將開發用模糊類聚演算法 找出局部腦皮質發育異常的發病位置,初步結 果如 Figure 8,配合 PET 影像融合技術使得醫 生更方便、更快速的診斷病理位置。 Figure 8 用腦部圖像分割與影像融合技術找 發病的位置 參考文獻 [1] 洪維恩 編著,Matlab7 程式設計,旗標出 版有限公司,2004 年 6 月

[2] Rafael C. Gonzalez, Richard E. Woods, and Steven L Eddins,廖紹綱譯,數位影像處理-運用 MATLAB,台灣東華書局股份有限公司, 2005 年 9 月

[3] F. Rosenblitt, Principles of Neurodynamics:

Perceptrons and the Theory of Brain Mechanisms. Washington, DC: Spartan, 1961

[4] IBSR [Online]. Available: http://www.cma.mgh.harvard.edu/ibsr/

[5] J. C. Bezek, Pattern Recognition with Fuzzy

Object Function Algorithms. New York: Plenum,

1981.

[6] K. S. Fu, Sequential Methods in Pattern

Recognition and Machine Learning. Orlando, FL:

Academic Press, 1968.

[7] Shan Shen, Sandham, W., Granat, M., and Sterr, A., MRI fuzzy segmentation of brain tissue using neighborhood attraction with neural-network optimization, IEEE Transactions

on Information Technology in Biomedicine, Vol. 9, Issue 3, Sept. 2005, p.p. 459 – 467.

[8] Kung, S.Y., and Taur, J.S., Decision-based

neural networks with signal/image classification applications, IEEE Transactions on Neural

Networks, Vol. 6, Issue 1, 1995, p.p.170 - 181 [9]T. Kohonen, Self-Organization and

Associative Memory, Series in Information

Science, vol. 8, Springer-Verlag, New York, 1984.

數據

Figure 1  演算法分析流程簡介
Figure 2 Fuzzy C-Means 概念圖  類神經網路 Fuzzy C-Means 分群步驟如下:  1.隨機選取 k 個資料點  , 1≦i≦k,並將之分別視為各群聚初始的群中心。 2.以公式 4 更新分群函數,    3.以公式 3 更新 Dm(Iter) 4.以公式 2 更新群中心。 5.由式−−&lt;ε)()1(1IterDIterDmm判斷是否趨近穩定的狀態。若小於ε(誤差值),代表分群結果已經穩定不變,則可結束此迭代方法,否則 Iter=Iter+1且返回步驟 2。 2.3、改良式

參考文獻

相關文件

In this paper, we have studied a neural network approach for solving general nonlinear convex programs with second-order cone constraints.. The proposed neural network is based on

In the past researches, all kinds of the clustering algorithms are proposed for dealing with high dimensional data in large data sets.. Nevertheless, almost all of

Categories of Network Types by Broad Learning Method.

Each unit in hidden layer receives only a portion of total errors and these errors then feedback to the input layer.. Go to step 4 until the error is

Moreover, this chapter also presents the basic of the Taguchi method, artificial neural network, genetic algorithm, particle swarm optimization, soft computing and

In the table boldface line was the S curve means students and dotted line was the P curve means problem.

format, Signal acquisition, Wavelet packet analysis , Discrete wavelet transform, Hyperkalemia, Acute myocardial infarction, P wave, QRS complex, T wave, Neural network,

Kuo, R.J., Chen, C.H., Hwang, Y.C., 2001, “An intelligent stock trading decision support system through integration of genetic algorithm based fuzzy neural network and