• 沒有找到結果。

本論文中所使用之影像分割與影像轉換模型的超參數與訓練細節

第四章 影像轉換與影像分割模型之結果分析

附錄 1 本論文中所使用之影像分割與影像轉換模型的超參數與訓練細節

數項、η為學習率。在此次實驗中,ε設為10-8、β1設為0.5、β2設為0.999、η設 為2×10-8。而針對初始化每個卷積層中的參數時的數值範圍,設為從高斯分布中 隨機取樣,其平均值定為0,標準差定為 0.02。訓練上為訓練 300 個 Epochs,每 個Epoch 有 2634 次 Iteration,對應一個周期有 2634 張訓練影像,且每次生成網 路僅讀取一張訓練集影像(batch size=1),並且每次判別器會判斷新生成器所生成 之1 張假影像與前一次的生成器所生成之 50 張假影像作為該次生成器的損失值。

針對損失函數如Eq. 3.24 所示,Lcycle的λ 設為 10.0,LGAN的係數設為1.0。

OCT2HE 影像轉換模型

依照 CycleGAN 的網路超參數來做設置,三階段不同的 OCT2HE 模型僅有 損失函數的係數不同其餘參數皆相同。

因為訓練過程中有使用到預訓練好的 VGG16 網路[43],因此在此列出 VGG16 的網路詳細架構,如下表所示。

針對OCT2HE 模型的第一版,其損失函數如 Eq. 3.24 所示,Lcycle的λ 設為 10.0,LGAN的係數設為1.0。

針對 OCT2HE 模型的第二版,其損失函數如 Eq. 4.4 所示,Lcycle的 λ 設為 10.0,LGAN的係數設為1.0,Lsegmentation的𝛼設為 3.0。

針對 OCT2HE 模型的最終版,其損失函數如 Eq. 4.6 所示,Lcycle的 λ 設為 5.0,LGAN的係數設為1.0,Lsegmentation的𝛼設為 3.0,Lfeature map的𝛽設為 0.3。

此處說明一下係數是如何設定的,針對 OCT2HE 模型第一版,基本上因為

主要是觀察在解決雜訊重建問題後的生成影像品質為何,因此採用與CycleGAN 相同的係數。

針對OCT2HE 模型第二版,因為多了一個限制邊界的損失函數 Lsegmentation, 因此在調整係數𝛼的過程中,配合不同的 Lcycle的係數λ,需觀察在訓練過程中的 損失函數值生成器與判別器是否有符合兩個特點,兩者損失值相當與兩者損失值 不斷上下震盪。確保訓練過程正確後再觀察使用驗證集影像作為輸入,其輸出結 果的品質為何,總共嘗試的(𝛼, λ)有(1.0, 10.0)、(3.0, 1.0)、(3.0, 5.0)、(3.0, 7.0)、

(3.0, 10.0)、(5.0, 1.0),得到了以下的現象,當係數𝛼等於 5.0 時,對於生成器的限 制太強大了,導致在訓練至第2 個周期判別器損失值就已將趨近於 0,判別器與 生成器能力嚴重不平衡;當係數𝛼等於 3.0 時,λ 嘗試了 4 個值,每一種組合其訓 練過程都顯示正常,然而驗證結果圖的品質卻是λ 等於 10.0 時最好;當係數𝛼等 於1.0 時,訓練過程也是正常,但是可以從驗證結果圖看出其與 OCT2HE 模型第 一版是一模一樣的,像是Lsegmentation並沒有起到它的作用,因此最後選擇(𝛼, λ)為 (3.0, 10.0)。

針對OCT2HE 模型第三版,因為 Lcycle與Lfeature map本質上是類似的,都是幫 助模型限制轉換前後的影像其紋理資訊要相同,而藉由前幾個階段的模型可以看

出Lcycle的限制能力並沒有這麼顯著,在有Lfeature map的情況下,若將Lcycle的係數

λ 定為 10.0,則會使得訓練剛開始就失敗,因此選擇將 λ 固定為 5.0,並主要調

整Lfeature map的係數𝛽,觀察其影響。總共嘗試了𝛽等於 1.0、0.7、0.5、0.3、0.1。

首先當𝛽等於 1.0、0.7 時對於生成器的限制太強了,訓練過程就失敗了;而針對 𝛽等於 0.5、0.3、0.1 時,則是觀察此三個模型各自的驗證結果表現,發現𝛽等於 0.3 時有最好的結果,因此最後選擇(λ, 𝛼, 𝛽)等於(5.0, 3.0, 0.3)。

OCT 與 H&E 影像的影像分割模型

其網路架構對於OCT 或 H&E 影像的影像分割模型都如下表所示:

(共有 482,067 個需學習的參數。)

超參數:透過Adam 作為參數更新之優化器,其中的ε設為108、β1設為0.9、

β2設為 0.999、 η設為 2×104,且使用平均值為0,標準差為 1 的高斯分布來取 樣初始參數值。其損失函數如Eq. 4.6 所示,Lcrossentropy的係數設為1.0,而在訓練 上為訓練20 個 Epochs。