第三章 系統流程
3.3 建立紅血球模型
3.3.2 二值影像邊緣提取
當二值化處理結束之後,可以看到影像中仍然有許多空洞存在,此空洞可能 是因為紅血球本身外厚內薄的原因,所以二值化處理的時候無法將紅血球影像形 成一個完整無空洞的區塊;在本論文中,該空洞對於實驗後續分析並沒有任何助 益,更有可能造成無謂的計算量上升,因此,將空洞填滿將對於實驗的進行有所 幫助,填補空洞後的影像如圖 3.11(b);再利用 Sobel 運算子對圖 3.11(b)計算邊界,
可得邊界影像如圖 3.11(c)。
(a) (b)
(c)
圖 3.11 二值影像邊緣提取:(a)血液抹片二值化影像;(b)填補影像中的空洞;(c) 則是由(b) 作邊緣提取所得的邊緣影像。
32
3.3.3 高圓度區塊面積分析
參考 3.4.4,每個封閉邊界都能計算出圓度,再將所得的圓度利用高斯混成 模型分成三類(圖 3.12),預期會形成高、中,以及低圓度三個高斯分布模型;根 據 2.3 節,高圓度高斯分布模型的資料將有 68.27%落在帄均值左右一個標準差的 範圍內,因此設定帄均值減去一個標準差為正圓度臨界值,高於此數值則判斷此 封閉邊界近似於圓,很有可能是本節所想要尋找的紅血球區塊,由此臨界值,可 以保留下約 84.135%的高圓度區塊,但是即使滿足高圓度限制,也未必是紅血球 區塊,另外還得要再考慮區塊面積大小的問題。
圖 3.12 正圓度分析。
33
圖 3.13 是參考上一步驟所選定的高圓度臨界值而標記的高圓度區塊,當區 塊內包含有一個黑色圓圈,此區塊即為高圓度區塊,其圓度標記於該區塊的左下 角;由此參考圖片來看,本論文只尋找單一且圓度高的區塊,對於區塊交疊或者 是相連的部分則不作處理。
圖 3.14 為高圓度區塊面積直方圖,這些疑似紅血球的高圓度區塊其面積並 沒有固定範圍,受到血小板、血液抹片製作技術或者是血液來源本身的影響,所 以差距可以到六、七倍之譜;雖然就面積大小來說有很大的差異,但也可以看出,
此直方圖實際上具備集中趨勢,在健康的動物體內,紅血球的大小應該是落在一 個固定的區間內,此區間雖然沒有明確界定,但是可以合理假設經過統計後,可 以由直方圖得到一個高機率分佈的區間,而在實驗過程中也確實證明了這項假 設。
圖 3.13 根據正圓度圈選出可能為紅血球的區塊。
34
圖 3.14 分析高圓度區塊面積直方圖。
為了取得紅血球的近似大小,本論文將每個圖 3.14 中每個區間內的數量除 以高圓度區塊的總數,因此可以得到機率密度分布,再由此機率密度分布作為權 值,與每個區間的均值作加權運算,則可以得到紅血球的近似大小。
3.3.4 高圓度區塊半徑分析
本論文所討論的紅血球模型還包含了紅血球半徑(r),此半徑的計算方式乃是 由高圓度區塊面積計算而得;已知區塊具備高圓度,因此可以簡單地由圓形的面 積計算公式:
radius2
Area (3.1)
radius Area (3.2)
35
分析半徑大小的分布,可以得到一個關於半徑大小分布的直方圖,如圖 20 所示:
圖 3.15 高圓度區塊近似半徑直方圖。
依照 3.3.1 節高圓度區塊面積分析,在這裡可以對近似半徑直方圖進行同樣 的處理,將每個區間內的數量除以總數量,計算得近似半徑落在該區間的機率密 度分佈,再將此機率密度分佈作為權值,與每個區間的均值作運算,即可得到高 圓度區塊的近似半徑。
至此,紅血球面積的近似大小以及紅血球半徑的近似大小已經獲得,紅血球 模型即由此二參數來描述,在後續的白血球細胞核影像處理中,將會有重要的作 用。
36
3.4 白血球細胞核影像處理與特徵抽取
白血球細胞大致上可分成細胞核與細胞質區塊,在本論文的實驗進行過程中 發現,當血液抹片製作較差,導致染色不均,或者是數位顯微鏡曝光程度差異,
都會影響到白血球細胞質邊界的清晰程度,因此,因為其易受人為因素影響的特 性,所以在本章並不討論白血球細胞質。
圖 3.16 白血球細胞核影像處理流程圖。
本節共分成四小節,3.4.1 介紹色彩空間轉換,3.4.2 介紹區域成長法復原細 胞核區域,3.4.3 則因為 3.4.2 節所復原出來的細胞核區域並未必真實地描述了白 血球細胞核區域,因為白血球細胞核分葉的現象,導致可能有兩三個區域同屬於 同一細胞核,若直接以 3.4.2 節的結果來作為白血球細胞核,而不描述這些不同 區塊間的關係,最後產生出來的白血球細胞核描述會是錯誤的描述; 3.4.4 說明
37
在 3.5.3 節的處理之後,核區已經重建完成,於是可以從這些已經重新描述過的 白血球細胞核區塊抽取出特徵,作為白血球分類的依據。
3.4.1 色彩空間轉換
本論文為了要將細胞核盡可能地與背景有更多的差異,因此需要透過色彩空 間轉換,讓屬於白血球細胞核的特性更為顯著;觀察白血球細胞核影像之後,本 論文決定採用 HSI 色彩空間,由此色彩空間特性,可以得到影像中色調、飽和 度、以及亮度資訊;透過 HSI,本論文可以分析影像中色調,飽和度,以及亮度 的變化,經過實驗發現,在血液抹片影像上,色調的變化因染色技術以及曝光參 數有關,並不具有一致性,因此不能從色調來作分析;亮度資訊也和色調一樣,
不具有一致性,只有飽和度在各種染色技術,都能突顯出白血球細胞核,即使曝 光參數變化,也能有很高的容忍程度,因此由 RGB 轉換成 HSI 確實有其必要性。
圖 3.17 色彩空間轉換及面積過濾流程圖。
根據第 3.2 節 RGB 直方圖分析與修正之後的結果,可以相信 RGB 三通道已 經獲得適當的修正,使三通道的直方圖分布上都較為均勻,以此為前提,開始進 行 RGB 色彩空間轉換到 HSV 色彩空間;在實驗過程中發現 H(hue)通道很容易 受到曝光程度、白帄衡,以及不同染色技術的影響,並不具有後續實驗分析的價 值;而 I(intensity)通道影像也隨著曝光程度改變而有不同的變化,同樣地,I 通
38
道也不能拿來作分析;再來看 S(saturation)通道影像,可以發現無論曝光程度,
白帄衡怎樣變化,白血球細胞核區塊的飽和度相較起影像中其他區域有很大的差 異,可參考圖 3.18(b),因此,可以設定臨界值,將白血球細胞核區塊自 S 通道 影像中切割出來。
初始臨界值設定乃是根據經驗,在本論文的實驗過程中發現,白血球細胞核 區塊飽和度幾乎都維持在 0.75 以上,因此可以先設定臨界值為 0.75 來對 S 通道 影像作切割,圖 3.18(c)即為以色彩飽和度為 0.75 為臨界值,對 S 通道影像切割 後的結果。
由圖 3.18(c)和圖 3.18(b)來做比較,在圖 3.18(c)中發現依然存在著一些會影 響到後續實驗進行的雜訊,在此以紅色方框標記;由本例來說,雜訊是因為紅血 球重疊而產生的陰影,其色彩飽和度也在 0.75 以上,所以也被錯誤歸類到白血 球細胞核區塊;除了紅血球重疊這個因素之外,有時候也因為曝光不足、血小板,
或者是嗜鹼性顆粒的關係,而出現錯誤歸類的區塊,為了克服這一點,本論文基 於一個假設:「雜訊面積和白血球細胞核區塊面積相比較小」,因此依經驗設定一 面積臨界值為 100,大於此數值者,才會被歸類為白血球細胞核區塊;此一假設 並沒有理論支持,單純是實驗過程中的心得,而這個假設所導致的最大缺點,就 在於可能會有白血球細胞核區塊也小於 100 像素,也被這個假設所濾除,如圖 3.18(d)所示,為了修正這個缺點,本論文將會在 3.5.2 節提出修正方法。
(a) (b)
39
© (d)
圖 3.18 白血球細胞核影像飽和度切割;(a)原圖;(b)來自(a)的飽和度影像;(c)飽 和度臨界值(0.75)切割;(d)濾除過小區塊之結果。
3.4.2 區域成長法復原細胞核區
為了要尋找白血球細胞核區塊,並且定位白血球區塊,本論文在一個前提下 進行後續的操作:「當雜訊完全去除掉的時候,剩下的區塊即為白血球細胞核區 塊」,因此,如果單純只對整張飽和度影像選取一個臨界值作分割,從 3.5.1 節可 以發現依然會存在本論文所不希望出現的錯誤區塊,想要從影像中找到一個全域 臨界值來做二值化切割幾乎是不可能的事,因此,在本小節延續 3.5.1 節的結果,
將探討的範圍從整張影像,限定到可能為白血球細胞核區塊的近鄰區域,一方面 修正 3.5.1 節為了在雜訊與真實細胞核區塊之間所作的取捨,一方面也因為搜索 細胞核區塊的範圍從整張影像,縮減到極小的範圍,將可大幅提高定位白血球區 塊的準確度,但是即使復原了核區,在此章節仍未能定位白血球細胞核,理由將 由 3.5.3 節回答。
由圖 3.18(d),可以看到三個離散的白血球細胞核區塊,再參照圖 3.18(a),
會發現這三個離散的白血球細胞核區塊實際上都同屬於一個細胞核,但是從這三 個白血球細胞核區塊並沒有辦法得到此細胞核任何資訊;觀察圖 3.18(a),可以
40
發現原本的細胞核區塊遠比這三個白血球細胞核區塊來得大,為了實驗的進行,
有必要由現有的資訊來恢復完整的白血球細胞核。
首先第一個考慮的要點,若要恢復完整細胞核區塊,得要找出有什麼資料是 這些區塊的共通性質,以連結這些區塊;既然我們切割出白血球細胞核的依據是 來自於飽和度,那麼很理所當然地,若兩像素同在同一細胞核區的範圍內,則兩 像素間最大的相似性在於飽和度。
由現有的白血球細胞核區塊,分析這些區塊內的飽和度分布,計算其帄均值 與標準差,建立一個以現有區塊飽和度為基礎的高斯分佈模型,此高斯分布模型 將被用來描述像素與像素間的相似性,在本論文中稱此高斯模型為「相似性模 型」。
初始輪廓為圖 3.18(d)中所示的三個離散細胞核區塊的邊緣,搜索範圍為以
初始輪廓為圖 3.18(d)中所示的三個離散細胞核區塊的邊緣,搜索範圍為以