• 沒有找到結果。

第一章 緒論

1.4 相關研究之探討

近年來,以數位影像分析血液抹片以計算白血球細胞數量的研究已經獲得了 許多成果,而在這個研究方向又分成影像切割,以及血球識別,首先討論影像切 割的部分,參考文獻[8]透過設定臨界值將白血球細胞核自灰階影像中切割出來,

再以主動輪廓來搜尋白血球細胞質的邊界,而參考文獻[9]為了克服染色過深區 塊,以及為了產生主動輪廓所需要的初始輪廓,進一步使用了型態學,但是卻因

4

此造成了細胞核區域的失真,標示出來的細胞核區塊與肉眼所視細胞核區域有很 大的差別,然而,較為特別的是,[9]已經開始注意到當把問題提高到較為普遍 的狀況時,得要開始處理本論文所提到的染色問題;由於[8]以及[9]都採用主動 輪廓作為解決白血球細胞影像切割的方法,因此都產生了幾個問題,第一,主動 輪廓受到初始輪廓的影響太大,如何找到適當的初始輪廓就是一個很大的問題;

第二,主動輪廓所耗費的時間太久,通常需要經過長時間的迭代次數方能找到適 當的邊界;第三,有些細胞的細胞質含量極少,在數位影像上會看到幾乎只有細 胞核,倘若以[8]、[9]的做法來做細胞核切割,主動輪廓很有可能會發散,而無 法找到最佳解,因此主動輪廓可能不是個恰當的想法。

參考文獻[10]對於影像切割則沒有執著在整個白血球細胞影像的切割,而是 著重在白血球細胞核切割,因為白血球細胞的分類上比較明顯的特徵還是來自於 白血球細胞核;[10]將每個像素的 RGB 三通道數值視為一個向量,將影像進行 史密特正交化(Gram-Schmidt orthogonalization),藉此來分割出白血球細胞核,但 是這樣的做法忽略了染色差異,不同染色技術以及不同操作人員都可能會對血液 抹片有不一樣的影響,以 RGB 通道數值作為標準,並不是很可靠的做法。

參考文獻[11]則想要用交離變換的方式來定位白血球細胞核,但是交離變換 只能找出特定的像素結構,在白血球五種類別中,除了淋巴球以外,其餘五種類 別的白血球都具備有兩種以上的變體,只以特定結構來分析白血球細胞,只能對 淋巴球有一定的效果,對於其他類型的白血球則沒有明確的規則可以遵守。

因此,若想要在血液抹片上利用影像切割來識別白血球,有一個最重要的問 題得要解決,也就是「對於同一個對象的血液抹片分析,是否都能產生一致的結 果?意即分析系統的結果將具有可重現性?」,在這個問題框架之下,首要解決 的就是影像切割,這也將是本論文將要嘗詴解決的問題之一。

5

1.5

論文主體與貢獻

在進行血液抹片分析的時候,系統的流程主要可以分成三個步驟:影像切割、

特徵抽取,以及分類。

因此本論文將在第二章介紹相關技術以及原理,在第三章則介紹本論文將提 出的系統之流程,第四章則是與近年相關領域論文結果之比較與分析,第五章則 是結論與未來展望。

而在本論文的研究中,將會把重點集中在影像切割,以及特徵抽取,而在分 類的部分將會採用前人所作的支持向量機二元樹(support vector machine binary tree),本論文所達成的貢獻有三,如下所示:

1. 當血液抹片影像出現本論文所指涉的雜訊時,本論文所提出的方法可以在很 大程度上排除掉這類雜訊。

2. 可以對多顆白血球進行同時定位以及分析,不需要限定影像只能存在單一白 血球細胞。

3. 分析出白血球細胞核分葉數目,提供粒細胞以及非粒細胞明確的鑑別資訊。

5

第二章 相關技術與原理

本章節將會介紹與本論文有關的知識與理論,將從影像處理以及圖型識別的 角度來做介紹,在 2.1 節介紹關於本論文所使用的色彩模型轉換,在 2.2 節則會 介紹影像二值化,包含全域二值化以及區域二值化,在 2.3 節則會提到高斯混合 模型(Gaussian mixture model),在本論文中常以高斯分佈或者是高斯混合模型來 建立影像模型,或者是作物體切割與選取;2.4 節介紹灰階共生矩陣;2.5 節則會 介紹帄均值移動演算法(mean shift algorithm),本論文使用帄均值移動演算法來對 未知分群數目的資料作分析,以取得分群數目;2.6 節則是介紹本論文用來做細 胞核分類的主要演算法,也就是支持向量機(support vector machine)的原理。

2.1 色彩模型轉換

本論文中所使用到的色彩模型包括 RGB、HSV,還有灰階(gray-level)影像,

針對不同的處理階段,需要不一樣的色彩模型輔助。

在本論文中,色彩模型的轉換,主要目的在於輔助影像切割,使影像切割的 結果更接近實驗需求;在進行影像切割的時候,通常假設影像包含了感興趣的區 域與不敢興趣的區域,兩者通常可以由某種特性來做明顯的區分,例如:強度 (intensity)、飽和度(saturation),以及色調(hue)等等,根據不同需求而採用不同的 色彩模型,而本論文基於兩個目的,第一個目的是紅血球模型建立,需要將 RGB 色彩模型轉換成灰階色彩模型,以獲得像素強度資訊,可利用於後續的邊緣提取;

另一個目的則是白血球細胞核搜尋,主要參考的特性為細胞核區塊的飽和度遠高 於背景以及其他血液中的血球,因此將 RGB 色彩模型轉換成 HSV 色彩模型,以 取得飽和度影像。

6

2.1.1 RGB 色彩模型

在 RGB 色彩模型,每種色彩是由紅、綠、藍三個主要頻譜成分來顯示,倘 若把 RGB 色彩模型以可視化模型來表示,如圖 2.1,則可以發現紅、綠、藍三種 分量構成了一個立方體,且三種分量互相正交,一張以 RGB 色彩模型表示的影 像,得要用上三個數值來描述同一個像素;用來表示像素(pixels)所需的位元數稱 為「像素深度」,一張以 RGB 色彩模型表達的影像,其紅、綠、藍影像皆為 8 位元影像,則每個 RGB 像素需用 24 位元來表達。

圖 2.1 RGB 色彩模型

2.1.2 RGB 色彩模型轉換成灰階色彩模型

灰階色彩模型,有別於 RGB 色彩模型得要用三個數值來描述單一像素,灰 階色彩模型只有單一數值,灰階模型所呈現出來的影像,代表著影像的強度 (intensity)資訊,最弱灰階為黑色,最強灰階為白色,灰階模型則是在這兩個灰 階限制下,計算出從最弱灰階到最強灰階中的變遷灰階,圖 2.2 將最弱到最強灰

7

階之間額外區分出 8 個灰階值。

圖 2.2 10 灰階

而在計算機影像處理領域中,最常用的灰階模型具有 256 強度,這是因為電 腦常用的 1 位元組等於是 8 位元,而 8 個位元就代表最低可顯示的十進位數字為 0,最高可顯示的十進位數字為 255,共有 256 個數值,此外也就代表著一個像 素可以用 1 位元組來代表,另一方面也因為 256 灰階也大約是一般人眼所能分辨 的灰階數目,所以才會使用此數值作為常用灰階數目。

圖 2.3 256 灰階

在做 RGB 模型轉灰階模型的時候,並不是將 RGB 三個成分相加再除以 3,

而得要考慮人眼對於綠色的感受度較高,對於藍色的感受度較低,因此在考慮這 個因素之後,轉換出來的灰階影像才會與人眼觀察影像所感受到的明暗變化類似,

詳細轉換公式如下:

B G

R

Gray0.299 0.587 0.114 (2.1)

8

2.1.3 RGB 色彩模型轉換成 HSV 色彩模型

HSV 色彩空間是從 RGB 色彩空間經過計算而得的一種表達色彩的方式,H 代表色相(hue)、S 代表(saturation),V 則是代表著明度(brightness);比起 RGB,

HSV 可以更為適當地聯繫人類的感知顏色,因此,HSV 常常被用於計算機視覺 或者是影像處理相關領域。

倘若將 HSV 模型以一個可視覺化的方式表達,將會是一個圓錐體,色相代 表著繞圓錐體中心軸的角度,而飽和度則為圓錐體的某橫截面上的一點到橫截面 圓心的距離,明度則被表示為從圓錐體的橫截面積的圓心,到圓錐體頂點的距離,

如圖 2 所示,此可視化模型很適當地表達的 HSV 色彩空間的概念。

圖 2.4 HSV 圓錐模型

為了將 RGB 色彩空間轉換到 HSV 色彩空間,得要先將 RGB 三通道數值進

9

行正規化(normalize)。

256

min 240 60 max

min 120 60 max

min 360 60 max 度(saturation)與明度(brightness)。

2.2 全域二值化與區域二值化

10

不再涉及像素的灰階變遷,使處理變得更簡單,也使影像的數據處理量縮小。

常見的二值化方式是設定一個臨界值,倘若一像素之灰階大於此臨界值,則 判斷此像素屬於某特定物體,將其灰階重新設定為最高灰階;否則該像素將被排 除在物體區域外,灰階值將被設定為最低灰階,以表示此像素屬於背景或者其他 物體區域,類似此類作法被稱為全域二值化法;相對於全域二值化,也存在著區 域二值化方法,可以進一步考慮到影像的細部特性。

在本論文中採用了兩種二值化方式,第一種為最大類間方差法(Otsu)二值化,

另一種則為尼布蘭克(Niblack)二值化,前者為全域二值化,考慮整張影像的特性 之後,設定一個臨界值來將整張影像進行二值化處理;後者則為區域二值化,則 是先建立一個遮罩,將此遮罩滑動過整張影像,每次所處理的範圍限定在此遮罩 範圍內,依照某種判斷準則,將遮罩內影像作二值化處理,此一過程持續到整張 影像都被處理過為止,如此一來可以透過限定處理範圍取得更為細部的資訊;本 節分成兩部分,第一部分先介紹最大類間方差二值化法,接著再介紹尼布蘭克二 值化法。

2.2.1 最大類間方差二值化法

最大類間方差二值化法,是在 1975 年由大津(Nobuyuki Otsu)所提出的二值 化方法;將灰階影像轉換二值化影像是影像處理中一個很基本的處理過程,最大 類間方差法包含了反覆計算所有可能的臨界值,並且計算出這些臨界值兩側的像 素灰階分布,目的是找出一個臨界值,可使類內方差值(within class variance)最小,

最大類間方差二值化法,是在 1975 年由大津(Nobuyuki Otsu)所提出的二值 化方法;將灰階影像轉換二值化影像是影像處理中一個很基本的處理過程,最大 類間方差法包含了反覆計算所有可能的臨界值,並且計算出這些臨界值兩側的像 素灰階分布,目的是找出一個臨界值,可使類內方差值(within class variance)最小,