相關研究之探討

第一章緒論

1.4 相關研究之探討

近年來，以數位影像分析血液抹片以計算白血球細胞數量的研究已經獲得了許多成果，而在這個研究方向又分成影像切割，以及血球識別，首先討論影像切割的部分，參考文獻[8]透過設定臨界值將白血球細胞核自灰階影像中切割出來，

再以主動輪廓來搜尋白血球細胞質的邊界，而參考文獻[9]為了克服染色過深區塊，以及為了產生主動輪廓所需要的初始輪廓，進一步使用了型態學，但是卻因

此造成了細胞核區域的失真，標示出來的細胞核區塊與肉眼所視細胞核區域有很大的差別，然而，較為特別的是，[9]已經開始注意到當把問題提高到較為普遍的狀況時，得要開始處理本論文所提到的染色問題；由於[8]以及[9]都採用主動輪廓作為解決白血球細胞影像切割的方法，因此都產生了幾個問題，第一，主動輪廓受到初始輪廓的影響太大，如何找到適當的初始輪廓就是一個很大的問題；

第二，主動輪廓所耗費的時間太久，通常需要經過長時間的迭代次數方能找到適當的邊界；第三，有些細胞的細胞質含量極少，在數位影像上會看到幾乎只有細胞核，倘若以[8]、[9]的做法來做細胞核切割，主動輪廓很有可能會發散，而無法找到最佳解，因此主動輪廓可能不是個恰當的想法。

參考文獻[10]對於影像切割則沒有執著在整個白血球細胞影像的切割，而是著重在白血球細胞核切割，因為白血球細胞的分類上比較明顯的特徵還是來自於白血球細胞核；[10]將每個像素的 RGB 三通道數值視為一個向量，將影像進行史密特正交化(Gram-Schmidt orthogonalization)，藉此來分割出白血球細胞核，但是這樣的做法忽略了染色差異，不同染色技術以及不同操作人員都可能會對血液抹片有不一樣的影響，以 RGB 通道數值作為標準，並不是很可靠的做法。

參考文獻[11]則想要用交離變換的方式來定位白血球細胞核，但是交離變換只能找出特定的像素結構，在白血球五種類別中，除了淋巴球以外，其餘五種類別的白血球都具備有兩種以上的變體，只以特定結構來分析白血球細胞，只能對淋巴球有一定的效果，對於其他類型的白血球則沒有明確的規則可以遵守。

因此，若想要在血液抹片上利用影像切割來識別白血球，有一個最重要的問題得要解決，也就是「對於同一個對象的血液抹片分析，是否都能產生一致的結果？意即分析系統的結果將具有可重現性？」，在這個問題框架之下，首要解決的就是影像切割，這也將是本論文將要嘗詴解決的問題之一。

1.5

論文主體與貢獻

在進行血液抹片分析的時候，系統的流程主要可以分成三個步驟：影像切割、

特徵抽取，以及分類。

因此本論文將在第二章介紹相關技術以及原理，在第三章則介紹本論文將提出的系統之流程，第四章則是與近年相關領域論文結果之比較與分析，第五章則是結論與未來展望。

而在本論文的研究中，將會把重點集中在影像切割，以及特徵抽取，而在分類的部分將會採用前人所作的支持向量機二元樹(support vector machine binary tree)，本論文所達成的貢獻有三，如下所示：

1. 當血液抹片影像出現本論文所指涉的雜訊時，本論文所提出的方法可以在很大程度上排除掉這類雜訊。

2. 可以對多顆白血球進行同時定位以及分析，不需要限定影像只能存在單一白血球細胞。

3. 分析出白血球細胞核分葉數目，提供粒細胞以及非粒細胞明確的鑑別資訊。

第二章相關技術與原理

本章節將會介紹與本論文有關的知識與理論，將從影像處理以及圖型識別的角度來做介紹，在 2.1 節介紹關於本論文所使用的色彩模型轉換，在 2.2 節則會介紹影像二值化，包含全域二值化以及區域二值化，在 2.3 節則會提到高斯混合模型(Gaussian mixture model)，在本論文中常以高斯分佈或者是高斯混合模型來建立影像模型，或者是作物體切割與選取；2.4 節介紹灰階共生矩陣；2.5 節則會介紹帄均值移動演算法(mean shift algorithm)，本論文使用帄均值移動演算法來對未知分群數目的資料作分析，以取得分群數目；2.6 節則是介紹本論文用來做細胞核分類的主要演算法，也就是支持向量機(support vector machine)的原理。

2.1 色彩模型轉換

本論文中所使用到的色彩模型包括 RGB、HSV，還有灰階(gray-level)影像，

針對不同的處理階段，需要不一樣的色彩模型輔助。

在本論文中，色彩模型的轉換，主要目的在於輔助影像切割，使影像切割的結果更接近實驗需求；在進行影像切割的時候，通常假設影像包含了感興趣的區域與不敢興趣的區域，兩者通常可以由某種特性來做明顯的區分，例如：強度 (intensity)、飽和度(saturation)，以及色調(hue)等等，根據不同需求而採用不同的色彩模型，而本論文基於兩個目的，第一個目的是紅血球模型建立，需要將 RGB 色彩模型轉換成灰階色彩模型，以獲得像素強度資訊，可利用於後續的邊緣提取；

另一個目的則是白血球細胞核搜尋，主要參考的特性為細胞核區塊的飽和度遠高於背景以及其他血液中的血球，因此將 RGB 色彩模型轉換成 HSV 色彩模型，以取得飽和度影像。

2.1.1 RGB 色彩模型

在 RGB 色彩模型，每種色彩是由紅、綠、藍三個主要頻譜成分來顯示，倘若把 RGB 色彩模型以可視化模型來表示，如圖 2.1，則可以發現紅、綠、藍三種分量構成了一個立方體，且三種分量互相正交，一張以 RGB 色彩模型表示的影像，得要用上三個數值來描述同一個像素；用來表示像素(pixels)所需的位元數稱為「像素深度」，一張以 RGB 色彩模型表達的影像，其紅、綠、藍影像皆為 8 位元影像，則每個 RGB 像素需用 24 位元來表達。

圖 2.1 RGB 色彩模型

2.1.2 RGB 色彩模型轉換成灰階色彩模型

灰階色彩模型，有別於 RGB 色彩模型得要用三個數值來描述單一像素，灰階色彩模型只有單一數值，灰階模型所呈現出來的影像，代表著影像的強度 (intensity)資訊，最弱灰階為黑色，最強灰階為白色，灰階模型則是在這兩個灰階限制下，計算出從最弱灰階到最強灰階中的變遷灰階，圖 2.2 將最弱到最強灰

階之間額外區分出 8 個灰階值。

圖 2.2 10 灰階

而在計算機影像處理領域中，最常用的灰階模型具有 256 強度，這是因為電腦常用的 1 位元組等於是 8 位元，而 8 個位元就代表最低可顯示的十進位數字為 0，最高可顯示的十進位數字為 255，共有 256 個數值，此外也就代表著一個像素可以用 1 位元組來代表，另一方面也因為 256 灰階也大約是一般人眼所能分辨的灰階數目，所以才會使用此數值作為常用灰階數目。

圖 2.3 256 灰階

在做 RGB 模型轉灰階模型的時候，並不是將 RGB 三個成分相加再除以 3，

而得要考慮人眼對於綠色的感受度較高，對於藍色的感受度較低，因此在考慮這個因素之後，轉換出來的灰階影像才會與人眼觀察影像所感受到的明暗變化類似，

詳細轉換公式如下：

B G

Gray0.299 0.587 0.114 (2.1)

2.1.3 RGB 色彩模型轉換成 HSV 色彩模型

HSV 色彩空間是從 RGB 色彩空間經過計算而得的一種表達色彩的方式，H 代表色相(hue)、S 代表(saturation)，V 則是代表著明度(brightness)；比起 RGB，

HSV 可以更為適當地聯繫人類的感知顏色，因此，HSV 常常被用於計算機視覺或者是影像處理相關領域。

倘若將 HSV 模型以一個可視覺化的方式表達，將會是一個圓錐體，色相代表著繞圓錐體中心軸的角度，而飽和度則為圓錐體的某橫截面上的一點到橫截面圓心的距離，明度則被表示為從圓錐體的橫截面積的圓心，到圓錐體頂點的距離，

如圖 2 所示，此可視化模型很適當地表達的 HSV 色彩空間的概念。

圖 2.4 HSV 圓錐模型

為了將 RGB 色彩空間轉換到 HSV 色彩空間，得要先將 RGB 三通道數值進

行正規化(normalize)。

256

min 240 60 max

min 120 60 max

min 360 60 max 度(saturation)與明度(brightness)。

2.2 全域二值化與區域二值化

不再涉及像素的灰階變遷，使處理變得更簡單，也使影像的數據處理量縮小。

常見的二值化方式是設定一個臨界值，倘若一像素之灰階大於此臨界值，則判斷此像素屬於某特定物體，將其灰階重新設定為最高灰階；否則該像素將被排除在物體區域外，灰階值將被設定為最低灰階，以表示此像素屬於背景或者其他物體區域，類似此類作法被稱為全域二值化法；相對於全域二值化，也存在著區域二值化方法，可以進一步考慮到影像的細部特性。

在本論文中採用了兩種二值化方式，第一種為最大類間方差法(Otsu)二值化，

另一種則為尼布蘭克(Niblack)二值化，前者為全域二值化，考慮整張影像的特性之後，設定一個臨界值來將整張影像進行二值化處理；後者則為區域二值化，則是先建立一個遮罩，將此遮罩滑動過整張影像，每次所處理的範圍限定在此遮罩範圍內，依照某種判斷準則，將遮罩內影像作二值化處理，此一過程持續到整張影像都被處理過為止，如此一來可以透過限定處理範圍取得更為細部的資訊；本節分成兩部分，第一部分先介紹最大類間方差二值化法，接著再介紹尼布蘭克二值化法。

2.2.1 最大類間方差二值化法

最大類間方差二值化法，是在 1975 年由大津(Nobuyuki Otsu)所提出的二值化方法；將灰階影像轉換二值化影像是影像處理中一個很基本的處理過程，最大類間方差法包含了反覆計算所有可能的臨界值，並且計算出這些臨界值兩側的像素灰階分布，目的是找出一個臨界值，可使類內方差值(within class variance)最小，

在文檔中在具雜訊的正常血液抹片中進行白血球分類計數 (頁 13-0)

第一章 緒論

1.4 相關研究之探討

1.5

第二章 相關技術與原理

第一章緒論

第二章相關技術與原理