第三章 第三章第三章
第三章 影像處理之方法剖析影像處理之方法剖析影像處理之方法剖析 影像處理之方法剖析
本論文將在接下來的兩個章節裡,也就是本章節與第四章節中介紹本 研究所運用之「數位影像處理」[11]與「類神經網路」的一些基本定理。
首先,我們會在本章節中介紹有關影像前處理之兩個步驟,接著介紹的是 影像處理中形態學(Morphology)處理的方法及應用的層面,最後,我們 會介紹的是影像分割的方法,它可以將我們感興趣的物體(Object)從影 像中取出,並和背景作區隔。而本章節理論所運用之結果,將在第六章節 的研究成果與討論中闡述與實現。
第一節第一節
第一節第一節 影像對比模式影像對比模式影像對比模式 影像對比模式
我們首先定義一個影像為一個二維的函數 f x y( , ),其中x和y為一空
間座標(Spatial coordinates),而f x y( , )通常稱為影像在(x y, )該點的強度
值(Intensity),或是在灰階影像上,我們稱其為灰階值(Gray level)。一 般而言,一個數位影像的函數 f x y( , )表示式,我們表示如下:
( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
0, 0 0,1 0, 1
1, 0 1,1 1, 1
,
1, 0 1,1 1, 1
f f f N
f f f N
f x y
f M f M f M N
−
−
=
− − − −
(3.1)
上式(3.1)陣列中的每一個元素,例如 f(0, 0)等,我們稱為影像元素
(Image element)、圖像元素(Picture element)、像素(Pixel)或是像素點
(Pel),而在接下來的討論中,我們都將用影像(Image)和像素這兩個名 詞來表示一張數位影像及其元素。接著,我們要討論的是影像的反白和對
壹壹
壹壹、、、、 影像的反白影像的反白影像的反白影像的反白
影像的反白算是影像前處理中較為基礎的方法之ㄧ,但有時卻是不可 或缺的,因為在醫學影像上,數位影像的反白可以造成猶如 X 光片之負片 的效果,如下圖 3-1 所示(接下來的影像圖示將以醫學影像上之數位乳房 X 光的影像作示範說明)。
(a)原始影像 (b)反白影像 圖 3-1 乳房 X 光影像之反白
又如之前所述的,我們已將一影像定義為函數f x y( , ),屬於一個包含
圖像元素的集合,則我們可以知道的是,在集合論中, f 可視為來自實數 集合R中的一個集合,所以影像的反白即為 f 的補集,其函數之表示式如 下:
( , ) 1 ( , )
f
cx y = − f x y
(3.2)此概念我們將在下兩節,也就是形態學及影像分割的定理中使用到。
貳貳
貳貳、、、、 影像的增強影像的增強影像的增強影像的增強
關於影像對比增強的部份,我們將採用使對比度延展的轉換函數和直 方圖處理的方式來做比較。首先,我們考慮底下(3.3)的一個轉換函數[12]。
( ) ( )
1
1
Es T r
m r
= =
+
(3.3)其中r代表輸入影像的強度值,s為輸出影像中對應的強度值,E是控 制此函數的斜率,當(3.3)式中的E為 20 時,其轉換函數圖形如下圖 3-2 所示,而m為我們要討論的一個極限函數,此極限函數又可以稱為臨界
(Thresholding)函數。
圖 3-2 轉換函數之圖形
由圖 3-2 我們知道,當輸出影像的輸入位準比m小一些時,會馬上對 應到一較窄的暗帶部份,而當輸出影像的輸入位準比m大一些時,其對應 的也是一較窄的亮帶部份,由此結果,我們可以得到如下圖 3-3 之(b)所 示的一個已增強對比的影像。
(a)原始影像 (b)增強影像 圖 3-3 對比增強之影像
接著我們考慮直方圖的影像增強模式。在[0, G]範圍內總共含有 L 個 可能之強度值的數位影像,其直方圖定義成離散函數為h r( )k 。
( )
k kh r = n
(3.4)其中rk是在區間[0, G]中的第k個強度值,而nk是影像中強度值為rk之 像素的個數。
通常我們在討論灰階的影像時,其強度值的區間會是 1 到 255,所以 我們都會令直方圖的橫座標為強度值區間[0, 255],而影像的像素個數則為 縱坐標(縱坐標的區間設定會視影像之大小及像素之分布而有所變化),
有時區間的設定會影響後來在分析影像灰階值統計上的結果,近而造成影 像的表示和描述產生不正確的現象(例如影像分割中臨界值T之分析),我 們將在本章最後一節的影像分割定理中證明。下圖 3-4 則為圖 3-3 之(a)
影像的直方圖(其區間之設定已做過處理)。
圖 3-4 影像之直方圖
我們要產生直方圖增強影像的結果,就要討論到直方圖上的機率分佈 函數,首先我們定義影像的機率分佈函數如下:
( ) ( )
k k kh r n
p r = n = n
(3.5)其中n為影像中像素的總數。接著,我們利用直方圖匹配(Histogram matching)的方法產生指定的且新生成的直方圖去增強原來的影像。我們 定義的轉換函數如下:
( ) ( ) ( )
0
H z = T r = ∫
rp w dw
(3.6)其中w為虛擬的積分變數,而z是所要尋求之輸出影像的強度值。由 於z可以獲得較為均勻的機率分佈函數p z( )k ,所以我們經由(3.6)式之 逆轉換求得z=H−1
(
T r( ))
後,就可以得到如下圖 3-5 所示之可匹配的直方 圖及增強的影像。(a)增強影像 (b)新指定之影像直方圖 圖 3-5 直方圖匹配增強之影像與直方圖
我們由圖 3-3 之(b)與圖 3-5 之(a)做比較後可發現,對比度延展 之效果似乎比直方圖匹配的效果更加好,因為直方圖的影像增強是為增加 全域之變化,連我們不重視的背景細節部份亮度也被增強了,且計算上的 複雜度差不多,所以,對比度延展在影像增強方面似乎呈現較優勢之情形。
第二節 第二節 第二節
第二節 形態學的理論基礎形態學的理論基礎形態學的理論基礎 形態學的理論基礎
形態學這個名詞通常代表處理動物和植物形式之結構分析。就數學上 的形態學而言,把它當作抽取影像成分的工具,而這些成分在區域形狀的 表示和描述上是有用的[13]。首先我們定義一些集合論中較少見且將會利 用到之集合運算。
令C是一個卡式座標(Cartesian)中的集合,而w=(x y, )為代表像素
座標中的任一元素,則我們定義集合C的反射(Reflection)C
Λ 及平移
(Translation)( )C z如下:
{ | , if }
C w w c c C
Λ
= = − ∈
(3.7)( ) C
z= { w w | = + c z , if c ∈ C }
(3.8)其中c可代表C中的任一個元素,而z=(z z1, 2)代表集合C平移的距 離。我們可依序將上式(3.7)與(3.8)的集合展示於圖 3-6 的(a)與(b),
圖中較為粗黑的點(O 點)可視為集合中的指定原點(Origin)。
(a)集合反射 (b)集合平移 圖 3-6 集合論之演算
壹壹
壹壹、、、、 形態學之運算形態學之運算形態學之運算形態學之運算
膨脹(Dilation)和侵蝕(Erosion)是形態學處理中較重要的基礎運 算,但由於許多相關研究的文獻上均有記載[14],所以此處只簡單的介紹 其基本理論,並以一般常見和前述特定的集合表示式定義兩者。
膨脹是一種在影像中使物體「增大」或「變厚」的運算,此厚化的特 定方式和程度是由一種稱為結構元素(Structuring element)的形狀來控制。
數學上,膨脹是以集合運算的方式來定義,例如A藉由B的膨脹可記為 A⊕B,表示成(3.9)式。
( )
|
zA B z B A
Λ
⊕ = ≠ ∅
∩
(3.9)與膨脹相反的是侵蝕運算,它可使影像中的物件「收縮」或是「變薄」,
收縮的方式和程度也是由結構元素所控制。A被B侵蝕記為A BΘ ,表示成
(3.10)式。
{ | ( )
z c}
A B Θ = z B ∩ A ≠ ∅
(3.10)接下來要介紹的是我們主要會用到的形態學運算,也就是結合膨脹與 侵蝕的斷開和閉合之運算,以及延伸出之形態學重建的運算:
一、 斷開
A對B的斷開,在形態學上可表示為A B ,也就是A被B侵蝕一 次後,再將結果以B執行膨脹,公式可推導為
( )
( ) ( )
{
z|
z}
A B A B B
B B A
= Θ ⊕
= ⊆
∪
(3.11)其中
∪
{ } 代表所有大括號內之集合的聯集。A B 又可以解釋為 一個可以完全放進A中之B的所有平移所組成之集合。因此,若A中 有部份是在B平移後無法填補的,將會被刪除掉。所以,形態學的斷 開會完全移去無法包容結構元素之物件的區域,使物件輪廓平滑,消 除細的連線,以及移去細的突出物。二、 閉合
A對B的閉合,在形態學上表示為A B• 。其運算過程是和斷開呈 現相反的情形,也就是先執行膨脹後再侵蝕,推導公式如下
( )
( ) ( )
{ }
(
z|
z c)
cA B A B B
B B A
• = ⊕ Θ
= ∪ ⊆
(3.12)形態學上之閉合也傾向於使物體的輪廓平滑,不過它不像斷開一 樣,是部分的移除,而是把斷掉的部份連接起來,做填補細長缺口或 填補比結構元素小的孔洞之工作。
三、 形態學之重建
形態學的重建是涉及兩張影像和一個結構元素的形態學轉換,一 張影像視為標記(Marker),可設定轉換的起始點,另一張影像視為遮 罩,用以限制轉換的輸出;所用的結構元素則定義他們的連通性。如 果g和 f 分別代表兩張影像,g是遮罩,而f 為標記,則我們可定義一 個3 3× 矩陣為結構元素A,接著我們定義形態學重建的公式如下:
( )
f ' = f ⊕ A ∩ g
(3.13)其中f '代表執行重建運算一次後新的影像。接著我們依據重建的 理論去獲得形態學重建的演算法,其中要特別記住的是,標記影像 f 必 須是g的子集合。
1. 將h1初始化,使其成為標記影像 f 。 2. 令結構元素A中的元素均為二值化的 1。
3. 重複執行重建運算,直到最後重建的結果影像hk+1=hk。
最後要說明的是,我們形態學的運算大都建立在膨脹和侵蝕的基礎運 算上,所以重建的運算亦可配合斷開的運算,稱為「重建後斷開」,亦有 所謂的「重建後閉合」的運算。而其相關的運用方式我們將在下一小節中,
也就是「形態學的濾波」中提到。
貳貳
貳貳、、、、 形態學的濾波功能形態學的濾波功能形態學的濾波功能形態學的濾波功能
就如同前述所說的,我們在此討論形態學運算上應用之實際例子,也 就是本研究會利用到之形態學處理的濾波方式。這裡將介紹兩個濾波之方 法,分別為「交替循序濾波」(Alternating Sequential Filtering, ASF)、「重 建斷開-重建閉合濾波」(Opening and Closing by Reconstruction Filtering, OCRF)之應用。雖然他們的運算性質大同小異,但結果卻值得去比較:
一、 交替循序濾波(ASF)
交替循序濾波的一個形式為以一連串大小遞增的結構元素去執 行斷開與閉合的運算。我們將一影像函數f x y( , )視為一個 3-D 曲面,
亦即其強度值解讀為xy平面上的高度值,當結構元素A頂著內側滑動 時,找到它任一部份可達到之最高點,以構成斷開運算,所以斷開可 用於移除小及明亮的細節,而留下整體及較大明亮的特徵。同理可說 明閉合的現象,即注意到當結構元素被平移到所有位置時,它在曲面 頂向下推,結構元素順著曲面上端滑動時,找到它任一部份可達到之 最低點,將構成閉合之狀態;而閉合可抑制比結構元素小之黑暗細節 的部份。我們將以下圖 3-7 說明此結果。
(a)n=2的影像 (b)n=3的影像 圖 3-7 以 ASF 濾波之影像
圖 3-7 為圖 3-1 之(a)的原始影像濾波過後之結果,由於之前就 已提過 ASF 的形式是以大小遞增的結構元素來執行,所以圖 3-7 之(a)
與(b)中所提到之n即為結構元素的大小。接著,我們發現圖 3-7 之
(a)比圖 3-7 之(b)還清晰,且跟圖 3-1 之(a)乳房 x 光原始影像 比較起來,邊緣的雜訊已消除。觀察圖 3-7 之(a)與(b)中,其方 型框框起來的部份,可明顯地看出圖 3-7 之(b)是屬於侵蝕過度的現 象,已經造成邊緣的破壞。而且經測試之後,可以知道n=1時邊緣雜 訊消除效果不佳,所以我們便以圖 3-7 之(a)作為 ASF 之結果。
二、 重建斷開-重建閉合濾波(OCRF)
在上一小節的最後,提到關於形態學運算的組合,此處就採用重 建配上斷開和閉合的濾波方式。它的技術並不複雜,但配以某些特別 的條件執行運算。首先,我們須先建立一個如前述定理中所提到的標 記影像f ;其實,找尋的辦法很簡單,將原始影像g(遮罩影像)做 侵蝕的預處理動作後即可得到。接著,配合結構元素A執行重建加斷 開的運算後得到影像 f'。最後,要進行影像之重建閉合的形態學運 算,跟重建斷開不一樣之處,重建閉合是取影像 f'的補集( )f ' c做重建
加斷開後再取補集的運算方式。我們將結果展示如下圖 3-8。
(a)侵蝕影像 (b)濾波影像
其中圖 3-8 之(a)為標記影像 f,而圖 3-8 之(b)為使用 OCRF 濾波後的結果。經過測試,我們選用結構元素大小n=1時,即可得到 較佳之濾波結果,所以我們選用它當作 OCRF 之結果。
根據上述討論之 ASF 和 OCRF 的結果,我們發現各有其優缺點,例 如,圖 3-7 之(a)邊緣部份的雜訊似乎消除的比圖 3-8 之(b)還高,但 OCRF 濾波後的圖形卻較 ASF 的完整且清晰,所以依據此處討論的結果,
在濾波的部份,是要視情況而採用某一種濾波方法才有效果。
第三節 第三節 第三節
第三節 影像分割之方法與步驟影像分割之方法與步驟影像分割之方法與步驟 影像分割之方法與步驟
本節將介紹另一個我們常使用到之影像處理的基本定理,也就是影像 分割之方法與步驟。在大多數的自動圖樣辨識與景物分析的問題中,影像 分割都是基本的預備步驟。本節所討論的方法,盡管只是全部方法中的一 部份,但它們是實際上普遍採用的代表性技術。
影像分割將一幅影像切割為它的構成區域或物體,執行切割的程度則 依解決的問題而定。一般而言,當感興趣的物體在一應用中已被隔離出 時,分割就應該停止。我們將在此介紹兩種分割的方法。
一、 臨界值分割
因為其直覺上的特性與實現上的簡便性,臨界值分割法在影像分 割的應用上享有重要的地位。我們考慮一個根據局部影像鄰域的性質 來改變臨界值的方法。如圖 3-9(由圖 3-4 之影像分析而得)所示,直 方圖對應到由明亮物體在陰暗背景上所組成的一幅影像 f x y( , )上,使
得物體和背景像素的強度值分成兩組模式來形容,從背景中抽取物體 的一個明顯方式,就是選取將這兩組模式分開的一個臨界值T。
圖 3-9 有臨界值T區隔的影像直方圖
於是,對有f x y( , )≥T 的任一點(x y, ),我們都稱為物體點(Object point);否則就稱為背景點(Background point)。換句話說,取臨界值 T後的影像g x y( , )定義成
( ) ( )
( )
1 if ,
, 0 if ,
f x y T g x y
f x y T
≥
=
<
(3.14)其中標示為 1 的像素對應為物體,而標示為 0 的像素對應為背 景。挑選臨界值T 的一個方式可藉由檢視影像直方圖的分布後選取,
或是另一種選取T 的方法是嘗試錯誤法。但我們在此提供一個常見之 自動選取臨界值T的演算法[15],條列如下:
1. 選取一個T的初始估測。
2. 用T來分割影像,將會產生兩組像素:G1及G2。 3. 計算G1與G2區域中像素的平均強度值µ1與µ2。 4. 計算一個新的臨界值T'。
5. 反覆步驟 2 到 4,直到連續遞迴中的臨界值差異小於預先定義 的參數T0。
經由以上之討論,我們將可得到臨界值分割的結果,如下所示。
(a)原始影像 (b)分割影像 圖 3-10 以臨界值分割的影像
二、 區域成長分割
令R代表整個影像區域。我們可以把分割看成是將R劃分成n個 子區域R R1, 2,…,Rn的過程,此時我們可以定義以下的條件:
1.
1 n
i i
R R
=
∪
= 。2. Ri
∩
Rj = ∅ ,and i≠ j。 3. P R( )i =True。4. P R
(
i∪
Rk)
=False ,and i≠k。而我們知道第三個和第四個條件分別代表在區域中灰階值的像
素值是否相同,True 代表灰階值相同,False 代表灰階值的不同。但第 四個條件中的i和k指的是互相在旁邊之區域。
顧名思義,區域成長是像素或子區域根據預先定義的準則組合成 更大區域的過程[16]。基本的方法是從一組「種子點」出發,把每個 與種子點有預先定義的類似性質的鄰近像素附加近來進行區域成長。
而選擇種子點的方法有:
1. 選擇一組或更多個起始點,通常可根據問題的特性做選擇。
2. 在每個像素處計算同一組起始點性質,這些性質在最終會被 用來指定像素到區域上。
3. 具有被置於接近這些群集中心性質的像素,可以用來當作種 子點。
區域成長的另一個問題就是終止的法則。基本上,當再也無像素 滿足被包括到某一區域的準則時,區域成長就應該停止。接著,將圖 3-10 之(a)執行區域成長之分割,結果如下圖所示。
圖 3-11 以區域成長分割的影像