• 沒有找到結果。

視覺目標感知程序中亮度、對比與梯度結構之基本效應觀察

N/A
N/A
Protected

Academic year: 2021

Share "視覺目標感知程序中亮度、對比與梯度結構之基本效應觀察"

Copied!
86
0
0

加載中.... (立即查看全文)

全文

(1)

       

多媒體工程研究所

     

           

視覺目標感知程序中

亮度、對比與梯度結構之基本效應觀察

   

Basic Observations on Potential Cues Behind Visual Target

Perception : Intensity, Contrast and Gradient Organization

     

研 究 生:江俊良

指導教授:林正中

     

中 華 民 國 九 十 九 年 六 月

(2)

視覺目標感知程序中亮度、對比與梯度結構之基本效應觀察 Basic Observations on Potential Cues Behind Visual Target Perception :

Intensity, Contrast and Gradient Organization.          研 究 生:江俊良 Student:Chun-Liang Chiang 指導教授:林正中 Advisor:Cheng-Chung Lin       國 立 交 通 大 學 多 媒 體 工 程 研 究 所 碩 士 論 文       A Thesis

Submitted to Institute of Multimedia Engineering College of Computer Science

National Chiao Tung University in partial Fulfillment of the Requirements

for the Degree of Master

in

Computer Science June 2010

Hsinchu, Taiwan, Republic of China  

 

(3)

視覺目標感知程序中亮度、對比與梯度結構之基本效應觀察

    學生:江俊良 指導教授:林正中 副教授   國立交通大學多媒體工程研究所碩士班    

摘 要

    本論文旨在觀察利用亮度、對比與梯度之間的交互作用,於灰階影像 中擷取視覺目標的區塊結果,共分成兩個觀察項目:亮度與梯度結構的交 互作用、對比與梯度結構的交互作用。   本論文將亮度與對比分成強、中、弱三個部分,分別與梯度結構的同 向性分佈區域、逆向性分佈區域及散亂性分佈區域交互作用,產生一系列 的目標擷取圖,以觀察其效應。   利用一般化的影像特性,透過不斷的實驗與觀察,探討亮度、對比與 梯度結構對目標擷取的結果與主觀認知的差距。      

(4)

Basic Observations on Potential Cues Behind Visual Target Perception : Intensity, Contrast and Gradient Organization

 

Student:Chun-Liang Chiang Advisor:Cheng-Chung Lin

   

Institute of Multimedia Engineering National Chiao Tung University

 

ABSRACT

 

In this thesis, experiments on using the interactions among intensity, contrast and gradient organization(GORG hereafter) for capturing visual targets in a graylevel still image will be reported.

 

The GORG, gradient organization, at a specific locality is an index reflecting whether gradients in the neighborhood are mostly in alignment with, opposite to, or in randomness with respect to the central gradient under consideration. For any graylevel image, an associated GORG map can be derived, as well as a contrast map too.

 

Two observations were conducted during the experiments. The first focused on the interactive behavior of intensity and GORG attributes in the product of the image and GORG map; the second on that of the contrast map and GORG map.

(5)

Specifically, the another is interested in

(1) The results from the interaction between pixels of high, medium, and low intensity(contrast) along with those of alignment, opposed, and random GORG(consequently a outcomes from each of the two observations for every image input).

(2) Getting a preliminary picture of how much the deviation from the

subjective visual target perception may be using the three cues proposed in this thesis for capturing visual target by computation.

(6)

 

目 錄

中文摘要 英文摘要 目 錄 圖片目錄 第 一 章 第 二 章 2.1 2.2 2.3 第 三 章 3.1 3.2 3.3 第 四 章 4.1 4.2 第 五 章 5.1 5.2 第 六 章 參考文獻  ……… ……… ……… ……… 簡介 ……… 相關研究 ……… 臨界值法 ……… 對比與區域合併 ……… 灰階圖相對亮區與暗區分割 ……… 實驗動機與構想 ……… 梯度結構與視覺內涵 ……… 亮度分佈與視覺內涵 ……… 對比分佈與視覺內涵 ……… 處理方法 ……… 系統架構 ……… 處理步驟 ……… 實驗結果 ……… 影像類型的探討 ……… 實驗結果 ……… 結論 ……… ……… i ii iv v 1 3 3 5 6 9 9 12 13 14 14 15 25 25 56 76 77      

(7)

 

圖 目 錄

  圖 2-1 圖 2-2 圖 2-3 圖 2-4 圖 2-5 圖 2-6 圖 3-1 圖 3-2 圖 3-3 圖 3-4 圖 3-5 圖 4-1 圖 4-2 圖 4-3 圖 4-4 圖 4-5 圖 4-6 圖 4-7 圖 4-8 圖 4-9 圖 4-10 圖 5-1 圖 5-2 圖 5-3 圖 5-4 圖 5-5 文獻[4]的結果圖 ……… 文獻[5]的結果圖 ……… 文獻[6]的處理流程 ……… 文獻[6]與文獻[7]的結果比較圖……… (a)Center-on 光線感受場(b)Center-off 光線感受場… 文獻[8]中間與結果圖 ……… 汽車表面的大面積一致性的光影變化……… 班馬的條紋結構……… 純色馬、天空與雜草……… 長頸鹿、天空與草原……… 表面圖紋複雜的影像……… 系統流程圖……… 灰階影像轉換圖……… 亮度對比圖……… 梯度方向示意圖……… convolution mask……… 梯度結構權重圖……… 中亮度與中對比轉換示意圖……… 美洲豹 (1190x798) ……… 美洲豹:亮度與梯度結構擷取圖……… 美洲豹:對比與梯度結構擷取圖……… 長頸鹿 (1024x768) ……… 長頸鹿:亮度與梯度結構擷取圖……… 長頸鹿:對比與梯度結構擷取圖……… 花豹 (515x344)……… 花豹:亮度與梯度結構擷取圖……… 4 5 6 6 7 8 10 11 12 13 13 14 16 17 17 18 19 21 22 23 24 26 27 28 29 30

(8)

圖 5-6 圖 5-7 圖 5-8 圖 5-9 圖 5-10 圖 5-11 圖 5-12 圖 5-13 圖 5-14 圖 5-15 圖 5-16 圖 5-17 圖 5-18 圖 5-19 圖 5-20 圖 5-21 圖 5-22 圖 5-23 圖 5-24 圖 5-25 圖 5-26 圖 5-27 圖 5-28 圖 5-29 圖 5-30 圖 5-31 圖 5-32 花豹:對比與梯度結構擷取圖……… 乳牛 (600x400)……… 乳牛:亮度與梯度結構擷取圖……… 乳牛:對比與梯度結構擷取圖……… 大斑塊的馬 (900x600)……… 大斑塊的馬:亮度與梯度結構擷取圖……… 大斑塊的馬:對比與梯度結構擷取圖……… 純色馬 (1024x768) ……… 純色馬:亮度與梯度結構擷取圖……… 純色馬:對比與梯度結構擷取圖……… 黑猩猩 (1855x1484)……… 黑猩猩:亮度與梯度結構擷取圖……… 黑猩猩:對比與梯度結構擷取圖……… 汽車 (780x490)……… 汽車:亮度與梯度結構擷取圖……… 汽車:對比與梯度結構擷取圖……… 人物 (1024x768) ……… 人物:亮度與梯度結構擷取圖……… 人物:對比與梯度結構擷取圖……… 猴子 (1024x683) ……… 猴子:亮度與梯度結構擷取圖……… 猴子:對比與梯度結構擷取圖……… 山獅 (1600x1200)……… 山獅:亮度與梯度結構擷取圖……… 山獅:對比與梯度結構擷取圖……… 王建民:亮度與梯度結構擷取圖……… 王建民:對比與梯度結構擷取圖……… 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57

(9)

圖 5-33 圖 5-34 圖 5-35 圖 5-36 圖 5-37 圖 5-38 圖 5-39 圖 5-40 圖 5-41 圖 5-42 圖 5-43 圖 5-44 圖 5-45 圖 5-46 圖 5-47 圖 5-48 圖 5-49 圖 5-50 純色馬:亮度與梯度結構擷取圖……… 純色馬:對比與梯度結構擷取圖……… 斑馬:亮度與梯度結構擷取圖……… 斑馬:對比與梯度結構擷取圖……… 鳥:亮度與梯度結構擷取圖……… 鳥:對比與梯度結構擷取圖……… 獵豹:亮度與梯度結構擷取圖……… 獵豹:對比與梯度結構擷取圖……… 大麥町:亮度與梯度結構擷取圖……… 大麥町:對比與梯度結構擷取圖……… 鹿:亮度與梯度結構擷取圖……… 鹿:對比與梯度結構擷取圖……… 針鼴:亮度與梯度結構擷取圖……… 針鼴:對比與梯度結構擷取圖……… 猴子:亮度與梯度結構擷取圖……… 猴子:對比與梯度結構擷取圖……… 松鼠:亮度與梯度結構擷取圖……… 松鼠:對比與梯度結構擷取圖……… 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75    

(10)

第一章 簡介

    在電腦視覺的領域中,對於目標擷取(Target Perception)定義就是將 影像中的主體目標與背景分離,以取得主體目標在影像中的分佈區域。依 據人眼的視覺捕捉目標的能力,我們會將注意力放在幾種不同的視覺屬性, 例如:亮度、對比、視深、色彩、影像結構和目標運動等特性。一般來說, 當目標與鄰近區域有著不同的視覺屬性的話,我們將會很容易將其擷取出 來。 通常在進行影像中的目標擷取之前,我們會進行影像分割(Image Segmentation)的處理,影像分割的定義就是將影像區分為不同的區塊,而相 同區塊所包含的像素則會有著相同的影像區域特性。藉由影像分割的處理 之後,我們可以再針對每個區塊做適當的處理。 本論文擬藉由對人類視覺捕捉光影特性的有限認識,建構幾個簡單的程 式模組執行影像分割。在此基礎上設計並實作一套流程,利用亮度-梯度結 構與對比-梯度結構之交互效應,自動化擷取輸入影像中之”主體目標區”。 透過對此兩種效應在擷取視覺目標成效上之觀察,分析並探討擷取結果與 主觀認知上的差距。   接下來將會在第二章中介紹一些影像分割所使用的方法。第三章說明

(11)

此篇論文實驗的動機與構想。第四章說明此篇論文所採用的方法以及處理 的程序。第五章是實驗的結果探討,最後第六章則是結論的部分。

(12)

第二章 相關研究

  由於灰階影像中之影像特性諸如亮度及由其導衍而出之光影特性 (對比、梯度等)均有局部同質性分部之特點,故各式光影指標值之分佈 在某種程度上也意謂著影像中視覺目標之所在。影像切割指的即是各類 找出影像中某一光影指標值變化範圍內某一特定區間在影像上分佈區 塊所在之處理手段。本論文所探討之影像切割乃針對靜態灰階影像中之 亮度(intensity)、對比(contrast)及梯度(gradient)三種光影特性指標在影像 中分佈位置之分割而言。 在本章節,我將介紹依序臨界值法(thresholding)[1][2][3][4][5]、對 比與區域合併[6]的影像分割方法,及以人類視網膜的神經結反應現象為 基礎[8]的分割方法。  

2.1 臨界值法(Thresholding)

  在灰階影像分割的處理方法中,臨界值法是一種簡單且常見的技術, 在大多數的教科書[1][2]與影像分割相關文獻[3][4][5]都會提到其敘述。 通常在影像中,同一個物體表面通常會處於某個亮度範圍,基於這個想 法,我們利用臨界值法將影像的灰階直方圖分割成幾個部分,藉由觀察 或影像特性來決定臨界值所在的位置,以區分出物體與背景。圖 2-1 是

(13)

文獻[4]一個簡單的分割結果,t*為其 threshold。   圖 2-1:文獻[4] 結果圖 除了只利用灰階值統計的直方圖決定臨界值的全域性臨界值法 (global thresholding)之外,也有將影像裡的空間分佈特性與灰階直方圖 整合起來決定不同區域的臨界值,以使每個分割區域更為完美,這種方 法就叫自適應臨界值法(adaptive thresholding),這種方法會以自定的結 束準則來優化分割區域。圖 2-2 是考慮灰階直方圖與空間特性的一種結 果。

(14)

圖 2-2:文獻[5]的結果圖

2.2 對比與區域合併

  文獻[6]介紹一種以影像對比(contrast)為基礎的彩色影像分割方法, 其作法乃利用每個像素的色彩資訊,依據自定的公式得到 0°、45°、 90°和 135°這四個方向的對比值,之後利用 adaptive thresholding 來優化 一些邊界資訊,然後依據 2 個準則決定每兩個相鄰像素是不是相同區域。 決定區域的準則如下: 準則 1:若 2 個相鄰像素之間有邊界存在,則不在同一區域。 準則 2:若 2 個相鄰像素之間沒有邊界存在,則只要它們與共同相 鄰的像素沒有不一致的情況,就可以當做在同一區域。例 如:A、B 與 C 都相鄰,如果 A、B 符合準則 2,則 A 與 C 及 B 與 C 皆同區域或皆不同區域。

(15)

圖 2-3 是文獻[6]的處理流程圖,圖 2-4 是文獻[6]與文獻[7]的結果比 較,(b)是文獻[6]結果圖,(c)~(e)則是文獻[7]在不同 threshold 的結果。 圖 2-3:文獻[6]的處理流程 圖 2-4:文獻[6]與文獻[7]的結果比較圖  

2.3 灰階圖相對亮區與暗區分割

文獻[8]以眼睛視網膜上的神經結對光線刺激的反應現象作為影像 切割基礎以輔助找尋影像中的目標。center-on 的反應現象指的是某些神 經結只對中心區域的光線刺激有反應,center-off 的反應現象指的是某些

(16)

神經結只對周圍區域的光線刺激有反應,圖 2-5 是光線剌激的感受場示 意圖。

圖 2-5: (a)Center-on 光線感受場 (b)Center-off 光線感受場

文獻[8]利用 2 個濾波器來模擬 center-on 及 center-off 感受場與輸入 影像經由 bipolarized convolution(BiCVL)得到 2 張不同的感受結果圖 (Mbindx及 Mdntr),再分別處理取得 Importance Map(Ibindx及 Idntr),之後將

2 張 Importance Map 經過 BiCVL 取得目標區域,再利用優化程序將最 終的目標區域尋找出來。圖 2-6 是擷取文獻[8]的一組中間與結果圖。

(17)

就目前影像分割研究的觀察,大多數的方法都針對單一的光影特性 擷取及分割影像,但是這種單一光影特性的方法無法完全符合各式各樣 的影像類型,於是本論文在此希望結合多種視覺特性,擷取影像中的主 體目標區域,除了常見的亮度及對比特性外,我們觀察到梯度方向的特 性可以在影像中顯現各個物體的結構,所以本論文在此結合亮度與梯度 結構、對比與梯度結構,期望獲得不錯的結果。 圖 2-6:文獻[8]中間與結果圖 (a) 原圖 (b) Mbindx (c) Mdntr (d) Ibindx (e) Idntr (f) Ibindx與 Idntr的 BiCVL 結果 (g) 優化後的目標區域結果

(18)

第三章 實驗動機與構想

    在研究一些影像分割的方法之後,我發覺大多數的影像分割方法都只 利用特定的影像特性(例如:亮度、顏色、景深、邊界等)對整張影像進行區 域分割,而沒有考慮到影像中多重影像特性、結構組織的分佈與主觀視覺 觀察的差異,於是本論文就觀察影像中的亮度(intensity)、對比(contrast)與 梯度方向結構(gradient)在影像中出現的區域特性,設計一套方法來處理。

3.1 梯度結構與視覺內涵

  梯度方向在影像處理的意義在於小區域亮度由暗往亮的變化方向,而 梯度分佈指的是影像中像素的梯度方向與鄰近像素的梯度方向之間的相似 程度,通常在觀察這個影像特徵時,我們會將其分為同向性分佈區域、逆 向性分佈區域與散亂性分佈區域,現在針對這三項分佈區域進行分析: (1). 同向性分佈: 同向性分佈指的是指定點週邊像素之梯度方向多數與指定點梯 度方向大約同向之區域。通常在同向性分佈區域,我們可以觀察到 大型或大區塊的結構組織與兩大型組織之交界,例如在光線照射下, 在大型表面之邊緣大多會呈現相同的梯度分佈。圖 3-1 是汽車表面 的大面積一致性的光影變化及其梯度方向分佈。

(19)

圖 3-1 汽車表面的大面積一致性的光影變化 (2). 逆向性分佈: 逆向性分佈指的是指定點週邊像素之梯度方向多數與指定點 梯度方向大約呈逆向(近 180°)之區域。通常在逆向性分佈區域,我 們可以觀察到條紋類型的結構組織或者不同結構組織的分界線,例 如動物身上的毛絨、斑馬身上的條紋、物體的邊緣或者是表面內凹 的縫隙(石縫、衣服、皮膚、樹皮皺折),乃至表面長形凸隆等。 圖 3-2 為斑馬的條紋結構例子及其梯度方向分佈。

(20)

圖 3-2 班馬的條紋結構 (3). 散亂性分佈: 散亂性分佈指的是指定點週邊像素之梯度方向與指定點梯度方 向差異不具同向性與逆向性特質之區域。通常在散亂性分佈區域, 我們可以觀察到的是亮度變化大,但變化的方向很不固定的區域, 例如雜草花叢;或者是亮度變化極弱的區域,例如天空、純色的馬。 如果是分佈在亮度變化極弱的區域,那麼這個區域就不一定能區分 出是背景或是主體目標。圖 3-3 為散亂性結構的例子。

(21)

圖 3-3 純色馬、天空與雜草 雖然由梯度方向的分佈區域可以取得影像中物體組織結構,但是只依 賴這種特性所得到的資訊還是不夠,所以加入亮度與對比的影像特性,以 觀察三者之間的組合與主觀視覺的差距。

3.2 亮度分佈與視覺內涵

  亮度是一種最基本且最常用的影像特性,在影像中同一物體表面可能 有不同的亮度分佈(如圖 3-4 之長頸鹿)或大致相同的亮度分佈(如圖 3-3 之黑 馬),但是可以在同一張影像中簡單區分出不同物體所在的區域。於是此篇 論文試圖將亮度與梯度方向分佈結合,期望能分析出影像中物體所在的區 域。

(22)

圖 3-4 長頸鹿、天空與草原

3.3 對比分佈與視覺內涵

  對比值的定義就是小區域中最大亮度與最小亮度的差距,藉由這個特 性我們可以觀察出在高對比分佈區域有可能是一些輪廓、邊界或表面圖紋 複雜的物體,而低對比分佈區域有可能是背景或物體的表面,例如人的皮 膚、純色動物的皮毛、天空、草原、失焦遠景或近景等。此篇論文將對比 與梯度方向分佈結合,期望能分析出影像中物體所在的區域,並且和亮度 與梯度方向分佈的結合做比較。圖 3-5 為表面圖紋複雜的影像例子。 原圖 高對比圖 低對比圖 圖 3-5 表面圖紋複雜的影像

(23)

第四章 處理方法

    本論文的目標是觀察亮度與梯度方向、對比與梯度方向的參數混合對 影像中視覺目標之擷取結果,試圖透過實驗與觀察,找到與我們主觀認知 的差距。本章節將針對這些步驟作詳細的說明,說明中將以梯度結構一詞 指稱梯度方向分佈,計分同向性梯度結構、逆向性梯度結構與散亂性梯度 結構三類。

4.1 系統架構

  圖 4-1 系統流程圖 原始影像 灰階影像 梯度方向 分佈圖 亮度對比圖 梯度結構權重圖 (同向、逆向、散亂) 亮度與梯度結構 合成圖 對比與梯度結構 合成圖 Threshold  Threshold  亮度與梯度結構 擷取圖 對比與梯度結構 擷取圖

(24)

本論文的視覺目標擷取流程步驟如圖 4-1 所示,首先將原始全彩影 像進行色彩轉換(Color Conversion)產生灰階影像,再由灰階影像導出亮 度對比圖與梯度方向分佈圖。之後利用梯度方向分佈圖分別導出同向性 權重圖、逆向性權重圖與散亂性權重圖。   將灰階影像與亮度對比圖各別分成強、中、弱三種影像,分別與同 向性權重圖、逆向性權重圖及散亂性權重圖相互作用得到一組亮度與梯 度結構擷取圖、對比與梯度結構擷取圖,以觀察兩者之間與我們主觀認 知的差距。  

4.2 處理步驟

  大部分的影像來源,主要以錄影畫面擷取、數位相機及掃描器等方 式取得,所取得的影像大多是彩色影像,在不同的情況下影像所適用的 色彩模型(Color Model)也不盡相同,常見的色彩模型有 RGB、YUV 與 HSI 等等,各種色彩模型之間通常可以透過幾個簡單的公式相互轉換。   一般灰階影像(Grayscale)的取得方法,主要是將彩色影像(Color Image)的亮度值當作是影像的灰階值,而就目前最常利用的是將 HSI 的 I 值或者是 YUV 的 Y 值視為灰階影像的亮度(Luminance)。其轉換的方 法主要是分別將各自不同的頻道(Channel) 乘上特定權重後的總和。

(25)

就一般常見的 RGB 影像來說,以 HSI 的 I 值的轉換算式為 L 0.333R 0.333G 0.333B 而 YUV 的 Y 值所採用的轉換算式為 L 0.299R 0.587G 0.114B 就不同的權重比例轉換將會產生不同的視覺效果。圖 4-2 為 L2的灰階影 像轉換圖。   原始影像 灰階影像 L2 圖 4-2 灰階影像轉換圖 在取得灰階影像的亮度對比值之作法上,我們利用灰階影像的亮度 值 L,以下列公式計算對比值 C: C x , y L L 其中: L max , L x i , y j L min , L x i , y j 處理程序是先設定一個 n*n 的 mask,將灰階影像由左上至右下對每 一個像素進行掃描。當掃描到某一個像素時,將該像素放置於 mask 中

(26)

心,並且在 mask 的範圍內尋找亮度最大值與亮度最小值的差值,當成 是此像素的對比值。圖 4-3 是亮度對比圖。 灰階影像 亮度對比圖 圖 4-3 亮度對比圖 決定梯度方向的方法是參考文獻[1][2]中所介紹的方法。首先定義 梯度的表示法: L grad L gg ∂L ∂x ∂L ∂y 其中 L≣L(x,y)為影像中(x,y)坐標的亮度值,gx為 x 方向的亮度變化量, gy為 y 方向的亮度變化量。圖 4-4 為梯度方向示意圖。 圖 4-4 梯度方向示意圖

(27)

在取得 gx與 gy的操作上,一般可以利用 prewitt mask 或 sobel mask 與灰階影像進行 convolution 的操作。 g h1 x i, y j .L x i, y j g h2 x i, y j .L x i, y j 取得影像座標(x,y)處之梯度強度| L| g g 與梯度方向 θ tan ,之後利用 gx與 gy的正負方向將θ轉換成 0~360 度的範

圍。圖 4-5 為 Prewitt mask 與 Sobel mask。

h1 10 10 10 1 1 1     h2 1 0 1 1 0 1 1 0 1 h1 10 20 10 1 2 1 h2 1 0 1 2 0 2 1 0 1

Prewitt mask Sobel mask

圖 4-5 convolution mask   經過影像的梯度方向處理之後,依據一開始所構思的想法,取得影 像的同向性權重圖、逆向性權重圖及散亂性權重圖。處理程序是設定一 個 n*n 的 mask,將梯度方向分佈圖由左上至右下每一個像素進行掃描。 當掃描到某一個像素時,將該像素放置於 mask 中心,計算 mask 中的 像素梯度方向與 mask 中心像素梯度方向的角度差值,並予正規化(調整 使介於 0°~180°之間),判斷此像素是否位於同向性、逆向性及散亂性區

(28)

域,依據三個區域的像素累積數量,給予一定的權重,例如位於同向性、 逆向性及散亂性區域的像素數量為 k1、k2及 k3皆小於 n*n,其權重值的 計算為 k1/n 2、k 2/n 2及 k 3/n 2   對於同向性、逆向性及散亂性區域的劃分,目前的實驗結果是將同 向性區域劃分在 0°到 30°的區域,逆向性區域劃分在 145°到 180°的區 域,而散亂性區域劃分在 75°到 105°的區域。圖 4-6 是同向性、逆向性 及散亂性分佈圖之圖例。 (a) (b) 圖 4-6 梯度結構權重圖 (a)同向性權重圖 (b)逆向性權重圖 (c)散亂性權重圖 (c)   最後將亮度、對比與梯度方向結合,本論文將亮度與對比分成強、 中、弱三部分,分別與梯度方向的三種權重圖交互作用,取 threshold

(29)

之後將結果分區圖顯示出來。

亮度與梯度結構結合圖及對比與梯度結構結合圖的處理公式如 下:

IAB x, y IA x i, y j .IB x i, y j 00 xy map_wmap_h

其中 IA是亮度值或對比值,IB是梯度結構的權重值,n 為 mask 大小。 處理程序是先設定一個 n*n 的 mask,將灰階影像圖或亮度對比圖由 左上至右下每一個像素進行掃描。當掃描到某一個像素時,將該像素放 置於 mask 中心,並且在方向權重圖的相對位置也取一個 n*n 的 mask 大小的區域,進行 convolution,當做此像素的數值。 在上述的處理過程中,本論文將亮度值與對比值分成高、中、低三 部份進行處理轉換,再與梯度結構進行結合: (1). 高亮度(對比)轉換: 直接取影像灰階圖與亮度對比圖的數值,數值的範圍為 0~255。 (2). 中亮度(對比)轉換: 一開始的構想是先取得影像灰階圖與亮度對比圖的數值,依據公式: L x, y L x, y L . L – L x, y 其中 Lmin為 0,Lmax為 255,L 為亮度值或對比值

(30)

進行轉換。後來在實驗過程中發現有些影像統計會集中在某些範圍, 導致結果與高亮度(對比)或低亮度(對比)的結果相似,於是改以原 影像的平均值來動態調整 Lmin與 Lmax的範圍進行轉換。 先計算整張影像的亮度值平均值與對比值平均值,如果平均值偏向 高亮度(對比),就將低於平均值的範圍正規化調整(normalize)成平 均值到最大值的範圍大小。反之若平均值偏向低亮度(對比),就將 高於平均值的範圍正規化調整成平均值到最小值的範圍大小。圖 4-7 為平均值偏向高亮度(對比)的轉換示意圖。 圖 4-7 中亮度與中對比轉換示意圖 (3). 低亮度(對比)轉換: 先取得影像灰階圖與亮度對比圖的數值,依據公式: L新值 x, y 255 L原值 x, y 進行轉換。 經過亮度(對比)與梯度結構的結合處理之後,計算每張處理結果圖 Lmin  mean‐k  Lmin  0  Lmax  255 mean   0  Lmax  255 mean 令 K = Lmax – mean  則 Lmin = mean ‐ k  將 0~mean 之間的數值 normalize 到 Lmin~mean 

(31)

的平均值與標準差,令 threshold=平均值+k*標準差,當像素值小於該 threshold 時輸出值為 0,反之若不小於該 threshold 則輸出值為 1。圖 4-8 為美洲豹灰階圖,圖 4-9 為該影像的亮度與梯度結構擷取圖,圖 4-10 為該影像的對比與梯度結構擷取圖。 圖 4-8 美洲豹 (1190x798) 美洲豹是一種斑紋複雜的動物,表面上由高亮度的紋路與低亮度的 班塊組成。就主觀上的觀察,在高亮度、低亮度及高對比的擷取會有不 錯的結果,因為原始影像比較大,使得斑塊與紋路所構成的面積皆不小, 所以光影變化多處於同向性及逆向性的分佈,配合上背景的牆壁與岩石 多處於亮度變化不大的低對比區與同向性、散亂性分佈,所以在高亮度 與同向性結構、低亮度與同向性結構及高對比與同向性結構應該有不錯 的視覺擷取結果。

(32)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 4-9 美洲豹:亮度與梯度結構擷取圖 圖 4-9 是一組亮度與梯度結構的擷取結果,單純就美洲豹的身體來 看,高亮度與同向性結構及低亮度與同向性結構有著互補的擷取結果, 然而因為背景所處的區塊有部分與低亮度同向性結構相似,導致在低亮 度與同向性結構的擷取結果不佳。

(33)

  原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 4-10 美洲豹:對比與梯度結構擷取圖 圖 4-10 是一組對比與梯度結構的擷取結果,美洲豹的圖紋複雜且亮 度分明,所以在高對比及中對比有較佳的擷取結果,但是因為背景多屬 於中、低對比,所以在中對比與同向性結構的擷取結果也不算太好,而 對比的特性主要表現在輪廓上,所以必須配合亮度的特性擷取目標。  

(34)

第五章 實驗結果

  在這個章節中,我們將針對幾種類型的影像來做主觀視覺分析,再 探討亮度與梯度結構的擷取結果及對比與梯度結構的擷取結果與主觀 的差距。  

5.1 影像類型的探討與比較

  首先我們將影像中的主體目標分成斑紋皮毛類的主體目標、斑塊皮 毛類的主體目標、純色皮毛類的主體目標、人/人造物的主體目標以及 毛絨絨的主體目標,分別處於單純背景或複雜背景中,先進行影像在主 觀上的分析,再探討高、中、低亮度與梯度結構及高、中、低對比與梯 度結構之擷取結果。 單純背景與複雜背景的分類,本論文主要是以背景的型式來區分, 例如只由大面積的失焦模糊影像、雜草叢或純色牆壁等所建構的背景視 為單純背景,而多種類的影像所建構的背景則視為複雜背景。  

(35)

(1). 斑紋皮毛類與單純背景: 圖 5-1 長頸鹿 (1024x768) 圖 5-1 是長頸鹿與單純背景所建構的影像,這張影像的主體在亮度 上呈現高、低亮度的分佈,而且斑塊與紋路之間的亮度分明,所以有高 對比的特性存在,由於斑塊與紋路所佔的區域皆不小,所以在交界及所 在的區域有著同向性結構與逆向性結構,所以在高、低亮度、高對比與 同向性、逆向性結構的擷取應該會有不錯的結果。 背景的部分,雜草多以高、中亮度、高、中對比的逆向性及散亂性 結構為主,失焦的草原背景以高亮度、低對比的散亂性結構為主,失焦 的樹叢以低亮度、低對比的同向性或散亂性結構為主,所以在此影像中 影響應該不大。

(36)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-2 長頸鹿:亮度與梯度結構擷取圖 圖 5-2 是一組亮度與梯度結構的擷取結果,在高亮度與同向性結構 及低亮度與同向性結構有互補作用,但因為失焦的樹叢與主體目標有相 似的低亮度與同向性結構,所以也一同擷取出來。  

(37)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-3 長頸鹿:對比與梯度結構擷取圖 圖 5-3 是一組對比與梯度結構的擷取結果,在高對比與同向性結構 可以有效擷取長頸鹿的區域範圍,而且在高對比區有可能影響到主體擷 取的雜草叢,也因為結構的不同而影響不大。  

(38)

(2). 斑紋皮毛類與複雜背景: 圖 5-4 花豹 (515x344) 圖 5-4 是花豹與複雜背景所建構的影像,這張影像的主體在亮度上 呈現高、低亮度的分佈,此張影像因為本身偏小,導致主體的斑紋密集, 所以主體呈現高對比的特性,而且因為斑紋小而密集,使得身體構造以 逆向性及散亂性結構為主,所以在高、低亮度、高對比與逆向性、散亂 性結構的擷取應該會有較明顯的結果。 背景的部分,在主體後方的背景以中、低亮度、低對比的同向性、 散亂性結構為主,而主體所在的樹幹則以高、低亮度、高對比與逆向性、 散亂性結構為主,與主體的特徵相似,所以應該會與主體一同擷取出 來。  

(39)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-5 花豹:亮度與梯度結構擷取圖 圖 5-5 是一組亮度與梯度結構的擷取結果,因為背景複雜,只有在 高亮度與逆向性結構的擷取可以獲得還可以的結果,而在高亮度與同向 性結構中,發現主體有部分落在這個擷取結果中,但由於背景的影響很 難加以利用。  

(40)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-6 花豹:對比與梯度結構擷取圖 圖 5-6 是一組對比與梯度結構的擷取結果,光就亮度對比圖的觀察, 就可以發現高對比會有良好的擷取結果,只是樹幹的特性太相似,完全 找不到方法將兩者分開。  

(41)

(3). 斑塊皮毛類與單純背景: 圖 5-7 乳牛 (600x400) 圖 5-7 是乳牛與單純背景所建構的影像,這張影像的主體以大斑塊 所構成,斑塊以高亮度及低亮度的單一色調分佈,在對比的特性上,高 對比可以取得主體及斑塊的輪廓,而低對比可以顯示主體斑塊的區域, 而在陽光照射下,其結構分佈大多處於同向性或散亂性的結構分佈,在 這個觀察下,應該在高、低亮度、低對比與同向性、散亂性結構中會擷 取到較好的結果。 背景的部分,在主體所在的草地以中亮度、低對比的散亂性結構為 主,而遠方樹林的區域可能會以低亮度、低對比與同向性、散亂性結構 為主。  

(42)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-8 乳牛:亮度與梯度結構擷取圖 圖 5-8 是一組亮度與梯度結構的擷取結果,就乳牛的身體來看,在 高亮度與同向性結構及低亮度與同向性結構有著良好的擷取結果及互 補作用。  

(43)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-9 乳牛:對比與梯度結構擷取圖 圖 5-9 是一組對比與梯度結構的擷取結果,高對比與同向性結構將 主體輪廓擷取出來,可以配合亮度的特性將主體包起來,而低對比與同 向性結構的擷取就不如預期的好。  

(44)

(4). 斑塊皮毛類與複雜背景: 圖 5-10 大斑塊的馬 (900x600) 圖 5-10 是大斑塊的馬與複雜背景所建構的影像,這張影像的主體以 大斑塊與部分鬃毛所構成,斑塊以高亮度及低亮度的單一色調分佈,在 對比的特性上,高對比可以取得主體、斑塊的輪廓及鬃毛的區域,而低 對比可以顯示主體斑塊的區域,由於主體處於背光的位置,陽光造成的 亮度變化不大,其結構分佈可能屬於同向性或散亂性的結構分佈,在這 個觀察下,應該在高、低亮度、低對比與同向性、散亂性結構中會擷取 到較好的結果。 背景的部分,樹幹的部分因為背光,所以和主體的低亮度斑塊有相 似的特性,其餘的部分大多為散亂性結構,但是在亮度與對比的分佈範 圍很廣,容易影響主體的擷取。

(45)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-11 大斑塊的馬:亮度與梯度結構擷取圖 圖 5-11 是一組亮度與梯度結構的擷取結果,就主體來看,在高亮度 與同向性結構、低亮度與同向性結構及低亮度與散亂性結構有著相對不 錯的擷取結果,但是仍然受到背景的影響無法準確擷取主體範圍。

(46)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-12 大斑塊的馬:對比與梯度結構擷取圖 圖 5-12 是一組對比與梯度結構的擷取結果,就主體來看,在低對比 與散亂性結構及低對比同向性結構似乎會有較好的結果,但是背景的特 性太明顯,使得沒有一個好的擷取結果。  

(47)

(5). 純色皮毛類與單純背景: 圖 5-13 純色馬 (1024x768) 圖 5-13 是純色馬與單純背景所建構的影像,這張影像的主體以低亮 度的單一色調分佈,在對比的特性上,可以由高對比取得主體輪廓,而 低對比可以顯示主體的區域,由於主體在陽光照射下有著明顯的光影變 化,其結構分佈應該屬於同向性及逆向性結構分佈,在這個觀察下,應 該在低亮度、低對比與同向性、逆向性結構中會擷取到較好的結果。 背景的部分,海面以高、中亮度、中、低對比與散亂性結構為主, 天空以高、中亮度、低對比與同向性結構為主,在與主體的特性比較之 後,應該不太會影響到主體的擷取。  

(48)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-14 純色馬:亮度與梯度結構擷取圖 圖 5-14 是一組亮度與梯度結構的擷取結果,在低亮度與同向性結構 的擷取結果可算是相當好,而逆向性的結構的影響則沒有想像中的高。  

(49)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-15 純色馬:對比與梯度結構擷取圖 圖 5-15 是一組對比與梯度結構的擷取結果,原本以為本體會呈現低 對比的特性,但實際上卻因為皮膚的皺摺與受光面的分佈而影響到低對 比的特性,而在高對比的輪廓擷取中,也因為浪花太明顯而一起擷取出 來。

(50)

(6). 純色皮毛類與複雜背景: 圖 5-16 黑猩猩 (1855x1484) 圖 5-16 是黑猩猩與複雜背景所建構的影像,這張影像的主體以低亮 度的單一色調分佈為主及少部分高亮度分佈,在對比的特性上,可以由 高對比取得主體輪廓,而低對比可以顯示主體的區域,由於影像偏大, 所以發現主體身上有很多短毛與皮膚皺摺,其結構分佈應該屬於逆向性 及散亂性結構分佈,在這個觀察下,應該在低亮度、低對比與逆向性、 散亂性結構中會擷取到較好的結果。 背景的部分,因為影像偏大且結構複雜,在同向性、逆向性及散亂 性結構都有不少的比例,亮度與對比的範圍應該也不小,所以在各個擷 取結果中,應該都會以小而雜亂地分佈被擷取出來。  

(51)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-17 黑猩猩:亮度與梯度結構擷取圖 圖 5-17 是一組亮度與梯度結構的擷取結果,黑猩猩的身體在低亮度 與逆向性、散亂性結構中都有很好的結果,而在高亮度與逆向性、散亂 性結構中也可找到互補的區域,背景的部分則與一開始的觀察相符合, 在每個擷取結果中都以小而雜亂的區塊出現,應該可以再利用一些影像 處理的步驟與主體分離。

(52)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-18 黑猩猩:對比與梯度結構擷取圖 圖 5-18 是一組對比與梯度結構的擷取結果,雖然就黑猩猩的身體來 看,在中、低對比與逆向性、散亂性結構有不錯的擷取結果,但是在背 景的影響下,在中、低對比與逆向性結構的擷取結果算是比較明顯的。  

(53)

(7). 人/人造物與單純背景: 圖 5-19 汽車 (780x490) 圖 5-19 是汽車與單純背景所建構的影像,因為展示台上的燈光照射, 使得這張影像的主體以高亮度至低亮度的漸層變化分佈,在對比的特性 上,大部分的區域都屬於低對比區,只有輪廓才是高對比區,由於主體 為平滑且漸層分佈,其結構分佈屬於同向性及逆向性結構分佈,在這個 觀察下,應該在全亮度、高、低對比與同向性、逆向性結構中會擷取到 較好的結果。 背景的部分,地板同樣以全亮度的漸層分佈,與車身的特性相似, 而背景則沒有太大的亮度變化,大多會屬於散亂性的結構分佈。  

(54)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-20 汽車:亮度與梯度結構擷取圖 圖 5-20 是一組亮度與梯度結構的擷取結果,汽車的車身在全亮度與 同向性結構中的確有不錯的擷取結果,但是車輪並不在這個特性之中, 那是因為車輪為類似的同心圓組成,所以會以逆向性結構為主,地板的 部分則與車身一同被擷取出來。  

(55)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-21 汽車:對比與梯度結構擷取圖 圖 5-21 是一組對比與梯度結構的擷取結果,車身在中、低對比與同 向性結構有不錯的結果,輪廓上以高對比與同向性、散亂性結構的擷取 有著不錯的結果。  

(56)

(8). 人/人造物與複雜背景: 圖 5-22 人物 (1024x768) 圖 5-22 是人物與複雜背景所建構的影像,人物的結構主要分成三部 分:平滑單色調的皮膚、結構分明的五官與頭髮、各種不同的衣服,就 這張影像來看,皮膚的部分可以在高亮度與同向性結構中找到,五官與 頭髮則以低亮度與逆向性結構中找到,而衣服則以高亮度與散亂性結構 為主。 背景的部分,左下的人造物應該屬於高亮度與同向性分佈,而其他 的背景則以多種類的結構分佈。  

(57)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-23 人物亮度與梯度結構擷取圖 圖 5-23 是一組亮度與梯度結構的擷取結果,人物的特性太過分散, 所以只能以多張影像的互補才能較完整取得主體區域,而左下的人造物 似乎因為沒太大的亮度變化,而屬於散亂性結構。  

(58)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-24 人物:對比與梯度結構擷取圖 圖 5-24 是一組對比與梯度結構的擷取結果,在中、低對比看起來有 不差的結果,而因為背景多為小而雜亂的區域,應該可以再利用一些影 像處理的步驟與主體分離。  

(59)

(9). 毛絨類與單純背景: 圖 5-25 猴子 (1024x683) 圖 5-25 是猴子與單純背景所建構的影像,主體結構以明顯的毛絨結 構所組成,所以在逆向性結構應該有良好的擷取結果,而身體的亮度分 佈是以中亮度為主的全亮度分佈,在對比的特性上,因為是毛絨結構, 所以在局部上會呈現高、中對比的特性,所以在中亮度、高、中對比與 逆向性結構應該有著良好的擷取結果。 背景的部分,近端屬於中、長類的雜草分佈,結構上多為逆向性及 散亂性結構,特性上可能會影響主體的擷取,而遠端的失焦背景則以低 亮度與同向性、散亂性結構為主。  

(60)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-26 猴子:亮度與梯度結構擷取圖 圖 5-26 是一組亮度與梯度結構的擷取結果,雖然中亮度與逆向性結 構有不錯的擷取結果,但是高亮度與逆向性結構及低亮度與逆向性結構 的互補,看起來的結果更好,近端的雜草特性與主體相近,就結果上來 看,似乎無法與主體分離。  

(61)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-27 猴子:對比與梯度結構擷取圖 圖 5-27 是一組對比與梯度結構的擷取結果,中對比與逆向性結構的 確有不錯的結果,而高對比與散亂性結構的擷取還算不錯,應該是因為 毛絨末端容易取得散亂性結構分佈的原因。  

(62)

(10). 毛絨類與複雜背景: 圖 5-28 山獅 (1600x1200) 圖 5-28 是山獅與複雜背景所建構的影像,主體結構以明顯的短毛絨 所組成,所以在散亂性結構應該有良好的擷取結果,而身體的亮度分佈 是以中亮度為主的全亮度分佈,在對比的特性上,因為是毛絨結構,所 以在局部上會呈現高、中對比的特性,所以在中亮度、高、中對比與散 亂性結構應該有著良好的擷取結果。 背景的部分,雪地屬於高、中亮度、低對比與同向性、散亂性結構 為主,而樹林以中、低亮度、中對比與同向性、散亂性結構為主,天空 為高、中亮度、低對比與散亂性結構為主,對於主體的擷取影響很大。  

(63)

原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-29 山獅:亮度與梯度結構擷取圖 圖 5-29 是一組亮度與梯度結構的擷取結果,就主體部位來看,在逆 向性及散亂性結構都有不錯的擷取,但是背景的特性影響太大,無法將 主體擷取出來。  

(64)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-30 山獅:對比與梯度結構擷取圖 圖 5-30 是一組對比與梯度結構的擷取結果,相對於亮度的特性擷取, 高對比與逆向性、散亂性結構的擷取更好,只要再進行一些處理將小而 零碎的背景區域去除就可以取得主體目標。  

(65)

5.2 實驗結果

(1.)王建民 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-31 王建民:亮度與梯度結構擷取圖

(66)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-32 王建民:對比與梯度結構擷取圖  

(67)

(2.) 純色馬 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-33 純色馬:亮度與梯度結構擷取圖  

(68)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-34 純色馬:對比與梯度結構擷取圖    

(69)

(3.) 斑馬 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-35 斑馬:亮度與梯度結構擷取圖  

(70)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-36 斑馬:對比與梯度結構擷取圖    

(71)

(4.) 鳥 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-37 鳥:亮度與梯度結構擷取圖  

(72)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-38 鳥:對比與梯度結構擷取圖    

(73)

(5.)獵豹 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-39 獵豹:亮度與梯度結構擷取圖  

(74)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-40 獵豹:對比與梯度結構擷取圖    

(75)

(6.)大麥町 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-41 大麥町:亮度與梯度結構擷取圖  

(76)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-42 大麥町:對比與梯度結構擷取圖    

(77)

(7.)鹿 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-43 鹿:亮度與梯度結構擷取圖  

(78)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-44 鹿:對比與梯度結構擷取圖    

(79)

(8.) 針鼴 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-45 針鼴:亮度與梯度結構擷取圖  

(80)

原始影像 亮度對比圖

高對比同向性結構 高對比逆向性結構 高對比散亂性結構

中對比同向性結構 中對比逆向性結構 中對比散亂性結構

低對比同向性結構 低對比逆向性結構 低對比散亂性結構

(81)

(8.) 猴子 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-47 猴子:亮度與梯度結構擷取圖  

(82)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-48 猴子:對比與梯度結構擷取圖    

(83)

(10.) 松鼠 原始影像 高亮度同向性結構 高亮度逆向性結構 高亮度散亂性結構 中亮度同向性結構 中亮度逆向性結構 中亮度散亂性結構 低亮度同向性結構 低亮度逆向性結構 低亮度散亂性結構 圖 5-49 松鼠:亮度與梯度結構擷取圖  

(84)

原始影像 亮度對比圖 高對比同向性結構 高對比逆向性結構 高對比散亂性結構 中對比同向性結構 中對比逆向性結構 中對比散亂性結構 低對比同向性結構 低對比逆向性結構 低對比散亂性結構 圖 5-50 松鼠:對比與梯度結構擷取圖    

(85)

第六章 結論

    本論文在此提出一種構想,試圖利用影像中的梯度結構分佈情形與 一般化的特性來擷取主體目標,以方便使用者可以針對主體所在的區域 進行進一步的處理。 本論文的方法仍有許多尚待改進的部分,例如: (1). 做為一個主體擷取的方法,本論文所進行的步驟還不夠完整, 後續可以將目前的擷取結果進一步分析與合併,以產生更好的 主體擷取結果。 (2). 目前的擷取結果還不夠精準,應該可以加入一些優化的處理將 小而分散的背景擷取區域加以分離,以取得更精確的主體區 域。 (3). 可再引進相關的人眼視覺機制,得到較符合主觀視覺觀察的擷 取特性。 本論文在此起了一個開頭,希望在未來的研究上可以繼續深入探討 這項議題。    

(86)

參 考 文 獻

 

[1]. Milan Sonka, Vaclav Hlavac, Roger Boyle, "Image Processing, Analysis, and Machine Vision".

[2]. Rafael C. Gonzalez, Richard E. Woods, "Digital Image Processing". [3]. Nikhil R. Pal, Sankar K. Pal, "A Review on Image Segmentation

Techniques", Pattern Recognition Volume 26, Issue 9, Pages 1277-1294, 1993.

[4]. Hong Zhang, Jiulun Fan, "A Threshold Segmentation Method for Sparse Histogram Image," fskd, vol. 5, pp.340-344, 2009 Sixth

International Conference on Fuzzy Systems and Knowledge Discovery, 2009

[5]. Ye Zhang; Hongsong Qu; Yanjie Wang; , "Adaptive Image Segmentation Based on Fast Thresholding and Image

Merging," Artificial Reality and Telexistence--Workshops, 2006. ICAT '06. 16th International Conference on , vol., no., pp.308-311, Nov. 2006 [6]. Hsin-Chia Chen, Wei-Jung Chien, Sheng-Jyh Wang,

“Contrast-based Color Image Segmentation,” IEEE Signal Processing Letters, vol. 11, no. 7, pp. 641–644, 2004.

[7]. Y. Deng and B. S. Manjunath, “Unsupervised segmentation of

color-texture regions in images and video,” IEEE Trans. Pattern Anal. Machine Intell., vol. 23, pp. 800–810, Aug. 2001.

[8]. Chen-An Huang, Chen-Chung Lin, “Spotting Wildlives in the Wild”, Master thesis, 2000

數據

圖 5-6  圖 5-7  圖 5-8  圖 5-9  圖 5-10  圖 5-11  圖 5-12  圖 5-13  圖 5-14  圖 5-15  圖 5-16  圖 5-17  圖 5-18  圖 5-19  圖 5-20  圖 5-21  圖 5-22  圖 5-23  圖 5-24  圖 5-25  圖 5-26  圖 5-27  圖 5-28  圖 5-29  圖 5-30  圖 5-31  圖 5-32  花豹:對比與梯度結構擷取圖…………………………  乳牛 (600x400)…………………
圖 5-33  圖 5-34  圖 5-35  圖 5-36  圖 5-37  圖 5-38  圖 5-39  圖 5-40  圖 5-41  圖 5-42  圖 5-43  圖 5-44  圖 5-45  圖 5-46  圖 5-47  圖 5-48  圖 5-49  圖 5-50  純色馬:亮度與梯度結構擷取圖………………………… 純色馬:對比與梯度結構擷取圖………………………… 斑馬:亮度與梯度結構擷取圖…………………………… 斑馬:對比與梯度結構擷取圖…………………………… 鳥:亮度與梯度結構擷取圖
圖 2-2:文獻[5]的結果圖  2.2 對比與區域合併        文獻[6]介紹一種以影像對比(contrast)為基礎的彩色影像分割方法, 其作法乃利用每個像素的色彩資訊,依據自定的公式得到 0°、45°、  90°和 135°這四個方向的對比值,之後利用 adaptive thresholding 來優化 一些邊界資訊,然後依據 2 個準則決定每兩個相鄰像素是不是相同區域。 決定區域的準則如下:  準則 1:若 2 個相鄰像素之間有邊界存在,則不在同一區域。  準則 2:若 2 個相鄰像素之間沒有
圖 2-3 是文獻[6]的處理流程圖,圖 2-4 是文獻[6]與文獻[7]的結果比 較,(b)是文獻[6]結果圖,(c)~(e)則是文獻[7]在不同 threshold 的結果。  圖 2-3:文獻[6]的處理流程  圖 2-4:文獻[6]與文獻[7]的結果比較圖    2.3 灰階圖相對亮區與暗區分割      文獻[8]以眼睛視網膜上的神經結對光線刺激的反應現象作為影像 切割基礎以輔助找尋影像中的目標。center-on 的反應現象指的是某些神 經結只對中心區域的光線刺激有反應,center-off 的
+7

參考文獻

相關文件

統計暨普查局過往主要採用基本價格計算及分析行業的生產總額、增加值總額以及產業結構,亦同時一併公佈按生產者

《數學摺 紙計畫 : 30 個課程活動探索》[1] 針對子母線性質提供初步探討, 在正方形的簡 單架構下, 得到 「子母線性質」 十分漂亮以及簡潔的結論,

“Does perceived organizational support mediate the relationship between procedural justice and organizational citizenship behavior”. Academy of Management

CF12203A#2 許惠恒 在亞洲國家多中心隨機研究比較 Joint Asia Diabetes Evaluation (JADE) 的結構照護計劃與 Diabetes Monitoring Database (DIAMOND)

編號 主持人 計畫名稱 審查結果 CF12202 許惠恒 在亞洲國家多中心隨機研究比較 Joint Asia Diabetes. Evaluation (JADE)

(四)比賽中如懷疑對方有冒名頂替者,應立即以口頭向該場地技術委員提出,並拍照存證,於該 場比賽結束

動態時間扭曲:又稱為 DTW(Dynamic Time Wraping, DTW) ,主要是用來比

Simple Harmonic