• 沒有找到結果。

第二章 文獻探討

2.3 影像特徵

針對一張同樣場景、環境、光線的影像,使用不同的數位相機攝影後,

在做比較時,我們第一個會注意到影像的色彩表現,例如:哪張影像的色彩 飽和?哪張清晰或是邊緣較銳利?是否有偏色的情形?景深適合嗎?等等 問題。如果,我們可以明顯感受不同相機所拍攝出的影像是不一樣的,但要 如何把這種感覺上的不同「量化」呢?我們提出以下分類特徵:

2.3.1 影像色彩特徵

處理,其包含的特徵大致有平均值、相關係數、鄰近分佈質心、能量比等,

且在運算處理時,我們必須做「灰階世界假定(Gray-World Assumption)」,

意即將一張影像以灰階表示,因此,每一個像素會有 256 種變化,最亮的顏 色是白色,以數值 255 表示,最暗的顏色是黑色,以數值 0 表示;介於這中 間的就是灰色,依明暗的不同可以有 254 種變化,以數值 254 到 1 來表示之。

而彩色影像就是此表示法的延伸,一個彩色影像的每個像素都是由三原光

(紅、綠、藍)組成,每一種原光由淺到深以 0 到 255 的數值來表示,都有 256 種變化,因此,用三原光可以表示出256256256224 16777216種 顏色變化,故我們可以說每一張彩色影像都是由三個二維空間域陣列來存放 的,每個陣列分別代表一種原光,陣列中的元素值的大小則表示該原光的深 淺程度,計算時也需要將三種原光分開計算,而針對這三原光的計算所獲得 之數值,即色彩特徵值。

2.3.2 影像品質特徵

除了色彩特徵指標之外,不同相機所拍攝之影像的”品質”也不太相同。

我們一般都用肉眼直接觀察不同相機拍攝之影像的品質差異,例如某一台相 機拍攝的影像輪廓比較銳利但色調較暗;而另一台相機拍攝的影像採光好,

顏色品質也較好,但沒有第一台相機那樣輪廓清晰。這些視覺上的差異,我 們採用 Memon 等人所提出的「影像品質指標(Image Quality Metrics, IQM)」

[7]作為特徵指標。

在評估影像系統或是編碼處理技術上,影像品質指標是相當具有優勢的 指標值,一項好的品質指標應該要能反映出經過影像處理之後的失真程度。

一般來說,均方差(Mean Square Error, MSE)與噪訊比(Signal to Noise Ratio, SNR)是我們最常用的指標值。然而,對觀察者的視覺上來說,它們仍無法 符合所有的需求,因此,針對某些多媒體和極低位元率(low bit rate)的影 像,就發展出一套以人類感覺為基礎的影像特徵指標值,這套指標可分為六 類:

a. 以像素差為基礎(Pixel Difference-based)

b. 以相關性為基礎(Correlation-based)

c. 以邊緣為基礎(Edge-based)

d. 以頻譜為基礎(Spectral-based)

e. 以內容為基礎(Context-based)

f. 以人類視覺系統為基礎(Human visual system(HVS)-based)

但其中有些是屬於動態影像使用的指標,因此我們選擇其中針對靜態影 像的測量指標,其為 a, b, d 等三類,作為影像鑑定指標。

2.3.3 頻率域之影像特徵

空間域數位影像是我們平常在電腦中最常使用的資料格式,在這種格式 中每張影像都是由許多像素(pixel)所組合成的,而一張影像通常是以一個 二維陣列來存放,如果將此陣列每個元素值(element)讀出,則可以輕易地 將數位影像顯示在電腦上,因此,這些元素值我們又稱為「像素值」,這種 方法所儲存的數位影像稱為「空間域數位影像」。

除了空間域數位影像資料格式外,另一種數位影像的表達方式為「頻率 域數位影像」資料格式,此表示法是將一般影像由空間域轉換成頻率域的結 果,透過轉換處理後,會將影像之不同頻率的部分個別濾出,產生許多不同 的高低頻帶,常見的空間域轉換成頻率域的方法有:「離散餘弦轉換(Discrete Cosine Transformation, DCT )」 及 「 離 散 小 波 轉 換 ( Discrete Wavelet Transformation, DWT)」[8]。

在本文中,我們採用小波轉換法(Wavelet Transfer),小波轉換其運作上 主要是依靠以下三種要素組合而成:影像金字塔(image pyramid)、濾波器組 合(filter bank)以及次頻道編碼(sub-band coding)。以下就分別對這三項要素進 行簡單地說明。

A. 影像金字塔:

圖 4. 影像金字塔示意圖

資料來源: 改自 SRI International (2001) [9]

影像金字塔的概念是由 Burt and Adelson 於 1983 年所提出的,一個 影像金字塔,其實就是一連串大小漸漸縮小的影像組合。金字塔的最底 層是最原始大小的影像,每往上一階層,影像的長與寬都會被削減一 半,直到影像的長寬皆變成 1 為止。而其層級(level)則相反地由最高 層開始向下計算。也就是說,第 n 層的影像長寬為皆為第 0 層的 2n倍。

影像金字塔的主要功用為將影像以不同的解析度表達出來,其中解析度 較小的影像,可以用來快速分析影像的變化較大的部分,例如我們可以 利用影像金字塔中階層較小的部分來分析一張影像的大略顏色分佈;相 對地,解析度較大的影像,則是用來分析影像中較細微的部分時所使用 的。另外,影像金字塔在較小階層的部分做的改變,若套用回影像金字 塔的最底層時,反而會造成比較全面性的影響。

B. 濾波器組合:

小波轉換使用將訊號通過分解濾波器組合(analysis filters)的方式,

來達到將訊號為分解為高頻訊號以及低頻訊號的目的。而分解濾波器組 合中,又可細分為一低通濾波器(low pass filter,通常以 h0稱之)以及

C. 次頻道編碼:

所謂的次頻道編碼,乃是將訊號分解至數個特定頻段的一種方式,

而這些被分解出來的特定頻段則被稱為次頻道(sub-band)。被分解至次頻 道的訊號要能夠被重組回原來的訊號;並且所有次頻道所佔用之總頻寬 (band width)必須和原訊號相等。因此,當次頻道的訊號被分解出來之 後,還需要經過降低取樣數(down-sample)的動作,以使得所有次頻道之 總合的頻寬,不會超過原來的訊號。反之,在重組訊號的時候,必須將 次頻道之訊號做提高取樣數之動作(up-sample),才能夠正確地還原原來 的訊號。

圖 5. 一維小波轉換之分解與合成示意圖

圖 5.顯示了一個簡單的一維小波轉換分解與合成的流程,先將訊號 x 通過預設的分解濾波器組合 h0及 h1後,可以分別得到低頻與高頻的 次頻道訊號,再將這些訊號做一降低取樣數之動作後,即可得到一維小 波轉換之次頻道編碼結果。還原訊號時亦如圖中所示,先將次頻道訊號 做提高取樣數的動作之後,再分別將通過合成濾波器組合 g0及 g1後之 次頻道訊號相加,即可得到原來的訊號 x。

以上所提的流程為一維小波轉換時的情形,當推廣到二維影像之小 波轉換時,則是先將橫列(row)的訊號逐列做一維小波轉換,這時可以 得到二組次頻道訊號:L(低頻)以及 H(高頻)。這時,再對 L 以及 H 的 訊號以逐行(column)的方式做一維小波轉換,即可將其分解為四組次頻 道訊號:LL(最低頻)、LH(水平低頻與垂直高頻)、HL(水平高頻與垂直

圖 6. 二維小波轉換之分解示意圖

在影像經二維小波轉換分解成為 LL、LH、HL、HH 等四組次頻道 訊號後,我們根據本節前面所提到的影像金字塔的理論,可以對這四組 次頻道訊號,進行再一次的二維小波轉換分解,如此一來便可將這些次 頻道依頻率的高低,再細分精密的頻段。我們可以使用一樹狀結構來記 錄這些次頻道間的分解關係(如圖 7 左),這樣的一個資料結構一般通稱 為小波樹(wavelet tree),並且我們通常會將其組合成類似圖 7.右邊的 影像以便作為展示以及記錄之用。

圖 7. 小波樹及其一般表示法

相關文件