影像光源頻譜估計法

第二章文獻探討

第二節影像光源頻譜估計法

1、主成分分析法(Principal Component Analysis)

主成分分析法（Principal component analysis）是多變量分析法中的一種，由 Karl Person 首先提出，之後再由 Hotelling 加以發展而成，其目的在於將原有資料中多個變數予以縮減，成為數量較少且互相獨立的線性組合變項（主成分），而不同的主成份以仍保有原變數最多的資訊，且能顯示出的變異數為最大當作原則，藉此達到簡化資料的效果[4]。綜上所述，其目的可為分為以下三項：

1.概述變數間的關係，而得到的主成分要保有原來變數的資訊。

2.將原來變數轉換成新的沒有相關的變數，讓主成分有各自的獨立性。

3.簡化多變量資料的維度，降低變數的數量。

這裡假設在 P 個變數{x₁,x₂,...x_p}中，要將 P 個變數簡化 m 個新的變量 {

Y

₁

, Y

₂

,...Y

_m}，且 m<p，在進行主成分分析時可依以下幾個步驟進行：

1.先求 P 個變數的平均值 x ，及各變數與平均值間的差

x~

∑

=

x p

1

（公式 2-11）

-~ x

= i

x

i （公式 2-12）

2.計算共變異矩陣 S（covariance matrix）

1 ~~

∑

= ⁿ

i T i i

x p x

S

（公式 2-13）

3.計算 S 的特徵值

( )

λ 與特徵向量（a）

當我們要求取特徵向量時，可將原始資料表示成一個 P×P 的共變異數矩陣S，此共變異矩陣 S 及 P 次元向量ar與特徵值λ 間的相互關係可以表示為：

a a

S r =

r

（公式 2-14）

公式 2-14 可改寫成

* )

-(S

λ ar

0 r

（公式 2-15）

若欲求得有意義的解，則需合乎下列行列式的條件：

-det(S

λ

S -

= 0

（公式 2-16）

特徵值λ 可由公式 2-16 求得，而特徵向量xr 則可藉由將 λ 帶入公式 2-14 求得，

特徵向量

ar

為使S 在 Y 的總變異中成為最大的向量，特徵值 λ（Eigenvalue）為極大化後的變異數（Var）。

Var（a₁∗

x

₁ +

a

₂ ∗

x

₂ +...+

a

_m∗

x

_m）

所以，λ1 為第一個主成分的特徵值，亦即其為第一個主成分的變異數；λ2 為第二個主成分的特徵值，亦即其為第二個主成分的變異數；依此類推...且

Y

₁

Y

₂,

Y 間彼此相互獨立。而求出的特徵向量{3

a

₁,

a

₂,...,

a

_m }也要符合公式 2-17 的條件：

a

₁² +

a

₂² + ⋅⋅ ⋅⋅+

a

_m² =1 （公式 2-17）

下列公式為P 個變數經主成分分析轉換後的結果：

(4) 研究者在研究時不必選取全部的主成分，只需將特徵值（Eigenvalues）小於 X2

1 的主成分予以放棄，而保留特徵值大於 1 的成份即可。

由於主成分分析是一項成熟且可靠度高的統計分析技術，已經被廣泛應用於色彩的領域中，Berns 等人就曾對 PCA 在色彩學領域的應用提出說明[8]，現將先前PCA 運用於頻譜估計的研究文獻說明如下：

1.Remero 等人利用主成分析法降低光譜樣本的維度後，抽取少數特徵向量當作基本光譜，代入三刺激值公式後以假轉置（pseudo inverse）求得模擬的人工光源和自然光源的光譜，結果顯示利用3-5 個主成分就可以重建出效果良好的光源頻譜[9][10]。

2.Nieves 等人利用主成分分析法來分析多頻譜影像下的日光光源，結果發現抽取的6 個和 9 個主成分配合濾鏡進行光譜重建時，效果會比 3 個主成分略好，但與差距並不太大[11]。Imai 等人的研究則顯示利用六個主成分來重建影像的反射譜就可以獲得令人滿意的光譜重建效果，而使用太多主成分對於研究者而言未必是最有效率的選擇[12]。

3. Agahian 的研究提出，在 A 光源下利用原始資料的反射譜與重建後的反射譜間的色差值ΔΕ ，加上一個很小的係數 s 構成一個權重係數矩陣^*_ab ω 搭配求主成分，

便可取色票的反射譜，利用這種方法可以把色差控制在3 以下[13]。

4. Corzo 等人提出利用 PCA 來取得經過正規化後光譜的主成分，代入三刺激值公式後，結合受限制的回歸模式來模擬螢光燈的光源頻譜[14]。

由上述的文獻可以看到主成分分析法除了被拿來應用於光源頻譜的估計

外，也被廣泛的應用於估計畫作或紡織品的反射譜，本研究也將採用主成分分析法作為重建影像光譜的基本方法並與隨後介紹的支援向量回歸進行比較。

2、支援向量回歸(Support Vector Regression)

回歸分析是一種應用廣泛的統計分析方法，其目的是要了解「目的變數」Y 是否能夠用一些「自變數」K 的線性方程式來表示，並用它來解釋此「目的變數」的特性，亦即解釋變數K 和 Y 間的關係是否密切，透過此線性回歸方程式，即可由變數K 的值預測出 Y 的值，基本線性回歸模型如下：

γ

₀ +

γ

₁K₁ +

γ

₂K₂ +...+

γ

_pK_p +

ε

（公式 2-19）

公式2-19 中，γ 為偏回歸係數，為 ε 誤差項，p 代表自變數的數量。Tsumura 的研究顯示使用多元回歸在估計畫作反射譜上的表現，會優於主成分分析與Wiener 及線性回歸等方法[15]， Nieves 等人利用回歸的概念代入三刺激值公式運算，

求得的光譜表現也優於主成分分析[16]，但是一般使用回歸來預測未知變項時，

通常需要數量較多的訓練樣本，才能維持回歸的準確性，而且樣本變項間不能有太高的共線性，否則也會影響到預估的結果。

支援向量回歸（Support Vector Regression, SVR）是 Drucker 等人利用支援向量機（Support Vector machine，SVM）的基礎發展而成的回歸方法，支援向量機是以統計學習理論（Statistical Learning Theory）為基礎所發展出來的分類工具，

利用結構風險最小化原理（Structural Risk Minimization Inductive Principle），找到最優分類線，將不同樣本間的邊界（Margin）最大化，讓識別的錯誤率降到 0，

以解決凸二次規劃（Convex Quadratic Programming）[17]問題。若遇到非線性的狀況，導致在原始空間無法得到合理的分類結果，則利用核心函數（kernel

function）將非線性的資料投影到高維維空間（High-dimensional Feature Space）

中尋找一個有最大邊界之超平面（Hyperplane）後進行線性資料分類（圖 2-5），

SVM 的另一特性就是即使在訓練樣本數量較少的情況下，仍然能保持有一定程度的分類準確性，因此很適合作為樣本數量較少的實驗的研究工具[18][19][20]。

圖2-5 將原始數據由低維空間用映射函數 Φ 到投影到高維空間

一般回歸是利用一組已知的變數來預測未知的變數，而支援向量回歸所要找的是一個可以預估資料分佈的平面，這裡假設訓練樣本的集合為:

) , ( ),..., ,

(

x

y

x

y

_l ∈

R

ⁿ×

R

i

=1,2,3,L,

l

. （公式 2-20）

其中x 表示輸入的特徵（attribute），y 表示 x 所對應的輸出值，SVR 的工作就是在尋找

R 上的一個函數

ⁿ

f

(x),以便用

y

f

(x)來推估任一輸入值x所對應的輸出值

y 。

支援向量回歸需要定義一個損失函數（Loss Function），該函數可以忽略真實值某個範圍內的誤差，支援向量回歸較常使用的函數為ε 不敏感損失函數

（ε-Intensitive Loss Function ），這種函數是用來檢驗回歸方程式與訓練資料間的

y

x

● ●

●

● ● ●

●

µ µ µ µ µ

µ µ

^●

µ

ψ(y)

ψ(x)

●

µ µ µ µ

µ

ψ

差距，而ε 值的選擇是由使用者依據實驗數據的狀況進行設定。針對不同的問題又區分成線性支援向量回歸（Linear Support Vector Regression）和非線性支援向量回歸（Non-Linear Support Vector Regression）兩種類型，其特性描述如後。

1.線性支援向量回歸:

支援向量回歸主要是利用訓練資料（Training Data），建立一個回歸方程式，

使測試資料（Testing Data）可以擁有誤差最小的預測結果，回歸公式可以表示如下：

= ∗

藉由Lagrangian multiplier 的最佳化處理後，可將公式改寫成 2-25:

L =

其條件為

在執行支援向量回歸時選用不同的核心函數會產生不同的結果，常用的核心函數有線性核心函數(Linear kernel)、多項式核心函數(Polynomial kernel)及高斯核心函數(Gaussian Radial Basis function Kernel , RBF)三種：

Linear kernel： K

(

x_i

,

x_j

) =

x_i

⋅

x^T_j （公式 2-30）

Polynomial kernel： K

(

x_i

,

x_j

) = (

γx^T_i

⋅

x_j

+

)

^d （公式 2-31）

RBF Kernel： exp

(

−

γ x

i −

x

j ²

)

（公式 2-32）

其中γ>0，且 γ、r、d 都是 kernel 的參數。

研究者可以依據不同的需求選擇不同的核心函數，而藉由核心函數的應用，

讓SVR 可以進行非線性回歸的工作，更進一步的提升了預估的效能。

Agarwal 等人在 rg 色度空間中比較支援向量回歸（SVR）與類神經網路系統（Neural network, NN）及 Gray world 等演算法，應用在色彩恆常性的表現時，

發現SVR 的表現優於其他兩個方法[21]。

Brian 等人的研究也顯示，運用 r g 2 維色度空間的形成的直方圖加以二進位化後，作為向量回歸的輸入項來估計光源的色度，結果發現運用這樣的方式在光源色度估計上的效果也優於類神經網路系統[22]。

W. F. Zhang 等人提出以 R、G、B 三刺激值和光譜的波長數值作為輸入項搭配支援向量回歸來估計色票的反射譜，結果發現在小樣本的實驗中，SVR 在均方根差（Root mean Square Error）的表現優於 Wiener 等方法，但是在色差的估計上表現較不理想，在雜訊較高的實驗環境下Δ

E

_ab色差的平均值超過5[23]。

由上述文獻的說明顯示，當研究者想利用 SVR 來做出準確的預估結果時，

需要達成下列三個條件：

1.必須要選擇與輸出值關連性大的變數作為輸入值，而輸入值間的相關性則不能太高，以免影響到最後的結果。

2.必須預先計算好 C、γ、ε等參數的設定值，才能保證運算結果的正確性。

3.必須視樣本特性選擇最適合的核心函數。

在確立好上述三個條件完備後，SVR 的效果會比較接近我們的需求。

在文檔中自然影像中的光譜估計 (頁 19-30)

第二章 文獻探討

第二節 影像光源頻譜估計法