第二章 文獻探討
第二節 物體頻譜反射率的量測與估計
從第一節了解到,色彩觀察的三要素是光源、物體頻譜反射率與觀測者色彩 知覺。在本節中,物體頻譜反射率是本研究核心的議題,故本節將針對物體頻譜 反射率的量測與估計做進一步地了解。本研究將藉由檢視這些方法,試圖改善其 缺點,開發出一套新的物體頻譜反射率估計與修正方法。
一、 物體頻譜反射率的量測
透過物體頻譜反射率相關量測儀,可以量測出各物體的頻譜反射率。在本研 究實驗中蒐集的兩組色票頻譜樣本分別為孟塞爾色票書(Munsell Books of Color,
以下簡稱 Munsell 色票)與馬克貝斯色票(GretagMacbeth ColorChecker® ,以下簡 稱 Macbeth 色票)。
(一)孟塞爾色票書(Munsell 色票)
Munsell 色票被廣泛使用於設計領域中,因為色票顏色種類眾多,涵蓋色相 範圍廣,時常成為量測目標的標準選擇(University of Joensuu Color Group, n.d.)。
Munsell 色票共 1269 條頻譜反射率曲線繪製如圖 2-4。
圖 2-4 Munsell 色票物體頻譜反射率圖形
(二)馬克貝斯色票(Macbeth 色票)
Macbeth 色票的 24 種顏色中包含膚色、天空色、綠草色等日常生活中常見 的顏色,常被用於數位影像拍攝時的校正(Munsell Color Science Laboratory, 2011),
以及作為物體頻譜反射率重建研究中的實驗訓練樣本(Training Data)與實驗測試 樣本(Testing Data),其色票與 24 條頻譜反射率曲線繪製如圖 2-5。
圖 2-5 Macbeth 色票與其物體頻譜反射率圖形
資料來源:Munsell Color Science Laboratory (2011). CIE standard illuminant data.
Retrieved from: http://www.cis.rit.edu/research/mcsl/online/cie.php.
二、 物體頻譜反射率的估計
本研究針對頻譜的估計方法,整理出最多相關研究所使用以主成分分析法為 主與本研究使用到的內插方法這兩種類型,也簡單介紹其他物體頻譜反射率重建 方法共三部分,簡述其操作方式並歸納其優缺點。
(一)主成分分析法(Principle component Analysis,PCA)
藉由畫 2D 散布圖來觀察兩個變數之間的相關性。同理,也可以畫 3D 立體 圖了解三個變數關係情況。然而,當變數非常多時,就有可能發生某一群變數間 有較高的相依性,某些變數的影響程度卻非常有限。主成分分析法(Principal component analysis)其目的就在於將原有資料中多個變數予以縮減,也就是降低 維度(Dimensionality Reduction)的概念,找出真正核心的變數,成為數量較少且 互相獨立的線性組合變項(主成分),藉此達到化繁為簡的效果。(Agahian et al., 2008; Ansari et al., 2006; Ayala et al., 2006; Cohen, 1964; Fairman & Brill, 2004;
Maloney, 1986; Parkkinen et al., 1989; Tzeng & Berns, 2005)
以頻譜反射率資料為例,運用 PCA 分析資料時,能使資料組原本龐大的資 訊,以數個主要的基底頻譜做為代表。如圖 2-6,即為 Macbeth 24 色色票使用 PCA 方法求得的三個基底函數。再將這些頻譜經由線性累加的方式,就能重建 原始資料中的任一頻譜。
圖 2-6 PCA 方法產生的基底函數
近年來,針對各家學者使用 PCA 方法來重建頻譜的研究相當多,大致上,
一般認為大約需要至少六個主成分才可以準確估計出反射頻譜。在 2004 年的研 究中(Fairman, & Brill, 2004),運用典型的 PCA 來重建三千多筆反射率資料,並 公開反射率的前六個主成分基底函數。同年出版的 Computational Colour Science using MATLAB 一書中(Westland & Ripamonti, 2004),以實際量測的 404 筆自然界 物質的頻譜反射率,求出前三個主成分資料。
2006 年後發表的 PCA 文獻特點,主要是各研究者們提出先將收集到的色彩 樣本先分類,依照頻譜形狀特性或是以顏色來分成不同樣本組。舉例來說,2006 年的研究是將 PCA 用特定歸納好的樣本作測試(Ansari et al., 2006),不僅提高重 建精準度也省下許多計算時間。同一年裡,Ayala 等人(Ayala et al., 2006)將色彩 空間分成十個區域,讓原本的訓練樣本對應到孟賽爾色相,以三個特徵向量來重 建反射頻譜。同樣的概念,研究者在 2008 年的研究中建議了新的調整方法來改 善傳統的 PCA(Zhang & Xu, 2008),首先將待測試的色彩樣本分類,提出以 hue 色相來進行分組,依色相的類型把頻譜(圖 2-7 由左而右,由上而下)分成紅色 R、
黃紅色 YR、黃色 Y、綠黃色 GY、綠色 G、藍綠色 BG、藍色 B、紫藍色 PB、
紫色 P、紅紫色 RP 與灰階色調組,如圖 2-8,發現該研究以色相來區分頻譜形 狀類型進而得到各組的基底函數,對於重建頻譜而言是非常有效的。
圖 2-7 以 hue 色相分類共 11 組頻譜類型
資料來源:“ Reconstructing spectral reflectance by dividing spectral space and extending the principal components in principal component analysis, ” by Zhang, X.,
& Xu, H, 2008, Journal of the Optical Society of America A, 25(2), 371-378.
Agahian 與其共事者(Agahian et al., 2008)也於 2008 同年提出了「加權」的 PCA 方法來重建物體頻譜反射率,其主要目的是最小化加權平方重建的誤差值 e,
如公式(2-12)。與傳統的 PCA 方法最大不同在於,他們根據不同測試樣本透過矩 陣運算會得到不同的特徵向量來估計反射率頻譜,其實驗結果會比傳統 PCA 方 法來得更理想。
𝐞 = ∑𝟕𝟎𝟎λ=𝟒𝟎𝟎𝒘 (𝑟λ− (𝑽𝟎+ ∑𝑘𝑗=1𝑐𝑗𝑉𝑗λ) ) 2 (2-12)
幾年後,非負主成分分析(Nonnegative Principal Component Analysis)的新設 計方式在 2012 年被提出,其與傳統 PCA 方法的差別在於 NNPCA(Nonnegative Principal Component Analysis)先定義係數與基底函數這兩者必須都為正的值(Lee, Park, Ryu, & Park, 2012),重建後的效果雖然與傳統 PCA 差異不明顯,但其最大 優點是計算時間上會更為迅速。比較傳統 PCA 與 NNPCA 兩者的基底函數如圖 2-8:
圖 2-8 PCA 與 NNPCA 的基底函數頻譜圖
資料來源:“ Fast model-based multispectral imaging using nonnegative principal component analysis, ” by Lee, M. H., Park, H., Ryu, I., & Park, J.I., 2012, Optics Letters, 37(11), 1937-1939.
最新的相關文獻顯示,有研究者(Wu, Tian, & Tang, 2014)強調由於 PCA 方法 針對某一樣本組所產生出來的基底函數,如果將其基底函數重建於其他色票樣本 的反射頻譜,並不見得能得到理想準確的值。因此,他們提出一個可以適用各種 頻譜最適合基底函數的計算方法,也就是以不同的權重來進一步改良傳統 PCA 的計算方式,接著再進一步做迴歸分析,即便此改良方法會讓計算時間相對變得 更久,但其重建準確率卻是提升的(Wu, Tian, & Tang, 2014)。
PCA 的相關延伸方法相當多,其估計的表現都算不錯,但是隨著特徵向量 的增加,其運算速度也會隨之降低,而且大部分實驗結果顯示透過主成分估計出 來的頻譜反射率,最主要的大問題還是有數值超過 1 或是出現負值的現象,是近 年來各研究仍然持續要努力的目標。
(二)內插法(Amidror, 2002)
內插方法有許多不同的種類,主要包括線性(Linear) 內插法、最鄰近內插法 (Nearest neighbor interpolation)、三次板條樣(Cubic Spline)內插法、自然鄰點內插
法(Natural Neighbor interpolation)等,每一種內插法的計算方式皆不相同,各自都 選擇線性三角網內插法(Linear Triangulated Interpolation) 隨著輸入的量測資料數 量增加,內插方法的實驗結果會好於 PCA 方法(Abed et al., 2009)。此內插方法能 夠產生相當精準的頻譜重建結果。值得一提的是,無限制地增加量測樣本雖然可 以提高重建精確度,但並無法保證所有的目標樣本都可以被重建得到,同時計算 所耗費的時間也會拉長。
2012 年的相關研究中同樣使用此內插法為基礎(Kim et al., 2012),並針對之 前碰到的問題提出了 hybrid 混合方法。實驗步驟是先選擇三維的線性內插法內
(1)同色異譜的多頻譜估計法
依據同色異譜的現象,利用虛反矩陣(Pseudo Inverse)的運算,將由數萬組的 RGB 色頻數值資料模擬出近似三原色刺激值的頻譜作為模擬頻譜反射率的基底 (呂億德,民 98),如圖 2-9,其模擬函數分別為𝑟𝑅(𝜆)、𝑟𝐺(𝜆)、𝑟𝐵(𝜆)。
圖 2-9 基底函數圖形
資料來源:呂億德(民 98)。自然影像中最佳化物體反射譜估計及其後製應用之研 究(未出版之碩士論文)。頁 46。
利用𝑟𝑅(𝜆)、𝑟𝐺(𝜆)、𝑟𝐵(𝜆)進行加成方式,與 RGB 分量值之係數𝑐𝑅、𝑐𝐺、𝑐𝐵累 加過後,在公式 2-13 中,可求得任意色的最佳化物體頻譜反射率𝑅0(𝜆)。此種以 RGB 三原色為模擬反射率的基底,求得任意色的反射率(Chou & Lin, 2012)。實 踐結果發現整體色差平均值低,但是仍有幾個顏色出現大色差的現象。另外,其 估計的頻譜範圍會有出現負值的缺點。
𝑹𝟎(𝜆) = 𝑪𝑹∗ 𝒓𝑹(𝜆) + 𝑪𝑮∗ 𝒓𝑮(𝜆) + 𝑪𝑩∗ 𝒓𝑩(𝜆) (2-13)
(2)快速反射譜模擬方法
快速反射譜模擬法,是以 Sigmoid 函數及 Gaussian 函數,分別模擬 R、G、
B 三原色的反射譜,其餘色彩則運用三原色反射譜的比例關係進行模擬(周遵儒、
陳怡君,民 97)。依照比例來進行加成的方式,可快速獲得反射譜的模擬結果,
並能將反射率控制在實際範圍內。然而,高明度的色彩(RGB 值均大於 200)其重
(3)迴歸分析法(Regression Analysis)
迴歸(Regression)的意思指的是用已知的一組數值來推測要求的未知數。支
300 400 500 600 700 800
0
RGB reflectance (Sigmoid and Normal Distribution)
300 400 500 600 700 800
0
RGB reflectance (Sigmoid and Normal Distribution)
300 400 500 600 700 800
0
RGB reflectance (Sigmoid and Normal Distribution)
度 增 加 , 所 需 要 的 訓 練 樣 本 數 目 也 要 增 多 。 支 援 向 量 迴 歸 (Support Vector Regression,SVR)是 Drucker 等人以支援向量機(Support Vector machine,SVM) 為基礎發展成的回歸方法。SVM 是機器學習領域的演算方法,可廣泛運用於遙 測資料分類,已預先決定好的核函數(kernel function)將原資料映射至高維度的特 徵空間。其優勢是在解決小樣本及高維度模式下都有很好的效果,同時具有清楚 的理論與完整的架構,並且實作分類效果良好。研究者同樣於 2008 年透過 SVR 搭配不同數量的訓練樣本組與不同程度的雜訊計算來求出反射頻譜(Zhang &
Dai, 2008)。其實驗發現重建的效果大致好於傳統的 Wiener 模擬方法。此類以 SVR 重建的研究方法,關於核心(kernel)的選定將嚴重影響其重建的好壞,即便持續 增加訓練樣本同樣也可提高重建準確度,卻也相對耗費大量的計算時間。因此,
如何找出更好的核心與設計更有效率的 SVR 演算方式,仍需要持續做改善。
2009 年,Eslahi 等人又提出以典型相關分析(Canonical Correction Analysis,
CCA)來設計頻譜的重建方式(Eslahi, Amirshahi, & Agahian, 2009)。所謂的典型相 關指的是兩組變數都是一個變數以上,量測此兩組變數間的相關性即是典型相關,
(4)非負矩陣分解方法(Non-negative Matrix Fatorization,NMF)
2012 年,Farajikhah 等人提出導入高斯初始向量(Gaussian initializing vectors) 於 NMF 方法中來計算重建頻譜方法(Farajikhah & Amirshahi, 2012)。此設計方式 可以得到都是正數的基底並增進高斯方法的準確性與 NMF 的可靠性,於是如何