• 沒有找到結果。

奇異值分解在影像處理上之運用 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "奇異值分解在影像處理上之運用 - 政大學術集成"

Copied!
49
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學統計學系研究所 碩士學位論文. 奇異值分解在影像處理上之運用. 治 政 Singular Value Decomposition: 大 立. ‧. ‧ 國. 學. Application to Image Processing. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 指導教授:薛慧敏 博士 研究生:顏佑君 撰. 中 華 民 國 一百零四 年 十 月.

(2) 摘. 要. 奇異值分解(singular valve decomposition)是一個重要且被廣為運用的矩陣分 解方法,其具備許多良好性質,包括低階近似理論(low rank approximation)。在 現今大數據(big data)的年代,人們接收到的資訊數量龐大且形式多元。相較於 文字型態的資料,影像資料可以提供更多的資訊,因此影像資料扮演舉足輕重 的角色。影像資料的儲存比文字資料更為複雜,若能運用影像壓縮的技術,減 少影像資料中較不重要的資訊,降低影像的儲存空間,便能大幅提升影像處理 工作的效率。另一方面,有時影像在被存取的過程中遭到雜訊汙染,產生模糊. 政 治 大 被用於解決影像處理問題,對於影像資料也有充分的解釋能力。本文考慮將奇 立. 影像,此模糊的影像被稱為退化影像(image degradation)。近年來奇異值分解常. ‧ 國. 學. 異值分解應用在影像壓縮與去除雜訊上,以奇異值累積比重作為選取奇異值的 準則,並透過模擬實驗來評估此方法的效果。. ‧ sit. y. Nat. n. al. er. io. 關鍵字:奇異值分解、低階近似、影像處理、影像壓縮、去除影像雜訊。. Ch. engchi. i. i n U. v.

(3) Abstract Singular value decomposition (SVD) is a robust and reliable matrix decomposition method. It has many attractive properties, such as the low rank approximation. In the era of big data, numerous data are generated rapidly. Offering attractive visual effect and important information, image becomes a common and useful type of data. Recently, SVD has been utilized in several image process and analysis problems. This research focuses on the problems of image compression and image denoise for restoration. We. 政 治 大 subspace for an efficient立 image compression, and to screen out the noise propose to apply the SVD method to capture the main signal image. ‧ 國. 學. image subspace for image restoration. Simulations are conducted to investigate the proposed method. We find that the SVD method has. ‧. satisfactory results for image compression. However, in image denoising,. sit. y. Nat. the performance of the SVD method varies depending on the original image,. n. al. er. io. the noise added and the threshold used.. Ch. engchi. i n U. v. Keywords: singular value decomposition, low rank approximation, image processing, image compression, image denoising. ii.

(4) 目錄 第一章、. 緒論...................................................... 1. 第二章、. 研究方法.................................................. 4. 一.. 奇異值分解基本介紹.......................................... 4. 二.. 奇異值分解之低階近似性質(low rank approximation) ............... 5. 三.. 奇異值分解在影像壓縮的應用與評估............................ 6. 四.. 奇異值分解在消除影像雜訊的應用與評估........................ 9. 第三章、 一.. 實證分析................................................. 11 奇異值分解在影像壓縮的應用................................. 11. 政 治 大 結果呈現:實驗一 ............................................... 12 立 實驗設計 ....................................................... 11. ‧ 國. 學. 結果呈現:實驗二 ............................................... 17 結果呈現:實驗三 ............................................... 22 奇異值分解在雜訊消除上的應用............................... 27. ‧. 二.. 實驗設計 ....................................................... 27. y. Nat. io. sit. 結果呈現:實驗一 ............................................... 28. al. n. 第四章、. er. 結果呈現:實驗二 ............................................... 34. i n U. v. 結論..................................................... 40. Ch. engchi. 參考文獻........................................................... 42. iii.

(5) 表次 表 3-1、三色堇(pansy)在各奇異值比重水準 w0 下,壓縮率及平均平方誤差值 . 15 表 3-2、三色堇(pansy)在各奇異值比重水準 w0 下所分解出的訊號影像與雜訊影 像.................................................................................................................................. 16 表 3-3、腳踏車(bike)在各奇異值比重水準 w0 下,壓縮率及平均平方誤差 ........ 20 表 3-4、腳踏車(bike)在各奇異值比重水準 w0 下所分解出的訊號影像與雜訊影像 ...................................................................................................................................... 21 表 3-5、女孩(girl)在各奇異值比重水準 w0 下,壓縮率及平均平方誤差 ............. 25. 政 治 大 像.................................................................................................................................. 26 立 表 3-6、女孩(girl)影像在各奇異值比重水準 w0 下所分解出的訊號影像與雜訊影. ‧ 國. 學. 表 3-7、加入 normal (0,1)亂數的三色堇(pansy)的退化影像及其在各奇異值比重 水準 w0 下,與原始影像的平均平方誤差值 ............................................................ 32. ‧. 表 3-8、加入 normal (0, 1)亂數的三色堇(pansy)的退化影像及其在各奇異值比重. sit. y. Nat. 水準 w0 下,所分解出的訊號影像 ............................................................................ 33. al. er. io. 表 3-9、加入 normal (0,2)亂數的三色堇(pansy)的退化影像及其在各奇異值比重. v. n. 水準 w0 下,與原始影像的平均平方誤差值 ............................................................ 38. Ch. engchi. i n U. 表 3-10、加入 normal (0, 2)亂數的三色堇(pansy)的退化影像其在在各奇異值比重 水準 w0 下,所分解出的訊號影像 ............................................................................ 39. iv.

(6) 圖次 圖 2-1、紅、綠、藍三原色亮度從 0 到 1 之變化。 ................................................. 6 圖 2-2、紅、綠、藍三原色相互重疊之變化。 ......................................................... 7 圖 3-1、三色堇(pansy)原圖 ....................................................................................... 14 圖 3-2、腳踏車(bike)原圖 .......................................................................................... 19 圖 3-3、女孩(girl)原圖 ............................................................................................... 24 圖 3-4、加入 normal (0, 1) 亂數的紅色(R) 三色堇(pansy)退化影像 k 取 1 到 30 之訊號影像與原始影像的平均平方誤差變化.......................................................... 31. 政 治 大 之訊號影像與原始影像的平均平方誤差變化.......................................................... 31 立 圖 3-5、加入 normal (0, 1) 亂數的綠色(G) 三色堇(pansy)退化影像 k 取 1 到 30. ‧ 國. 學. 圖 3-6、加入 normal (0, 1) 亂數的藍色(B) 三色堇(pansy)退化影像 k 取 1 到 30 之訊號影像與原始影像的平均平方誤差變化.......................................................... 31. ‧. 圖 3-7、加入 normal (0, 2) 亂數的紅色(R) 三色堇(pansy)退化影像 k 取 1 到 30. sit. y. Nat. 之訊號影像與原始影像的平均平方誤差變化.......................................................... 37. al. er. io. 圖 3-8、加入 normal (0, 2) 亂數的綠色(G) 三色堇(pansy)退化影像 k 取 1 到 30. v. n. 之訊號影像與原始影像的平均平方誤差變化.......................................................... 37. Ch. engchi. i n U. 圖 3-9、加入 normal (0, 2) 亂數的藍色(B) 三色堇(pansy)退化影像 k 取 1 到 30 之訊號影像與原始影像的平均平方誤差變化.......................................................... 37. v.

(7) 第一章、. 緒論. 面對資料量龐大的矩陣資料,奇異值分解(Singular Value Decomposition,簡 稱 SVD)具備許多良好性質,是一個重要且被廣為運用的矩陣分解方法。奇異值 分解是一個穩健而且可靠的正交化矩陣分解法,奇異值分解能將原始矩陣對角 化,並且使原始矩陣分解為多個正交化的矩陣相加,因此透過奇異值分解能幫 助矩陣在計算上達到簡化的效果。奇異值分解可以運用在解線性方程組、求最 小平方法解、求僞逆矩陣和資料壓縮等多項用途(Sadek, 2012)。. 政 治 大 式多元,相較於文字型態的資料,影像資料可以提供更多的資訊,因此影像資 立 在現今大數據(big data)的年代,人們接收到的資訊量非常龐大且資料的形. ‧ 國. 學. 料扮演舉足輕重的角色。在地理學中,常透過衛星遙測影像等工具了解一個地 區水文、地形等地理環境(Aronoff,1989);在醫學上,醫師們利用 X 光、超音. ‧. 波、電腦斷層掃描等技術,幫助診斷病人的病情(Menze 等人,2015);在生活. sit. y. Nat. 中,人們也常透過照片紀錄生活。. al. er. io. 影像資料的儲存比文字資料更為複雜,通常影像數位化的方式是將影像以. v. n. 陣列的方式呈現,這樣的儲存方式相對而言非常沒有效率,使得影像資料比文. Ch. engchi. i n U. 字資料需要更大的儲存空間,若影像資料量太大將會影響在傳送、展現或儲存 的執行效率,若能運用影像壓縮的技術,消除或減少影像資料中多餘的資訊, 降低影像的儲存空間,能幫助影像處理工作的效率大幅提升。資料壓縮的目的 是希望能將須呈現的資料用最少的空間儲存,在降低儲存空間的同時,還要確 保影像品質是可被接受的。若相同的資訊可以用不同的資訊量表達,我們就有 誘因進行資料壓縮,減少多餘資訊,將儲存空間作最有效的利用(Karadimitriou 和 Fenstermacher,1997)。 在影像被存取的過程中也時常遭到汙染,例如在醫學影像中,常會有 X 光 或超音波等影像因為機器未被校正妥當,因而在產生影像得過程中可能產生雜 1.

(8) 訊(Sanches,等人,2008)。模糊的影像被稱為退化影像(image degradation),其 中,退化影像又分為失焦、動態模糊、低解析度以及外加雜訊。失焦通常發生 在攝影的過程中,由於攝影機器沒有調整正確,導致影像失焦退化。動態模糊 具有方向性,主要發生在攝影過程中,影像中的人或物移動而造成。低解析度 則是在產生影像時,機器得能力有限,使得得到的影像解析度不佳,或是呈現 時,機器的解析度太低造成影像退化。外加的雜訊可能發生在產生影像的過程 中,可能因為機器本身有瑕疵,而產生附加在影像中的雜訊,或是在存取的過 程中,影像受到干擾而產生雜訊。將觀察到的退化影像,去除雜訊後回到原始. 政 治 大 影像還原主要有兩個目標,一個是影像重建,另一個是移除雜訊。若影像 立. 影像的過程稱之為影像還原(image restoration) (Banham 和 Katsaggelos,1997)。. 在產生的過程品質不佳,需要靠影像重建的技術,將影像還原,最常見的是動. ‧ 國. 學. 態模糊的影像,透過分析移動的方向做修正,改善影像中的拖影。若影像受到. y. Nat. 到影像還原的效果(Banham 和 Katsaggelos,1997)。. ‧. 雜訊汙染,則需要透過雜訊過濾的技術,將雜訊過濾出來,保留原始影像,達. er. io. sit. 近年來奇異值分解常被用於解決影像處理問題,對於影像資料也有充分的 解釋能力(Sadek, 2012)。影像經過奇異值分解後,對於影像資料而言,每個正. al. n. v i n 交化的矩陣代表每個圖層,對角線上的奇異值代表每個圖層的亮度(Ganic 等 Ch engchi U. 人,2003),全部的圖層相加後可以還原為原始影像。在固定維度下,奇異值分 解能提供最大的資訊量,此性質通常用於資料壓縮的工作(Yang 和 Lu,1995)。 奇異值分解的低階近似性質能在固定的儲存空間裡,儲存最大的資訊量,得到 與原始影像最接近的壓縮影像。奇異值分解也能將影像資料劃分為兩個子空 間,一個是能夠傳遞資料中重要資訊的訊號子空間,另一個是資料內容較次要 的雜訊子空間(Konstantinides 等人,1997)。若影像資料受到雜訊汙染,透過奇 異值分解可以利用此性質將影像的重要資訊與雜訊分離,故此性質常用於過濾 雜訊,提高影像品質,或是用於浮水印的應用,在亮度較低的圖層加入浮水 2.

(9) 印,以保護原始影像(Gorodetski 等人,2001)。奇異值分解在影像上有許多運 用,在對於影像訊號處理領域中也是近年來越來越盛行的處理方法(Kamm, 1998)。 本論文將在第二章介紹奇異值分解的基本特性與奇異值分解的低階近似性 質,說明奇異值分解對影像壓縮處理與去除影像雜訊的方法,並提出選取 k 值 的方法以並評估奇異值分解對影像處理的效果。第三章則是驗證前面章節所提 出的方法,針對資料壓縮和去除影像雜訊兩部分做實驗,將前章節提出的方法 套用在我們任意選取出來的圖片影像上,並觀察其實驗結果。第四章為總結,. 政 治 大. 其中包括研究方法的限制與未來的研究目標。. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 3. i n U. v.

(10) 第二章、. 研究方法. 一. 奇異值分解基本介紹 奇異值分解是一種矩陣的分解方法,透過奇異值分解,可在不需要做任何 前提假設下,將任意的矩陣 A 分解成A = UΣ𝑉𝑉 𝑇𝑇 。奇異值分解定理在矩陣的運算 上有許多的好處,近年來奇異值分解在影像處理的領域中也被廣泛運用,本章 將介紹奇異值分解的基本性質,並說明奇異值分解在影像處理上的應用。. 政 治 大 min(m, n),則 r ≤ L。則立 A 矩陣的奇異值分解為 𝑢𝑢𝑟𝑟. 𝑢𝑢𝑟𝑟+1. (2.1). … 𝑢𝑢𝑚𝑚 ]為一m × m方形矩陣,矩陣中的行向量. ‧. …. A = UΣ𝑉𝑉 𝑇𝑇 ,. 學. 其中𝑈𝑈 = [𝑢𝑢1. ‧ 國. 設 A 為一m × n的實數矩陣,其秩(rank)為 r,即rank (A) = r,若L =. {𝑢𝑢𝑘𝑘 }則稱為 A 的左奇異向量,此些向量形成𝑅𝑅 𝑚𝑚 的正交基底,所以當i = j時,. sit. y. Nat. 𝑢𝑢𝑖𝑖 ∙ 𝑢𝑢𝑗𝑗 = 1;而當i ≠ j時,𝑢𝑢𝑖𝑖 ∙ 𝑢𝑢𝑗𝑗 = 0。Σ=�Σ𝑖𝑖𝑖𝑖 �為一m × n矩陣,矩陣中上左方前. er. io. r × r對角線元素稱為奇異值𝜎𝜎𝑖𝑖 ,矩陣中的其餘元素皆為 0,即. n. aΣl𝑖𝑖𝑖𝑖 = �𝜎𝜎𝑖𝑖 , 1 ≤ 𝑖𝑖 = 𝑗𝑗 ≤ 𝑟𝑟 , i v 𝑜𝑜. 𝑤𝑤. n C h0, U engchi. 或. 最後, 𝑉𝑉 = [𝑣𝑣1. …. 𝜎𝜎1 0 0 ⎡0 ⋱ 0 ⎢ ∑ = ⎢ 0 0 𝜎𝜎𝑟𝑟 ⎢0 … 0 ⎣0 … 0. 𝑣𝑣𝑟𝑟. 𝑣𝑣𝑟𝑟+1. 0 ⋮ 0 0 0. … … … ⋱ …. 0 ⎤ 0⎥ 。 0⎥ 0⎥ 0⎦𝑚𝑚×𝑛𝑛. … 𝑣𝑣𝑛𝑛 ]為n × n的方陣,V 的行向量或者是𝑉𝑉 𝑇𝑇 的. 列向量{𝑣𝑣𝑘𝑘 }則稱為右奇異向量,且右奇異向量為𝑅𝑅 𝑛𝑛 的一組正交基底。. 4.

(11) 二. 奇異值分解之低階近似性質(low rank approximation) 透過奇異值分解,矩陣 A 可以表示成 r 個秩為 1 的矩陣和,即 A = 𝜎𝜎1 𝑢𝑢1 𝑣𝑣1𝑇𝑇 + 𝜎𝜎2 𝑢𝑢2 𝑣𝑣2𝑇𝑇 + ⋯ + 𝜎𝜎𝑟𝑟 𝑢𝑢𝑟𝑟 𝑣𝑣𝑟𝑟𝑇𝑇 。. 假設奇異值已由大到小排序。給定 k≤ 𝑟𝑟,令Σ𝑘𝑘 為由前 k 個奇異值所組成的m ×. n對角線矩陣,即. 𝜎𝜎1 0 0 ⎡0 ⋱ 0 ⎢ ∑𝑘𝑘 = ⎢ 0 0 𝜎𝜎𝑘𝑘 ⎢0 … 0 ⎣0 … 0. 0 ⋮ 0 0 0. … … … ⋱ …. 0 ⎤ 0⎥ , 0⎥ 0⎥ 0⎦𝑚𝑚×𝑛𝑛. 政 治 大. ∑𝑟𝑟−𝑘𝑘 = ∑ − ∑𝑘𝑘 由剩餘 r-k 個較小的非零奇異值所組成的m × n對角線矩陣。. 立. ‧ 國. 學. 則A可分解為UΣ𝑘𝑘 𝑉𝑉 𝑇𝑇 和UΣ𝑟𝑟−𝑘𝑘 𝑉𝑉 𝑇𝑇 兩部分,且兩個矩陣互為正交。其中,UΣ𝑘𝑘 𝑉𝑉 𝑇𝑇 對. 應前 k 個較大的奇異值,故為正交化的主要組成架構,其所對應的子空間稱為. ‧. 訊號子空間(signal subspace),而UΣ𝑟𝑟−𝑘𝑘 𝑉𝑉 𝑇𝑇 為正交化的次要組成架構,次要組成. 架構所對應的子空間稱為雜訊子空間(noise subspace),換而言之,透過奇異值. y. Nat. sit. 分解可將資料矩陣分解成互為正交的主要子空間和次要主空間。. n. al. er. io. 對應較大的奇異值的主要子空間包含資料矩陣的大部分資訊,而次要子空. i n U. v. 間對應相對較小的奇異值,而且第r + 1到第 n 個奇異值為 0,因此,從雜訊子. Ch. engchi. 空間中所獲取的資訊相較之下比較不重要。所謂的低階近似 (low rank. approximation)便是透過捨去雜訊子空間的資訊,僅保留訊號子空間的資訊,以 達到簡化資料的效果。在秩固定在 k 的情況下,原始矩陣 A 可以用秩為 k 的矩 陣𝐴𝐴𝑘𝑘 =UΣ𝑘𝑘 𝑉𝑉 𝑇𝑇 近似,且其可以表示成 k 個秩為 1 的矩陣相加,即: 𝐴𝐴𝑘𝑘 =UΣ𝑘𝑘 𝑉𝑉 𝑇𝑇 = ∑𝑘𝑘𝑖𝑖=1 𝜎𝜎𝑖𝑖 𝑢𝑢𝑖𝑖 𝑣𝑣𝑖𝑖𝑇𝑇 = 𝜎𝜎1 𝑢𝑢1 𝑣𝑣1𝑇𝑇 + 𝜎𝜎2 𝑢𝑢2 𝑣𝑣2𝑇𝑇 + ⋯ + 𝜎𝜎𝑘𝑘 𝑢𝑢𝑘𝑘 𝑣𝑣𝑘𝑘𝑇𝑇. (2.2). 在實務上常常用𝐴𝐴𝑘𝑘 近似A,以下的 Eckart-Young Theorem (1936) 證明在所有秩 不超過 k 的矩陣中, 𝐴𝐴𝑘𝑘 與原 A 矩陣間差異量最小,即𝐴𝐴𝑘𝑘 為A的最佳估計量。 定義矩陣 A 之弗羅貝尼烏斯範數(Frobenius norm)為‖𝐴𝐴‖2𝐹𝐹 = trace(𝐴𝐴𝑇𝑇 𝐴𝐴)。 5.

(12) 定理一: (Eckart and Young (1936)). ‖𝐴𝐴𝑘𝑘 − 𝐴𝐴‖ =. inf. 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟(𝐴𝐴̅)≤𝑘𝑘. ‖𝐴𝐴̅ − 𝐴𝐴‖。. 若希望資訊保留越完整,應選取較大的 k 值,其中 k 至多為 r。當 k 等於 r 時,UΣ𝑟𝑟 𝑉𝑉 𝑇𝑇 等於原始的資料矩陣,則將不會損失任何資訊。但相反的,當 k 值 越小,則資料簡化的程度越高。. 低階近似在影像處理中有許多實務上的運用,包括影像壓縮以及消除雜 訊。例如:將原始影像透過低階近似壓縮,可以大幅降低儲存空間,以促進傳輸 效率。將影像透過奇異值分解,可協助萃取主要以及重要資訊,消除雜訊。以 下將介紹此二應用。. 學. ‧ 國. 立. 政 治 大. 三. 奇異值分解在影像壓縮的應用與評估. ‧. 一般原始圖片影像的存取方式是將圖片切割成一格一格的像素儲存資料內. sit. y. Nat. 容,每個像素裡分別儲存紅、綠、藍三個顏色的亮度,亮度以 0 到 1 之間的數. al. er. io. 值表現,越接近 0 越暗,反之,越接近 1 表示越亮。當三個亮度皆為零時則產. v. n. 生黑色;三個亮度皆為一時則對應至白色,請見圖一與圖二。. Ch. engchi. i n U. 圖 2-1、紅、綠、藍三原色亮度從 0 到 1 之變化。. 6.

(13) 圖 2-2、紅、綠、藍三原色相互重疊之變化。. 一張 m×n 像素的彩色照片,即表示圖片切割成 m 列 n 行共 m×n 的像素 格,且對應三個 m×n 的數字矩陣,則此影像資料將對應 3×m×n 個數字資料,. 政 治 大 過適當運算方法,萃取影像主要資訊,消除細微雜訊,以有效降低資料量。奇 立 則在資料存取、運算或傳輸上,需要相當的儲存空間。影像資料壓縮則期望透. ‧ 國. 學. 異值分解常被用來處理資料壓縮的問題。. Sadek (2012)指出奇異值分解將影像分解成數個圖層,奇異值代表每個圖層. ‧. 的亮度(luminance),亮度越高顏色越明顯,亮度越低則趨近黑色,所以亮度在. sit. y. Nat. 影像上又稱為能量(energy)或是資訊量,所以奇異值在影像處理中扮演很重要的. al. er. io. 角色。另一方面,奇異向量則提供影像形狀的資訊。. v. n. 已知奇異值分解可以將矩陣資料分解為正交化的結構,並且利用先前提到. Ch. engchi. i n U. 的低階近似性質,在秩固定的情況下,得到最佳的近似解。也就是在固定儲存 空間限制下,奇異值分解可以提供最大的資料量。若考慮秩為 k 的近似矩陣來 進行資料壓縮,如(2.2),即A ≈ 𝐴𝐴𝑘𝑘 =UΣ𝑘𝑘 𝑉𝑉 𝑇𝑇 ,則每個壓縮矩陣由 k 個左奇異向. 量和右奇異向量,以及 k 個奇異值來決定,故每個矩陣經壓縮過後的總資料量 為(m+n+1)×k。則可定義以下的壓縮率(Compression Ratio)公式: R=. 𝑘𝑘(𝑚𝑚+𝑛𝑛+1) 𝑚𝑚𝑚𝑚. × 100。. R 代表壓縮的百分率,壓縮率的分母表示原始資料需要的儲存空間,分子代表 壓縮後所需的儲存空間,k 代表被選取截尾資料的秩,而 m 跟 n 分別是資料矩 7.

(14) 陣的列數和行數,若只考慮資料的壓縮效果,壓縮率越小越好,表示需要的儲 存空間越少。 資料的品質與壓縮程度可說是魚與熊掌不可兼得,若希望有較高的資料品 質,就不可過度壓縮資料,即 k 值越大越好,壓縮過後的資料與原始資料就越 接近,當保留的資訊量越大將需要越多的儲存空間。相反得,選取越小的 k 值,資料被高度壓縮,資料的品質便勢必要被犧牲。為了同時兼顧資料的品質 與壓縮,k 值的選取是一個重要的課題。當儲存空間有限時,則我們得在該限 制下尋找最大可能的 k 值,以保留最多的資訊量。另一方面,研究人員也經常. 政 治 大 值,以獲得最有效率的資料縮減。 立. 利用其他準則來評估壓縮資料的品質。給定相當品質水準,尋找最小可能的 k. ‧ 國. 學. 為了評估壓縮後的影像資料品質,平均平方誤差(Mean Square Error, 簡稱. MSE)常被用來作為衡量指標,其定義如下: 𝑛𝑛 2 ∑𝑚𝑚 𝑖𝑖=1 ∑𝑗𝑗=1[𝐼𝐼(𝑖𝑖,𝑗𝑗)−𝑘𝑘(𝑖𝑖,𝑗𝑗)]. 。. y. 𝑚𝑚𝑚𝑚. ‧. Nat. MSE =. sit. 其中𝐼𝐼(𝑖𝑖, 𝑗𝑗)為原始的矩陣資料,𝑘𝑘(𝑖𝑖, 𝑗𝑗)則是代表壓縮後的矩陣資料。若平均平方. n. al. er. io. 誤差值越小,表示壓縮後的資料與原始資料越相近,資料品質越高,反之,若. i n U. v. 平均平方誤差值越大,表示壓縮後的資料越失真,資料品質越低。由於平均平. Ch. engchi. 方誤差的計算公式中的平方項會膨脹結果,為了改善這項問題,可以考慮將平 均平方誤差開根號。 已知在影像資料的奇異值分解中,奇異值有承載資訊量大小的意義,值越 大則代表承載的資訊量越大,在本文中,我們將考慮以奇異值比重(w)做為參考 標準以決定資料壓縮程度。奇異值比重的計算公式如下: ∑𝑘𝑘𝑖𝑖=1 𝜎𝜎𝑖𝑖 𝑤𝑤𝑘𝑘 = 𝑟𝑟 , 𝑘𝑘 = 1, … , r。 ∑𝑖𝑖=1 𝜎𝜎𝑖𝑖. 其中分母為所有奇異值的總和,分子則是代表前 k 個奇異值的總和。若所有奇 異值都相同時,則奇異值比重等比於 k 值。一般情況下,奇異值比重同時考慮 8.

(15) 奇異值的總和,比僅只考慮 k 值得到更多資訊,取不同的奇異值比重,會有不 同的效果。奇異值比重 w 為 k 的非遞減函數。若奇異值比重較高,k 值也會相 對較大,資料品質也會相對提升,但壓縮率也會較大,反之,若奇異值比重較 低,k 值也會相對較小,而資料壓縮率小,需要的儲存空間較少。. 四. 奇異值分解在消除影像雜訊的應用與評估 影像資料在處理或存取的過程中,常常容易受到干擾或是被加入人為雜. 政 治 大 要的影像處理工作,我們稱之為影像還原。我們考慮利用奇異值分解的性質, 立 訊,使真實影像變得模糊或失真,故消除人為雜訊以恢復清晰的原始影像為重. 運用奇異質分解方法在消除影像的雜訊,期望影像經過處理後,能夠清楚重現. ‧ 國. 學. 原始影像。. ‧. 已知透過奇異值分解能將影像資料矩陣切割成訊號子空間和雜訊子空間,. y. Nat. 其中訊號子空間提供主要的、大部分的影像訊息,而雜訊子空間則包含比較次. er. io. sit. 要的訊息,一般自然雜訊於影像製造或存取過程中產生。此處我們有興趣的研 究問題為當影像被加入人為雜訊時,是否可應用奇異值分解以過濾人為雜訊。. al. n. v i n 已知奇異值分解將影像資料的訊號影像(signal)與雜訊(noise)分割成正交化的架 Ch engchi U. 構,所以奇異值分解將資料分割為訊號影像與雜訊影像,分割後的資料矩陣是 原始影像與雜訊的最適估計。由於過濾雜訊的最大目標是將被加入人為雜訊後 的影像回復到原始的影像,直覺的做法為僅保留奇異值分解所獲得的訊號影 像,去除雜訊影像。如同前章節所述,我們將根據奇異值的大小來區隔訊號影 像跟雜訊。 可能的做法為選定一奇異值比重 w 值的水準 w0,經過奇異值分解後,切割 出訊號影像與雜訊。w 值水準 w0 的選取決定訊號影像和雜訊的分割程度,w0 值若太低,則沒辦法得到足夠的原始影像訊息。另一方面,若選取的 w0 值太 9.

(16) 大,雖然可以包含足夠的原始影像資訊,但可能把人為雜訊也涵蓋進訊號影像 中,得到的影像可能與真實影像不符合。所以 w0 的選取為值得研究的問題。已 知在消除影像雜訊的評估上,得到的訊號影像與真實原始影像越接近越好。除 了透過肉眼判斷外,還可以用一些量化準則如平均平方誤差(MSE)來評估。當 訊號影像與真實原始影像之間的平均平方誤差越小,表示此方法在消除雜訊上 的表現越佳。 一般而言,當 w0 低時,原始影像的主要資訊連同雜訊同時被消除,故所獲 得的影像與原始真實影像間的平均平方誤差值較大,此平均平方誤差將隨著 w0. 政 治 大. 值增加而下降。但當 w0 超過某水準時,則雜訊也被帶入訊號影像,使得平均平 方誤差又逐漸上升。. 立. 然而在現實中,我們通常只得到被雜訊干擾後的影像,沒有未加入雜訊的. ‧ 國. 學. 原始影像,所以在現實的環境中評估困難,所以上述的評估以及 w0 的選取方法. ‧. 並不可行,未來,研究人員必須發展可行的消除雜訊的影像處理策略。在下一. n. al. er. io. sit. y. Nat. 章中,我們將透過模擬實驗來探究奇異值分析在消除雜訊問題上的表現。. Ch. engchi. 10. i n U. v.

(17) 第三章、. 實證分析. 一. 奇異值分解在影像壓縮的應用. 實驗設計. 本節的實驗目的為了解影像資料透過奇異值分解後在影像壓縮的效果。選. 政 治 大 不同的 k 值,以此劃分訊號影像和雜訊影像,將原始資料經過低階近似後,我 立 取奇異值比重 w0 水準作為 k 值的選取依據,在不同的奇異值比重 w0 下,得到. 們計算其壓縮率以瞭解其壓縮效率,同時除了以肉眼觀察訊號影像的成像品. ‧ 國. 學. 質,並計算訊號影像與原始影像的平均平方誤差以瞭解其壓縮品質。. ‧. 將任意選取的圖片影像經過 R 統計軟體的 jpeg 程式處理,影像將產生紅. y. Nat. (R)、綠(G)、藍(B)三個m × n數字矩陣。矩陣的行、列數大小則依照圖片的像素. er. io. sit. 而定。後續對紅、綠、藍三個矩陣做奇異值分解,再以奇異值比重水準. w0=30%、50%、80%作為依據,選取 k 值,將圖片劃分為訊號影像和雜訊影. al. n. v i n 像。我們計算在不同的奇異值比重下資料相對的壓縮率以評估壓縮效率,為了 Ch engchi U 同時評估三個矩陣的效果,定義下列總壓縮率(Full Compression Ratio), 𝑅𝑅𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 =. 𝑘𝑘𝑅𝑅 (𝑚𝑚 + 𝑛𝑛 + 1) + 𝑘𝑘𝐺𝐺 (𝑚𝑚 + 𝑛𝑛 + 1) + 𝑘𝑘𝐵𝐵 (𝑚𝑚 + 𝑛𝑛 + 1) × 100 3 × 𝑚𝑚 × 𝑛𝑛 =. (𝑘𝑘𝑅𝑅 + 𝑘𝑘𝐺𝐺 + 𝑘𝑘𝐵𝐵 )(𝑚𝑚 + 𝑛𝑛 + 1) × 100。 3 × 𝑚𝑚 × 𝑛𝑛. 其中 kR, kG, kB 分別為 R、G、B 矩陣所選取的 k 值。之後將三個矩陣的訊號影 像與雜訊影像各自加總組合,則可將原始影像分為訊號影像和雜訊影像。我們 將觀察訊號影像和雜訊影像的成像效果,為了客觀評估分解後的影像品質,我 們就各 R、G、B 矩陣其計算訊號影像和原始影像的平均評分誤差(MSE),最終 11.

(18) 再計算此三 MSE 的平均數,我們稱此值為總平均平方誤差(Full MSE),其定義 如下: MSE𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 = =. MSE𝑅𝑅 + MSE𝐺𝐺 + MSE𝐵𝐵 3. 𝑛𝑛 𝑚𝑚 𝑛𝑛 𝑚𝑚 𝑛𝑛 2 2 2 ∑𝑚𝑚 𝑖𝑖=1 ∑𝑗𝑗=1[𝐼𝐼𝑅𝑅 (𝑖𝑖, 𝑗𝑗) − 𝑘𝑘𝑅𝑅 (𝑖𝑖, 𝑗𝑗)] + ∑𝑖𝑖=1 ∑𝑗𝑗=1[𝐼𝐼𝐺𝐺 (𝑖𝑖, 𝑗𝑗) − 𝑘𝑘𝐺𝐺 (𝑖𝑖, 𝑗𝑗)] + ∑𝑖𝑖=1 ∑𝑗𝑗=1[𝐼𝐼𝐵𝐵 (𝑖𝑖, 𝑗𝑗) − 𝑘𝑘𝐵𝐵 (𝑖𝑖, 𝑗𝑗)]. 3 × 𝑚𝑚 × 𝑛𝑛. 結果呈現:實驗一. 政 治 大 名為三色堇(pansy)的原圖主要的構圖為一朵紫色的三色堇,大部分背景則 立 原圖簡介. ‧ 國. 學. 是綠色的葉子,見圖三。三色堇的紫色主要由紅色和藍色組成呈現,綠色在這. ‧. 張照片是占面積最多的顏色。此圖片像素為600 × 465,圖片資料經過 R 統計. 軟體數值化處理後,其紅色、綠色、藍色亮度數值分別以三個600 × 465的矩陣. sit. n. al. er. io 觀察與結果. y. Nat. 呈現。運用奇異值分解的影像壓縮結果呈現於表一與表二。. Ch. engchi. i n U. v. 圖片矩陣經過奇異值分解後,透過低階近似選擇奇異值比為 30%的時候, 紅色矩陣的 k 值為 4,壓縮率為 1.53%,與原圖的紅色矩陣的平均平方誤差為 0.011;綠色矩陣的 k 值為 3,壓縮率為 1.15%,與原圖的綠色矩陣的平均平方 誤差為 0.017;藍色矩陣的 k 值為 3,壓縮率為 1.15%,與原圖的藍色矩陣的平 均平方誤差為 0.019;總壓縮率為 1.27%,低階近似後的訊號影像與原始影像的 平均平方誤差為 0.016。 將矩陣資料重新輸出為圖片後,訊號影像乘載百分之三十的資訊量,訊號 影像總壓縮率僅為原圖的 1.27%,發現訊號影像只能看出原始圖片的顏色分 布,中央的紫色色塊是原本的三色堇,旁邊的綠色色塊原本是葉子,線條非常 12. 。.

(19) 不明顯,圖片甚至會出現縱向或橫向的線條;而雜訊影像雖然顏色較暗,但擁 有剩下百分之七十的資訊量,所以圖片的線條比訊號影像清楚很多,可看出原 始圖片花和葉子的線條。表示只靠前 3 個或前 4 個數值較大的奇異值與相對應 奇異向量僅能將圖片的顏色簡單表達,無法描繪出圖片的線條。但是僅有百分 之三十的資訊量明顯還是不足,而雜訊影像雖然因為缺少前面數值較大的奇異 值,圖片的亮度被減弱許多,但是靠著剩下百分之七十的資訊量,還是可以看 出原始圖片的樣子。 當奇異值比重水準為 50%的時候,紅色矩陣的 k 值為 21,壓縮率為. 政 治 大 縮率為 6.50%,與原圖的綠色矩陣的平均平方誤差為 0.005;藍色矩陣的 k 值為 立 8.02%,與原圖的紅色矩陣的平均平方誤差為 0.004;綠色矩陣的 k 值為 17,壓. 16,壓縮率為 6.11%,與原圖的藍色矩陣的平均平方誤差為 0.006;總壓縮率為. ‧ 國. 學. 6.88%,低階近似後的訊號影像與原始影像的平均平方誤差為 0.005。壓縮率比. ‧. 奇異值比重為 30%時略微增加,但總平均壓縮率還不到 7%,表示只要使用原. y. Nat. 本儲存空間的 7%,就可以得到 50%的資訊。雖然損失一點壓縮率,但總平均. er. io. 提升。. sit. 平方誤差也從 0.016 降到 0.005,圖片的品質較比重水準為 30%的結果有顯著的. al. n. v i n 在奇異值比重為 50%下,相較於比重為 30%,訊號影像中三色堇和葉子的 Ch engchi U. 輪廓更為明顯,與原始影像更為相近,但是圖片上還是有些縱向或橫向的紋. 路,圖片上的輪廓不夠俐落。雜訊影像中除了保留了原始圖片中比較明顯的白 色線條,其他部份幾乎呈現黑色,也就是數值皆靠近零。另外訊號影像右下方 顏色比較淺的葉片上有不自然的紫紅色斑點出現,表示綠色被低估。訊號影像 上原本為紫藍色的花瓣上有不自然的黃色色塊,已知黃色是由紅光和綠光組 成,故這些黃色色塊的出現是源自於藍光的嚴重低估,我們發現藍色矩陣的平 均平方誤差是 0.006,是三個矩陣中平均平方誤差值為高的矩陣,表示數值的分 析與成像結果相符。 13.

(20) 當奇異值比重提高為 80%的時候,紅色矩陣的 k 值為 112,壓縮率為 42.80%,與原圖的紅色矩陣的平均平方誤差為 0.00064;綠色矩陣的 k 值為 104,壓縮率為 39.74%,與原圖的綠色矩陣的平均平方誤差為 0.00079;藍色矩 陣的 k 值為 102,壓縮率為 38.97%,與原圖的藍色矩陣的平均平方誤差為 0.00086;總壓縮率為 40.50%,雖然總壓縮率增加許多,但是低階近似後的訊號 影像與原始影像的平均平方誤差為 0.00076,較之前 30%、50%比重水準的成像 品質大幅提升。 當奇異值比重達到 80%的時候,訊號影像品質大幅提升,三色堇和葉子的. 政 治 大 改善,右下方原本顏色較淺的葉片上雖仍有紫紅色斑點,但是比奇異值比重為 立 輪廓都非常清晰,縱向或橫向的線條也已經消失了,花瓣上的黃色色塊也明顯. 雜訊影像幾乎呈現黑色,影像的數值表現幾乎為 0。. 學. ‧ 國. 50%的時候略為改善,圖片經過低階近似後,訊號影像的效果是可被接受的。. ‧. 在這張三色堇的圖片中,在固定奇異值比重水準下,紅色矩陣的所選取的. y. Nat. k 值都是最大的,而綠色矩陣的 k 值都是最小的,這種現象推測跟本圖片的色. er. io. sit. 調有關。由於這張圖片很大的面積是綠色,所以綠色矩陣的前面幾個較大的奇 異值便包含多數的資訊,而紅色是這張照片最次要的顏色,此圖片的紅色主要. al. n. v i n 用在表現三色堇,包括花蕊的黃色是由紅色和綠色組成,紫色花瓣是由紅色和 Ch engchi U 藍色組成,所以在同樣的奇異值比重下,需要較大的 k 值,才能展現這些較為 局部、細膩的趨勢,達到相同的資訊量。 圖 3-1、三色堇(pansy)原圖. 14.

(21) 表 3-1、三色堇(pansy)在各奇異值比重水準 w0 下,壓縮率及平均平方誤差值 奇異值比重水準 w0 (%). 80. K. 4. 21. 112. Compression Rate (%). 1.53. 8.02. 42.80. R-MSE. 0.011. 0.004. 0.00064. √R − MSE. 0.107. 0.063. 0.025. K. 3. 17. 104. Compression Rate (%). 1.15. 6.50. 39.74. 政0.017治 大0.005. G-MSE. 0.071. 0.028. K. 3. 16. 102. Compression Rate (%). 1.15. 6.11. 38.97. B-MSE. 0.019. 0.006. 0.00086. 0.138. 0.076. y. 0.029. 1.27. 6.88. 0.016. 0.005 iv n U. ‧ 國. 0.129. Nat. √B − MSE. io. Compression Rate (%). n. al. 學. B. 立. ‧. √G − MSE. Full. 0.00079. Full-MSE √Full − MSE. Ch. e0.125 ngchi. 15. sit. G. 50. er. R. 30. 0.070. 40.50 0.00076 0.028.

(22) 表 3-2、三色堇(pansy)在各奇異值比重水準 w0 下所分解出的訊號影像與雜訊影 像 奇異值比 訊號影像. 重水準 w0. 雜訊影像. (%). 30. 立. ‧. ‧ 國. 學. 50. 政 治 大. n. er. io. sit. y. Nat. al. Ch. engchi. 80. 16. i n U. v.

(23) 結果呈現:實驗二. 原圖簡介 我們考慮的第二張影像命名為腳踏車(bike),原圖中有一個穿著紅色衣服的 小孩,在公園中騎著一台藍色的腳踏車,見圖四。在圖片中央的小孩衣服為紅 色,腳踏車為藍色,旁邊的樹木是綠色,皆為光的三原色,綠色部分還是占最 多。此圖片像素為1451 × 966,圖片資料經過 R 統計軟體數值化處理後,其紅 色、綠色、藍色亮度數值分別以三個1451 × 966的矩陣呈現。運用奇異值分解. 政 治 大. 的影像壓縮結果呈現於表三與表四。. 立. ‧ 國. 學. 觀察與結果. 圖片矩陣經過奇異值分解後,透過低階近似選擇奇異值比 w0 為 30%的時. ‧. 候,紅色矩陣的 k 值為 3,壓縮率為 0.52%,與原圖的紅色矩陣的平均平方誤差. sit. y. Nat. 為 0.013;綠色矩陣的 k 值為 2,壓縮率為 0.35%,與原圖的綠色矩陣的平均平. al. er. io. 方誤差為 0.016;藍色矩陣的 k 值為 3,壓縮率為 0.52%,與原圖的藍色矩陣的. v. n. 平均平方誤差為 0.012;總壓縮率為 0.46%,低階近似後的訊號影像與原始影像 的平均平方誤差為 0.014。. Ch. engchi. i n U. 當奇異值比重水準 w0 為 30%時,訊號影像總壓縮率僅為原圖的 0.52%,發 現訊號影像只能看出原始圖片的顏色分布,在圖片中央只能看出小孩的紅色衣 服,臉部完全看不出來,只能呈現紅色的色塊,還有腳踏車的藍色的色塊,周 圍則是原本為樹木與草地的綠色,線條非常不明顯,圖片出現縱向或橫向的線 條;而雜訊影像雖然顏色較暗,但擁有剩下百分之七十的資訊量,所以圖片的 線條比訊號影像清楚很多,可看出小孩的輪廓,但顏色較暗,而且顏色也不是 很自然。表示只靠前 2 個或前 3 個數值較大的奇異值與相對應奇異向量僅能將 圖片的顏色簡單表達,無法描繪出圖片的線條。顯示僅有百分之三十的資訊量 17.

(24) 還是非常不足,而雜訊影像雖然因為缺少前面數值較大的奇異值,圖片的亮度 被減弱許多,但是靠著剩下百分之七十的資訊量,還是可以看出原始圖片的主 要構圖與輪廓。 當奇異值比重水準 w0 為 50%的時候,紅色矩陣的 k 值為 20,壓縮率為 3.45%,與原圖的紅色矩陣的平均平方誤差為 0.0038;綠色矩陣的 k 值為 19, 壓縮率為 3.28%,與原圖的綠色矩陣的平均平方誤差為 0.0039;藍色矩陣的 k 值為 24,壓縮率為 4.14%,與原圖的藍色矩陣的平均平方誤差為 0.0032;總壓 縮率為 3.62%,低階近似後的訊號影像與原始影像的平均平方誤差為 0.0036。. 政 治 大 只要使用原本儲存空間的 4%,就可以得到 50%的資訊。雖然損失一點壓縮 立. 壓縮率比奇異值比重為 30%時增加近八倍,但總平均壓縮率還不到 4%,表示. 率,但總平均平方誤差也從 0.014 降到 0.0036,圖片的品質較比重水準為 30%. ‧ 國. 學. 的結果有顯著的提升。. ‧. 當奇異值比重水準 w0 為 50%,訊號影像中小孩的臉部輪廓與腳踏車已經大. y. Nat. 致成形,與原始影像更為相近,但是圖片上還是有些不自然的縱向或橫向的紋. er. io. sit. 路,圖片上的輪廓不夠俐落,而且小孩臉部有一些不自然的藍綠色色塊,表示 紅色光在臉部被低估。雜訊影像的部分只剩下一些混亂的白色線條,原圖的資. al. n. v i n 訊已經所剩無幾,亮度在數值表現上接近 0,所以雜訊影像幾乎為黑色。 Ch engchi U. 當奇異值比重水準提高為 80%的時候,紅色矩陣的 k 值為 149,壓縮率為. 25.70%,與原圖的紅色矩陣的平均平方誤差為 0.00038;綠色矩陣的 k 值為 148,壓縮率為 25.53%,與原圖的綠色矩陣的平均平方誤差為 0.00039;藍色矩 陣的 k 值為 163,壓縮率為 28.12%,與原圖的藍色矩陣的平均平方誤差為 0.00034;總壓縮率為 26.45%,雖然總壓縮率增加許多,但是低階近似後的訊號 影像與原始影像的平均平方誤差為 0.00037,大約是奇異值比重為 50%時總平均 平方誤差的 10%,較之前 30%、50%比重水準的成像誤差大幅降低。 當奇異值比重 w0 達到 80%的時候,訊號影像品質大幅提升,受到壓縮的影 18.

(25) 像與原圖已經非常相近,縱向或橫向的線條也已經消失了,原本小孩臉上的藍 綠色色塊變的較細小,推測可能受到背後的綠色草地的影響,但是訊號影像的 效果還是可以被接受的。雜訊影像幾乎呈現黑色,影像的數值表現幾乎為 0。 在這張小孩騎腳踏車的圖片中,不論奇異值比重為何,在奇異值比重相同 的情況下,藍色矩陣的所選取的 k 值都是最大的,而綠色矩陣的 k 值都是最小 的,可能是由於這張圖片很大的面積是綠色,所以綠色矩陣的前面幾個較大的 奇異值便包含較多的資訊,而這張照片中僅有腳踏車有藍色以及小孩衣服上有 部分的藍色,藍色在這圖片中是三個矩陣中最次要的顏色,所以在同樣的奇異. 政 治 大. 值比重下,需要較大的 k 值,才能達到相同的資訊量。. 學. ‧ 國. 立. 圖 3-2、腳踏車(bike)原圖. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 19. i n U. v.

(26) 表 3-3、腳踏車(bike)在各奇異值比重水準 w0 下,壓縮率及平均平方誤差 奇異值比重水準 w0 (%). 80. K. 3. 20. 149. Compression Rate (%). 0.52. 3.45. 25.70. R-MSE. 0.013. 0.0038. 0.00038. √R − MSE. 0.12. 0.061. 0.020. K. 2. 19. 148. Compression Rate (%). 0.35. 3.28. 25.53. 政0.016治 大0.0039. G-MSE. 0.063. 0.020. K. 3. 24. 163. Compression Rate (%). 0.52. 4.14. 28.12. B-MSE. 0.012. 0.0032. 0.00034. 0.11. 0.057. y. 0.019. 0.46. 3.62. ‧ 國. 0.13. ‧. 立. Nat. Compression Rate (%). io. Full. √B − MSE. n. al. 學. B. √G − MSE. 0.00039. Full-MSE √Full − MSE. Ch. 0.014. e n0.12g c h i. 20. sit. G. 50. er. R. 30. i n U. v. 26.45. 0.0036. 0.00037. 0.060. 0.019.

(27) 表 3-4、腳踏車(bike)在各奇異值比重水準 w0 下所分解出的訊號影像與雜訊影像 各奇異值 訊號影像. 比重水準. 雜訊影像. w0 (%). 30. 立. ‧. ‧ 國. 學. 50. 政 治 大. n. al. er. io. sit. y. Nat. 80. Ch. engchi. 21. i n U. v.

(28) 結果呈現:實驗三. 原圖簡介 在第三張影像中,池畔邊有一個穿著白色衣服的小女孩,我們將此命名為 女孩(girl),見圖五。在圖片中央的小孩衣服為白色,身後的水面為藍色,此圖 片有大面積的白色,需要有高亮度的紅、綠、藍三原色才能呈現。此圖片像素 為579 × 960,圖片資料經過 R 統計軟體數值化處理後,其紅色、綠色、藍色. 亮度數值分別以三個579 × 960的矩陣呈現。運用奇異值分解的影像壓縮結果呈. 政 治 大. 現於表五與表六。. 立. ‧ 國. 學. 觀察與結果. 圖片矩陣經過奇異值分解後,透過低階近似選擇奇異值比重水準 w0 為 30%. ‧. 的時候,紅色矩陣的 k 值為 1,壓縮率為 0.28%,與原圖的紅色矩陣的平均平方. sit. y. Nat. 誤差為 0.066;綠色矩陣的 k 值為 1,壓縮率為 0.28%,與原圖的綠色矩陣的平. al. er. io. 均平方誤差為 0.057;藍色矩陣的 k 值為 1,壓縮率為 0.28%,與原圖的藍色矩. v. n. 陣的平均平方誤差為 0.050;總壓縮率為 0.28%,低階近似後的訊號影像與原始. Ch. 影像的平均平方誤差為 0.058。. engchi. i n U. 當奇異值比重水準 w0 為 30%時,訊號影像總壓縮率為原圖的 0.28%,雖然 靠著很低的壓縮率就能得到 30%的資訊量,但是訊號影像完全看不出原圖的面 貌,只有灰藍色的矩形色塊;而雜訊影像擁有剩下百分之七十的資訊量,除了 小女孩的臉部特別暗以外,小女孩的衣服部分甚至是身邊的圍籬線條都十分清 楚。表示只靠前 1 個數值較大的奇異值與相對應奇異向量僅能將圖片的亮度略 略表達,對於圖片的線條完全無法呈現。僅有百分之三十的資訊量還是非常不 足,而雜訊影像雖然因為缺少最大的奇異值,圖片的亮度被減弱許多,但是靠 著剩下百分之七十的資訊量,大致可以看出原始圖片的主要構圖與輪廓。 22.

(29) 當奇異值比重水準 w0 為 50%的時候,紅色矩陣的 k 值為 4,壓縮率為 1.11%,與原圖的紅色矩陣的平均平方誤差為 0.012;綠色矩陣的 k 值為 3,壓 縮率為 0.83%,與原圖的綠色矩陣的平均平方誤差為 0.012;藍色矩陣的 k 值為 3,壓縮率為 0.83%,與原圖的藍色矩陣的平均平方誤差為 0.010;總壓縮率為 0.92%,低階近似後的訊號影像與原始影像的平均平方誤差為 0.011。壓縮率比 奇異值比重為 30%時增加近八倍,但總平均壓縮率還不到 4%,表示只要使用 原本儲存空間的 4%,就可以得到 50%的資訊。雖然損失一點壓縮率,但總平 均平方誤差也從 0.058 降到 0.011,圖片的品質較比重水準為 30%的結果有顯著. 政 治 大 當奇異值比重水準 w 為 50%的時候,訊號影像已經有原圖的雛形,影像由 立. 的提升。. 0. 縱向或橫向的線條組成,以矩形的色塊組成,但圖片中的輪廓不明顯,女孩臉. ‧ 國. 學. 部的五官和表情完全看不出來。奇異值比重為 50%的雜訊影像亮度又比當奇異. ‧. 值比重為 30%的雜訊影像暗一點,在訊號影像較亮的地方,例如白色裙擺,在. y. Nat. 雜訊影像就會特別暗,表示亮度被分配到訊號影像。訊號影像有許多不自然的. er. io. sit. 色塊,與原圖對照後,發現不自的色塊主要都發生在白色的地方,表示構成白 色的三原色中有其中一個顏色被低估,顏色就容易失真。雜訊影像中,小女孩. al. n. v i n 的臉部在奇異值比重為 30%的時候比較暗,但當奇異值比重為 50%時,在雜訊 Ch engchi U 影像中女孩的臉部卻變得清晰,推測是因為訊號影像為了建構小女孩的黑色頭 髮,所以臉部的亮度較暗,反而將臉部的亮度分配到雜訊影像而導致這樣的結 果。 當奇異值比重水準提高為 80%的時候,紅色矩陣的 k 值為 53,壓縮率為 14.68%,與原圖的紅色矩陣的平均平方誤差為 0.00087;綠色矩陣的 k 值為 53,壓縮率為 14.68%,與原圖的綠色矩陣的平均平方誤差為 0.00078;藍色矩 陣的 k 值為 53,壓縮率為 14.68%,與原圖的藍色矩陣的平均平方誤差為 0.00076;總壓縮率為 14.68%,雖然總壓縮率增加許多,但是低階近似後的訊號 23.

(30) 影像與原始影像的平均平方誤差為 0.00080,較之前 30%、50%比重水準的成像 誤差大幅降低。 當奇異值比重水準達到 80%的時候,訊號影像與原圖已經非常相近,小女 孩的臉部也非常清晰,白色衣服上仍有細碎的青藍色斑點,表示紅色被低估, 對照表五中的數值結果,當奇異值比為 80%的時候,紅色矩陣的平均平方誤差 為 0.00087,是三個顏色矩陣中最大的,表示紅色的誤差最大,與影像的表現結 果相符。雜訊已經無法傳遞原圖的資訊,影像幾乎呈現黑色,影像的數值表現 幾乎為 0。. 政 治 大 圖片的表現算是非常平均,奇異值比重在各水準之下,三原色的 k 值都非常相 立 在這張小女孩的圖片中,有很大一部分的面積是白色,所以三原色在這張. 近甚至相同。然而,由於白色相對應於紅、綠、藍三個顏色同時都接近上限. ‧ 國. 學. 1,屬於邊界極端值,所以處理後容易出現低估的狀況,低階近似後圖片品質較. ‧. 難掌控。. y. Nat. 根據上述三個實驗可知,圖片的色調與奇異值的選取個數(k)有很大的關. er. io. sit. 係,若圖片中顏色變異越小,則在同樣的奇異值比重水準下,選取的奇異向量 個數可較少。平均而言,當奇異值比重選取到 80%,訊號影像的成像效果都與. n. al. 原圖相當接近,資料的壓縮率介於 C h 14%-40%之間。U n i engchi 圖 3-3、女孩(girl)原圖. 24. v.

(31) 表 3-5、女孩(girl)在各奇異值比重水準 w0 下,壓縮率及平均平方誤差 奇異值比重水準 w0 (%). 80. K. 1. 4. 53. Compression Rate (%). 0.28. 1.11. 14.68. R-MSE. 0.066. 0.012. 0.00087. √R − MSE. 0.26. 0.11. 0.029. K. 1. 3. 53. Compression Rate (%). 0.28. 0.83. 14.68. 政0.057治 大0.012. G-MSE. 0.11. 0.028. K. 1. 3. 53. Compression Rate (%). 0.28. 0.83. 14.68. B-MSE. 0.050. 0.010. 0.00076. 0.22. 0.10. y. 0.028. 0.28. 0.92. 0.058. 0.011 iv n U. ‧ 國. 0.24. ‧. 立. Nat. Compression Rate (%). io. Full. √B − MSE. n. al. 學. B. √G − MSE. 0.00078. Full-MSE √Full − MSE. Ch. e n0.24g c h i. 25. sit. G. 50. er. R. 30. 0.11. 14.68 0.00080 0.028.

(32) 表 3-6、女孩(girl)影像在各奇異值比重水準 w0 下所分解出的訊號影像與雜訊影 像 奇異值比 訊號影像. 重水準 w0. 雜訊影像. (%). 30. 立. ‧. ‧ 國. 學. 50. 政 治 大. n. er. io. sit. y. Nat. al. 80. Ch. engchi. 26. i n U. v.

(33) 二. 奇異值分解在雜訊消除上的應用. 實驗設計. 本節的實驗目的為了解當影像資料被加入雜訊,透過奇異值分解處理後,以 不同的奇異值比重水準切割訊號影像與雜訊影像,所獲得的訊號影像的品質與未 加入雜訊的原始影像相近程度。我們以奇異值比重作為 k 值的選取依據,給定不 同的奇異值比重水準下,將得到不同的 k 值,並以此劃分訊號影像和雜訊影像,. 政 治 大. 之後我們比較訊號影像與未加入雜訊的原影像,包括計算之間的平均平方誤差,. 立. 同時以肉眼觀察訊號影像的成像品質,以藉此了解奇異值分解在此問題上的實用. ‧ 國. 學. 性。. 以下介紹人工雜訊的產生。由於影像透過統計軟體 R 的 jpeg 套件讀取後所. ‧. 𝑥𝑥+𝛿𝛿. y. Nat. 產生的 R、G、B 三個矩陣中的任一數值皆介於 0 到 1 之間,x ∈ [0, 1],所以我. sit. io. 們先將數值資料做羅吉斯(logit)轉換,f(𝑥𝑥) = 𝑙𝑙𝑙𝑙𝑙𝑙 1−𝑥𝑥+𝛿𝛿 ,則f(x) ∈ R,其中數值𝛿𝛿. er. 加入的目的為避免f(𝑥𝑥)在 x=0 或 1 時發散的問題,在實驗中我們考慮𝛿𝛿 = 10−6。. al. n. v i n 另一方面,我們產生服從平均數 = C h0、變異數為𝜎𝜎 的常態分配的隨機誤差ε,令Y engchi U 𝑒𝑒 𝑦𝑦. 2. f(x) + ε,且 𝑓𝑓 −1 (𝑌𝑌) = 𝑥𝑥 ∗ ,其中𝑓𝑓 −1 (𝑦𝑦) = 1+𝑒𝑒 𝑦𝑦。則𝑥𝑥 ∗ 為介於 0 到 1 之間的被加. 入雜訊的數值。. 被加入亂數後的影像資料在此我們稱為退化影像,而未被加入亂數的影像 為原始影像,我們將退化影像透過奇異值分解處理後,分為訊號影像和雜訊影 像,此時影像處理的目的為希望訊號影像與原始影像越接近越好。為了評估雜 訊消除的效果,我們將計算訊號影響與原始影像之間的平均平方誤差(MSE)。 在以下的實驗中,我們將在影像資料中加入不同變異程度的隨機誤差。我們 將根據各 k 值下所獲得的訊號影像,計算其與原始影像的平均平方誤差。之後我 27.

(34) 們將選出誤差最小的 k 值,並以肉眼觀察其相對應的訊號影像的成像效果。另外 一方面,我們也嘗試在奇異值比重(w)固定為 50%與 80%下的訊號影像並觀察其 結果。. 結果呈現:實驗一. 原始影像為名為三色堇(pansy)的原圖主要的構圖為一朵紫色的三色堇,見圖 三,退化影像則是在三色堇的原圖經過羅吉斯轉換後加入平均數為 0 變異數為 1. 政 治 大. 的常態分配亂數,紅、綠、藍三原色的矩陣取不同的 k 值得到的訊號影像與原始. 立. 影像的平均平方誤差變化分別呈現於圖六、圖七與圖八,運用奇異值分解去除雜. ‧ 國. 學. 訊的結果則呈現於表七與表八。. 三色堇的原始影像被加入平均數 0、變異數為 1 的常態分配的隨機誤差ε. ‧. 後,我們分別就三原色矩陣計算退化影像與原始影像之均方差。其中綠色矩陣. y. Nat. sit. 的平均平方誤差 0.0366 為三者間最高,而藍色矩陣的平均平方誤差 0.0230 為三. n. al. er. io. 者間最低,紅色矩陣的平均平方誤差為 0.0320。取此三均方差之平均,則平均 總平均平方誤差為 0.0305。. Ch. engchi. i n U. v. 從表八中可發現,雖然加入雜訊,退化影像與原始影像相差不大,仍然可 以看出原始結構,但是退化影像的色彩飽和度相對較低。例如原本顏色單純的 綠色葉片也多了許多細小的斑點,也就是雜訊。接下來利用奇異值分解,得到 訊號影像,希望可以改善雜訊的情況。 由圖六、圖七、圖八可觀察到,紅、綠、藍三個矩陣的平均平方誤差隨著 k 值都呈現先遞減後遞增的趨勢。當取的 k 值過低時,訊號影像提供的資訊不 足,導致與原始影像的平均平方誤差較大。當只取一個奇異值時,紅色矩陣之 均方差大於 0.025,綠色矩陣的均方差則將近 0.03,藍色矩陣的均方差則超過 28.

(35) 0.04。隨著 k 值遞增,訊號影像的資訊量增加,平均平方誤差逐漸下降,直到 到達最小值。其中紅色矩陣的均方差在 k=14 時達到其最小值 0.00782; 綠色矩 陣的均方差在 k=15 時達到其最小值 0.00856;而藍色矩陣的均方差在 k=22。時 達到其最小值 0.00774。之後各個矩陣之均方差又隨著 k 值而逐漸遞增,表示訊 號影像不只包括原始影像的資訊,也受雜訊汙染,造成誤差變大。 接著我們考慮以各亮度矩陣之均方差最低的 k 值下所獲得的影像矩陣,結 合並輸出該影像,見表八中的第二個圖像。我們觀察到原退化影像中顆粒般的 雜訊已被消除,但因為 k 值選取的個數不多,所以訊號影像像是經過壓縮,花. 政 治 大 問題是在數值極端的白色都表現不佳,數值被低估而產生色差或不自然的色 立. 葉的輪廓並不清晰,有不自然的橫向和縱向線條,與資料壓縮實驗面臨相同的. 塊。. ‧ 國. 學. 由於實務中未經汙染的真實原始影像通常並不可得,所以前述的平均平方. ‧. 誤差並無法計算,因此我們另外考慮以奇異值比重(w)作為 k 值選取的依據。當. y. Nat. 奇異值比重水準設為 50%時,紅色矩陣選取的 k 值為 112,與原始影像的平均. er. io. sit. 平方誤差為 0.00782,綠色矩陣選取的 k 值為 111,與原始影像的平均平方誤差 為 0.0217,藍色矩陣選取的 k 值為 94,與原始影像的平均平方誤差為 0.0131,. al. n. v i n 總平均平方誤差為 0.0180。將此些訊號影像組合的影像列於表八的第三個圖 Ch engchi U. 像。此時由於選取較多的 k 值,訊號影像呈現的三色堇輪廓較為清晰,雖然包 含一些雜訊,相較於退化影像的雜訊顆粒相對較細,但是白色的部分表現仍不 如預期。 選取奇異值比重為 80%,紅色矩陣選取的 k 值為 255,與原始影像的平均 平方誤差為 0.0287,綠色矩陣選取的 k 值為 254,與原始影像的平均平方誤差 為 0.0327,藍色矩陣選取的 k 值為 240,與原始影像的平均平方誤差為 0.0204,總平均平方誤差為 0.0273。 當奇異值比重設為 80%的時候,選取的 k 值較奇異值比重為 50%時多出超 29.

(36) 過兩倍,然而選取較高的奇異值比重對訊號影像的成像結果卻沒有幫助,在數 值上,紅、綠、藍三個矩陣的平均平方誤差皆增大,訊號影像被加入比奇異值 比重為 50%時,視覺上看來,雜訊的顆粒更大更多。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 30. i n U. v.

(37) 圖 3-4、加入 normal (0, 1) 亂數的紅色(R) 三色堇(pansy)退化影像 k 取 1 到 30 之訊號影像與原始影像的平均平方誤差變化. 政 治 大 之訊號影像與原始影像的平均平方誤差變化 立. 圖 3-5、加入 normal (0, 1) 亂數的綠色(G) 三色堇(pansy)退化影像 k 取 1 到 30. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3-6、加入 normal (0, 1) 亂數的藍色(B) 三色堇(pansy)退化影像 k 取 1 到 30 之訊號影像與原始影像的平均平方誤差變化. 31.

(38) 表 3-7、加入 normal (0,1)亂數的三色堇(pansy)的退化影像及其在各奇異值比重 水準 w0 下,與原始影像的平均平方誤差值. 14. 112. 255. R-MSE. 0.0320. 0.00782. 0.0193. 0.0287. √R − MSE. 0.179. 0.0884. 0.139. 0.169. K. -. 15. 111. 254. G-MSE. 0.0366. 0.0217. 0.0327. √G − MSE. 0.191 立. 0.147. 0.181. -. 22. 94. 240. B-MSE. 0.0230. 0.00774. 0.0131. 0.0204. √B − MSE. 0.152. 0.0880. 0.115. 0.143. Full-MSE. 0.0305. 0.00804. 0.0180. y. 0.0273. √Full − MSE. 0.175. 0.0897. 0.165. io. n. al. 治 政 0.00856 大 0.0925. 0.134. er. K. Nat. Full. -. 學. B. K. ‧ 國. G. w0=80. ‧. R. 最小影像. w0=50. 平均平方誤差. sit. 退化影像. Ch. engchi. 32. i n U. v.

(39) 表 3-8、加入 normal (0, 1)亂數的三色堇(pansy)的退化影像及其在各奇異值比重 水準 w0 下,所分解出的訊號影像. 退化影像. 平均平方誤差. 立. 最小影像. 政 治 大. ‧. ‧ 國. 學. n. al. er. io. sit. y. Nat. w0=50. Ch. engchi. w0=80. 33. i n U. v.

(40) 結果呈現:實驗二. 原始影像與實驗一同樣是名為三色堇(pansy)的原圖主要的構圖為一朵紫色 的三色堇,見圖三,退化影像則是在三色堇的原圖經過羅吉斯轉換後加入平均數 為 0 變異數為 2 的常態分配亂數,紅、綠、藍三原色的矩陣取不同的 k 值得到的 訊號影像與原始影像的平均平方誤差變化分別呈現於圖九、圖十與圖十一,運用 奇異值分解去除雜訊的結果則呈現於表九與表十。 三色堇的原始影像被加入平均數 0、變異數為 2 的常態分配的隨機誤差ε. 政 治 大 的平均平方誤差 0.0930 為三者間最高,而藍色矩陣的平均平方誤差 0.0752 為三 立 後,我們分別就三原色矩陣計算退化影像與原始影像之均方差。其中綠色矩陣. ‧ 國. 學. 者間最低,紅色矩陣的平均平方誤差為 0.0882。取此三均方差之平均,則總平 均平方誤差為 0.0854,顯示加了變異數較大的亂數,三原色矩陣的退化影像與. ‧. 原始影像之間的平均平方誤差皆比實驗一大幅增加。. sit. y. Nat. 從表十中可發現,加入變異數較大的亂數雜訊,實驗二的退化影像比實驗. al. er. io. 一的退化影像色彩飽和度低,不如原始影像顏色豔麗,花葉的輪廓較為模糊,. v. n. 花葉上細小的顆粒像是在影像中撒了一把沙。接下來利用奇異值分解,得到訊. Ch. engchi. 號影像,希望可以改善雜訊的情況。. i n U. 由圖九、圖十、圖十一可觀察到,紅、綠、藍三個矩陣的平均平方誤差隨 著 k 值都呈現先遞減後遞增的趨勢,尤其是紅色和綠色矩陣的平均平方誤差經 過最低點後上升幅度非常明顯。當取的 k 值過低時,訊號影像提供的資訊不 足,導致與原始影像的平均平方誤差較大。當只取一個奇異值時,紅色矩陣之 均方差約為 0.027,綠色矩陣的均方差則大於 0.03,藍色矩陣的均方差則超過 0.045。隨著 k 值遞增,訊號影像的資訊量增加,平均平方誤差逐漸下降,直到 到達最小值。其中紅色矩陣的均方差在 k=7 時達到其最小值 0.0155; 綠色矩陣 的均方差在 k=7 時達到其最小值 0.0152;而藍色矩陣的均方差在 k=11 時達到其 34.

(41) 最小值 0.0181。之後各個矩陣之均方差又隨著 k 值而逐漸遞增,表示訊號影像 不只包括原始影像的資訊,也受雜訊汙染,造成誤差變大。 接著我們考慮以各亮度矩陣之均方差最低的 k 值下所獲得的影像矩陣,結 合並輸出該影像,見表十中的第二個圖像。我們觀察到原退化影像中顆粒般的 雜訊已被消除,但因為 k 值選取的個數不多,所以訊號影像像是經過壓縮,花 葉的輪廓並不清晰,有不自然的橫向和縱向線條,與資料壓縮實驗面臨相同的 問題是在數值極端的白色都表現不佳,數值被低估而產生色差或不自然的色 塊。. 政 治 大 誤差並無法計算,因此我們另外考慮以奇異值比重(w)作為 k 值選取的依據。當 立 由於實務中未經汙染的真實原始影像通常並不可得,所以前述的平均平方. 奇異值比重水準設為 50%時,紅色矩陣選取的 k 值為 127,與原始影像的平均. ‧ 國. 學. 平方誤差為 0.0573,綠色矩陣選取的 k 值為 126,與原始影像的平均平方誤差. ‧. 為 0.0595,藍色矩陣選取的 k 值為 119,與原始影像的平均平方誤差為. y. Nat. 0.0485,總平均平方誤差為 0.0551。將此些訊號影像組合的影像列於表十的第. er. io. sit. 三個圖像。此時由於選取較多的 k 值,訊號影像呈現的三色堇輪廓較為清晰, 雖然包含一些雜訊,相較於退化影像的雜訊顆粒相對較細,但是白色的部分表. n. al. 現仍不如預期。. Ch. engchi. i n U. v. 選取奇異值比重為 80%,紅色矩陣選取的 k 值為 265,與原始影像的平均 平方誤差為 0.0802,綠色矩陣選取的 k 值為 264,與原始影像的平均平方誤差 為 0.0842,藍色矩陣選取的 k 值為 259,與原始影像的平均平方誤差為 0.0683,總平均平方誤差為 0.0776。 當奇異值比重設為 80%的時候,選取的 k 值較奇異值比重為 50%時多出超 過兩倍,然而選取較高的奇異值比重對訊號影像的成像結果卻沒有幫助,在數 值上,紅、綠、藍三個矩陣的平均平方誤差皆增大,奇異值比重設為 80%的訊 號影像比奇異值比重為 50%時,視覺上看來,雜訊的顆粒更大更多。 35.

(42) 透過以上實驗可以發現,雖然奇異值分解可以將影像資料分為訊號影像和 雜訊影像,但是無法將雜訊完全分離,退化影像與原始影像的平均平方誤差經 過奇異值分解後,無法降低至 0,也就是無法將影像還原成原始影像,然而, 奇異值分解還是能有效地將平均平方誤差降低,當奇異值比重為 50%時訊號影 像的表現較奇異值比重為 80%時較佳。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 36. i n U. v.

(43) 圖 3-7、加入 normal (0, 2) 亂數的紅色(R) 三色堇(pansy)退化影像 k 取 1 到 30 之訊號影像與原始影像的平均平方誤差變化. 政 治 大 之訊號影像與原始影像的平均平方誤差變化 立. 圖 3-8、加入 normal (0, 2) 亂數的綠色(G) 三色堇(pansy)退化影像 k 取 1 到 30. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3-9、加入 normal (0, 2) 亂數的藍色(B) 三色堇(pansy)退化影像 k 取 1 到 30 之訊號影像與原始影像的平均平方誤差變化. 37.

(44) 表 3-9、加入 normal (0,2)亂數的三色堇(pansy)的退化影像及其在各奇異值比重 水準 w0 下,與原始影像的平均平方誤差值. 7. 127. 265. R-MSE. 0.0882. 0.0155. 0.0573. 0.0802. √R − MSE. 0.297. 0.125. 0.239. 0.283. K. -. 7. 126. 264. G-MSE. 0.0930. 0.0595. 0.0842. √G − MSE. 0.305 立. 0.244. 0.290. -. 11. 119. 259. B-MSE. 0.0752. 0.0181. 0.0485. 0.0683. √B − MSE. 0.274. 0.135. 0.220. 0.261. Full-MSE. 0.0854. 0.0163. 0.0551. y. 0.0776. √Full − MSE. 0.292. 0.128. 0.278. io. n. al. 治 政 0.0152 大 0.123. 0.235. er. K. Nat. Full. -. 學. B. K. ‧ 國. G. w0=80. ‧. R. 最小影像. w0=50. 平均平方誤差. sit. 退化影像. Ch. engchi. 38. i n U. v.

(45) 表 3-10、加入 normal (0, 2)亂數的三色堇(pansy)的退化影像其在在各奇異值比重 水準 w0 下,所分解出的訊號影像. 退化影像. 平均平方誤差. 立. 最小影像. 政 治 大. ‧. ‧ 國. 學. n. al. er. io. sit. y. Nat. W0=50. Ch. engchi. W0=80. 39. i n U. v.

(46) 第四章、. 結論. 本研究主要對於影像資料常見的兩個問題提供處理方法,包括影像壓縮以 及影像還原。影像壓縮的目的是降低影像資料的儲存空間。另一方面,當影像 資料受到雜訊汙染後,影像復原的目的是試圖去除雜訊以恢復原始影像。由於 影像資料經過數值化得以矩陣數據資料呈現,我們在此論文中考慮利用奇異值 分解以解決此二問題。 奇異值分解將矩陣資料分解為多個矩陣的線性組合,其中每個矩陣為兩奇. 政 治 大 種呈現方式。在受限的儲存空間下,利用奇異值分解的最佳化低階近似性質在 立 異向量的乘積,而係數則為相對應的奇異值。奇異值分解提供矩陣資料的另一. ‧ 國. 學. 資料壓縮上,不僅可以減少資料的儲存空間,也可以得到與原始影像最接近的 壓縮影像。另一方面,奇異值分解可以將資料區分為訊號資料與雜訊資料,且. ‧. 互相獨立,所以透過奇異值分解,將可以去除雜訊使得影像復原。. sit. y. Nat. 當運用奇異值分解在影像壓縮及影像還原時,奇異值選取的準則為重要關. al. er. io. 鍵。我們提出以奇異值比重(w0) 作為選取準則。在論文中我們設計了數個實驗. v. n. 以評估奇異值分解方法的表現。在影像壓縮部分,若儲存空間許可,可以選取. Ch. engchi. i n U. 較高的奇異值比重,奇異值比重越高影像品質越高。根據我們的實驗結果,建 議選取比重至少 50%的奇異值,以確保影像壓縮後的品質。在奇異值比重為 50%的情況下,資料的總壓縮率大約介於 1%~7%之間,儲存空間大幅降低。另 外,壓縮影像所面臨的問題是在亮度極高的部分會有低估的情形,尤其在白色 的部分特別明顯。三原色中只要有一個顏色被低估,就會在影像中產生不自然 的色塊或斑點。 在影像還原中,我們期望能獲得與原始影像最為相近的結果,但一般而 言,在實際情況下我們無法得到原始影像,所以在影像處理上,自動化非主觀 的雜訊認定是困難的事,我們仍選擇以奇異值比重作為分解的準則。在我們的 40.

(47) 實驗中,當選取奇異值比重為 50%是較適當的,因為選取太高的奇異值比重會 將過多的雜訊也包含進訊號影像中,太低則無法得到足夠的影像資訊,因此, 應該選擇較中庸的奇異值比重,才能兼顧影像品質,並去除雜訊。 在兩項實驗中皆可發現,運用奇異值分解處理影像問題,都容易低估在影 像中亮度較高的部分,此現象與影像資料本身的性質有關,將來若希望繼續使 用奇異值分解進行影像處理,應該設法處理亮度被低估的問題,才能確保較高 的影像品質。在去除雜訊實驗中,由於實務上我們無法得到原始影像,因此無 法將影像去除雜訊的效果量化,只能用人工肉眼判斷影像品質。此外,在實驗. 政 治 大 值分解有關。奇異值分解雖將資料作分解,但卻無法區分出影像資料中哪些是 立 中我們發現雖然影像中的雜訊有被改善,但是無法被完全消除,此現象與奇異. 使用者所需要的訊息或是雜訊,此研究中我們以奇異值比重作為劃分的準則,. ‧ 國. 學. 但仍有改善空間。所以定義一個更精確的量化評估準則以及更細膩的劃分方法. ‧. 將是研究人員未來的研究方向。. n. er. io. sit. y. Nat. al. Ch. engchi. 41. i n U. v.

(48) 參考文獻 Aronoff, S., (1989). Geographic information systems: A management perspective. Geocarto international, 4, 4, 58.. Banham, M.R., Katsaggelos, A.K., (1997). Digital image restoration. Signal processing magazine, IEEE, 14, 2, 24-41.. 政 治 大 rank. Psychometrika, 1, 3, 立 211-218.. Eckart, C., Young, G.,(1936). The approximation of one matrix by another of lower. ‧ 國. 學. Ganic, Zubair, N., and Eskicioglu, A.M., (2003). An optimal watermarking scheme. ‧. based on singular value decomposition. Proceedings of the IASTED international. n. al. er. io. sit. y. Nat. conference on communication, network, and information security (CNIS), 85-90.. i n U. v. Gorodetski, V.I., Popyack, L.J., Samoilov, V., and Skormin, V.A., (2001). SVD-Based. Ch. engchi. approach to transparent embedding data into digital images. Proc. Int. workshop on mathematical methods, models and architecture for computer network security, lecture notes in computer science, 2052, 263-274.. Kamm, J. L., (1998). SVD-Based methods for signal and image restoration, PhD thesis.. 42.

(49) Karadimitriou, K., Fenstermacher, M., (1997). Image compression in medical image databases using set redundancy. Data compression conference, 1997. DCC '97. proceedings, IEEE.. Konstantinides, K., Natarajan, B., and Yovanof, G.S., (1997). Noise estimation and filtering using block-based singular value decomposition. IEEE Trans. Image Processing, 6, 479- 483.. 政 治 大 benchmark (BRATS). Medical imaging, IEEE transactions on, 34, 10, 1993-2024. 立 Menze, B.H.等人, (2015). The multimodal brain tumor image segmentation. ‧ 國. 學. Sadek, R. A., (2012). SVD based image processing applications: state of. er. io. sit. y. Nat. Computer Science and Applications (IJACSA), 3, 7, 26-34.. ‧. the art, contributions and research challenges. International Journal of Advanced. Sanches, J.M., Nascimento, J.C., Marques, J.S.(2008). Medical image noise reduction. al. n. v i n C h Image processing, using the Sylvester–Lyapunov equation. IEEE Transactions on, 17, engchi U 9, 1522-1539.. 43.

(50)

參考文獻

相關文件

Partial Volume Segmentation with Voxel Histograms; Higher Order Statistics for Tissue Segmentation; III Quantification; Two-dimensional Shape and Texture

Hence, code for each non zero AC coefficient is composed of a basecode (corresponding to runlength/category) and a code corresponding to offset in.. Standard tables vs

• The scene with depth variations and the camera has movement... Planar scene (or a

• Richard Szeliski, Image Alignment and Stitching: A Tutorial, Foundations and Trends in Computer Graphics and Computer Vision, 2(1):1-104, December 2006. Szeliski

• Richard Szeliski, Image Alignment and Stitching: A Tutorial, Foundations and Trends in Computer Graphics and Computer Vision, 2(1):1-104, December 2006. Szeliski

• The scene with depth variations and the camera has movement... Planar scene (or a

 image processing, visualization and interaction modules can be combined to complex image processing networks using a graphical

It is required to do radial distortion correction for better stitching results. correction for better