影像縫補 - 超解析度程序 - 研究方法 - 影像縫補技術應用於以樣本為基礎的超解析度演算法之研究

第三章研究方法

3.2 超解析度程序

3.2.4 影像縫補

‧

start nodes

end nodes

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在求圖形的最短路徑的方法中，Dijkstra 演算法[21]可以找出加權圖形G(E,V)中，

邊的權重值不為負值，自起點 s (sV)到其他節點 v (vV-{s})的最短路徑。在實作的 部分，以圖 3-8 (c)為例，圖形 G 包含了N(N)個節點，我們使用一個 K × K 的相鄰矩陣來儲存圖形 G 的的資訊。其中，陣列的索引值代表節點，陣列中的元素值如 果為 0，表示節點v_i自己；如果為∞，表示節點v_i到v_j沒有存在的邊；其餘的陣列元素值則為節點v_i到v_j的權重值。接著，利用 Dijkstra 演算法來找出圖形中的最短路徑，其 pseudo code 如圖 3-9 所示。

Dijkstra’s algorithm

0 function Dijkstra(G, s) 1 for all v ∈ V-{s}

2 do dist[v]←∞

3 S←∅

4 Q←V 5 while Q ≠ ∅

6 do u←minDistance(Q, dist) 7 S←S ∪ {u}

8 for all v ∈ neighbors[u]

9 do if dist[v] > dist[u] + w(u, v) 10 then dist[v]←dist[u]+w(u, v) 11 return dist

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

找出最短路徑後，即可利用此最短路徑作為重疊區域的最小錯誤邊界的分割，在邊界的上與左側，以相鄰補丁的像素值作為合成後的像素值，在邊界的下與右側，以最佳相似度的高頻補丁的像素值作為合成後的像素值，而在分割邊界上的點，則以相鄰補丁與最佳相似度的高頻補丁的像素平均值作為合成後的像素值。

如圖 3-10 (a)(b)(c)所示，使用影像縫補技術在重疊區域的補丁合成上，以最小錯誤邊界進行分割，可以確保高頻補丁與相鄰補丁之間接續的連續性。另如圖 3-10 (d)(e)(f) 所示，在 Freeman 的 One-pass 演算法中，由於重疊區域僅有 1 pixel，補丁之間的分割即為重疊區域，並無針對補丁間的接續性進行特別的處理。

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第四章實驗結果與分析

在本章中，我們將以人臉影像作為主要的訓練與受測樣本，對於本論文所提出之方法與 Freeman 的 One-pass 演算法進行比較，並以量化的影像評量數據作為客觀的分析。此外，

我們也將藉由實驗的結果探討資料特性對於人臉超解析度結果的影響。

4.1 實驗環境

本論文所使用平台為 Microsoft Windows 7 (64-bit)，CPU 為 Intel(R) Core(TM) i5-3317U CPU @ 1.70 GHz，記憶體為 4.00 GB。開發環境為 Microsoft Visual Studio 2010 Visual C++。影像處理函式使用 OpenCV 2.4.5 版。

4.1.1 影像資料庫

本實驗所使用的影像資料庫有四個，分別是 MIT (Massachusetts Institute of Technology) CBCL (Center for Biological & Computational Learning) face database[22]、

MIT CVCL (Computational Visual Cognition Laboratory) database、Centro Universitario da FEI face database 與 Hong Kong University VCL (Visual Cognition Laboratory) face database。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

本則利用 CVCL database 中的城市建築與自然風景等圖片。

如圖 4-1 所示，以 8 張 200×200 的高解析度人臉影像作為訓練資料的樣本，將可訓練出大約 300,000 筆 7×7 與 5×5 的補丁配對資料。在 4.2.1、4.2.2 與 4.3.1 小節的實驗中，

主要都以圖 4-1 的人臉訓練資料樣本所產生的補丁配對作為訓練資料庫。在 4.3.2 小節中，則各別以圖 4-2 與圖 4-3 的女性與男性的人臉訓練資料樣本進行實驗。而圖 4-4 與圖 4-5 的亞洲與西方人種的人臉影像樣本則為 4.3.3 小節的訓練資料樣本。最後，在 4.3.4 小節中，則以圖 4-6、圖 4-7 與圖 4-8 中不同於人臉類別的影像作為訓練資料進行實驗。

圖 4-1 訓練資料樣本－人臉(8 張 200×200 pixels 高解析度影像)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 4-2 訓練資料樣本－人臉－女性(8 張 200×200 pixels 高解析度影像)

圖 4-3 訓練資料樣本－人臉－男性(8 張 200×200 pixels 高解析度影像)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 4-4 訓練資料樣本－人臉－亞洲人(8 張 200×200 pixels 高解析度影像)

圖 4-5 訓練資料樣本－人臉－西方人(8 張 200×200 pixels 高解析度影像)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 4-6 訓練資料樣本－森林(8 張 200×200 pixels 高解析度影像)

圖 4-7 訓練資料樣本－建築(8 張 200×200 pixels 高解析度影像)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 4-8 訓練資料樣本－動物(8 張 200×200 pixels 高解析度影像)

圖 4-9 訓練資料樣本與所產生的補丁資料

如圖 4-9 所示，一張 200×200 的高解析度影像經由訓練程序後可以產生大約 40,000 組的中頻與高頻補丁的配對，扣除資料相同的補丁後，8 張高解析度影像總共可以產生

訓練程序

中頻補丁高頻補丁

‧ ‧

8 張 200×200 pixels 的高解析度影像資料庫

可以產生超過 300,000 筆的

補丁資料

‧

另外，結構相似度指標(SSIM index, Structural SIMilarity index)[23]是一種用於評量兩張影像相似度的指標，結合了影像的亮度、對比度與結構性，綜合性地表示影像的整

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

4.2.1 受測影像的取樣比率對於超解析度結果的影響

為了對照超解析度的結果與原始影像之間的差異，我們假設低解析度影像是高解析度影像受到高斯模糊與向下取樣的退化所產生，因此，將受測的高解析度影像樣本，加入 mean 值為 1 的 5×5 高斯低通模糊函數，再經由向下取樣的動作將影像縮小以降低影像的品質。訓練資料的影像樣本如圖 4-1 所示，資料庫中的補丁配對數量為 200,000 筆。

我們分別以 1/2、1/4、1/16、1/64 與 1/256 的縮小比率進行實驗。

圖 4-10 受測影像向下取樣 1/2 的結果

Original HR image Blur and Resize to 1/2

High pass filter Resize by NN Result

PSNR: 32.30 dB SSIM: 78.56%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/2

Patches synthesis: image quilting

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 4-11 受測影像向下取樣 1/4 的結果

圖 4-12 受測影像向下取樣 1/16 的結果

Original HR image Blur and Resize to 1/16

High pass filter Resize by NN Result

PSNR: 30.95 dB SSIM: 72.50%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/16

Patches synthesis: image quilting Original HR image Blur and Resize to 1/4

High pass filter Resize by NN Result

PSNR: 31.74 dB SSIM: 76.22%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/4

Patches synthesis: image quilting

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 4-13 受測影像向下取樣 1/64 的結果

Original HR image Blur and Resize to 1/256

High pass filter Resize by NN Result

PSNR: 26.14 dB SSIM: 59.46%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/256

Patches synthesis: image quilting Original HR image Blur and Resize to 1/64

High pass filter Resize by NN Result

PSNR: 29.06 dB SSIM: 66.22%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/64

Patches synthesis: image quilting

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 4-10 到圖 4-14 分別表示一張人臉的受測影像在經過 1/2、1/4、1/16、1/64 與 1/256 的向下取樣後，由超解析度演算法所放大後的影像。可以發現當取樣比率在 1/2、1/4 與 1/16 時，其各對應的中頻影像仍可清楚地看見人臉的輪廓與一些細節資訊，在超解析度後的 PSNR 值仍有 30 dB 以上，SSIM 也保有 70%以上，算是可以接受的影像品質。而取樣比率在 1/64 與 1/256 時，其各對應的中頻影像幾乎已無邊緣等中頻資訊，在超解析度後的 PSNR 已降至 30 dB 以下，SSIM 也低於 70%，影像失真嚴重。如表 4-1 與圖 4-15 所示，受測影像在退化過程的取樣比率越小時，PSNR 與 SSIM 也隨之降低，影像失真的情況越嚴重。後續實驗中，我們將以 1/2、1/4 與 1/16 作為受測影像在退化過程中的主要取樣比率。

‧

在這部分的實驗中，將比較本論文所提出的影像縫補技術與 Freeman 的 One-pass 演算法這兩種不同的補丁合成方法對於超解析度結果的影響。訓練資料的影像樣本如圖

‧

Original HR image

Our method PSNR: 34.29 dB

SSIM: 81.66%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/2 Patches synthesis:

One-pass algorithm vs. our method

One-pass algorithm PSNR: 33.60 dB

SSIM: 80.95%

Blur and Resize to 1/2

smoother Original HR image

Our method PSNR: 32.30 dB

SSIM: 78.56%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/2 Patches synthesis:

One-pass algorithm vs. our method

One-pass algorithm PSNR: 32.19 dB

SSIM: 78.12%

Blur and Resize to 1/2

smoother

‧

Original HR image

Our method PSNR: 33.33 dB

SSIM: 78.39%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/4 Patches synthesis:

One-pass algorithm vs. our method

One-pass algorithm PSNR: 32.36 dB

SSIM: 76.21%

Blur and Resize to 1/4 Original HR image

Our method PSNR: 31.74 dB

SSIM: 76.22%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/4 Patches synthesis:

One-pass algorithm vs. our method

One-pass algorithm PSNR: 31.02 dB

SSIM: 73.90%

Blur and Resize to 1/4

sharper

‧

Original HR image

Our method PSNR: 32.69 dB

SSIM: 75.88%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/16 Patches synthesis:

One-pass algorithm vs. our method

One-pass algorithm PSNR: 32.37 dB

SSIM: 75.76%

Blur and Resize to 1/16 Original HR image

Our method PSNR: 30.95 dB

SSIM: 72.50%

Quilting path Conditions:

DB: Human face DB patches: 200,000 LR resize: 1/16 Patches synthesis:

One-pass algorithm vs. our method

One-pass algorithm PSNR: 30.82 dB

SSIM: 72.15%

Blur and Resize to 1/16

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 4-16、圖 4-18 與圖 4-20 分別代表受測影像一在取樣比率為 1/2、1/4、1/16 時的超解析度放大結果；圖 4-17、圖 4-19 與圖 4-21 則分別代表受測影像二在取樣比率為 1/2、1/4、1/16 時的超解析度放大結果。以本論文方法所產生的超解析度影像與 Freeman 的方法相比，可以發現在受測影像中，頭髮的邊緣較為銳利，而皮膚也較為平滑。由於本論文方法在每一次高頻補丁與相鄰補丁的合成上，都會找最小錯誤邊界的分割，如圖 4-22 所示，我們將每一次的最小錯誤邊界的分割紀錄成一張路徑圖，以觀察其實際分割的變化並與超解析度後的影像進行對照比對。

圖 4-22 補丁在重疊區域的分割路徑圖

如表 4-2 所示，本論文方法在 PSNR 與 SSIM 的數據都高於 Freeman 的 One-pass 演算法。其中，如圖 4-23 與圖 4-24 所示，在受測影像的取樣比率為 1/4 時，效果更為明顯。在對照實際的評量數據 PSNR 與 SSIM 後，證實本論文所提出的影像縫補技術可以適用在以樣本為基礎的超解析度演算法中的補丁合成方法上，對於影像品質的提升有一定的幫助。

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

另外，為了讓實驗結果能更為嚴謹與周延，我們使用了 FEI face database 中的 100 張人臉圖片作為大量受測影像的樣本，以大規模受測影像的實驗數據驗證本論文方法的效能。如圖 4-25 所示，總計 100 張解低度為 200×200 的人臉受測影像，其中男性與女性的比例各為 50%，先將 100 張高解析度影像退化為低解析度影像，然後以光柵式掃描的順序依續進行測詴。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

(a)

(b)

圖 4-26 100 張人臉受測影像所得到的 PSNR 與 SSIM 的折線圖

圖 4-26 (a)與(b)各為 100 張人臉受測影像的實驗數據所繪製而成的 PSNR 與 SSIM 的折線圖，可以很清楚地發現，以本論文方法所得到的 PSNR 與 SSIM 的值均高於 One-pass 演算法。其中，在最好的狀況下，以本論文方法所得到的 PSNR 值可以大於

25 30 35 40

PSNR

One-pass演算法本論文方法

70%

80%

90%

100%

SSIM

One-pass演算法本論文方法

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

用 Freeman 的以樣本為基礎的超解析度演算法文中的一張失敗案例的影像進行實驗，如圖 4-27 所示，將一張含有 JPEG 雜訊的低解析度影像進行超解析度放大，以 Freeman 方法放大的結果，在影像中人物的臉上出現許多因雜訊與補丁接續不良而產生的人工高頻資訊，相對於本論文方法，由於利用影像縫補技術，使得補丁與補丁之間的接續性更為良好，對於含有雜訊的影像而言，以本論文方法所得到的超解析結果同樣也優於 Freeman 方法。

圖 4-27 Freeman 方法與本論文方法對於雜訊影像的超解析度結果的比較 (a) 原始低解析度影像

(b) 以 Freeman 方法放大 4 倍的結果 (c) 以本論文方法放大 4 倍的結果 (a)

(b)

(c)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

4.3 訓練資料的特性對於超解析度結果的影響

在訓練程序中，我們以中頻與高頻補丁在空間上的相對應關係為基礎定義了訓練資料的關聯模型，同時也定義了不同解析度影像間的統計關係是獨立於影像對比度，並與縮放比率無關，所以資料間的關聯性是建立在影像的區域(local)關係而非全域(global)關係上，然而不同的訓練影像經訓練程序後所產生的補丁資料，其像素值的分佈與變化都不盡相同。在這一節中，我們將分析不同數量與不同類別的訓練資料，對於超解析度結果的影響，同時我們也將探討相同性別或者是人種的受測影像與訓練資料的組合，對於人臉超解析度的結果是否具有正面的意義與幫助。

4.3.1 不同數量的訓練資料對於超解析度結果的比較

在文檔中影像縫補技術應用於以樣本為基礎的超解析度演算法之研究 - 政大學術集成 (頁 41-0)

影像縫補

第三章 研究方法

3.2 超解析度程序

3.2.4 影像縫補

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第四章 實驗結果與分析

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧ 國

第三章研究方法

立政治大學

立政治大學

立政治大學

第四章實驗結果與分析

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學