第一章 緒論
1.4 論文章節架構
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
3
擴散方法與向量場結合後,動態地轉換為紋路結構,整合其紋路,產生符合輸入影 像特徵的裝飾紋路風格。
可根據使用者調整不同的參數變化,能控制紋路的生成結果,例如紋路線條的寬度,
前景、背景特徵的生成角度和方向…等。
1.4 論文章節架構
在第二章,我們將會介紹與本研究相關的論文,包括過去裝飾紋路的研究、在非 相片寫實電腦繪圖技術領域中相似的主題和反應-擴散的方法;第三章將介紹本論文主 要的研究方法與步驟;第四章介紹的是實驗結果與討論;第五章為結論與未來展望。
‧
Medial Axis Transformation(MAT)來生成更為複雜和交錯的花飾紋路。另外,Xu和Kaplan 兩位學者所提出的漩渦和迴旋狀的迷宮生成[7],雖然結果是迷宮,但是其結構形式也具 有規則性,並且與中國某些裝飾紋路有顯著的相似。而目前在國內外較少有偏向於中國 傳統裝飾紋路的生成研究,大多是以人文或歷史為觀察角度來探討傳統裝飾紋路的結構 及附有的象徵意涵之研究[8][9]。‧
影像以色彩作分割後利用Artisticic Thresholding[11]建立出對應的黑白影像和特徵擷 取…等步驟後比對出紋路資料庫中的現有範本來產生中國傳統獸面紋。此研究提供了我 們許多有關分析傳統獸面紋的基礎,而我們的目的是改善它的比對技術以增加精確度和 利用反應-擴散做為主要方法來加強結果的特徵紋路和產生背景紋路,並且風格化其生 成結果。2.2 反應-擴散(Reaction-Diffusion)
反應-擴散與生物紋路有所連結的研究,首見於 1952 年,由 Turin 所發表的 The Chemical Basis of Morphogenesis[12]。其中定義了一項反應-擴散公式:在一個空間之中,
若是存在兩種以上的分子,它們會互相進行反應交換,同時也會藉由擴散作用而分布到 鄰近的區域,於是就會自然地產生條紋和斑點…等各式各樣的圖樣,而擴散就是指物質 由濃度高到低的區域散布現象。透過以上所產生出來的圖案則被稱為 Turing Pattern,
其中包含了三個重要的性質,具自我組織化、自我回復功能以及藉由改變兩種物質的相 互關係和擴散速度,可產生出不同形式的花紋圖樣,也能與自然界生物的花紋特徵有形 狀結構相似的對應。1991 年,Turk [13]發表的是透過反應-擴散方法生成動物表面的紋 理,並且能應用於動物之立體模型上的貼圖,圖 3 便能顯示出各樣形式的花紋模擬與模 型的貼圖應用。1993 年 Pearson[14]觀察大自然中的紋路,例如沙漠中經過風吹之後形 成的沙紋、雲所排列組織成的雲街現象…等後,利用反應-擴散方法中的 Gray-Scott model 做為基礎,衍生出十二種外形和排列組合相異的花紋之生成,見圖 4 所列。2006 年,由 Liu et al. [15] 同樣利用反應-擴散公式模擬出從幼年到成年花豹身上的斑紋成長 與變化:幼年為圓點、成長時變成圓圈、成年後則變為薔薇形(rosette)。由此我們可以 得知生物的花紋特徵的確能夠藉由擴散反應公式模擬而成。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
6
圖 3. Turk 反應-擴散後之結果[13]。
圖 4. Complex Patterns in a Simple System[14]所生成的十二種紋路圖樣。
由於中國傳統獸面紋的產生是透過現實動物和古人想像得來,我們將其歸類為抽象 風格化藝術的一種,富有多樣的線條和塊狀紋理,於是我們參考了 Evolving Mazes from Images[16],此研究的目標是讓一張輸入原始影像根據時間變化能夠轉變為迷宮的圖樣,
並且能保存輸入影像原有的紋理特徵,圖 5,方法是建立於 Cellular Neural Networks(CNN) 架構之中的反應-擴散模擬,它定義了細胞與鄰近細胞之間模擬相同於反應-擴散的傳遞 訊息,具有兩點特色:1.細胞中有連續性的動態行為以及 2.有限半徑範圍的連接,能視 為反應-擴散方法的一種。以結果而言,迷宮圖樣除了具遊戲性外,在西方國家也被視
‧
圖 5. Evolving Mazes from Images[16] (a)原始影像經過時間變化逐步形成(d)的迷宮 結構,並保有原始影像的斑點特徵。
2.3 Non-photorealistic Rendering
在NPR的領域中,以探討非光學物理的角度生成目標影像為主,直接地解釋就是將 輸入影像進行藝術化和風格化的轉變。近年來,NPR研究在處理影像特徵時,多數都會 加入向量場作為處理的一部分,讓我們除了有影像本身的明亮度和顏色…等影像本身的 資訊外,更增加了一項參考資訊和控制因素。Kyprianidis和Kang[17]於2011年提出了對 於靜態與動態的影像轉為抽象風格的研究,方法基於LIC(Line Integral Convolution)的架 構,找出影像的向量資訊並做為抽象化特徵的加強,結果如圖6,這篇研究對於我們有 關向量場與影像風格化技術之間的結合有很大的啟發。2008年,Kim et al.[18]以擷取特 徵向量的方式讓點描的放置增加了方向性,改變了過去大多是以色調來決定的方法,這 項方法讓輸出影像更能強調其特徵,結果之比較見圖7。另外,Pedersen和Singh[19]在 NPAR 2006所提出的是曲線藉由流體的擴散特性和給予向量引力產生互斥效果模擬出
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
8
類似迷宮的結構,並且能夠參考輸入影像來生成出符合其特徵的迷宮,和上述的迷宮生 成方法相較之下,其結果能夠具有Evolving Mazes from Images[16]無法產生的自似特性,
但運算的時間複雜度卻高出許多;Ando和Tsuruno[20]在NPAR 2010提出透過流體的擴散 特性模擬出大理石紋和日本墨流的向量圖形,並讓使用者能夠即時互動,其結果與中國 傳統裝飾紋路中的雲紋相當類似。以上兩篇相關研究也與向量有密切的關聯性。
(a) (b)
圖 6. (a)輸入影像,(b)配合特徵向量抽象化之輸出影像[18]。
(a) (b)
圖 7. (a)根據色調決定之方法,(b)為透過特徵向量決定之方法[17]。
2.4 五官辨識
欲將動物臉孔的寫實相片與傳統獸面紋圖樣相互對應並進行風格轉換的過程中不 可避免的就是比對臉部的特徵,在近年來臉部辨識的技術是一項熱門的研究,以現階段
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
9
而言,針對人類臉部特徵的辨識與相關應用都已有一定的成熟度,而與電腦圖學所相關 的多用於人類臉孔之特徵進行風格化的轉換,例如 ExampleBased Caricature Generation with Exaggeration[21] 和 Automatic Caricature Generation By Analyzing Facial Features[22]…等之中的技術皆為進行找出自動找出人類五官的特徵並風格化為漫畫的 表現。而為求應用在獸面紋風格圖樣生成的便利性,我們參考了上述研究中的方法以求 得到動物的臉孔特徵,但根據輸入影像中動物種類的不同會產生有特徵與外形差異過大 的現象,無法以通用的規則對待所有動物五官的偵測,因此增加了許多辨識上的困難度。
另外,我們也參考了 Feature-Based Image Metamorphosis[23]的變形技術以應用在我們期 望的特徵誇張化。
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
12
圖 8. 傳統獸面紋特徵比例分配[10]。藍色區域為雙眼、紅色區域為鼻梁、桃紅色區域為 獠牙、橘色區域為雙耳、綠色區域則為觝角。
除此之外,每一個年代的獸面紋圖樣之變化,從較早期年代的基本獸面樣式與側身 組合演進至較晚期的年代有鮮明的臉部特徵和動物特徵,由此可見所能描述的特徵演變 的越來越豐富。
一個完整的獸面紋裝飾圖樣除了有前段所述的特徵之外,根據我們的觀察,在獸面 紋圖樣以外的區域也大多具有其它線條狀交疊的紋路裝飾,在文獻[2]的分類中是屬於幾 何紋路,此類的紋路多源自於如火焰或水渦…等大自然現象,而多出現於獸面紋圖樣中 的幾何紋路被稱為雷紋,是由雷的古文字“ ”所象形而來,故因此命名。分析雷紋的 結構,基本形態的輪廓為矩形並且以回字型的旋轉線條為特徵的表現。在變化上,以迴 旋層次的多寡與排列組合不同做為多樣的類型呈現,常做為烘托主題的次要裝飾紋路,
較少以單獨的形式出現,圖 9 為不同類型之雷紋範例。
(a) (b)
圖 9. 不同的雷紋類型[2],(a)為勾連雷紋、(b)為菱形雷紋。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
13
3.2 研究方法
透過文獻史料與 3.1 中對傳統獸面紋的分析之後,我們將最主要的特徵結構,例如:
雙眼、卷角、雙耳…等歸類為五官的特徵,而比對一張動物臉譜影像與傳統獸面紋圖樣,
見圖 10,我們發現在五官特徵的對應中具有比例誇張化的效果,同時也會形成黑白兩色 風格化的轉換,特別是在眼睛部分的誇大呈現最為顯著。在相關文獻中,發現對於在傳 統獸面紋五官特徵中豐富的線條裝飾並沒有明確的指出是如何得來,以輸入影像能提供 的資訊而言,我們假定是以現實中的動物之花紋特徵做為來源並加以線條化做為風格的 描述,而在過去與反應-擴散相關的文獻[12][13][15]印證了其方法確實能夠模擬出生物 體表的花紋且能以包含線條風格…等多樣化結構呈現的特性。有此為基礎,我們開始著 手於利用反應-擴散方法做為紋路裝飾的生成與風格化技術。另外,在動物臉譜以外的 區域,我們也試圖運用反應-擴散生成線條紋路的特性來模擬出具迴旋結構的幾何紋路,
由於做為次要的裝飾紋路,我們較不考慮例如圖 9 中較複雜樣式的幾何紋路生成。總結 來說,我們將傳統獸面紋圖樣定義為一種風格,其中包含了黑白色彩與誇張化、抽象風 格化的動物臉孔以及多具結構的線條做為裝飾。
圖 10. 動物臉譜與傳統獸面紋圖樣[2]比對。
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
15
圖 11. 系統流程圖。
3.4 五官特徵的生成
在這一節中,參考傳統中國獸面紋圖樣對應寫實相片之產生技術[10]中生成獸面紋 特徵的方法,將輸入的動物臉譜作色彩區塊的分割並透過 Artistic Thresholding[11]的技 術建立出 Thresholding 純粹黑白兩色的影像,其目的是抓出臉孔上的特徵部位之後能夠 開始與存於資料庫中的獸面紋之五官特徵範本進行比對並找出相似性最高的五官特徵。
我們將其中的比對方法改為 Structure Similarity(SSIM)[24],相較於[10]所使用的比對技 術,SSIM 除了在影像品質上的衡量更符合人類眼睛感知對結構性特徵的判斷之外,在
我們將其中的比對方法改為 Structure Similarity(SSIM)[24],相較於[10]所使用的比對技 術,SSIM 除了在影像品質上的衡量更符合人類眼睛感知對結構性特徵的判斷之外,在