第一章 緒論
1.4 論文章節架構
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
1.4 論文章節架構
在第二章,我們將會介紹本研究相關的基礎知識,以及過去在非相片寫實電腦繪 圖技術領域中常見的研究主題。第三章將介紹本論文主要的研究方法與步驟。第四章介 紹的是實驗結果與討論。第五章則是結論與未來研究。
‧
的紋路的產生規則。而後,Grunbaum and Shephard[4]更進一步提出產生週期性的拼貼花‧
2.2 Texture Synthesis
Texture Synthesis目前主要的研究都放在以像素(pixel)為基礎的分析,而本論文期望 研究的紋路希望能以曲線表示,也就是向量影像(vector image)。向量影像的優點在於便 於以幾何的規則去描述。而Texture Synthesis的研究均建立於對於不同種texture的結構有 其假定的模型,比如說,在Yanxi Liu et. al.的研究中[9],將texture分為regular, near-regular, irregular, and stochastic textures這四類,如此一來,便可基於不同texture的特性進行分析 和處理。除此之外,Texture Synthesis的架構加以延伸,可處理將不同texture做風格轉移 的議題。Hertzmann的”Image Analogies”[10]這篇論文,是針對影像像素提供了一個轉移 影像中範例的自動化演算法架構。之後,Hertzmann持續對於風格轉移的架構做延伸,
產生基於範例的曲線風格轉移[11]。
2.3 Bi-tonal Image
‧
例子包括 A method for computing stipple drawings [12], Artistic screening [13],
Computergenerated pen-and-ink illustration [14],以及 Image-guided maze construction [15]。
相對於 half toning,轉換任一張彩色圖像為 bi-tonal image 的最簡單方式毫無疑問地 就是設置 threshold。選擇一個 cutoff value,一個映像點被轉換為黑色或白色取決於其亮 度在 thresh 之下或之上。但很可惜的是簡單的 threshold 設置並無法讓影像產生有說服力 的藝術風格,若不將其焦點放在來源圖像中的特徵也無法識別顏色和相似亮度間的對 比。適當的 threshold,如(圖 1(c)),不同的 cutoff value 空間依賴於局部的色調。利用這 個方法可以將提取特徵做得更好,但仍存在許多的問題。例如為了讓某些物件在背景中 變得顯眼可能會把黑色的物件畫成白色或是把明亮的物件畫成黑色,。這些色調的反轉 對於在場景中捕捉細節以及產生對觀察者而言自然的結果是非常重要的。但是,他們無 法由簡單的 threshold 來負責,針對這樣的缺點,Artistic Thresholding[16]利用 Energy function 調整各參數權重值的方法來做改善,每一個權重值對應到獨立的 threshold 來維 持來源圖像中物件的可見性,尤其是高對比的邊緣。
(a) (b) (c)
圖 1 . Thresholding 的選擇,(a)來源圖像,(b)針對來源圖像做 simple thresholding,(c) 合適的 thresholding。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
然而,half toning 和 threshold 不是唯一使用黑白來描劃影像的方法,使用線段的表 示法即為一個很好的例子(圖 2(a)),其在輪廓線上安排些許的線段做為稀少的視覺暗示 來傳達所要表現的外型和紋理資訊。其他方法諸如水墨畫,使用大量的黑色去傳達一張 圖像中所有的突出部分(圖 2(b))或是剪貼(藉由其自然的二進位表示方法,在黑色的紙上 剪出洞來描述一張圖像(圖 2(c)),相關的研究如 Computer-generated paper cutting [17]其 利用 Dijkstra’s algorithm 做為基礎方法去強調黑色區塊間的連接性,並藉由 edge detection 保有原始圖像的外觀,同時藉由加入多種 Boolean 運算,讓使用者可以有更多的選擇去 產生他們自己的剪紙作品以達到風格化的目的。
圖 2. Half toning 以外的三種以黑白表現連續色調的例子:(a)一個簡單的線條畫[18],
(b)張大千的水墨畫[19],(c) Susan Throckmorton 的現代剪紙作品[20]
‧
2.4 Local Layering
不論東西方,裝飾的圖紋中常出現交疊紋飾(如圖 3所示),在傳統的2D繪畫或是合
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
堆疊清單圖表,定義階層順序的集合,使其始終不互相貫穿,並證明他們的局部的堆疊 運算子是正確且足以達成任一個一致性的堆疊。
2.5 人臉辨識與抽象化藝術
相較於動物的臉部辨識,人臉辨識在電腦視覺(computer vision)的研究中已有一段長 時間的研究,因此相較之下其技術也較為純熟,在這裡,我們參考 Automatic Caricature Generation By Analyzing Facial Features[23]這篇論文,不同於以往非寫實的臉影像處理系 統侷限於以影像為基礎(Image-based),這篇論文的研究目的是以特徵為基礎
(Feature-based)的方式,達到將人像自動轉換成卡通肖像畫的應用。其最大的創新在於不 需對輸入影像一一的定義要誇張化的部位及臉型,利用統一且簡單的演算法即可自動的 找出所有臉部上的特徵,並加以誇張化。除了上述步驟外,在影像的形變中,還需利用 一張畫家的作品,將其套上誇張化後得到的輪廓產生新的肖像畫,藉此表現輸入圖像的 特徵,同時完整的保留原畫家的繪畫風格。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y 第三章
研究方法與步驟
獸面紋路的生成主要分為三個部份。第一,由輸入圖像中做特徵擷取,以保留每張 原始圖像其特有的風格和紋路。第二,資料庫建立以及比對,定義獸面紋路中較為重要 的特徵,進而針對這些特徵去對所蒐集的獸面紋資料去做分類,達到系統化的分析。第 三,圖像生成之結合,在每一個獸面紋中都包含了前景與背景,其生成方式也不完全相 同,定義基本的架構後,再進行組合,有利於使用者設計出特有的風格結果。因此在這 一章中,我們會逐一介紹這三個部份,闡述我們如何由一張寫實圖片產生能反映原始圖 像中特徵紋路的獸面紋。
3.1 研究方法
在研究中發現東方紋理結構的裝飾紋路主要以單一色調做為基底去產生圖案(圖 4),所以我們的研究方法一開始主要著重於產生純粹黑白兩色的 Bi-tonal image。由於東 方紋理結構的裝飾紋路分類甚多,因此在我們的研究中以獸面紋為主要的探討中心。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
(a) (b)
圖 4. 東方紋理結構的裝飾紋路:(a)卷龍紋[24],(b) 銅鏡裝飾[25]
在本研究中我們主要針對獸面紋去做分析,其是商周青銅器的主要紋樣,多裝飾在 樂器(祭祀用)的主要部位基本構圖為:一雙大而有神的眼睛;雙眼間有一鼻樑;大咧口、
大獠牙;額頂有一對觝角(或雙耳);有軀幹的話則向兩側展開,另有尖銳的爪子;根據 觝角的彎曲方向可分為外卷角和內卷角以及呈圓弧形的對稱角的紋飾,在 3.4 Data Base Construction 中,我們將有更詳盡的分析。另外,在商周晚期和後代中,獸面紋路也廣 泛的被使用於各種武器上做為裝飾紋路,舉凡槍、劍、戢以及矛…等武器,做為嚇阻之 作用,但關於這類的紋路資料較少,因此在本研究中不做探討。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
(a) (b)
(c)
圖 5. 商周青銅器上之饕餮紋,(a)外卷角饕餮紋圖[26],(b)內卷角饕餮紋[27],(c)圓弧 形對稱角饕餮紋[27]
而隨著年代的推進,獸面紋樣的變化也可概分為三大類(圖 6),首先是最簡單的側 身紋樣結合動物特徵,接著是臉部特徵結合動物特徵,最後最為複雜的是側身組合結合 臉部特徵再結合動物特徵,在本論文中將只針對第二類臉部特徵結合動物特徵這一部份 的組合架構去做研究與分析,產生具有相似風格的獸面紋樣。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 6. 隨年代推進獸面紋圖樣之演進,(a) 商周早期-側身紋樣結合動物特徵,(b)商周中 期-臉部特徵結合動物特徵,(c)商周晚期後-側身組合結合臉部特徵與動物特徵[28]
根據神與獸的紋樣學[30]一書中對於獸面紋的探討我們可以發現其設計的風格主要 著重於頭上支角的變化。另外,在我們搜集資料的過程中也發現到,除了動物頭上支角 的特徵外,其眼睛、舌頭以及耳朵的部分則和古象形文字有著不可分割的關係(圖 7),
基於這樣的關係,我們可以更清楚的明白整個獸面紋的設計方法其實從很早的朝代就已 奠定基礎,也有助於我們套用象形文字的概念去幫助我們完成獸面紋產生的技術。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 7. 獸面紋與象形文字之比較關係[29]
進一步的研究,我們可以發現獸面紋除了明顯的幾個重要特徵外,剩餘的裝飾紋路部份 與迷宮圖案有類似的部分,因此我們參考了相關的論文,如Evolving Mazes from
Images[30]。近代生活中較常見的獸面紋運用可見於一些商標圖樣。
3.2 研究步驟
我們將整個實作過程大致分三個步驟來完成。第一步驟,特徵擷取,一開始我們 先使用 EDISON’s synergistic image segmentation [31]的方法對原始輸入圖像做處理,使 用分割的方式將其細分為許多區域,其背後的分割原理為將各相鄰像素間的 RGB 值做 歸類,當相鄰像素間的色差值介於一定範圍中時,我們計算這些相似顏色的平均值,將 其做為此分段的顏色值,並分配給所有於此分段中的像素,產生所需的分段圖像 (Segmentation Image);接著我們參考 artistic thresholding 中的做法,將分段圖像做為輸 入圖像,建立所需的 bi-tonal image。第二步驟,資料庫建立以及特徵比對,預先定義獸 面紋中較為重要的特徵,再和使用者點取的特徵部位做比對與分析,達到系統化的分 析;第三步驟,我們回到原始圖像中將其分為前景以及背景兩部份個別的去做不同紋路 的處理。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
其中前景的處理以 bi-tonal image 做為輸入來源,針對特徵部位與資料庫做比對並 將比對得到的結果依比例縮放使得其符合原始圖片的大小;而相對於前景,背景的處理 則希望以原始圖像做邊緣偵測後所得的結果做為輸入來源,再依原始圖像中的向量場流 向安置符合原始圖像的紋樣(雷紋…等)。最後再將產生出來的前景與背景結果做結合產 生我們想要的完整圖紋,流程圖如圖 8 所示。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
3.3 Feature Extraction
以分段圖像(Segmentation Image)為基礎,我們建構 region adjacency graph,目的是 為了增加影像的可讀性,並增加對於特徵處理上的速度;假設來源圖像的大小為 W*H。
分段產生 N 個區域的集合,我們將其分別標示為 1…N。每一個區域是圖像中一個整數 位置(x , y)的子集合 Si 。我們可以把每一個區域上的各分段想成一張平面圖上的頂點。
當有兩個像素點其對應的區域為水平或垂直相鄰時,則這兩個頂點由一邊做連結。如圖 9 所示,對每一個區域 Si 我們給予一 ci 代表 Si中的所有映像點的平均顏色值,Ai 代表 Si中映像點的個數以及 li, j 代表 Si和 Sj為共用邊界的長度。
(a) (b)
圖 9. 一個簡單的 adjacency graph,在(a)中的每一個分段於(b)中有相對應的頂點,他 們有相同的顏色和標記。每一個頂點記錄了其代表的分段包含的像素個數。每一個邊記 錄了兩個鄰近分段共享邊界的長度。
延續上一個步驟,接著我們參考 Artistic thresholding 中的做法,建立 threshold
延續上一個步驟,接著我們參考 Artistic thresholding 中的做法,建立 threshold