• 沒有找到結果。

特徵擷取…

在文檔中 中 華 大 學 (頁 38-52)

第三章 研究方法

3.4 特徵擷取…

而本研究分析上節的書法鑑賞優美的原理,整理出三種特徵擷取來做為書 法字評分系統的分析特徵擷取,分述如下:

1、中心點位置特徵擷取:以書法字每一個 pixel 值乘上其座標,取其平均座標,

產生一個中心點,此即為字的中心,若中心和電腦字帖比對若相差不遠,即 表示有均勻的平衡美感,涵蓋理論:「均勻原理」。

2、字體大小特徵擷取:包含「字形大小」和「字形胖瘦」兩個特徵擷取,字 形大小、胖瘦是和電腦字帖做比較,字形大小涵蓋的理論是「等區域原理」,

字形胖瘦涵蓋的理論是「均勻原理」。

3、投射量特徵擷取:包含有「X、Y 軸投影量」和「X 軸投影差量」兩個特徵 擷取,X、Y 軸投影量定義是根據書法筆劃若是有水平或垂直的話,會在平 行或垂直作投影時在小區域內有大量的投影,若無則會在大區域只有小量的 投影,所以其涵蓋的理論是「水平、垂直、平行理論」;而 X 軸投影差量 是將對稱字右半邊投影量減去右半邊的投影量,將此值和電腦字做比較,若 愈接近則對稱度愈高,其涵蓋的理論是「對稱原理」。

本研究分析書法鑑賞優美的原理後,整理出以上三種特徵擷取,分述如下:

27

3.4.1 中心點位置特徵擷取

書法字的中心點位置若是不在我們認知架構中適當的位置,則書法字無法 展現其優雅的架構平衡美感,就好比特技演員在走鋼索一樣,重心不穩就很容 易發生危險,在書法字中強調的結字原則就提及到結構的穩健是一種視覺的平 衡,容易讓人產生一種穩定、安全的美感,所以定訂書法字中心點位置離電腦 字中心點的遠近,用以判斷書法字的美醜,先訂定出書法字中心點和電腦字中 心點兩者之距離差之最大範圍值,假設一個書法字完全偏右半邊,電腦字完全 偏左半邊,則兩者的中心點差距的最大差距為半個字的pixel 數,所以訂定以書 法字的X 軸 pixel 長度的一半為相距為最「遠」距離,若相距大小為 1/10 X 軸 pixel 數定義為最「近」距離,把「遠」「近」語言變數用歸屬函數模糊化。

字的中心點位置由於有近、遠二個語言變數,故有二條規則,一個變數,

所以採多規則、單一變數的近似推論,過程如下:

輸入: x is a

模糊規則 R1 : If x is A1 then y is B1 模糊規則 R2 : If x is A2 then y is B2 結論: y is b

圖3.7:中心點位置歸屬函數及推論過程 A1

0 10 20 30 40 50 60 70 80 90 100%

uA2(x) uA1(x)

100 50 0 遠

A2

b B1

a B2

u 前 題 部 份 結 論 部 份

最後是利用重心法來解模糊化,所得之分數S即為書法字中心點位置距電 腦字中心點位置之遠近所得的分數,假設位置在 G%的距離,則書法字和電腦 字的中心點為有點接近,所得的解模糊化的分數若是S 分則改進的辭令顯示“書 法字中心點位置距電腦字可再近(100-S)%”,例如所得的中心點位置分數是 73 分,則改進的辭令為“書法字中心點位置距電腦字可再近 27%一點”,再將此解 模糊化的分數,儲存在中心點位置資料庫中,以便我們下一個步驟模糊專家系 統的處理。

圖3.8:中心點位置特徵擷取

3.4.2 字體大小特徵擷取

書法字若是太大或者是太小也會影響到它的美感,太大的字有如一個大人 穿了一件小孩子的衣服,太小則感覺像是小孩穿了大人的衣服,若是字太胖(X 軸投影太大,其中大、小是和電腦字做比較)或太瘦(X 軸投影太小)也會影 響美感,所以字形的大、小、胖、瘦也會影響到書法字的美感,而九宮格的外

中心點位置特徵擷取

書法字資料庫 計算中心點位置 電腦字資料庫

中心點位置 資料

特 徵 擷 取 模 糊 系 統

互 動 式 改 進 辭 令 中心點位置相差值

29

圍的框就是這個大小的標準,就好像是一棟建築物一樣,外觀的形樣和架構,

若其大、小、長、寬設計得當會讓人產生一種舒適的美感,所以在本特徵擷取 裏共分兩個單元分析,(1) 字形的大小、(2)字形的胖瘦,兩個部份來探討。

1、字形的大小

圖3.9:電腦字和書法字大小比較圖

在此單元裏,假設字型的左上方座標為(0,0),考慮電腦字右下方的座標為 (x , y) ,書法字右下方的座標為(x’, y’),令 m=(x’-x),n=(y’-y) 其中:m 是對X 軸做投影的長, n 則是對 Y 軸做投影的長

假設若(m=0,n=0)則書法字形為適中,(m>0,n>0)則書法字形為大,如圖 3.10(a),以下所劃的藍色的是電腦字大小,紅色框是書法字的大小,假若 (m<0,n<0)則書法字形為小,如圖 3.10(b),如果不是上列所述,如(m≧0,n<0)、

(m≦0,n>0)則交由胖、瘦去判斷。

(x , y) (x', y')

圖3.10(a):書法字比電腦字為大,(b):書法字比電腦字為小

X 軸和 Y 軸的投影長短率由於有 m 和 n 二個變數和大、適中、小三個規 則,所以採多規則、多變數的近似推論,過程如下:

輸入:x is a and y is b

模糊規則: R1 If x is A1 and y is B1 then z is C1 else 模糊規則: R2 If x is A2 and y is B2 then z is C2 else 模糊規則: R2 If x is A3 and y is B3 then z is C3 結論:z is c

31

圖3.11:字形大小歸屬函數及推論過程

最後利用重心法解模糊化,所得之分數即為字形大小的分數,假設 (m>0,n>0)則字形為大,所得的分數假設是 S 分,則改進的辭令顯示“字形大小 應縮小為(100-S)%” ,例如所得解模糊化的分數是 78 分,則改進的辭令為“字 形大小應縮小28%”。

u u

u u

u u

a a

uA3(x)

B2

0 100 0

0 100 0 A2

uA2(x)

c3 c2 適中 大

-1 0 1 m 的歸屬函數 Min

C2

Min

C3

Max

c

0 100 0 大

uB3(x) 適中

-1 0 1 n 的歸屬函數

適中 大大 小

-1 0 1

B3 大 A3

小 適中

-1 0 1 m 的歸屬函數

前 題 部 份 結 論 部 份 b

b

n 的歸屬函數 R2

R3

2、字形的胖瘦

假設書法字的長寬比為 p=x’/y’,電腦字的長寬比為 q=x/y,則 o=(p-q) ,o>0 則書法字型為胖, o<0 書法字型為瘦,其中 p 是書法字長寬比例,q 是電腦字 的長寬比例

圖3.12(a):書法字比電腦字為胖,(b):書法字比電腦字為瘦

令o=(p-q),字形的「胖」、「瘦」或是「適中」程度,有三程語言變數,

把這三種語言變數用歸屬函數模糊化,歸屬函數也是利用三角形歸屬函數以方 便計算。

由於語言變數有胖、瘦、適中三種就有三條規則、一個變數,所以採多規 則規則、單一變數的近似推論,過程如下:

輸入: x is a

模糊規則 R1 : If x is A1 then y is B1 模糊規則 R2 : If x is A2 then y is B2 模糊規則 R3 : If x is A3 then y is B3 結論: y is b

33

圖3.13:字形胖瘦歸屬函數及推論過程

最後也是利用重心法解模糊化,所得之分數即為字形胖瘦的分數,假設字 形為「胖」,所得的分數若是 S 分則改進的辭令顯示“字形胖瘦應減胖為 (100-S)%” ,例如所得解模糊化的分數是 83 分,則改進的辭令為“字形胖瘦應 減胖17%”。

由上兩個單元(1)字形大小和(2)字形胖瘦,處理之後存在字體大小資料庫 中,其中字形大小所得的分數和字形胖瘦所得的分數各佔一半,以方便我們下 一個階段模糊專家系統的處理。

0 100 0 中心

面積

uA2(x) uA3( x) 適中

-1 -0.5 -0.167 0 0.167 0.5 1 胖 瘦

Min A3

b A1 A2

前 題 部 份 結 論 部 份 u

B3 B2

u

圖3.14:字體大小特徵擷取

3.4.3 投射量特徵擷取

1、X、Y 軸投影量特徵擷取

要分析二維空間的筆劃位置,把書法字做X、Y 軸的投影做分析,如此一 來也可以做筆劃是否有水平和垂直的分析,因為若一個有水平或垂直的筆劃,

在X 軸和 Y 軸的投影必定是在某一小範圍內有大量的投影量,這和不平行或垂 直者大範圍不相同的投影位置,若是電腦字的筆劃是有水平和垂直的例如「十」

這個字,書法字若寫得既不水平又不垂直,必定不會好看,那就可以根據電腦 字和書法字做投影量相減,必會相差很多,根據此原理來做為投影量比對的方 法,今說明如下:

若有一電腦字「門」和書法字的「門」在 X 軸和 Y 軸的投影,紅色是書 法字的投影部份,而黑色則是電腦字的投影部份,兩者相減,所以投影量比對,

就是兩者相差部份如下箭頭所指出的部份,如下圖所示。

字體大小特徵擷取

書法字資料庫 計算 m、n、o 值 電腦字資料庫

字體大小 資料庫

特 徵 擷 取 模 糊 系 統

互 動 式 改 進 辭 令

35

圖3.15:電腦字做X、Y軸投影情形

X、Y 軸投影量的語言變數的訂定是根據書法字和電腦字投影量做比對, 若電腦字和書法字重疊則不須扣分,若不同若該位置只有電腦投影量值有或只 有學生投影量值則需扣分,扣分的投影量除以書法字和電腦字投影量總和,把語 言變數用歸屬函數模糊化,歸屬函數也是利用三角形歸屬函數以方便計算。

由於投射量之差異量只有多和少二個語言變數,有二條規則一個變數,所 以採多規則、單一變數的近似推論,過程如下:

輸入: x is a

模糊規則 R1 : If x is A1 then y is B1 模糊規則 R2 : If x is A2 then y is B2 結論: y is b

圖3.16:X、Y 軸投影量相差歸屬函數及推論過程

最後是利用重心法來解模糊化,所得之分數S即為書法字投影量和電腦字 投影量相差所得的分數,假設投影量相差 R%,若是相差很少,所得的解模糊 化的分數若是 S 分則改進的辭令顯示“書法字和電腦字相差之投影量再少 (100-S)%”,例如所得的投影量相差分數是 80 分,則改進的辭令為“書法字和電 腦字相差之投影量再少 20%一點”,再將此解模糊化的分數,儲存在投影量資 料庫中,以便我們下一個步驟模糊專家系統的處理。

100 50 0 u

A1 少

0 10 20 30 40 50 60 70 80 90 100%

uA2(x) uA1(x)

多 A2

b 前 題 部 份 結 論 部 份

a

B1 B2 u

37

X、Y 軸投影量特徵擷取

圖3.17:X、Y 軸投影量特徵擷取

2、X 軸投影差量特徵擷取

研究發現在中國字中有部份是左右對稱字,例如:大中小高同門...,

可發現其對稱度也是構成書法美的條件之一,利用左右對稱的原理,加以分析 發現其X軸的投影量右半邊的pixel 總和減去左半邊的 pixel 總和,此數值若愈 接近電腦字,X軸的投影量右半邊的pixel 總和減去左半邊的 pixel 總和,則愈 顯得優美的程度愈高,假設X軸的投影差量書法字為Xr’,電腦字為 Xr , XR=

(Xr’-Xr) ,XR 共有三種語言變數“不勻稱右邊筆劃太粗或字型偏右” “字型 勻稱” “不勻稱右邊筆劃太細或字型偏左”,把語言變數用歸屬函數模糊化,歸 屬函數也是利用三角形歸屬函數以方便計算。

書法字資料庫 計算 X、Y 軸投影差量 電腦字資料庫

X、Y 軸投影量 資料庫 X、Y 軸投影差量值

特 徵 擷 取 模 糊 系 統

互 動 式 改 進 辭 令

X、Y 軸投影差量特徵擷取

X軸左半邊投影量 X軸右半邊投影量 圖3.18:X軸左、右半邊投影量

X軸的投影差量由於有三種語言變數就有三條規則、一個變數,所以採多 規則規則、單一變數的近似推論,過程如下:

輸入: x is a

模糊規則 R1 : If x is A1’then y is B1’

模糊規則 R2 : If x is A2’then y is B2’

模糊規則 R3 : If x is A3’then y is B3’

結論: y is b

在文檔中 中 華 大 學 (頁 38-52)

相關文件