特徵擷取…

第三章研究方法

3.4 特徵擷取…

而本研究分析上節的書法鑑賞優美的原理，整理出三種特徵擷取來做為書法字評分系統的分析特徵擷取，分述如下：

1、中心點位置特徵擷取：以書法字每一個 pixel 值乘上其座標，取其平均座標，

產生一個中心點，此即為字的中心，若中心和電腦字帖比對若相差不遠，即表示有均勻的平衡美感，涵蓋理論：「均勻原理」。

2、字體大小特徵擷取：包含「字形大小」和「字形胖瘦」兩個特徵擷取，字 形大小、胖瘦是和電腦字帖做比較，字形大小涵蓋的理論是「等區域原理」，

字形胖瘦涵蓋的理論是「均勻原理」。

3、投射量特徵擷取：包含有「X、Y 軸投影量」和「X 軸投影差量」兩個特徵 擷取，X、Y 軸投影量定義是根據書法筆劃若是有水平或垂直的話，會在平行或垂直作投影時在小區域內有大量的投影，若無則會在大區域只有小量的投影，所以其涵蓋的理論是「水平、垂直、平行理論」；而 X 軸投影差量是將對稱字右半邊投影量減去右半邊的投影量，將此值和電腦字做比較，若愈接近則對稱度愈高，其涵蓋的理論是「對稱原理」。

本研究分析書法鑑賞優美的原理後，整理出以上三種特徵擷取，分述如下：

3.4.1 中心點位置特徵擷取

書法字的中心點位置若是不在我們認知架構中適當的位置，則書法字無法展現其優雅的架構平衡美感，就好比特技演員在走鋼索一樣，重心不穩就很容易發生危險，在書法字中強調的結字原則就提及到結構的穩健是一種視覺的平衡，容易讓人產生一種穩定、安全的美感，所以定訂書法字中心點位置離電腦字中心點的遠近，用以判斷書法字的美醜，先訂定出書法字中心點和電腦字中心點兩者之距離差之最大範圍值，假設一個書法字完全偏右半邊，電腦字完全偏左半邊，則兩者的中心點差距的最大差距為半個字的pixel 數，所以訂定以書法字的X 軸 pixel 長度的一半為相距為最「遠」距離，若相距大小為 1/10 X 軸 pixel 數定義為最「近」距離，把「遠」「近」語言變數用歸屬函數模糊化。

字的中心點位置由於有近、遠二個語言變數，故有二條規則，一個變數，

所以採多規則、單一變數的近似推論，過程如下：

輸入: x is a

模糊規則 R1 : If x is A1 then y is B1 模糊規則 R2 : If x is A2 then y is B2 結論: y is b

圖3.7：中心點位置歸屬函數及推論過程 A1

近

0 10 20 30 40 50 60 70 80 90 100%

uA2(x) uA1(x)

100 50 0 遠

b B1

a B2

u 前題部份結論部份

最後是利用重心法來解模糊化，所得之分數Ｓ即為書法字中心點位置距電腦字中心點位置之遠近所得的分數，假設位置在 G%的距離，則書法字和電腦字的中心點為有點接近，所得的解模糊化的分數若是S 分則改進的辭令顯示“書法字中心點位置距電腦字可再近(100-S)%”，例如所得的中心點位置分數是 73 分，則改進的辭令為“書法字中心點位置距電腦字可再近 27%一點”，再將此解模糊化的分數，儲存在中心點位置資料庫中，以便我們下一個步驟模糊專家系統的處理。

圖3.8：中心點位置特徵擷取

3.4.2 字體大小特徵擷取

書法字若是太大或者是太小也會影響到它的美感，太大的字有如一個大人穿了一件小孩子的衣服，太小則感覺像是小孩穿了大人的衣服，若是字太胖（X 軸投影太大，其中大、小是和電腦字做比較）或太瘦（X 軸投影太小）也會影響美感，所以字形的大、小、胖、瘦也會影響到書法字的美感，而九宮格的外

中心點位置特徵擷取

書法字資料庫計算中心點位置電腦字資料庫

中心點位置資料

特徵擷取模糊系統

互動式改進辭令中心點位置相差值

圍的框就是這個大小的標準，就好像是一棟建築物一樣，外觀的形樣和架構，

若其大、小、長、寬設計得當會讓人產生一種舒適的美感，所以在本特徵擷取裏共分兩個單元分析，(1) 字形的大小、(2)字形的胖瘦，兩個部份來探討。

1、字形的大小

圖3.9：電腦字和書法字大小比較圖

在此單元裏，假設字型的左上方座標為(0,0)，考慮電腦字右下方的座標為 (x , y) ，書法字右下方的座標為(x’, y’)，令 m=(x’-x)，n=(y’-y) 其中：m 是對X 軸做投影的長， n 則是對 Y 軸做投影的長

假設若(m=0,n=0)則書法字形為適中，(m>0,n>0)則書法字形為大，如圖 3.10(a)，以下所劃的藍色的是電腦字大小，紅色框是書法字的大小，假若 (m<0,n<0)則書法字形為小，如圖 3.10(b)，如果不是上列所述，如(m≧0,n<0)、

(m≦0,n>0)則交由胖、瘦去判斷。

（x , y） (x＇, y＇)

圖3.10(a)：書法字比電腦字為大，(b)：書法字比電腦字為小

X 軸和 Y 軸的投影長短率由於有 m 和 n 二個變數和大、適中、小三個規則，所以採多規則、多變數的近似推論，過程如下：

輸入:x is a and y is b

模糊規則: R1 If x is A1 and y is B1 then z is C1 else 模糊規則: R2 If x is A2 and y is B2 then z is C2 else 模糊規則: R2 If x is A3 and y is B3 then z is C3 結論:z is c

圖3.11：字形大小歸屬函數及推論過程

最後利用重心法解模糊化，所得之分數即為字形大小的分數，假設 (m>0,n>0)則字形為大，所得的分數假設是 S 分，則改進的辭令顯示“字形大小應縮小為(100-S)%” ，例如所得解模糊化的分數是 78 分，則改進的辭令為“字形大小應縮小28%”。

u u

a a

uA3(x)

0 100 0

0 100 0 A2

uA2(x)

c3 c2 適中大

小

-1 0 1 m 的歸屬函數 Min

Min

Max

0 100 0 大

uB3(x) 適中

小

-1 0 1 n 的歸屬函數

適中大大小

-1 0 1

B3 大 A3

小適中

-1 0 1 m 的歸屬函數

大

前題部份結論部份 b

n 的歸屬函數 R2

2、字形的胖瘦

假設書法字的長寬比為 p=x’/y’，電腦字的長寬比為 q=x/y，則 o=(p-q) ，o>0 則書法字型為胖， o<0 書法字型為瘦，其中 p 是書法字長寬比例，q 是電腦字的長寬比例

圖3.12(a)：書法字比電腦字為胖，(b)：書法字比電腦字為瘦

令o=(p-q)，字形的「胖」、「瘦」或是「適中」程度，有三程語言變數，

把這三種語言變數用歸屬函數模糊化，歸屬函數也是利用三角形歸屬函數以方便計算。

由於語言變數有胖、瘦、適中三種就有三條規則、一個變數，所以採多規則規則、單一變數的近似推論，過程如下：

輸入: x is a

模糊規則 R1 : If x is A1 then y is B1 模糊規則 R2 : If x is A2 then y is B2 模糊規則 R3 : If x is A3 then y is B3 結論: y is b

圖3.13：字形胖瘦歸屬函數及推論過程

最後也是利用重心法解模糊化，所得之分數即為字形胖瘦的分數，假設字形為「胖」，所得的分數若是 S 分則改進的辭令顯示“字形胖瘦應減胖為 (100-S)%” ，例如所得解模糊化的分數是 83 分，則改進的辭令為“字形胖瘦應減胖17%”。

由上兩個單元(1)字形大小和(2)字形胖瘦，處理之後存在字體大小資料庫中，其中字形大小所得的分數和字形胖瘦所得的分數各佔一半，以方便我們下一個階段模糊專家系統的處理。

0 100 0 中心

面積

uA2(x) uA3( x) 適中

-1 -0.5 -0.167 0 0.167 0.5 1 胖瘦

Min A3

b A1 A2

前題部份結論部份 u

B3 B2

圖3.14：字體大小特徵擷取

3.4.3 投射量特徵擷取

1、X、Y 軸投影量特徵擷取

要分析二維空間的筆劃位置，把書法字做X、Y 軸的投影做分析，如此一來也可以做筆劃是否有水平和垂直的分析，因為若一個有水平或垂直的筆劃，

在X 軸和 Y 軸的投影必定是在某一小範圍內有大量的投影量，這和不平行或垂直者大範圍不相同的投影位置，若是電腦字的筆劃是有水平和垂直的例如「十」

這個字，書法字若寫得既不水平又不垂直，必定不會好看，那就可以根據電腦字和書法字做投影量相減，必會相差很多，根據此原理來做為投影量比對的方法，今說明如下：

若有一電腦字「門」和書法字的「門」在 X 軸和 Y 軸的投影，紅色是書法字的投影部份，而黑色則是電腦字的投影部份，兩者相減，所以投影量比對，

就是兩者相差部份如下箭頭所指出的部份，如下圖所示。

字體大小特徵擷取

書法字資料庫計算 m、n、o 值電腦字資料庫

字體大小資料庫

特徵擷取模糊系統

互動式改進辭令

圖3.15：電腦字做Ｘ、Ｙ軸投影情形

X、Y 軸投影量的語言變數的訂定是根據書法字和電腦字投影量做比對, 若電腦字和書法字重疊則不須扣分,若不同若該位置只有電腦投影量值有或只有學生投影量值則需扣分,扣分的投影量除以書法字和電腦字投影量總和，把語言變數用歸屬函數模糊化，歸屬函數也是利用三角形歸屬函數以方便計算。

由於投射量之差異量只有多和少二個語言變數，有二條規則一個變數，所以採多規則、單一變數的近似推論，過程如下：

輸入: x is a

模糊規則 R1 : If x is A1 then y is B1 模糊規則 R2 : If x is A2 then y is B2 結論: y is b

圖3.16：X、Y 軸投影量相差歸屬函數及推論過程

最後是利用重心法來解模糊化，所得之分數Ｓ即為書法字投影量和電腦字投影量相差所得的分數，假設投影量相差 R%，若是相差很少，所得的解模糊化的分數若是 S 分則改進的辭令顯示“書法字和電腦字相差之投影量再少 (100-S)%”，例如所得的投影量相差分數是 80 分，則改進的辭令為“書法字和電腦字相差之投影量再少 20%一點”，再將此解模糊化的分數，儲存在投影量資料庫中，以便我們下一個步驟模糊專家系統的處理。

100 50 0 u

A1 少

0 10 20 30 40 50 60 70 80 90 100%

uA2(x) uA1(x)

多 A2

b 前題部份結論部份

B1 B2 u

X、Y 軸投影量特徵擷取

圖3.17：X、Y 軸投影量特徵擷取

2、X 軸投影差量特徵擷取

研究發現在中國字中有部份是左右對稱字，例如：大中小高同門．．．，

可發現其對稱度也是構成書法美的條件之一，利用左右對稱的原理，加以分析發現其Ｘ軸的投影量右半邊的pixel 總和減去左半邊的 pixel 總和，此數值若愈接近電腦字，Ｘ軸的投影量右半邊的pixel 總和減去左半邊的 pixel 總和，則愈顯得優美的程度愈高，假設Ｘ軸的投影差量書法字為Xr’,電腦字為 Xr ， XR=

（Xr’－Xr），XR 共有三種語言變數“不勻稱右邊筆劃太粗或字型偏右” “字型勻稱” “不勻稱右邊筆劃太細或字型偏左”，把語言變數用歸屬函數模糊化，歸屬函數也是利用三角形歸屬函數以方便計算。

書法字資料庫計算 X、Y 軸投影差量電腦字資料庫

X、Y 軸投影量資料庫 X、Y 軸投影差量值

特徵擷取模糊系統

互動式改進辭令

X、Y 軸投影差量特徵擷取

Ｘ軸左半邊投影量Ｘ軸右半邊投影量圖3.18：Ｘ軸左、右半邊投影量

Ｘ軸的投影差量由於有三種語言變數就有三條規則、一個變數，所以採多規則規則、單一變數的近似推論，過程如下：

輸入: x is a

模糊規則 R1 : If x is A1’then y is B1’

模糊規則 R2 : If x is A2’then y is B2’

模糊規則 R3 : If x is A3’then y is B3’

結論: y is b

在文檔中中華大學 (頁 38-52)

第三章 研究方法

3.4 特徵擷取…

中心點位置特徵擷取

（x , y） (x＇, y＇)

字體大小特徵擷取

X、Y 軸投影量特徵擷取

X、Y 軸投影差量特徵擷取

第三章研究方法