第三章 研究方法
3.4 特徵擷取…
而本研究分析上節的書法鑑賞優美的原理,整理出三種特徵擷取來做為書 法字評分系統的分析特徵擷取,分述如下:
1、中心點位置特徵擷取:以書法字每一個 pixel 值乘上其座標,取其平均座標,
產生一個中心點,此即為字的中心,若中心和電腦字帖比對若相差不遠,即 表示有均勻的平衡美感,涵蓋理論:「均勻原理」。
2、字體大小特徵擷取:包含「字形大小」和「字形胖瘦」兩個特徵擷取,字 形大小、胖瘦是和電腦字帖做比較,字形大小涵蓋的理論是「等區域原理」,
字形胖瘦涵蓋的理論是「均勻原理」。
3、投射量特徵擷取:包含有「X、Y 軸投影量」和「X 軸投影差量」兩個特徵 擷取,X、Y 軸投影量定義是根據書法筆劃若是有水平或垂直的話,會在平 行或垂直作投影時在小區域內有大量的投影,若無則會在大區域只有小量的 投影,所以其涵蓋的理論是「水平、垂直、平行理論」;而 X 軸投影差量 是將對稱字右半邊投影量減去右半邊的投影量,將此值和電腦字做比較,若 愈接近則對稱度愈高,其涵蓋的理論是「對稱原理」。
本研究分析書法鑑賞優美的原理後,整理出以上三種特徵擷取,分述如下:
27
3.4.1 中心點位置特徵擷取
書法字的中心點位置若是不在我們認知架構中適當的位置,則書法字無法 展現其優雅的架構平衡美感,就好比特技演員在走鋼索一樣,重心不穩就很容 易發生危險,在書法字中強調的結字原則就提及到結構的穩健是一種視覺的平 衡,容易讓人產生一種穩定、安全的美感,所以定訂書法字中心點位置離電腦 字中心點的遠近,用以判斷書法字的美醜,先訂定出書法字中心點和電腦字中 心點兩者之距離差之最大範圍值,假設一個書法字完全偏右半邊,電腦字完全 偏左半邊,則兩者的中心點差距的最大差距為半個字的pixel 數,所以訂定以書 法字的X 軸 pixel 長度的一半為相距為最「遠」距離,若相距大小為 1/10 X 軸 pixel 數定義為最「近」距離,把「遠」「近」語言變數用歸屬函數模糊化。
字的中心點位置由於有近、遠二個語言變數,故有二條規則,一個變數,
所以採多規則、單一變數的近似推論,過程如下:
輸入: x is a
模糊規則 R1 : If x is A1 then y is B1 模糊規則 R2 : If x is A2 then y is B2 結論: y is b
圖3.7:中心點位置歸屬函數及推論過程 A1
近
0 10 20 30 40 50 60 70 80 90 100%
uA2(x) uA1(x)
100 50 0 遠
A2
b B1
a B2
u 前 題 部 份 結 論 部 份
最後是利用重心法來解模糊化,所得之分數S即為書法字中心點位置距電 腦字中心點位置之遠近所得的分數,假設位置在 G%的距離,則書法字和電腦 字的中心點為有點接近,所得的解模糊化的分數若是S 分則改進的辭令顯示“書 法字中心點位置距電腦字可再近(100-S)%”,例如所得的中心點位置分數是 73 分,則改進的辭令為“書法字中心點位置距電腦字可再近 27%一點”,再將此解 模糊化的分數,儲存在中心點位置資料庫中,以便我們下一個步驟模糊專家系 統的處理。
圖3.8:中心點位置特徵擷取
3.4.2 字體大小特徵擷取
書法字若是太大或者是太小也會影響到它的美感,太大的字有如一個大人 穿了一件小孩子的衣服,太小則感覺像是小孩穿了大人的衣服,若是字太胖(X 軸投影太大,其中大、小是和電腦字做比較)或太瘦(X 軸投影太小)也會影 響美感,所以字形的大、小、胖、瘦也會影響到書法字的美感,而九宮格的外
中心點位置特徵擷取
書法字資料庫 計算中心點位置 電腦字資料庫
中心點位置 資料
特 徵 擷 取 模 糊 系 統
互 動 式 改 進 辭 令 中心點位置相差值
29
圍的框就是這個大小的標準,就好像是一棟建築物一樣,外觀的形樣和架構,
若其大、小、長、寬設計得當會讓人產生一種舒適的美感,所以在本特徵擷取 裏共分兩個單元分析,(1) 字形的大小、(2)字形的胖瘦,兩個部份來探討。
1、字形的大小
圖3.9:電腦字和書法字大小比較圖
在此單元裏,假設字型的左上方座標為(0,0),考慮電腦字右下方的座標為 (x , y) ,書法字右下方的座標為(x’, y’),令 m=(x’-x),n=(y’-y) 其中:m 是對X 軸做投影的長, n 則是對 Y 軸做投影的長
假設若(m=0,n=0)則書法字形為適中,(m>0,n>0)則書法字形為大,如圖 3.10(a),以下所劃的藍色的是電腦字大小,紅色框是書法字的大小,假若 (m<0,n<0)則書法字形為小,如圖 3.10(b),如果不是上列所述,如(m≧0,n<0)、
(m≦0,n>0)則交由胖、瘦去判斷。
(x , y) (x', y')
圖3.10(a):書法字比電腦字為大,(b):書法字比電腦字為小
X 軸和 Y 軸的投影長短率由於有 m 和 n 二個變數和大、適中、小三個規 則,所以採多規則、多變數的近似推論,過程如下:
輸入:x is a and y is b
模糊規則: R1 If x is A1 and y is B1 then z is C1 else 模糊規則: R2 If x is A2 and y is B2 then z is C2 else 模糊規則: R2 If x is A3 and y is B3 then z is C3 結論:z is c
31
圖3.11:字形大小歸屬函數及推論過程
最後利用重心法解模糊化,所得之分數即為字形大小的分數,假設 (m>0,n>0)則字形為大,所得的分數假設是 S 分,則改進的辭令顯示“字形大小 應縮小為(100-S)%” ,例如所得解模糊化的分數是 78 分,則改進的辭令為“字 形大小應縮小28%”。
u u
u u
u u
a a
uA3(x)
B2
0 100 0
0 100 0 A2
uA2(x)
c3 c2 適中 大
小
-1 0 1 m 的歸屬函數 Min
C2
Min
C3
Max
c
0 100 0 大
uB3(x) 適中
小
-1 0 1 n 的歸屬函數
適中 大大 小
-1 0 1
B3 大 A3
小 適中
-1 0 1 m 的歸屬函數
大
前 題 部 份 結 論 部 份 b
b
n 的歸屬函數 R2
R3
2、字形的胖瘦
假設書法字的長寬比為 p=x’/y’,電腦字的長寬比為 q=x/y,則 o=(p-q) ,o>0 則書法字型為胖, o<0 書法字型為瘦,其中 p 是書法字長寬比例,q 是電腦字 的長寬比例
圖3.12(a):書法字比電腦字為胖,(b):書法字比電腦字為瘦
令o=(p-q),字形的「胖」、「瘦」或是「適中」程度,有三程語言變數,
把這三種語言變數用歸屬函數模糊化,歸屬函數也是利用三角形歸屬函數以方 便計算。
由於語言變數有胖、瘦、適中三種就有三條規則、一個變數,所以採多規 則規則、單一變數的近似推論,過程如下:
輸入: x is a
模糊規則 R1 : If x is A1 then y is B1 模糊規則 R2 : If x is A2 then y is B2 模糊規則 R3 : If x is A3 then y is B3 結論: y is b
33
圖3.13:字形胖瘦歸屬函數及推論過程
最後也是利用重心法解模糊化,所得之分數即為字形胖瘦的分數,假設字 形為「胖」,所得的分數若是 S 分則改進的辭令顯示“字形胖瘦應減胖為 (100-S)%” ,例如所得解模糊化的分數是 83 分,則改進的辭令為“字形胖瘦應 減胖17%”。
由上兩個單元(1)字形大小和(2)字形胖瘦,處理之後存在字體大小資料庫 中,其中字形大小所得的分數和字形胖瘦所得的分數各佔一半,以方便我們下 一個階段模糊專家系統的處理。
0 100 0 中心
面積
uA2(x) uA3( x) 適中
-1 -0.5 -0.167 0 0.167 0.5 1 胖 瘦
Min A3
b A1 A2
前 題 部 份 結 論 部 份 u
B3 B2
u
圖3.14:字體大小特徵擷取
3.4.3 投射量特徵擷取
1、X、Y 軸投影量特徵擷取
要分析二維空間的筆劃位置,把書法字做X、Y 軸的投影做分析,如此一 來也可以做筆劃是否有水平和垂直的分析,因為若一個有水平或垂直的筆劃,
在X 軸和 Y 軸的投影必定是在某一小範圍內有大量的投影量,這和不平行或垂 直者大範圍不相同的投影位置,若是電腦字的筆劃是有水平和垂直的例如「十」
這個字,書法字若寫得既不水平又不垂直,必定不會好看,那就可以根據電腦 字和書法字做投影量相減,必會相差很多,根據此原理來做為投影量比對的方 法,今說明如下:
若有一電腦字「門」和書法字的「門」在 X 軸和 Y 軸的投影,紅色是書 法字的投影部份,而黑色則是電腦字的投影部份,兩者相減,所以投影量比對,
就是兩者相差部份如下箭頭所指出的部份,如下圖所示。
字體大小特徵擷取
書法字資料庫 計算 m、n、o 值 電腦字資料庫
字體大小 資料庫
特 徵 擷 取 模 糊 系 統
互 動 式 改 進 辭 令
35
圖3.15:電腦字做X、Y軸投影情形
X、Y 軸投影量的語言變數的訂定是根據書法字和電腦字投影量做比對, 若電腦字和書法字重疊則不須扣分,若不同若該位置只有電腦投影量值有或只 有學生投影量值則需扣分,扣分的投影量除以書法字和電腦字投影量總和,把語 言變數用歸屬函數模糊化,歸屬函數也是利用三角形歸屬函數以方便計算。
由於投射量之差異量只有多和少二個語言變數,有二條規則一個變數,所 以採多規則、單一變數的近似推論,過程如下:
輸入: x is a
模糊規則 R1 : If x is A1 then y is B1 模糊規則 R2 : If x is A2 then y is B2 結論: y is b
圖3.16:X、Y 軸投影量相差歸屬函數及推論過程
最後是利用重心法來解模糊化,所得之分數S即為書法字投影量和電腦字 投影量相差所得的分數,假設投影量相差 R%,若是相差很少,所得的解模糊 化的分數若是 S 分則改進的辭令顯示“書法字和電腦字相差之投影量再少 (100-S)%”,例如所得的投影量相差分數是 80 分,則改進的辭令為“書法字和電 腦字相差之投影量再少 20%一點”,再將此解模糊化的分數,儲存在投影量資 料庫中,以便我們下一個步驟模糊專家系統的處理。
100 50 0 u
A1 少
0 10 20 30 40 50 60 70 80 90 100%
uA2(x) uA1(x)
多 A2
b 前 題 部 份 結 論 部 份
a
B1 B2 u
37
X、Y 軸投影量特徵擷取
圖3.17:X、Y 軸投影量特徵擷取
2、X 軸投影差量特徵擷取
研究發現在中國字中有部份是左右對稱字,例如:大中小高同門...,
可發現其對稱度也是構成書法美的條件之一,利用左右對稱的原理,加以分析 發現其X軸的投影量右半邊的pixel 總和減去左半邊的 pixel 總和,此數值若愈 接近電腦字,X軸的投影量右半邊的pixel 總和減去左半邊的 pixel 總和,則愈 顯得優美的程度愈高,假設X軸的投影差量書法字為Xr’,電腦字為 Xr , XR=
(Xr’-Xr) ,XR 共有三種語言變數“不勻稱右邊筆劃太粗或字型偏右” “字型 勻稱” “不勻稱右邊筆劃太細或字型偏左”,把語言變數用歸屬函數模糊化,歸 屬函數也是利用三角形歸屬函數以方便計算。
書法字資料庫 計算 X、Y 軸投影差量 電腦字資料庫
X、Y 軸投影量 資料庫 X、Y 軸投影差量值
特 徵 擷 取 模 糊 系 統
互 動 式 改 進 辭 令
X、Y 軸投影差量特徵擷取
X軸左半邊投影量 X軸右半邊投影量 圖3.18:X軸左、右半邊投影量
X軸的投影差量由於有三種語言變數就有三條規則、一個變數,所以採多 規則規則、單一變數的近似推論,過程如下:
輸入: x is a
模糊規則 R1 : If x is A1’then y is B1’
模糊規則 R2 : If x is A2’then y is B2’
模糊規則 R3 : If x is A3’then y is B3’
結論: y is b